Итак, на позициях 128– 255 фирма IBM поместила символы западно-европейских алфавитов, символы псевдографики, позволяющие рисовать на экране диаграммы и рамки, некоторые греческие буквы и т.д. Однако в разных странах, на разных моделях компьютеров могут использоваться и разные варианты второй половины кодовой таблицы (их называю расширениями ASCII).
Вторая половина таблицы ASCII используется для альтернативной таблицы (национальные алфавиты).
Например, для России:
1. 128 – 159 – прописные А – Я
2. 160 – 175 – а – п
3. 224 – 239 – р – я
4. 176 – 223, 212 – 223 – псевдографика
5. 179 – 255 – дополнительные знаки
Эта таблица получила название «модифицированной альтернативной кодировки ГОСТа».
Итак,
а)Прописные и строчные буквы, представляются разными кодами.
б) Чтобы упорядочить слова текста по алфавиту, компьютер должен сравнить между собой десятичные коды букв, расположить их по возрастанию.
След-но, если слова состоят только из прописных латинских или строчных латинских нет путаницы в сортировке, в противном случае – не получится алфавитной сортировки.
в) Чтобы не было недоразумений в DOS используются только латинские буквы, и строчные – чаще всего транслируются в прописные.
г) многие латинские и русские буквы (А, С, е) неразличимы визуально, поэтому следует учитывать это при подготовке, напр., баз данных.
Примечание.
В ОС Windows используется другая кодировка, но проблему перекодировка Windows решает сам.
Кодовая таблица в системе Windows
Символ | Десятичный код | Двоичный код | Символ | Десятичный код | Двоичный код |
Пробел ! * + , - . / = ? | 32 33 42 43 44 45 46 47 61 63 | 00100000 00100001 00101010 00101011 00101100 00101101 00101110 001011110 00111101 00111111 | 0 1 2 3 4 5 6 7 8 9 | 48 49 50 51 52 53 54 55 56 57 | 00110000 00110001 00110010 00110011 00110100 00110101 00110110 00110111 00111000 00111001 |
А Б В Г Д Е Ж З И Й К Л М Н О П | 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 | 11000000 11000001 11000010 11000011 11000100 11000101 11000110 11000111 11001000 11001001 11001010 11001011 11001100 11001101 11001110 11001111 | Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я | 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 | 11010000 11010001 11010010 11010011 11010100 11010101 11010110 11010111 11011000 11011001 11011010 11011011 11011100 11011101 11011110 11011111 |
Unicode
Задача 1:
Какое количество символов содержится на странице энциклопедического словаря, если в памяти компьютера эта страница занимает 13 Кб?
По умолчанию (раз другого не сказано, то кодировка ASCII) количество бит информации, приходящейся на один символ, равно 8 бит.
13 Кб*1024 байт*8 бит = 106496 бит
Кол-во символов = Количество / Кол-во бит информации на один символ =
= 106496 бит / 8 бит = 13312 символа
Задача 2:
Используя данные предыдущей задачи и зная, что в одной строке находится 85 знаков, определить количество строк на странице
Кол-во строк = Общее кол-во символов / Кол-во символов в одной строке =
= 13312 символов / 85 знаков = 157 строк.
Задача 3:
Определить количество информации, которое содержится на печатном листе бумаги (двусторонняя печать), если на олной стороне умещается 40 строк по 67 символов в строке?
40 строк*67 символов = 2680 символов на одной стороне листа
2680 символов*2 = 5360 символов на двух сторонах
5360 символов*1 байт = 5360 байт информации на двух сторонах
5360 байт:1024 байт = 5,23 Кб
Задача 4:
Какое количество информации будет содержаться на странице печатного текста при использовании 32-х символьного алфавита (на странице 60 строк по 56 символов)?
60 строк*56 символов = 3360 символов на странице
Мощность алфавита 32 символа
2I = 32 символа, I=5 бит информации на один символ 32-х символьного алфавита
3360 символов*5 бит = 16800 бит информации на странице
16800 бит:8 бит = 2100 байт
2100 байт:1024 байт = 2,05 Кб
Задача 5:
Какое количество информации в слове «информатика» при условии, что для кодирования используется 32-значный алфавит?
2I = 32 символа, I=5 бит информации на один символ 32-х символьного алфавита
11 букв*5 бит = 55 бит в слове
Задача 6:
Сколько информации в тексте из 4 страниц по 50 строк, в каждой строке по 80 символов. Алфавит для записи текста 16-тизначный.
4 страницы*50 строк*80 символов = 16000 символов на странице
2I = 16 символов, I=4 бита информации на один символ 16-ти символьного алфавита
16000 символов*4 бита = 64000 бит = 7,8 Кб
ОБРАБОТКА ДАННЫХ
Дата: 2019-03-05, просмотров: 269.