Кодирование текстовых данных
Поможем в ✍️ написании учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

 

Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Восьми двоичных разрядов достаточно для кодирования 256 различных символов.

Таблица 1.1. Базовая таблица кодировки ASCII

 

Код ASCII

Компьютер может обрабатывать информацию, представленную только в числовой форме. При вводе символов с клавиатуры символы кодируются определенным числом, а при выводе их для чтения человеком (на монитор, или принтер) по каждому числу (коду символа) строится изображение символа. Соотношение между набором символов и их кодами определяется кодовой таблицей символов.

Нажатие клавиши посылает в компьютер двоичное число – комбинацию нулей и единиц (1 байт). Любую комбинацию можно интерпретировать как десятичное число от 0 до 256. Напр., при нажатии клавиши «А» посылается число 01000001(2)=65(10). Для машины это число может служить номером «литеры» с изображением «А», которая хранится в памяти ЭВМ. Специальные электронные схемы по этому номеру находят литеру и печатают ее на экране.

Итак, 1 символ хранится в одном байте, след-но, коды символов принимают значения от 0 до 255. Такие кодировки называются однобайтными. Вместе с тем, существуют двухбайтные кодировки – Unicode, в которой коды символов могут принимать значения от 0 до 65535 (один символ кодируется 2 байтами). В этой кодировке(ее поддерживает, напр., Windows NT) имеются номера практически для всех применяемых символов (русских, латинских букв, букв алфавитов других стран, цифр, символов и т.д.)

При разработке IBM PC фирма IBM заложила однобайтную кодировку символов, которая принята во всем мире в качестве стандарта – это кодовая таблица ASCII (American Standard Information Interchange), один символ кодируется 1 байтом.

Кодовая таблица – это внутреннее представление символов в ЭВМ. В ASCII закодирована только половина возможных символов от 0 до 127.

1. Первые 32 символа 0–31 являются управляющими и предназначены, в основном, для передачи команд управления программно-аппаратным компонентам машины.

Напр.: посылка на принтер символа с кодом 13 заставит головку принтера вернуться к началу строки. Символ с кодом 10 воспринимается, как команда протянуть бумагу на одну строку.

Итак, первые 32 символа не воспроизводятся, а служат для управления.

2. 32 – 64 – специальные символы и цифры

3. 65 – 90 – 26 прописных латинские буквы

4. 97 – 122 – 26 строчных латинских букв

5. 123 – 127 – знаки препинания, специальные символы, скобки, пробелы

Дата: 2019-03-05, просмотров: 226.