Кодовая таблица

Кодовые таблицы используются для обозначения букв в компьютерных технологиях. Краткое описание типов таблиц символов и их использование описано в этой статье.

Что такое кодовая таблица

Известно, что числа в компьютере представляются в двоичной форме, как набор нулей и единиц. Для этого разработаны специальные методики преобразования числовых значений в двоичную последовательность. Как компьютер обрабатывает текстовую информацию – предложения, слова и буквы? Точно так же, как числа – в виде последовательности нулей и единиц.

Чтобы представить букву в компьютере, она заменяется числовым эквивалентом, а затем преобразуется в двоичный код. Каждая буква имеет свой номер. Все буквы с их числовыми эквивалентами компилируются в таблицу кодов символов, которую можно назвать ASCII, Unicode, KOI-7, KOI-8, Windows-1251.

Таблица ASCII

Самой первой системой кодирования текстовой информации была ASCII (Американский стандартный код обмена информацией).

Таблица ASCII была разработана в США в шестидесятых годах прошлого века. Появление такой единой системы кодирования символов было продиктовано необходимостью реализации компьютерного взаимодействия и обмена информацией. В то время каждый производитель компьютеров самостоятельно представлял буквы, цифры и управляющие коды. Только специалисты IBM использовали девять различных наборов кодировок символов.

Кодовая таблица

Рис. 1. Символы таблицы ASCII.

Идея создания единой стандартизированной системы кодирования символов в виде числовых эквивалентов принадлежит американскому специалисту в области информационных технологий Роберту Уильяму Бемеру. Это он придумал экранирующий символ «Esc», обозначающий то, что следующий после него символ, имеет некоторое другое значение, не такое как ему назначено в таблице ASCII.

Кодовая таблица

Рис. 2. Боб Бемер.

Изначально таблица использовалась для кодирования всего 128 символов, затем ее расширили до 256 символов. Первые тридцать два символа таблицы ASCI не имеют печатного эквивалента и используются для управления. Числа в диапазоне 32–127 предназначены для кодирования латинских букв верхнего и нижнего регистра, цифр и знаков препинания.

Знак пробела имеет код 32 и также является печатным символом. Проверить соответствие символа печатному коду легко. Для этого можно воспользоваться простейшим текстовым редактором Блокнот в группе программ Стандартные операционной системы Windows. Нажав одновременно функциональную клавишу Alt и введя код символа – десятичное число, в окне редактора на месте расположения курсора будет напечатан соответствующий символ.

Национальные версии таблицы ASCII

Таблица ASCII в диапазоне символов от 0 до 127 остается неизменной для всех программ. Диапазон значений кода от 128 до 255 может варьироваться в зависимости от языка и национальных особенностей.

Существуют разные национальные версии системы кодирования. Для кодирования букв русского алфавита используется:

  • IBM cp866
  • Вин-1251
  • КОИ8

Unicode

Unicode — это отраслевой стандарт кодирования символов во всех письменных языках мира. Он был предложен в 1991 году некоммерческой организацией Unicode Consortium.

Кодовая таблица

Рис. 3. Логотип Консорциума Unicode.

Кодовое пространство Unicode разделено на несколько регионов. Диапазон значений кода от 0 до 127 полностью дублирует кодовую систему ASCII. Затем есть области с символами на разных языках, знаками препинания и некоторыми техническими символами.

Юникод имеет несколько форм: UTF-8, UTF-16 и UTF-32.

Что мы узнали?

Для представления символьных значений в компьютере используются таблицы кодировки символов. Каждому символу в такой таблице соответствует числовое значение. Использование стандартизированных кодовых таблиц позволило обеспечить взаимодействие и обмен информацией между компьютерными системами.