Как и любую другую физическую величину, информацию можно измерить. Существуют разные подходы к измерению информации. Один из таких подходов обсуждается в курсе информатики для 7-го класса.

Что такое измерение информации

При измерении информации следует учитывать как объем отправляемого сообщения, так и его смысл. В связи с этим в информатике существуют разные подходы к измерению информации.

Алфавитный подход к измерению информации

Методы оценки количества информации могут учитывать или не учитывать смысл информационного сообщения.

Один из способов найти количество информации основан на определении веса каждого символа в тексте сообщения. При таком подходе объем сообщения зависит от количества символов в тексте; чем крупнее тест, тем больше вес информационного сообщения. В этом случае совершенно не важно, что написано, какой смысл имеет сообщение. Поскольку определение объема информации связано с текстовыми единицами: буквами, цифрами, знаками препинания, такой подход к измерению информации называется алфавитным.

Вес отдельного символа зависит от его номера в алфавите. Количество символов в алфавите называется мощностью (N). Например, емкость английского алфавита по количеству символов — 26, русского языка — 33. Но на самом деле при написании текста используются как прописные, так и строчные буквы, а также знаки препинания, пробелы и специальные символы невидимые символы, обозначающие конец абзаца и переход на новую строку. Поэтому они имеют дело с емкостью 128 или в расширенной версии 256 символов.

Информация об измерениях

Рис. 1. Таблица символов – латинский алфавит.

Бит, байт и другие единицы измерения

Для двоичного алфавита, состоящего из двух символов — нуля и единицы, степень алфавита будет равна 2. Вес символа в двоичном алфавите выбирается как минимальная единица информации и называется «битом». Происхождение термина «бит» происходит от английского слова «binary», что означает «двоичный.

восемь бит образуют байт.

Название «байт» было придумано в 1956 году В. Бухгольцем при проектировании первого суперкомпьютера. Слово «byte» было получено путем замены второй буквы в созвучном слове «bite», чтобы избежать путаницы с уже имеющимся термином «bit».

Информация об измерениях

Рис. 2. Портрет Вернера Бухгольца.

На практике объем информации выражается в более крупных единицах: килобайтах, терабайтах, мегабайтах.

Следует запомнить, что килобайт равен 1024 байта, а не 1000. Как, например, 1 километр равен 1000 метрам. Эта разница получается за счет того, 1 байт равен 8 битам, а не 10.

Чтобы было легче запомнить единицы измерения, следует воспользоваться таблицей степеней двойки.

Таблица степеней двойки

Экспонента

Важность

1

2

2

4

3

8

4

16

5

32

6

64

7

128

8

256

9

512

10

1024

20

1048576

Информация об измерениях

Рис. 3. Единицы измерения для информации.

То есть 23=8 – это 1 байт, состоящий из 8 бит, 210=1024 – 1 килобайт, 220=1048576 – 1 мегабайт, 230=1 гигабайт, 240=1 терабайт.

Определение количества информации

Вес символа (i) и мощность алфавита (N) связаны соотношением: 2i = N.

Таким образом, алфавит емкостью 256 символов имеет вес каждого символа 8 бит, т.е один байт. Это означает, что на каждую букву приходится один байт. В этом случае нетрудно определить, сколько весит весь закодированный текст сообщения. Для этого достаточно умножить вес символа алфавита на количество символов в тексте. Подсчитывая количество символов в сообщении, не следует забывать, что знаки препинания, как и пробелы, также являются символами и имеют такой же вес, как и буквы.

Например, если предположить, что каждая буква закодирована в один байт, для текста «Ура! Праздники наступили». Объем информации определяется умножением 8 бит на 24 символа (без кавычек). Произведение 8*24=192 бита — именно столько весит закодированная фраза. В переводе на байты: 192 бита разделить на 8 дает 24 байта.

Что мы узнали?

Одним из способов определения размера информационного сообщения является алфавитный подход, при котором каждый символ в тексте имеет определенный вес за счет мощности алфавита. Наименьшая единица информации – бит. Информация также может измеряться в байтах, килобайтах, мегабайтах.