Теоретический материал:
1) N = 2i, где N – мощность алфавита (количество символов в используемом
алфавите), i – информационный объем одного символа (информационный
вес символа), бит.
2) I = K*i, где I – информационный объем текстового документа (файла), K – количество символов в тексте
При алфавитном подходе к определению количества информации отвлекаются от содержания информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы.
Информационная емкость знака.
Представим себе, что необходимо передать информационное сообщение по каналу передачи информации от отправителя к получателю. Пусть сообщение кодируется с помощью знаковой системы, алфавит которой состоит из N знаков {1, …, N}. В простейшем случае, когда длина кода сообщения составляет один знак, отправитель может послать одно из N возможных сообщений “1”, “2”, …, “N”, которое будет нести количество информации I (рис. 1).
Формула 1) связывает между собой количество возможных информационных сообщений N и количество информации I, которое несет полученное сообщение. Тогда в рассматриваемой ситуации N — это количество знаков в алфавите знаковой системы, а i – количество информации, которое несет каждый знак:
N = 2i.
_______________________________________________________________________________
С помощью этой формулы можно, например, определить количество информации, которое несет знак в двоичной знаковой системе:
N = 2 => 2 = 2i => 21 = 2i => i = 1 бит.
Таким образом, в двоичной знаковой системе знак несет 1 бит информации. Интересно, что сама единица измерения количества информации “бит” (bit) получила свое название ОТ английского словосочетания “Binary digiT” – “двоичная цифра”.
Информационная емкость знака двоичной знаковой системы составляет 1 бит.
Чем большее количество знаков содержит алфавит знаковой системы, тем большее количество информации несет один знак. В качестве примера определим количество информации, которое несет буква русского алфавита.
_______________________________________________________________________________
Пример.
В русский алфавит входят 33 буквы, однако на практике часто для передачи сообщений используются только 32 буквы (исключается буква “ё”). С помощью формулы 1) определим количество информации, которое несет буква русского алфавита:
N = 32 => 32 = 2i => 25 = 2i => i=5 битов.
Таким образом, буква русского алфавита несет 5 битов информации (при алфавитном подходе к измерению количества информации).
_______________________________________________________________________________
Количество информации, которое несет знак, зависит от вероятности его получения. Если получатель заранее точно знает, какой знак придет, то полученное количество информации будет равно 0. Наоборот, чем менее вероятно получение знака, тем больше его информационная емкость.
В русской письменной речи частота использования букв в тексте различна, так в среднем на 1000 знаков осмысленного текста приходится 200 букв “а” и в сто раз меньшее количество буквы “ф” (всего 2). Таким образом, с точки зрения теории информации, информационная емкость знаков русского алфавита различна (у буквы “а” она наименьшая, а у буквы “ф” – наибольшая).
Количество информации в сообщении.
Сообщение состоит из последовательности знаков, каждый из которых несет определенное количество информации. Если знаки несут одинаковое количество информации, то количество информации I в сообщении можно подсчитать, умножив количество информации i, которое несет один знак, на длину кода (количество знаков в сообщении) К:
I = i × K
Так, каждая цифра двоичного компьютерного кода несет информацию в 1 бит. Следовательно, две цифры несут информацию в 2 бита, три цифры – в 3 бита и т. д. Количество информации в битах равно количеству цифр двоичного компьютерного кода (табл. 1.1).
Задачи на определение информационного объема текста
Проверяется умение оценивать количественные параметры информационных объектов.
Теоретический материал:
N = 2i , где N – мощность алфавита (количество символов в используемом
алфавите),
i – информационный объем одного символа (информационный
вес символа), бит
I = K*i, где I – информационный объем текстового документа (файла),
K – количество символов в тексте
Задача 1.
Считаем количество символов в заданном тексте (перед и после тире – пробел, после знаков препинания, кроме последнего – пробел, пробел – это тоже символ). В результате получаем – 52 символа в тексте.
Дано:
i = 16 бит
K = 52
I – ?
Решение:
I = K*i
I = 52*16бит = 832бит (такой ответ есть – 2)
Ответ: 2
Задача 2.
Дано:
K = 16*35*64 – количество символов в статье
i = 8 бит
I – ?
Решение: Чтобы перевести ответ в Кбайты нужно разделить результат на 8 и на 1024 (8=23, 1024=210)
I=16*35*64*8 бит==35Кбайт Ответ: 4
Задача 3.
Пусть x – это количество строк на каждой странице, тогда K=10*x*64 – количество символов в тексте рассказа.
Дано:
I = 15 Кбайт
K =10*x*64
i = 2 байта
x – ?
Решение:
Переведем информационный объем текста из Кбайт в байты.
I = 15 Кбайт = 15*1024 байт (не перемножаем)
Подставим все данные в формулу для измерения количества информации в тексте.
I = K*i
15*1024 = 10*x*64*2
Выразим из полученного выражения x
x = – количество строк на каждой странице – 4
Ответ: 4
Задачи для самостоятельного решения:
Задача 1.
Задача 2.
Задача 3.
Задача 4.
Задача 5.
Задача 6.
Задача 7.
Задачи взяты с сайта fipi.ru из открытого банка заданий (с.1-7)
1. Найди информационный объём следующего сообщения, если известно, что один символ кодируется одним байтом.
Кто владеет информацией, тот владеет миром.
Решение: посчитаем количество символов в сообщении, будем учитывать буквы, знаки препинания и пробелы.
Всего (43) символа. Каждый символ кодируется (1) байтом.
(I = К · i), (43 · 1) байт (= 43) байта.
Ответ: (43) байта.
2. Найди информационный объём слова из (12) символов в кодировке Unicode (каждый символ кодируется двумя байтами). Ответ дайте в битах.
Решение.
Мы знаем из условия задачи, что каждый символ кодируется двумя байтами. Найдём сколько это бит.
(2) байта (· 8 = 16) бит;
Слово состоит из (12) символов, поэтому
(16) бит (· 12) символов (= 192) бита.
Ответ: (192) бита.
3. Найди информационный вес книги, которая состоит из (700) страниц, на каждой странице (70) строк и в каждой строке (95) символов . Мощность алфавита — (256) символов. Ответ дать в Мб.
Решение: если мощность алфавита (256) символов, то информационный объём одного символа (8) бит.
Найдём количество символов в книге: (700·70·95 = 4655000) символов.
Информационный вес сообщения: (4655000·8=37240000) бит.
Ответ нужно дать в Мб, поэтому переведём биты в Мб
(37240000:8:1024:1024 = 4,44) Мб
Ответ: (4,44) Мб.
1. Информационный объём текстового
сообщения
Расчёт
информационного объёма текстового сообщения (количества информации,
содержащейся в информационном сообщении) основан на подсчёте количества
символов в этом сообщении, включая пробелы, и на определении
информационного веса одного символа, который зависит от кодировки, используемой
при передаче и хранении данного сообщения.
Для расчёта
информационного объёма текстового сообщения используется формула
I=K*i, где
I – это информационный объём текстового сообщения,
измеряющийся в байтах, килобайтах, мегабайтах;
K – количество символов в
сообщении,
i – информационный вес одного символа, который
измеряется в битах на один символ.
Информационный
объём одного символа связан с количеством символов в алфавите формулой
N=2i, где
N – это количество символов в алфавите (мощность
алфавита),
i – информационный
вес одного символа в битах на один символ.
2. Информационный объём растрового
графического изображения
Расчёт
информационного объёма растрового графического изображения (количества
информации, содержащейся в графическом изображении) основан на подсчёте количества
пикселей в этом изображении и на определении глубины
цвета (информационного веса одного пикселя).
Для расчёта
информационного объёма растрового графического изображения используется
формула
I=K*i, где
I – это информационный объём растрового графического
изображения, измеряющийся в байтах, килобайтах, мегабайтах;
K – количество пикселей (точек) в
изображении, определяющееся разрешающей способностью носителя информации
(экрана монитора, сканера, принтера);
i – глубина цвета, которая
измеряется в битах на один пиксель.
Глубина цвета связана с
количеством отображаемых цветов формулой
N=2i, где
N – это количество цветов в палитре,
i – глубина цвета в битах на
один пиксель.
как посчитать информационный объём текста ?
AlexMur07
Просветленный
(31013),
закрыт
3 года назад
Книга содержит 150 страниц. На каждой странице 33 строк. В каждой строке 57 символов (включая пробелы). Найти информационный объём текста.
необходимо в КБ (килобайтах)
Чеширский Кот из Страны Чудес
Просветленный
(35275)
7 лет назад
Уточни в какой кодировке текст. Обычно 1 байт = 1 символ. Хотя бывают и двухбайтовые кодировки.
И да, посчитай заодно символы конца строки.
В Windows каждая строка – 2 символа, в UNIX 1 символ.
Так что в каждой строке 59 символов.
57 символов + переход на следующую строку (#10) + возврат каретки (#13)
AlexMur07Просветленный (31013)
7 лет назад
это в виндовс, если осчитать то как какая формула? и чтобы в КБ перевести
Чеширский Кот из Страны Чудес
Просветленный
(35275)
Ещё раз: 1 байт – 1 символ.
Килобайт = 1024 байта.
Посчитай количество символов текста и раздели на 1024 – получишь его размер в килобайтах.