Как найти число символов в сообщении

Как определить количество информации

Все мы привыкли к тому, что все вокруг можно измерить. Мы можем определить массу посылки, длину стола, скорость движения автомобиля. Но как определить количество информации, содержащееся в сообщении? Ответ на вопрос в статье.

Итак, давайте для начала выберем сообщение. Пусть это будет «Принтер — устройство вывода информации.«. Наша задача — определить, сколько информации содержится в данном сообщении. Иными словами — сколько памяти потребуется для его хранения.

Как определить количество информации

Определение количества информации в сообщении

Для решения задачи нам нужно определить, сколько информации несет один символ сообщения, а потом умножить это значение на количество символов. И если количество символов мы можем посчитать, то вес символа нужно вычислить. Для этого посчитаем количество различных символов в сообщении. Напомню, что знаки препинания, пробел — это тоже символы. Кроме того, если в сообщении встречается одна и та же строчная и прописная буква — мы считаем их как два различных символа. Приступим.

В слове Принтер 6 различных символов (р встречается дважды и считается один раз), далее 7-й символ пробел и девятый — тире. Так как пробел уже был, то после тире мы его не считаем. В слове устройство 10 символов, но различных — 7, так как буквы  с, т и о повторяются. Кроме того буквы т и р уже была в слове Принтер. Так что получается, что в слове устройство 5 различных символов. Считая таким образом дальше мы получим, что в сообщении 20 различных символов.

Далее вспомним формулу, которую называют главной формулой информатики:

2i=N

Подставив в нее вместо N количество различных символов, мы узнаем, сколько информации несет один символ в битах. В нашем случае формула будет выглядеть так:

2i=20

Вспомним степени двойки и поймем, что i находится в диапазоне от 4 до 5 (так как 24=16, а 25=32). А так как бит — минимальная единица измерения информации и дробным быть не может, то мы округляем i в большую сторону до 5. Иначе, если принять, что i=4, мы смогли бы закодировать только 24=16 символов, а у нас их 20. Поэтому получаем, что i=5, то есть каждый символ в нашем сообщении несет 5 бит информации.

Осталось посчитать сколько символов в нашем сообщении. Но теперь мы будем считать все символы, не важно повторяются они или нет. Получим, что сообщение состоит из 39 символов. А так как каждый символ — это 5 бит информации, то, умножив 5 на 39 мы получим:

5 бит x 39 символов = 195 бит

Это и есть ответ на вопрос задачи — в сообщении 195 бит информации. И, подводя итог, можно написать алгоритм нахождения объема информации в сообщении:

  • посчитать количество различных символов.
  • подставив это значение в формулу 2i=N найти вес одного символа (округлив в большую сторону)
  • посчитать общее количество символов и умножить это число на вес одного символа.

Автор:

Набор символов знаковой системы (алфавит) можно рассматривать как различные возможные состояния (события).
Тогда, если считать, что появление символов в сообщении равновероятно, количество возможных событийN можно вычислить как N=2i
Количество информации в сообщении I можно подсчитать умножив количество символов K на информационный вес одного символа i
Итак, мы имеем формулы, необходимые для определения количества информации в алфавитном подходе:

Если к этим задачам добавить задачи на соотношение величин, записанных в разных единицах измерения, с использованием представления величин в виде степеней двойки мы получим 9 типов задач.
Рассмотрим задачи на все типы. Договоримся, что при переходе от одних единиц измерения информации к другим будем строить цепочку значений. Тогда уменьшается вероятность вычислительной ошибки.

Задача 1. Получено сообщение, информационный объем которого равен 32 битам. чему равен этот объем в байтах?

Решение: В одном байте 8 бит. 32:8=4
Ответ: 4 байта.

Задача 2. Объем информацинного сообщения 12582912 битов выразить в килобайтах и мегабайтах.

Решение: Поскольку 1Кбайт=1024 байт=1024*8 бит, то 12582912:(1024*8)=1536 Кбайт и
поскольку 1Мбайт=1024 Кбайт, то 1536:1024=1,5 Мбайт
Ответ:1536Кбайт и 1,5Мбайт.

Задача 3. Компьютер имеет оперативную память 512 Мб. Количество соответствующих этой величине бит больше:

1) 10 000 000 000бит 2) 8 000 000 000бит 3) 6 000 000 000бит 4) 4 000 000 000бит Решение: 512*1024*1024*8 бит=4294967296 бит.
Ответ: 4.

Задача 4. Определить количество битов в двух мегабайтах, используя для чисел только степени 2.
Решение: Поскольку 1байт=8битам=23битам, а 1Мбайт=210Кбайт=220байт=223бит. Отсюда, 2Мбайт=224бит.
Ответ: 224бит.

Задача 5. Сколько мегабайт информации содержит сообщение объемом 223бит?
Решение: Поскольку 1байт=8битам=23битам, то
223бит=223*223*23бит=210210байт=210Кбайт=1Мбайт.
Ответ: 1Мбайт

Задача 6. Один символ алфавита “весит” 4 бита. Сколько символов в этом алфавите?
Решение:
Дано:

i=4 По формуле N=2i находим N=24, N=16
Найти: N – ?  

Ответ: 16

Задача 7. Каждый символ алфавита записан с помощью 8 цифр двоичного кода. Сколько символов в этом алфавите?
Решение:
Дано:

i=8 По формуле N=2i находим N=28, N=256
Найти:N – ?  

Ответ: 256

Задача 8. Алфавит русского языка иногда оценивают в 32 буквы. Каков информационный вес одной буквы такого сокращенного русского алфавита?
Решение:
Дано:

N=32 По формуле N=2i находим 32=2i, 25=2i,i=5
Найти: i– ?  

Ответ: 5

Задача 9. Алфавит состоит из 100 символов. Какое количество информации несет один символ этого алфавита?
Решение:
Дано:

N=100 По формуле N=2i находим 32=2i, 25=2i,i=5
Найти: i– ?  

Ответ: 5

Задача 10. У племени “чичевоков” в алфавите 24 буквы и 8 цифр. Знаков препинания и арифметических знаков нет. Какое минимальное количество двоичных разрядов им необходимо для кодирования всех символов? Учтите, что слова надо отделять друг от друга!
Решение:
Дано:

N=24+8=32 По формуле N=2i находим 32=2i, 25=2i,i=5
Найти: i– ?  

Ответ: 5

Задача 11. Книга, набранная с помощью компьютера, содержит 150 страниц. На каждой странице — 40 строк, в каждой строке — 60 символов. Каков объем информации в книге? Ответ дайте в килобайтах и мегабайтах
Решение:
Дано:

K=360000 Определим количество символов в книге 150*40*60=360000. Один символ занимает один байт. По формуле I=K*iнаходим I=360000байт 360000:1024=351Кбайт=0,4Мбайт
Найти: I– ?  

Ответ: 351Кбайт или 0,4Мбайт

Задача 12. Информационный объем текста книги, набранной на компьютере с использованием кодировки Unicode, — 128 килобайт. Определить количество символов в тексте книги.
Решение:
Дано:

I=128Кбайт,i=2байт В кодировке Unicode один символ занимает 2 байта. Из формулыI=K*i выразимK=I/i,K=128*1024:2=65536
Найти: K– ?  

Ответ: 65536

Задача 13.Информационное сообщение объемом 1,5 Кб содержит 3072 символа. Определить информационный вес одного символа использованного алфавита
Решение:
Дано:

I=1,5Кбайт,K=3072 Из формулы I=K*i выразимi=I/K,i=1,5*1024*8:3072=4
Найти: i– ?  

Ответ: 4

Задача 14.Сообщение, записанное буквами из 64-символьного алфавита, содержит 20 символов. Какой объем информации оно несет?
Решение:
Дано:

N=64, K=20 По формуле N=2i находим 64=2i, 26=2i,i=6. По формуле I=K*i I=20*6=120
Найти: I– ?  

Ответ: 120бит

Задача 15. Сколько символов содержит сообщение, записанное с помощью 16-символьного алфавита, если его объем составил 1/16 часть мегабайта?
Решение:
Дано:

N=16, I=1/16 Мбайт По формуле N=2i находим 16=2i, 24=2i,i=4. Из формулы I=K*i выразим K=I/i, K=(1/16)*1024*1024*8/4=131072
Найти: K– ?  

Ответ: 131072

Задача 16. Объем сообщения, содержащего 2048 символов,составил 1/512 часть мегабайта. Каков размер алфавита, с помощью которого записано сообщение?
Решение:
Дано:

K=2048,I=1/512 Мбайт Из формулы I=K*i выразим i=I/K, i=(1/512)*1024*1024*8/2048=8. По формулеN=2iнаходим N=28=256
Найти: N– ?  

Ответ: 256

Задачи для самостоятельного решения:

  1. Каждый символ алфавита записывается с помощью 4 цифр двоичного кода. Сколько символов в этом алфавите?
  2. Алфавит для записи сообщений состоит из 32 символов, каков информационный вес одного символа? Не забудьте указать единицу измерения.
  3. Информационный объем текста, набранного на компьюте¬ре с использованием кодировки Unicode (каждый символ кодируется 16 битами), — 4 Кб. Определить количество символов в тексте.
  4. Объем информационного сообщения составляет 8192 бита. Выразить его в килобайтах.
  5. Сколько бит информации содержит сообщение объемом 4 Мб? Ответ дать в степенях 2.
  6. Сообщение, записанное буквами из 256-символьного ал¬фавита, содержит 256 символов. Какой объем информации оно несет в килобайтах?
  7. Сколько существует различных звуковых сигналов, состоящих из последовательностей коротких и длинных звонков. Длина каждого сигнала — 6 звонков.
  8. Метеорологическая станция ведет наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 20 до 100%, которое записывается при помощи минимально возможного количества бит. Станция сделала 80 измерений. Определите информационный объем результатом наблюдений.
  9. Скорость передачи данных через ADSL-соединение равна 512000 бит/с. Через данное соединение передают файл размером 1500 Кб. Определите время передачи файла в секундах.
  10. Определите скорость работы модема, если за 256 с он может передать растровое изображение размером 640х480 пикселей. На каждый пиксель приходится 3 байта. А если в палитре 16 миллионов цветов?

Тема определения количества информации на основе алфавитного подхода используется в заданиях А1, А2, А3, А13, В5 контрольно-измерительных материалов ЕГЭ.

Каждый объект в компьютере (или любом другом электронном устройстве) имеет свой информационный объём, то есть то количество информации, которое он занимает в памяти устройства.

Например, текстовый документ на (2)–(3) страницы может иметь информационный объём (150) Кб.

Изображение в хорошем качестве — (2)–(4) Мб.

Аудиофайл с песней на (3) минуты — около (6) Мб.

Рассмотрим измерение текстовой информации в компьютере.

Размер текстового сообщения зависит от того, с помощью какого алфавита он был написан и сколько в нём символов.

Алфавит (N) — это количество символов в некотором языке.

Чем больше алфавит, тем больше информационный вес одного символа.

Информационный вес одного символа (i) — это количество информации, которое отводится на один символ.

Обрати внимание!

Они связаны формулой:

N=2i

.

Например, в русском алфавите (33) буквы, вычислим информационный вес одного символа по формуле:

33=2i,i≈5

 бит. То есть вес одного символа (буквы) — (5) бит.

Представим, что в тетрадке записана следующая строка: «Мама сидела за столом».

Как посчитать, сколько информации несёт в себе это сообщение?

Нам известно, сколько весит один символ — (5) бит, можно подсчитать количество символов в данном сообщении — (18), соответственно, чтобы найти, сколько всего информации несёт в себе это сообщение, нужно перемножить информационный вес одного символа и количество символов в сообщении.

Обрати внимание!

Можно вывести формулу:

I=K×i

,

где (I) — информационный объём сообщения;

(K) — количество символов в сообщении;

(i) — информационный вес одного символа. 

Но мы будем работать с компьютерным текстом. Там алфавит намного больше.

Как ты думаешь, сколько всего символов можно ввести с клавиатуры?

Ты скажешь «много» и будешь прав: с клавиатуры можно ввести русские/английские буквы, цифры, специальные знаки и т. д. Всего (256) символов.

Посчитаем информационный вес одного символа компьютерного алфавита.

N=2i.256=2i.256=28.

Один символ компьютерного алфавита весит (8) бит или (1) байт.

Решим задачу.

Найди информационный объём текста (в битах), написанного с помощью компьютера:

«Информация — это сведения об окружающем нас мире».

Текст напечатан на компьютере, поэтому один символ весит (8) бит или (1) байт.

Всего символов в сообщении между кавычками: (48). При подсчёте символов учитываются все символы и пробелы.

Запишем решение:

I=K×i.I=48×8.I=384бит.

Ответ: (384) бита.

Задача

Найди информационный объём сообщения (в байтах), который напечатали школьники на уроке информатики, если оно содержит (2) страницы, на каждой странице по (12) строк, и в каждой строке (28) символов.

Оформим решение задачи.

Дано:

K=2×12×28.i=1байт.

Чтобы посчитать, сколько символов всего в сообщении, нужно умножить количество страниц на количество строк и на количество символов в каждой строке. 

В условии сказано, что текст напечатали, поэтому один символ равен (1) байту.

I=K×i.I=2×12×28×1.I=672байта.

Найти: (I) — ? Ответ: (672) байта.
Информатика ОГЭ №1

Добрый день, сегодня мы познакомимся с заданием №1 ОГЭ по информатике. Сама суть идёт из темы про кодирование информации. Когда мы пытаемся найти какое количество нужно выделить памяти у компьютера на один символ. Символ — это не только цифры (0-9) и буквы разных алфавитов, но и прочие специальные символы (знаки препинания, вопросительные, восклицательные знаки и т.д.). Пробел так же, как и любой другой символ занимает память при его использовании/наличии.

Само вычисление необходимого количества памяти происходит по формуле объёма информации:

Формула объёма информации
Формула объёма информации
  • I – объём информации (сколько весит файл/сообщение);
  • K – количество символов в сообщении/в файле;
  • i – количество информации (сколько памяти занимает один символ).

У этих переменных есть свои единицы измерения. Для количества символов – символы. А для объёма информации и количества информации — это бит, байт, кбайт и т.д.

Единицы измерения информации
Единицы измерения информации

Теперь, после некоторого введения в теорию мы обладаем инструментами для решения данной задачи. Осталось только определить, как применить полученные знания и каков алгоритм наших действий.

Задача №1

В кодировке КОИ-8 каждый символ кодируется 8 битами. Андрей написал текст (в нём нет лишних пробелов):

«Обь, Лена, Волга, Москва, Макензи, Амазонка — реки».

Ученик вычеркнул из списка название одной из рек. Заодно он вычеркнул лишние запятые и пробелы — два пробела не должны идти подряд. При этом размер нового предложения в данной кодировке оказался на 8 байт меньше, чем размер исходного предложения. Напишите в ответе вычеркнутое название реки.

Решение

Теперь попробуем разобрать данную задачу. У нас тут есть кодировка “КОИ-8”, которая говорит нам о том, что каждый символ весит 8 бит. А 8 бит это ровно 1 байт информации. Всё, что заключено в кавычки нас, интересует. Далее ученик вычеркнул слово (название реки) и, окружавшие его, запятую и пробел. После всех этих действий объём сообщения уменьшился на 8 байт.

Теперь мы обладаем всей полезной информацией и можем сделать некоторые выводы и суждения:

  • 1 символ = 1 байту;
  • удалили запятую и пробел – минус два символа, то есть 2 байта;
  • 8 байт – 2 байта = 6 байт;
  • 6 байт = 6 символов (в данном случае букв);
  • Следовательно, необходимо найти слово (в данном случае название реки), в котором есть ровно шесть букв – Москва.

Существуют задачи, где необходимо посчитать какое количество байт будет весить файл. Попробуем разобраться с этим видом задания.

Задача №2

Статья, набранная на компьютере, содержит 20 страниц, на каждой странице 40 строк, в каждой строке 48 символов. В одном из представлений Unicode каждый символ кодируется двумя байтами. Определите информационный объём статьи в Кбайтах в этом варианте представления Unicode.

Решение

Как можем заметить тут речь идёт о файле, в котором есть 20 страниц. В каждой странице 40 строк и на каждой строке 48 символов. Исходя из этих значений найдём сколько ВСЕГО символов в файле. Также сказано что каждый символ занимает (весит) 2 байта информации. Следовательно, умножив общее количество символов на вес символа, найдём информационный объём файла (сколько он будет весить на компьютере). На словах вроде решили, теперь решим и “на бумаге”.

Для начала найдем количество символов:

Расчёт количества символов в файле
Расчёт количества символов в файле

После этого никто не мешает найти объем информации:

Расчёт объёма информации файла по формуле
Расчёт объёма информации файла по формуле

Получили достаточно большой ответ. Поскольку здесь мы умножали количество символов на байты (их вес), то и ответ получился тоже в байтах. Если бы умножали на бит, то и информационный объём тоже был бы в единицах измерения — бит. Но в самом задание сказано определить информационный объём в Кбайтах. Для этого необходимо полученное число разделить на 1024 (исходя из таблицы переводов сверху).

Перевод количества информации из байт в килобайты
Перевод количества информации из байт в килобайты

Вышел достаточно лаконичный ответ – 75 Кбайт.

Понравилась статья? Хочешь разбираться в информатике, программировании и уметь работать в разных программах? Тогда ставь лайк, подпишись на канал и поделись статьей с друзьями!

Читайте также:

#информатика #огэ #разбор #задания #решение #экзамен

Добавить комментарий