Как найти вес текста в информатике

Задачи на определение информационного объема текста

Проверяется умение оценивать количественные параметры информационных объектов.

Теоретический материал:

N = 2i , где N – мощность алфавита (количество символов в используемом
алфавите),

i – информационный объем одного символа (информационный
вес символа), бит

I = K*i, где I – информационный объем текстового документа (файла),

K – количество символов в тексте

Задача 1.

Считаем количество символов в заданном тексте (перед и после тире – пробел, после знаков препинания, кроме последнего – пробел, пробел – это тоже символ). В результате получаем – 52 символа в тексте.

Дано:

i = 16 бит

K = 52

I – ?

Решение:

I = K*i

I = 52*16бит = 832бит (такой ответ есть – 2)

Ответ: 2

Задача 2.

Дано:

K = 16*35*64 – количество символов в статье

i = 8 бит

I – ?

Решение: Чтобы перевести ответ в Кбайты нужно разделить результат на 8 и на 1024 (8=23, 1024=210)

I=16*35*64*8 бит==35Кбайт Ответ: 4

Задача 3.

Пусть x – это количество строк на каждой странице, тогда K=10*x*64 – количество символов в тексте рассказа.

Дано:

I = 15 Кбайт

K =10*x*64

i = 2 байта

x – ?

Решение:

Переведем информационный объем текста из Кбайт в байты.

I = 15 Кбайт = 15*1024 байт (не перемножаем)

Подставим все данные в формулу для измерения количества информации в тексте.

I = K*i

15*1024 = 10*x*64*2

Выразим из полученного выражения x

x = – количество строк на каждой странице – 4

Ответ: 4

Задачи для самостоятельного решения:

Задача 1.

Задача 2.

Задача 3.

Задача 4.

Задача 5.

Задача 6.

Задача 7.

Задачи взяты с сайта fipi.ru из открытого банка заданий (с.1-7)

§ 1.6. Измерение информации

Информатика. 7 класса. Босова Л.Л. Оглавление


Ключевые слова:

  • бит
  • информационный вес символа
  • информационный объём сообщения
  • единицы измерения информации

1.6.1. Алфавитный подход к измерению информации

Одно и то же сообщение может нести много информации для одного человека и не нести её совсем для другого человека. При таком подходе количество информации определить однозначно затруднительно.

Алфавитный подход позволяет измерить информационный объём сообщения, представленного на некотором языке (естественном или формальном), независимо от его содержания.

Для количественного выражения любой величины необходима, прежде всего, единица измерения. Измерение осуществляется путём сопоставления измеряемой величины с единицей измерения. Сколько раз единица измерения «укладывается» в измеряемой величине, таков и результат измерения.

При алфавитном подходе считается, что каждый символ некоторого сообщения имеет определённый информационный вес — несёт фиксированное количество информации. Все символы одного алфавита имеют один и тот же вес, зависящий от мощности алфавита. Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется 1 бит.

Обратите внимание, что название единицы измерения информации «бит» (bit) происходит от английского словосочетания binary digit — «двоичная цифра».

За минимальную единицу измерения информации принят 1 бит. Считается, что таков информационный вес символа двоичного алфавита.

1.6.2. Информационный вес символа произвольного алфавита

Ранее мы выяснили, что алфавит любого естественного или формального языка можно заменить двоичным алфавитом. При этом мощность исходного алфавита N связана с разрядностью двоичного кода i, требуемой для кодирования всех символов исходного алфавита, соотношением: N = 2i.

Разрядность двоичного кода принято считать информационным весом символа алфавита. Информационный вес символа алфавита выражается в битах.

Информационный вес символа алфавита i и мощность алфавита N связаны между собой соотношением: N = 2i.

Задача 1. Алфавит племени Пульти содержит 8 символов. Каков информационный вес символа этого алфавита?

Решение. Составим краткую запись условия задачи.

§ 1.6. Измерение информации

Известно соотношение, связывающее величины i и N : N = 2i.

С учётом исходных данных: 8 = 2i. Отсюда: i = 3.

Полная запись решения в тетради может выглядеть так:

§ 1.6. Измерение информации

1.6.3. Информационный объём сообщения

Информационный объём сообщения (количество информации в сообщении), представленного символами естественного или формального языка, складывается из информационных весов составляющих его символов.

Информационный объём сообщения I равен произведению количества символов в сообщении К на информационный вес символа алфавита i;I = К • i.

Задача 2. Сообщение, записанное буквами 32-символьного алфавита, содержит 140 символов. Какое количество информации оно несёт?

§ 1.6. Измерение информации

Задача 3. Информационное сообщение объёмом 720 битов состоит из 180 символов. Какова мощность алфавита, с помощью которого записано это сообщение?

§ 1.6. Измерение информации

1.6.4. Единицы измерения информации

В наше время подготовка текстов в основном осуществляется с помощью компьютеров. Можно говорить о «компьютерном алфавите», включающем следующие символы: строчные и прописные русские и латинские буквы, цифры, знаки препинания, знаки арифметических операций, скобки и др. Такой алфавит содержит 256 символов. Поскольку 256 = 28, информационный вес каждого символа этого алфавита равен 8 битам. Величина, равная восьми битам, называется байтом. 1 байт — информационный вес символа алфавита мощностью 256.

1 байт = 8 битов

Бит и байт — «мелкие» единицы измерения. На практике для измерения информационных объёмов используются более крупные единицы:

1 килобайт = 1 Кб = 1024 байта = 210 байтов
1 мегабайт = 1 Мб = 1024 Кб = 210 Кб = 220 байтов
1 гигабайт = 1 Гб = 1024 Мб = 210 Мб = 220 Кб = 230 байтов
1 терабайт = 1 Тб = 1024 Гб = 210 Гб = 220 Мб = 230 Кб = 240 байтов

Задача 4. Информационное сообщение объёмом 4 Кбайта состоит из 4096 символов. Каков информационный вес символа используемого алфавита? Сколько символов содержит алфавит, с помощью которого записано это сообщение?

§ 1.6. Измерение информации

Ответ: 8 битов, 256 символов.

Задача 5. В велокроссе участвуют 128 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер цепочкой из нулей и единиц минимальной длины, одинаковой для каждого спортсмена. Каков будет информационный объём сообщения, записанного устройством после того, как промежуточный финиш пройдут 80 велосипедистов?

Решение. Номера 128 участников кодируются с помощью двоичного алфавита. Требуемая разрядность двоичного кода (длина цепочки) равна 7, так как 128 = 27. Иначе говоря, зафиксированное устройством сообщение о том, что промежуточный финиш прошёл один велосипедист, несёт 7 битов информации. Когда промежуточный финиш пройдут 80 спортсменов, устройство запишет 80 • 7 = 560 битов, или 70 байтов информации.

Ответ: 70 байтов.


Самое главное.

При алфавитном подходе считается, что каждый символ некоторого сообщения имеет опредёленный информационный вес — несёт фиксированное количество информации.

1 бит — минимальная единица измерения информации.

Информационный вес символа алфавита i и мощность алфавита N связаны между собой соотношением: N = 2i.

Информационный объём сообщения I равен произведению количества символов в сообщении К на информационный вес символа алфавита i: I = K•i.

1 байт = 8 битов.

Байт, килобайт, мегабайт, гигабайт, терабайт — единицы измерения информации. Каждая следующая единица больше предыдущей в 1024 (210) раза.


Вопросы и задания.

1.Ознакомтесь с материалами презентации к параграфу, содержащейся в электронном приложении к учебнику. Используйте эти материалы при подготовке ответов на вопросы и выполнении заданий.

2. В чём суть алфавитного подхода к измерению информации?

3. Что принято за минимальную единицу измерения информации?

4. Что нужно знать для определения информационного веса симво­ла алфавита некоторого естественного или формального языка?

5. Определите информационный вес i символа алфавита мощ­ностью N, заполняя таблицу

6. Как определить информационный объём сообщения, представлен­ного символами некоторого естественного или формального языка?

7. Определите количество информации в сообщении из Ксимво­лов алфавита мощностью N, заполняя таблицу

8. Племя Мульти пишет письма, пользуясь 16-символьным алфави­том. Племя Пульти пользуется 32-символьным алфавитом. Вож­ди племён обменялись письмами. Письмо племени Мульти содер­жит 120 символов, — а письмо племени Пульти — 96. Сравните информационные объёмы сообщений, содержащихся в письмах

9. Информационное сообщение объёмом 650 битов состоит из 130 символов. Каков информационный вес каждого символа этого сообщения?

10. Выразите количество информации в различных единицах, заполняя таблицу

11. Информационное сообщение объёмом 375 байтов состоит из 500 символов. Каков информационный вес каждого символа этого сообщения? Какова мощность алфавита, с помощью кото­рого было записано это сообщение?

12. Для записи текста использовался 64-символьный алфавит. Какое количество информации в байтах содержат 3 страницы текста, если на каждой странице расположено 40 строк по 60 символов в строке?

13. Сообщение занимает 6 страниц по 40 строк, в каждой строке за­писано по 60 символов. Информационный объём всего сообще­ния равен 9000 байтам. Каков информационный вес одного сим­вола? Сколько символов в алфавите языка, на котором записано это сообщение?

14. Метеорологическая станция ведёт наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 0 до 100 процентов, которое записывается цепочкой из нулей и единиц минимальной длины, одинаковой для каждого изме­рения. Станция сделала 8192 измерения. Определите информа­ционный объём результатов наблюдений.

15. Племя Пульти пользуется 32-символьным алфавитом. Свод основных законов племени хранится на 512 глиняных таблич­ках, на каждую из которых нанесено ровно 256 символов. Какое количество информации содержится на каждом носителе? Какое количество информации заключено во всём своде законов?


Оглавление

§ 1.5. Двоичное кодирование

§ 1.6. Измерение информации

Тестовые задания для самоконтроля


1.алфавит – это множество символов, используемых при записи текста

2.Полное количество символов в алфавите называется мощностью (размером) алфавита.

3.Информационный объем текста равен произведению количества символов в тексте на вес одного символа I=K*i

4.задача

запишем условие N=64, K=100, I-?

решение: из формулы мощности алфавита найдем вес одного символа

N=2^i, 64=2^i, 2^6=2^i, i=6 бит

вычислим информационный объем: I=100*6=600 бит

5.байт, килобайт, мегабайт и гигабайт – это единицы измерения информации

6.задача

запишем условие: N=256, I=3.5 Кб, K=?

решение: вычислим вес одного символа

256=2^i, i=8 бит

выразим информационный объем в битах

I=3,5Кб=3,5*1024*8=28672 бита

посчитаем количество символов К=I/i=28672/8=3584 символа

7.задача

запишем условие: К1=К2, N1=32, N2=64, I1/I2=?

решение: вычислим вес одного символа первого алфавита

32=2^i, i1=5 бита

вычислим вес одного символа второго алфавита

64=2^i, i1=6 бит

запишем формулу для нахождения информационного объема первого алфавита I1=K1*i1

запишем формулу для нахождения информационного объема второго алфавита I2=K2*i2

поскольку количество символов в текстах одинаковое, то можно записать отношение

I1/I2=i1/i2=5/6              это и есть ответ

Подробнее – на Znanija.com – https://znanija.com/task/20197289#readmore

Определить объём текста

Онлайн калькулятор легко и непринужденно вычислит объем текста в битах, байтах и килобайтах. Для перевода в другие единицы измерения данных воспользуйтесь онлайн конвертером.

Информационный вес (объем) символа текста определяется для следующих кодировок:
Unicode UTF-8
Unicode UTF-16
ASCII, ANSI, Windows-1251

Текст

Символов 0

Символов без учета пробелов 0

Уникальных символов 0

Слов 0

Слов (буквенных) 0

Уникальных слов 0

Строк 0

Абзацев 0

Предложений 0

Средняя длина слова 0

Время чтения 0 сек

Букв 0

Русских букв 0

Латинских букв 0

Гласных букв 0

Согласных букв 0

Слогов 0

Цифр 0

Чисел 0

Пробелов 0

Остальных знаков 0

Знаков препинания 0

Объем текста (Unicode UTF-8) бит 0

Объем текста (Unicode UTF-8) байт 0

Объем текста (Unicode UTF-8) килобайт 0

Объем текста (Unicode UTF-16) бит 0

Объем текста (Unicode UTF-16) байт 0

Объем текста (Unicode UTF-16) килобайт 0

Объем текста (ASCII, ANSI, Windows-1251) бит 0

Объем текста (ASCII, ANSI, Windows-1251) байт 0

Объем текста (ASCII, ANSI, Windows-1251) килобайт 0

Почему на windows сохраняя текст блокноте перенос строки занимает – 4 байта в юникоде или 2 байта в анси?
Это историческое явление, которое берёт начало с дос, последовательность OD OA (nr ) в виндовс используются чтоб был единообразный вывод на терминал независимо консоль это или принтер. Но для вывода просто на консоль достаточно только n.

В юникоде есть символы которые весят 4 байта, например эмоджи: 🙃

×

Пожалуйста напишите с чем связна такая низкая оценка:

×

Для установки калькулятора на iPhone – просто добавьте страницу
«На главный экран»

Для установки калькулятора на Android – просто добавьте страницу
«На главный экран»

Как определить информационный объем сообщения?

Анонимный вопрос

4 декабря 2018  · 24,7 K

Информационный объём 1 сообщения вычисляется по формуле: I = К · i, где I — информационный объем сообщения, K — количество символов в сообщении, i — информационный вес одного символа. Вес одного символа, набранного на компьютере, зависит от того, какую кодировку используют.

3,1 K

Комментировать ответ…Комментировать…

Чтобы сосчитать информационный объем всего сообщения необходимо знать из скольких символов оно состоит и какой в нем используется алфавит. Дело в том, что от алфавита зависит, сколько «весит» один символ.

Как только эти данные будут известны, можно умножить количество символов на информационный объем одного символа.

13,5 K

Комментировать ответ…Комментировать…

Добавить комментарий