Как найти вес одного слова

Каждый объект в компьютере (или любом другом электронном устройстве) имеет свой информационный объём, то есть то количество информации, которое он занимает в памяти устройства.

Например, текстовый документ на (2)–(3) страницы может иметь информационный объём (150) Кб.

Изображение в хорошем качестве — (2)–(4) Мб.

Аудиофайл с песней на (3) минуты — около (6) Мб.

Рассмотрим измерение текстовой информации в компьютере.

Размер текстового сообщения зависит от того, с помощью какого алфавита он был написан и сколько в нём символов.

Алфавит (N) — это количество символов в некотором языке.

Чем больше алфавит, тем больше информационный вес одного символа.

Информационный вес одного символа (i) — это количество информации, которое отводится на один символ.

Обрати внимание!

Они связаны формулой:

N=2i

.

Например, в русском алфавите (33) буквы, вычислим информационный вес одного символа по формуле:

33=2i,i≈5

 бит. То есть вес одного символа (буквы) — (5) бит.

Представим, что в тетрадке записана следующая строка: «Мама сидела за столом».

Как посчитать, сколько информации несёт в себе это сообщение?

Нам известно, сколько весит один символ — (5) бит, можно подсчитать количество символов в данном сообщении — (18), соответственно, чтобы найти, сколько всего информации несёт в себе это сообщение, нужно перемножить информационный вес одного символа и количество символов в сообщении.

Обрати внимание!

Можно вывести формулу:

I=K×i

,

где (I) — информационный объём сообщения;

(K) — количество символов в сообщении;

(i) — информационный вес одного символа. 

Но мы будем работать с компьютерным текстом. Там алфавит намного больше.

Как ты думаешь, сколько всего символов можно ввести с клавиатуры?

Ты скажешь «много» и будешь прав: с клавиатуры можно ввести русские/английские буквы, цифры, специальные знаки и т. д. Всего (256) символов.

Посчитаем информационный вес одного символа компьютерного алфавита.

N=2i.256=2i.256=28.

Один символ компьютерного алфавита весит (8) бит или (1) байт.

Решим задачу.

Найди информационный объём текста (в битах), написанного с помощью компьютера:

«Информация — это сведения об окружающем нас мире».

Текст напечатан на компьютере, поэтому один символ весит (8) бит или (1) байт.

Всего символов в сообщении между кавычками: (48). При подсчёте символов учитываются все символы и пробелы.

Запишем решение:

I=K×i.I=48×8.I=384бит.

Ответ: (384) бита.

Задача

Найди информационный объём сообщения (в байтах), который напечатали школьники на уроке информатики, если оно содержит (2) страницы, на каждой странице по (12) строк, и в каждой строке (28) символов.

Оформим решение задачи.

Дано:

K=2×12×28.i=1байт.

Чтобы посчитать, сколько символов всего в сообщении, нужно умножить количество страниц на количество строк и на количество символов в каждой строке. 

В условии сказано, что текст напечатали, поэтому один символ равен (1) байту.

I=K×i.I=2×12×28×1.I=672байта.

Найти: (I) — ? Ответ: (672) байта.

Алфавитный подход к измерению информации

Из школьных уроков вы знаете, что масса измеряется с помощью граммов, а единицей измерения для времени является секунда. Информацию также можно измерить, и для этого существует три подхода: алфавитный, содержательный и вероятностный. Рассмотрим первый из них.

Сущность алфавитного подхода

Алфавитный подход применяется в цифровых системах хранения и передачи информации, в которых используется двоичный способ кодирования информации, то есть с помощью 0 и 1. Для определения количества информации алфавитный подход учитывает только объем кода, а не содержание информации. Итак, с помощью i-разрядного двоичного кода можно закодировать алфавит, состоящий из N символов, при этом N является целой степенью двойки и называется мощность алфавита.

Пример.

Если i = 2, то в алфавите получится всего 4 символа (N = 4):

00 01 10 11

Пример.

Если i = 3, то мощность алфавита будет равна 8 символов (N = 8):

000 001 010 011 100 101 110 111

Из примеров видно, что величина i – это длина двоичного кода, с помощью которого кодируется один символ алфавита, она называется информационным весом символа и определяется из уравнения:

(2^{i} = N)

Единицы измерения информации

В двоичном коде цифра (0 или 1) несет одну наименьшую единицу информации, которая называется 1 бит.

Помимо битов существуют более крупные единицы измерения информации. Чтобы не запутаться при решении задач, следует запомнить таблицу переводов, представленную ниже:

1 байт = 23 бит = 8 бит
1 Кб (килобайт) = 210 байтов = 1024 байта
1 Мб (мегабайт) = 210 Кб = 1024 Кб
1 Гб (гигабайт) = 210 Мб = 1024 Мб
1 Тб (терабайт) = 210 Гб = 1024 Гб

Рассмотрев формулу информационного веса символа и единицы измерения информации, решим задачу.

Пример. Представим, что нам надо закодировать латинский алфавит, который содержит 26 символов. Сколько бит потребуется для кодирования каждого символа?

Давайте попробуем посчитать. Кодировка предполагает, что каждому символу алфавита мы ставим в соответствие уникальный набор битов, т.е. у всех символов эти наборы разные. Количество комбинаций N, которое можно составить из i битов (каждый их них может быть либо 0, либо 1), будет равно:

(N = 2^{i})

В нашем случае N = 26. Получаем

(26 = 2^{i})

26 не является степенью двойки, но это не страшно — нам надо найти такое минимальное i, чтобы 2i точно было больше 26:

  • 24 = 16 – не подходит (получается, что с помощью 4 бит мы можем закодировать только 16 символов);

  • 25 = 32 — подходит.

Нашли, что i = 5, т.е. вес одного символа — 5 бит.

Информационный объем

Теперь, когда мы умеем находить вес одного символа, рассмотрим, как находить информационный объем слова, предложения или текста. Для этого обозначим буквой K – количество символов в тексте, записанном с помощью алфавита, i – информационный вес одного символа, тогда информационный объем I текста в битах можно выразить с помощью формулы:

(I = K bullet i)

Пример. Используя данные с прошлого примера, а именно, что i = 5, найдем какой объем информации будет нужен для хранения слова из 10 закодированных нами букв?

Одна буква весит 5 бит, значит, 10 букв будут весить 5×10 = 50 бит.

Содержание материала

  1. Что это такое?
  2. Видео
  3. Вычисление мощности алфавита
  4. Что такое мощность алфавита: начальное понятие
  5. Как определить объем информации в тексте?
  6. Рассчитываем мощность
  7. Правильные названия единиц измерения данных
  8. Как найти мощность алфавита и использование его в компьютерных терминов

Что это такое?

Понятие «мощность алфавита» лежит в основе изучения информатики. Многочисленный набор символов принято называть — алфавит. Сумма всех символов выбранного языка называется мощностью. Следует вывод: мощность алфавита — это количество символов, которое используется в выбранном языке. Весь перечень используемых значков может содержать числа, различного характера скобки, специальные символы, запятые, двоеточия, точки, пробел и т.д.

Все же обобщенное понятие в информатике не учитывает расчеты информационной величины сообщения, которое содержит знаки препинания, числа и другое. Здесь необходим другой метод. Суть в том, что отдельная литера, цифра или скобка содержит собственный информационный объем данных. По этому информационному коду мозг компьютера опознает, что было напечатано. Машина разбирает введенные данные только в двоичном коде в виде единицы и нуля, в этом и заключается суть компьютерной науки.В результате выходит, что любой символ можно закод

В результате выходит, что любой символ можно закодировать путем различной расстановки нулей и единиц. Наименьшая последовательность, которая обозначает какую-либо букву или цифру, содержит всего два элемента. Информационный вес одного символа принято представлять в виде стандартной информационной единицы измерения, наименование которой «бит». Восемь битов равны одному байту.

Для определения количество информации, содержащейся в сообщении используют формулу Хартли: N=2i.

Формула предназначена для расчета мощности используемого языка, которая обозначается буквой N (информационный вес, или объем), i – количество бит (в единице слова. Т.е. вес символа).

Формулировка теории о количестве информации в набранной фразе: I=K*i. Здесь К – это количество символов в сообщении, I- информационная масса значка.

  Что такое url адрес и его структура

Количество символов входящих в русский алфавит — 33 буквы. Выходит, что мощность взятого языка N=33. Английский язык содержит 26 букв и его мощность — 26. Но есть и клавиатурный язык, состоящий из букв русского языка и дополнительных знаков: 33 буквы, 10 чисел, 11 знаков препинания, скобки и пробел = 57.

Видео

Вычисление мощности алфавита

Численность знаков в коде и мощность алфавита всегда выражают определённую зависимость. Для того чтобы определить информационный объём, который заключается в сообщении, прибегают к специальному способу измерения, которое выражается в формуле мощности алфавита: N = 2 в n -ной степени.

Эта формула была изобретена американским инженером Ральфом Хартли более сотни лет тому назад. Она применяется для работы с равновероятными событиями и используется для определения мощности конкретного буквенного набора, которая обозначается буквой N (информационная масса или объём). n означает численность бит в словесной единице, иными словами, количество знаков внутри двоичного кода. Так, если n равен 1, то N тоже равен 1, при n = 2 N = 4, при n = 3 N = 8, при n = 4 N = 16.

Чтобы сформулировать теорию о численности информации в набранном словосочетании, пользуются формулой I=K*i. В этом случае К обозначает численность всех символов в предложении, а i — это информационная масса символа.

При ответе на вопрос, как найти мощность алфавита, нужно сказать, что в русском языке 33 буквы, поэтому это можно выразить как N = 33. Для сравнения, аналогичный показатель в английском, немецком и французском языках равняется 26, в испанском — 27. Венгерский язык, например, является 40-символьным.

Существует также и клавиатурный язык, куда входят не только буквы, но и дополнительные знаки. Так, в русском языке есть ещё 10 цифр и 11 символов, а также пробел и пара скобок. Их мощность прибавляется к аналогичному буквенному показателю, и на выходе получается N = 33+10+11+1+2=57. В некоторых случаях букву «ё» не выделяют в качестве отдельного самостоятельного символа, и в таком случае полная мощность русского алфавита становится равна 56.

Что такое мощность алфавита: начальное понятие

Итак, если следовать общепринятому правилу, что конечное значение какой-либо величины представляет собой параметр, определяющий, какое количество раз эталонная единица уложена в измеряемой величине, можно сделать вывод: мощность алфавита есть полное количество символов, использующихся для того или иного языка.

Чтобы было понятнее, оставим пока вопрос о том, как находить мощность алфавита, в стороне, и обратим внимание на сами символы, естественно, с точки зрения информационных технологий. Грубо говоря, полный список используемых символов содержит литеры, цифры, всевозможные скобки, специальные символы, знаки препинания, и т.д. Однако, если подходить к вопросу о том, что такое мощность алфавита именно компьютерным способом, сюда следует включить еще и пробел (единичный разрыв между словами или другими символами).

Возьмем в качестве примера русский язык, вернее, клавиатурную раскладку. Исходя из вышесказанного, полный перечень содержит 33 литеры, 10 цифр и 11 специальных знаков. Таким образом, полная мощность алфавита равна 54.

Как определить объем информации в тексте?

Обычно всегда при наборе текста можно использовать жирные, заглавные, и буквы с курсивом, знаки препинания, разнообразные скобы, операции вычисления и т.д. По расчетам  получается, что мощность компьютерного алфавита — это 256 символов и вариантов. Следуя формуле Хартли, N=256, тогда масса каждого значка (i) в клавиатурном алфавите равна восьми битам, то есть один байт.

Рассчитываем мощность

Скорее всего, вам уже известно из школьного курса информатики, что в современных вычислительных системах, построенных на архитектуре фон Неймана, используется двоичная система кодировки информации. Так кодируются как программы, так и данные.

Для того чтобы представить текст в вычислительной системе, используют равномерный код из восьми разрядов. Равномерным код считается потому, что содержит фиксированный набор элементов — 0 и 1. Значения в таком коде задаются определенным порядком этих элементов. С помощью восьмиразрядного кода мы можем закодировать сообщения весом 256 бит, ведь по формуле Хартли: M8=28= 256 бит информации.

Такая ситуация с кодировкой символов двоичным кодом сложилась исторически. Но теоретически мы могли бы использовать и другие алфавиты для представления данных. Так, к примеру, в четырехзнаковом алфавите у каждого символа был бы вес не один, а два бита, в восьмизнаковом — 3 бита и так далее. Это рассчитывается с помощью двоичного логарифма, который был приведен выше (i = log2M).

Так как в алфавите мощностью 256 бит для обозначения одного символа отводится восемь двоичных разрядов, было решено ввести дополнительную меру информации — байт. Один байт содержит один символ кодовой таблицы ASCII и содержит в себе восемь бит.

Правильные названия единиц измерения данных

Для того чтобы устранить некорректности и неудобства, в марте 1999 года Международной комиссией в области электротехники были утверждены новые приставки к единицам, которые используются для определения объема информации в электронной вычислительной технике. Такими приставками стали «меби», «киби», «гиби», «теби», «эксби», «пети». Пока эти единицы еще не прижились, так что, скорее всего, необходимо время для введения этого стандарта и начала широкого применения. Как осуществлять переход от классических единиц к новоутвержденным, вы можете определить по следующей таблице:

Предположим, что мы имеем текст, который содержит K символов. Тогда, используя алфавитный подход, можно вычислить объем информации V, который в нем содержится. Он будет равен произведению мощности алфавита на информационный вес одного символа в нем.

По формуле Хартли мы знаем, как вычислить объем информации через двоичный логарифм. Предположив, что количество знаков алфавита равно N и количество знаков в записи информационного сообщения равняется K, получим такую формулу для вычисления информационного объема сообщения:

V = K ⋅ log2 N

Алфавитный подход свидетельствует о том, что информационный объем будет зависеть только лишь от мощности алфавита и размера сообщений (то есть количества символов в нем), но никак не будет связан со смысловым содержанием для человека.

Как найти мощность алфавита и использование его в компьютерных терминов

А теперь попробуем взглянуть на зависимость, которая выражает количество цифр в коде и мощности алфавита. Формула, где N-мощность алфавита, алфавитный и B-количество цифр в двоичный код, будет выглядеть так:

Н=2В

Это, 21=2, 22=4, 23=8, 24=16 и т. д. грубо говоря, нужное количество цифр двоичного кода веса персонажа. В информационном плане это выглядит так:

Мощность алфавита, Н

2

4

8

16

Количество код символа, б

1 бит

2 биты

3 бита

4 бита

Теги

Содержание

  1. Как определить объем текста
  2. Достаточный алфавит
  3. 1 байт = 8 бит.
  4. Единицы измерения количества информации:
  5. Информационный объем текста
  6. Ответ: Информационный объем текста 0,34 Мб.
  7. Задача:
  8. Измерение информации. Алфавитный подход к измерению информации. Мощность алфавита. Информационный объем текста
  9. Учитель информатики
  10. Сайт учителя информатики. Технологические карты уроков, Подготовка к ОГЭ и ЕГЭ, полезный материал и многое другое.
  11. § 1.6. Измерение информации
  12. 1.6.1. Алфавитный подход к измерению информации
  13. 1.6.2. Информационный вес символа произвольного алфавита
  14. 1.6.3. Информационный объём сообщения
  15. 1.6.4. Единицы измерения информации
  16. Самое главное.
  17. Вопросы и задания.
  18. Что такое мощность алфавита, как определить информационный объем
  19. Что это такое?
  20. Как определить объем информации в тексте?
  21. Примеры расчета мощности и объема
  22. Урок 5 Измерение информации (алфавитный подход). Единицы измерения информации
  23. §4. Измерение информации
  24. Алфавитный подход к измерению информации
  25. Алфавит. Мощность алфавита
  26. Информационный вес символа
  27. Информационный объем текста. Единицы информации
  28. Коротко о главном
  29. Вопросы и задания
  30. Электронное приложение к уроку

Как определить объем текста

Информационный объем текста складывается из информационных весов составляющих его символов.

Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видео информацию. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется всего два символа 0 и 1. Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1).

Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц – машинным языком.

Какой длины должен быть двоичный код, чтобы с его помощью можно было закодировать васе символы клавиатуры компьютера?

Достаточный алфавит

В алфавит мощностью 256 символов можно поместить практически все символы, которые есть на клавиатуре. Такой алфавит называется достаточным.

Единице в 8 бит присвоили свое название – байт.

1 байт = 8 бит.

Таким образом, информационный вес одного символа достаточного алфавита равен 1 байту.

Для измерения больших информационных объемов используются более крупные единицы измерения информации:

Единицы измерения количества информации:

1 килобайт = 1 Кб = 1024 байта

1 мегабайт = 1 Мб = 1024 Кб

1 гигабайт = 1 Гб = 1024 Гб

Информационный объем текста

Книга содержит 150 страниц.
На каждой странице – 40 строк.
В каждой строке 60 символов (включая пробелы).
Найти информационный объем текста.

1. Количество символов в книге:

60 * 40 * 150 = 360 000 символов.

2. Т.к. 1 символ весит 1 байт, информационный объем книги равен

3. Переведем байты в более крупные единицы:

360 000 / 1024 = 351,56 Кб

351,56 / 1024 = 0,34 Мб

Ответ: Информационный объем текста 0,34 Мб.

Задача:

Информационный объем текста, подготовленного с помощью компьютера, равен 3,5 Кб. Сколько символов содержит этот текст?

Информационный объем текста 3,5 Мб. Найти количество символов в тексте.

1. Переведем объем из Мб в байты:

3,5 Мб * 1024 = 3584 Кб

3584 Кб * 1024 = 3 670 016 байт

2. Т.к. 1 символ весит 1 байт, количество символов в тексте равно

SEO-анализ текста от Text.ru – это уникальный сервис, не имеющий аналогов. Возможность подсветки «воды», заспамленности и ключей в тексте позволяет сделать анализ текста интерактивным и легким для восприятия.

SEO-анализ текста включает в себя:

С помощью данного онлайн-сервиса можно определить число слов в тексте, а также количество символов с пробелами и без них.

Возможность нахождения поисковых ключей в тексте и определения их количества полезна как для написания нового текста, так и для оптимизации уже существующего. Расположение ключевых слов по группам и по частоте сделает навигацию по ключам удобной и быстрой. Сервис также найдет и морфологические варианты ключей, которые выделятся в тексте при нажатии на нужное ключевое слово.

Данный параметр отображает процент наличия в тексте стоп-слов, фразеологизмов, а также словесных оборотов, фраз, соединительных слов, являющихся не значимыми и не несущими смысловой нагрузки. Небольшое содержание «воды» в тексте является естественным показателем, при этом:

Процент заспамленности текста отражает количество поисковых ключевых слов в тексте. Чем больше в тексте ключевых слов, тем выше его заспамленность:

Данный параметр показывает количество слов, состоящих из букв различных алфавитов. Часто это буквы русского и английского языка, например, слово «стол», где «о» – буква английского алфавита. Некоторые копирайтеры заменяют в русских словах часть букв на английские, чтобы обманным путем повысить уникальность текста. SEO-анализ текста от Text.ru успешно выявляет такие слова.

SEO-анализ текста доступен через API. Подробнее в API-проверке.

К огда человек только начинает учиться копирайтингу, автор испытывает уйму сложностей даже в таких простых вещах, как определение объёма текста. Кажется: сущая мелочь, но и с ней надо уметь справиться.

Как узнать объём текста? Предлагаю вашему вниманию несколько удобных вариантов.

Редактор Word (или другая программа для работы с текстом). Когда вы набираете символы в Office, внизу страницы ведётся подсчёт слов и символов с пробелами.

Чтоб увидеть всю статистику, кликните на надпись внизу, и перед глазами появится табличка, как на картинке (изображение увеличивается).

Подсчёт объёма текста в Word

TextAnalyzer. Об этом сервисе для вебмастеров я уже писала. Онлайн-инструмент выручает меня в работе над SEO-статьями. Закиньте контент в редактор, кликните на кнопку, и всего через две секунды вы сможете узнать объём текста (с пробелами и без).

Также посчитать объём текста легко в Istio.com, Content Watch, 1y.ru, text.ru или других сервисах для «сеошников», копирайтеров, журналистов.

Как видите, узнать объём текста не составляет никакого труда. В следующий раз расскажу в блоге о том, как определить объём текста с учётом ключевых слов. Этот материал будет полезен тем, кто осваивает SEO-копирайтинг. Удачи начинающим авторам!

Источник

Измерение информации. Алфавитный подход к измерению информации. Мощность алфавита. Информационный объем текста

Алфавитный подход к измерению информации Вам хорошо известно, что для измерения таких величин, как, например, расстояние, масса, время, существуют эталонные единицы. Для расстояния — это метр, для массы — килограмм, для времени — секунда. Измерение происходит путем сопоставления измеряемой величины с эталонной единицей. Сколько раз эталонная единица укладывается в измеряемой величине, таков и результат измерения. Следовательно, и для измерения информации должна быть введена своя эталонная единица. Алфавитный подход позволяет измерять информационный объем текста на некотором языке (естественном или формальном), не связанный с содержанием этого текста.

Алфавит. Мощность алфавита
Под алфавитом мы будем понимать набор букв, знаков препинания, цифр, скобок и др. символов, используемых в тексте. В алфавит также следует включить и пробел, т. е. пропуск между словами.
Полное число символов в алфавите принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из русских букв и отмеченных дополнительных символов равна 54:33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел.

Информационный вес символа
При алфавитном подходе считается, что каждый символ текста имеет определенный информационный вес. Информационный вес символа зависит от мощности алфавита. А каким может быть наименьшее число символов в алфавите? Оно равно двум! Скоро вы узнаете, что такой алфавит используется в компьютере. Он содержит всего 2 символа, которые обозначаются цифрами «0» и «1». Его называют двоичным алфавитом. Изучая устройство и работу компьютера, вы узнаете, как с помощью всего двух символов можно представить любую информацию.

Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит.

Источник

Учитель информатики

Сайт учителя информатики. Технологические карты уроков, Подготовка к ОГЭ и ЕГЭ, полезный материал и многое другое.

§ 1.6. Измерение информации

Информатика. 7 класса. Босова Л.Л. Оглавление

1.6.1. Алфавитный подход к измерению информации

Одно и то же сообщение может нести много информации для одного человека и не нести её совсем для другого человека. При таком подходе количество информации определить однозначно затруднительно.

Алфавитный подход позволяет измерить информационный объём сообщения, представленного на некотором языке (естественном или формальном), независимо от его содержания.

Для количественного выражения любой величины необходима, прежде всего, единица измерения. Измерение осуществляется путём сопоставления измеряемой величины с единицей измерения. Сколько раз единица измерения «укладывается» в измеряемой величине, таков и результат измерения.

При алфавитном подходе считается, что каждый символ некоторого сообщения имеет определённый информационный вес — несёт фиксированное количество информации. Все символы одного алфавита имеют один и тот же вес, зависящий от мощности алфавита. Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется 1 бит.

Обратите внимание, что название единицы измерения информации «бит» (bit) происходит от английского словосочетания binary digit — «двоичная цифра».

За минимальную единицу измерения информации принят 1 бит. Считается, что таков информационный вес символа двоичного алфавита.

1.6.2. Информационный вес символа произвольного алфавита

Разрядность двоичного кода принято считать информационным весом символа алфавита. Информационный вес символа алфавита выражается в битах.

Задача 1. Алфавит племени Пульти содержит 8 символов. Каков информационный вес символа этого алфавита?

Решение. Составим краткую запись условия задачи.

Полная запись решения в тетради может выглядеть так:

1.6.3. Информационный объём сообщения

Информационный объём сообщения (количество информации в сообщении), представленного символами естественного или формального языка, складывается из информационных весов составляющих его символов.

Информационный объём сообщения I равен произведению количества символов в сообщении К на информационный вес символа алфавита i;I = К • i.

Задача 2. Сообщение, записанное буквами 32-символьного алфавита, содержит 140 символов. Какое количество информации оно несёт?

Задача 3. Информационное сообщение объёмом 720 битов состоит из 180 символов. Какова мощность алфавита, с помощью которого записано это сообщение?

1.6.4. Единицы измерения информации

1 байт = 8 битов

Бит и байт — «мелкие» единицы измерения. На практике для измерения информационных объёмов используются более крупные единицы:

1 килобайт = 1 Кб = 1024 байта = 2 10 байтов
1 мегабайт = 1 Мб = 1024 Кб = 2 10 Кб = 2 20 байтов
1 гигабайт = 1 Гб = 1024 Мб = 2 10 Мб = 2 20 Кб = 2 30 байтов
1 терабайт = 1 Тб = 1024 Гб = 2 10 Гб = 2 20 Мб = 2 30 Кб = 2 40 байтов

Задача 4. Информационное сообщение объёмом 4 Кбайта состоит из 4096 символов. Каков информационный вес символа используемого алфавита? Сколько символов содержит алфавит, с помощью которого записано это сообщение?

Ответ: 8 битов, 256 символов.

Задача 5. В велокроссе участвуют 128 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер цепочкой из нулей и единиц минимальной длины, одинаковой для каждого спортсмена. Каков будет информационный объём сообщения, записанного устройством после того, как промежуточный финиш пройдут 80 велосипедистов?

Ответ: 70 байтов.

Самое главное.

При алфавитном подходе считается, что каждый символ некоторого сообщения имеет опредёленный информационный вес — несёт фиксированное количество информации.

1 бит — минимальная единица измерения информации.

Информационный объём сообщения I равен произведению количества символов в сообщении К на информационный вес символа алфавита i: I = K•i.

Байт, килобайт, мегабайт, гигабайт, терабайт — единицы измерения информации. Каждая следующая единица больше предыдущей в 1024 (210) раза.

Вопросы и задания.

1.Ознакомтесь с материалами презентации к параграфу, содержащейся в электронном приложении к учебнику. Используйте эти материалы при подготовке ответов на вопросы и выполнении заданий.

Источник

Что такое мощность алфавита, как определить информационный объем

В век развития компьютерных технологий, информатики, систем исчисления и многого другого все перечисленные определения имеют немалое влияние на жизнь человека. Большее количество пользователей не слишком полно разбираются в информатике, поэтому проясним, что означает понятие мощность алфавита, как ее вычислить и применить.

Что это такое?

Понятие «мощность алфавита» лежит в основе изучения информатики. Многочисленный набор символов принято называть — алфавит. Сумма всех символов выбранного языка называется мощностью. Следует вывод: мощность алфавита — это количество символов, которое используется в выбранном языке. Весь перечень используемых значков может содержать числа, различного характера скобки, специальные символы, запятые, двоеточия, точки, пробел и т.д.

Все же обобщенное понятие в информатике не учитывает расчеты информационной величины сообщения, которое содержит знаки препинания, числа и другое. Здесь необходим другой метод. Суть в том, что отдельная литера, цифра или скобка содержит собственный информационный объем данных. По этому информационному коду мозг компьютера опознает, что было напечатано. Машина разбирает введенные данные только в двоичном коде в виде единицы и нуля, в этом и заключается суть компьютерной науки.

В результате выходит, что любой символ можно закодировать путем различной расстановки нулей и единиц. Наименьшая последовательность, которая обозначает какую-либо букву или цифру, содержит всего два элемента. Информационный вес одного символа принято представлять в виде стандартной информационной единицы измерения, наименование которой «бит». Восемь битов равны одному байту.

Формула предназначена для расчета мощности используемого языка, которая обозначается буквой N (информационный вес, или объем), i – количество бит (в единице слова. Т.е. вес символа).

Формулировка теории о количестве информации в набранной фразе: I=K*i. Здесь К – это количество символов в сообщении, I- информационная масса значка.

Количество символов входящих в русский алфавит — 33 буквы. Выходит, что мощность взятого языка N=33. Английский язык содержит 26 букв и его мощность — 26. Но есть и клавиатурный язык, состоящий из букв русского языка и дополнительных знаков: 33 буквы, 10 чисел, 11 знаков препинания, скобки и пробел = 57.

Как определить объем информации в тексте?

Обычно всегда при наборе текста можно использовать жирные, заглавные, и буквы с курсивом, знаки препинания, разнообразные скобы, операции вычисления и т.д. По расчетам получается, что мощность компьютерного алфавита — это 256 символов и вариантов. Следуя формуле Хартли, N=256, тогда масса каждого значка (i) в клавиатурном алфавите равна восьми битам, то есть один байт.

Размер напечатанной фразы нужно вычислять по формуле: V=K⋅log2N, N — это численность символов в алфавите, а количество знаков в напечатанной фразе – K. Например, дан любой текст, который уместился на 30 страницах. На каждой из них расположено по 55 строчек, в них по 65 символов. Получается, что на странице будет 50 х 65= 3 575 байт информации.

Примеры расчета мощности и объема

Сколько символов можно закодировать 3 битами?

Приняв информационный вес символа за байт, требуется рассчитать объем информации напечатанного сообщения:

«Белеет парус одинокий

В тумане моря голубом»

В приведенных двух строчках насчитывается 43 инициала (пробелы считаются, но скобки не учитываются), тогда информационный объем вычисляется по формуле, которая приведен ниже:

Источник

Урок 5
Измерение информации (алфавитный подход). Единицы измерения информации

§4. Измерение информации

Основные темы параграфа:

— алфавитный подход к измерению информации;
— алфавит, мощность алфавита;
— информационный вес символа;
— информационный объем текста;
— единицы информации.

Изучаемые вопросы:

— Алфавит, мощность алфавита.
— 1 бит – информационный вес символа двоичного алфавита.
— N=2b – формула для определения информационного веса символа.
— Информационный объём текста
— Единицы измерения информации: байт, килобайт, мегабайт, гигабайт.

Материал для углубленного изучения темы «Измерение информации»

Изучаемые вопросы:

— Содержательный подход к измерению информации
— Неопределенность знаний
— Формула Хартли

Алфавитный подход к измерению информации

Алфавитный подход позволяет измерять информационный объем текста на некотором языке (естественном или формальном), не связанный с содержанием этого текста.

Вам хорошо известно, что существуют единицы измерения таких величин, как, например, расстояние, масса, время. Для расстояния — это метр, для массы — грамм, для времени — секунда. Измерение происходит путем сопоставления измеряемой величины с единицей измерения.

* О другом подходе к измерению информации см. в разделе 1.1 материала для углубленного изучения «Дополнение к главе I».

Сколько раз единица измерения укладывается в измеряемой величине, таков и результат измерения. Следовательно, и для измерения информации должна быть введена своя единица измерения.

Алфавит. Мощность алфавита

Под алфавитом некоторого языка мы будем понимать набор букв, знаков препинания, цифр, скобок и других символов, используемых в тексте. В алфавит также следует включить и пробел, т. е. пропуск между словами.

Полное число символов алфавита принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из русских букв и отмеченных дополнительных символов равна 54: 33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел.

Информационный вес символа

При алфавитном подходе считается, что каждый символ текста имеет определенный информационный вес. Информационный вес символа зависит от мощности алфавита. А каким может быть наименьшее число символов в алфавите? Оно равно двум! Скоро вы узнаете, что такой алфавит используется в компьютере. Он содержит всего 2 символа, которые обозначаются цифрами 0 и 1. Его называют двоичным алфавитом. Изучая устройство и работу компьютера, вы узнаете, как с помощью всего двух символов можно представить любую информацию.

Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит.

С увеличением мощности алфавита увеличивается информационный вес символов этого алфавита. Так один символ из четырехсимвольного алфавита (N = 4) «весит» 2 бита. Объяснение этому можно дать следующее: все символы такого алфавита можно закодировать всеми возможными комбинациями из двух цифр двоичного алфавита. Комбинацию из нескольких (двух, трех и т. д.) знаков двоичного алфавита назовем двоичным кодом.

Используя три двоичные цифры, можно составить 8 различных комбинаций.

Следовательно, если мощность алфавита равна 8, то информационный вес одного символа равен 3 битам.

Четырехзначными двоичными кодами могут быть закодированы все символы 16-символьного алфавита, и т. д.

Найдем зависимость между мощностью алфавита (N) и количеством знаков в коде (b) — разрядностью двоичного кода.

В общем виде это записывается следующим образом:

N = 2b.

Разрядность двоичного кода — это и есть информационный вес символа.

Информационный объем текста. Единицы информации

Информационный объем текста складывается из информационных весов составляющих его символов. Например, следующий текст, записанный с помощью двоичного алфавита:

1101001011000101110010101101000111010010

содержит 40 символов, следовательно, его информационный объем равен 40 битам.

Сегодня для подготовки текстовых документов чаще всего применяются компьютеры. Алфавит, из которого составляется такой «компьютерный текст», содержит 256 символов. В алфавит такого размера можно поместить все практически необходимые символы: строчные и прописные латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания и пр.

1 байт = 8 битов.

Легко подсчитать информационный объем текста, если известно, что информационный вес одного символа равен 1 байту. Надо просто сосчитать число символов в тексте. Полученное значение и будет информационным объемом текста, выраженным в байтах.

Например, небольшая книжка, подготовленная с помощью компьютера, содержит 150 страниц. На каждой странице 40 строк, в каждой строке 60 символов (включая пробелы между словами). Значит, страница содержит 40 х 60 = 2400 байтов информации. Для вычисления информационного объема всей книги нужно полученную величину умножить на число страниц:

2400 байтов * 150 = 360 000 байтов.

Уже на таком примере видно, что байт — «мелкая» единица. А представьте, что нужно, например, измерить информационный объем целой библиотеки. В байтах это окажется громадным числом!

Для измерения больших информационных объемов используются более крупные единицы:

1 килобайт = 1 Кб = 2 10 байтов = 1024 байта

1 мегабайт = 1 Мб = 2 10 Кб = 1024 Кб

1 гигабайт = 1 Гб = 2 10 Мб = 1024 Мб

1 терабайт = 1 Тб = 2 10 Гб = 1024 Гб

Следовательно, информационный объем вышеупомянутой книги равен приблизительно 360 килобайтам. А если посчитать точнее, то получится:

360 000 : 1024 = 351,5625 Кб.

351,5625 : 1024 = 0,34332275 Мб.

В заключение еще раз обратим внимание на важное свойство рассмотренного здесь алфавитного подхода. При его использовании содержательная сторона текста в учет не берется. Текст, состоящий из бессмысленного сочетания символов, будет иметь ненулевой информационный объем.

Коротко о главном

Алфавитный подход — это способ измерения информационного объема текста, не связанного с его содержанием.

Алфавит — это вся совокупность символов, используемых в некотором языке для представления информации. Мощность алфавита — это число символов в нем.

1 бит — информационный вес одного символа двухсимвольного алфавита (N = 2).

Если N не равно двойке в целой степени, то находится большее N, ближайшее к N целое число М = 2 b (b — целое), и из этого равенства определяется b — информационный вес символа.

Информационный объем текста равен сумме информационных весов всех символов, составляющих текст.

1 байт — информационный вес символа из алфавита мощностью 2 8 = 256 символов. 1 байт = 8 битов.

Байт, килобайт, мегабайт, гигабайт, терабайт — единицы измерения информации. Каждая следующая единица больше предыдущей в 1024 (2 10 ) раза.

Вопросы и задания

1. Что такое алфавит?

2. Что такое мощность алфавита?

3. Как определяется информационный объем текста при использовании алфавитного подхода?

4. Текст составлен с использованием алфавита мощностью 64 символа и содержит 100 символов. Каков информационный объем текста?

5. Что такое байт, килобайт, мегабайт, гигабайт, терабайт?

6. Информационный объем текста, подготовленного с помощью компьютера, равен 3,5 Кб. Сколько символов содержит этот текст?

7. Два текста содержат одинаковое количество символов. Первый текст составлен в алфавите мощностью 32 символа, второй — мощностью 64 символа. Во сколько раз различаются информационные объемы этих текстов?

Электронное приложение к уроку

Вернуться к материалам урока
Презентации, плакаты, текстовые файлы Ресурсы ЕК ЦОР
Видео к уроку

Cкачать материалы урока

Источник

Современные компьютерные технологии, информатика, мощность алфавита, системы исчисления и многие другие понятия имеют самые непосредственные связи между собой. Очень немногие пользователи сегодня достаточно хорошо разбираются в этих вопросах. Попробуем прояснить, что такое мощность алфавита, как ее вычислять и применять на практике. В дальнейшем это, вне всякого сомнения, может пригодиться на практике.

Как измеряется информация

Прежде чем приступить к изучению вопроса о том, какова мощность алфавита, и вообще, что это такое, следует начать, так сказать, с азов.

Наверняка всем известно, что сегодня существуют специальные системы измерения каких-либо величин, на основе эталонных значений. Например, для расстояний и аналогичных величин это метры, для массы и веса – килограммы, для временных промежутков – секунды и т.д.

Но как же измерить информацию в смысле объема текста? Именно для этого и было введено понятие мощности алфавита.

Что такое мощность алфавита: начальное понятие

Итак, если следовать общепринятому правилу, что конечное значение какой-либо величины представляет собой параметр, определяющий, какое количество раз эталонная единица уложена в измеряемой величине, можно сделать вывод: мощность алфавита есть полное количество символов, использующихся для того или иного языка.

Чтобы было понятнее, оставим пока вопрос о том, как находить мощность алфавита, в стороне, и обратим внимание на сами символы, естественно, с точки зрения информационных технологий. Грубо говоря, полный список используемых символов содержит литеры, цифры, всевозможные скобки, специальные символы, знаки препинания, и т.д. Однако, если подходить к вопросу о том, что такое мощность алфавита именно компьютерным способом, сюда следует включить еще и пробел (единичный разрыв между словами или другими символами).

Возьмем в качестве примера русский язык, вернее, клавиатурную раскладку. Исходя из вышесказанного, полный перечень содержит 33 литеры, 10 цифр и 11 специальных знаков. Таким образом, полная мощность алфавита равна 54.

Информационный вес символов

Однако общее понятие мощности алфавита не определяет сущности вычислений информационных объемов текста, содержащего литеры, цифры и символы. Здесь требуется особый подход.

В принципе, задумайтесь, ну вот каким может быть минимальный набор с точки зрения компьютерной системы, сколько символов он может содержать? Ответ: два. И вот почему. Дело в том, что каждый символ, будь то буква или цифра, имеет свой информационный вес, по которому машина и распознает, что именно перед ней. Но компьютер понимает лишь представление в виде единиц и нулей, на чем, собственно, и основана вся информатика.

Таким образом, любой символ можно представить в виде последовательностей, содержащих цифры 1 и 0, то есть, минимальная последовательность, обозначающая букву, цифру или символ, состоит из двух компонентов.

Сам же информационный вес, принятый за стандартную информационную единицу измерения, называется битом (1 бит). Соответственно, 8 бит составляют 1 байт.

Представление символов в двоичном коде

Итак, что такое мощность алфавита, думается, уже немного понятно. Теперь посмотрим на другой аспект, в частности, практическое представление мощности с использованием двоичного кода. В качестве примера для простоты возьмем алфавит, содержащий всего 4 символа.

В двузначном двоичном коде последовательность и их информационное представление можно описать следующим образом:

Отсюда – простейший вывод: при мощности алфавита N=4 вес единичного символа составляет 2 бита.

Если использовать трехзначный двоичный код для алфавита, например, с 8 символами, количество комбинаций будет следующим:

Иными словами, при мощности алфавита N=8 вес одного символа для трехзначного двоичного кода будет равен 3 битам.

Как находить мощность алфавита и использовать ее в компьютерном выражении

Теперь попробуем посмотреть на зависимость, которую выражает количество знаков в коде и мощность алфавита. Формула, где N – алфавитная мощность алфавита, а b – количество знаков в двоичном коде, будет выглядеть так:

То есть, 2 1 =2, 2 2 =4, 2 3 =8, 2 4 =16 и т.д. Грубо говоря, искомое количество знаков самого двоичного кода и есть вес символа. В информационном выражении это выглядит так:

Мощность алфавита, N

Количество знаков кода, b

Измерение информационного объема

Однако это были всего лишь простейшие примеры, так сказать, для начального понимания того, что такое мощность алфавита. Перейдем непосредственно к практике.

На данном этапе развития компьютерной техники для набора текста с учетом заглавных, прописных и строчных букв, кириллических и латинских литер, знаков препинания, скобок, знаков арифметических действий и т.д. используется 256 символов. Исходя из того, что 256 это 2 8 , нетрудно догадаться, что вес каждого символа в таком алфавите равен 8, то есть, 8 битам или 1 байту.

Если исходить из всех известных параметров, можно с легкостью получить нужное нам значение информационного объема любого текста. Например, у нас есть компьютерный текст, содержащий 30 страниц. На одной странице располагается 50 строк по 60 любых знаков или символов, включая и пробелы.

Таким образом, одна страница будет содержать 50 х 60= 3 000 байт информации, а весь текст – 3000 х 50=150000 байт. Как видим даже небольшие тексты измерять в байтах неудобно. А что говорить о целых библиотеках?

В данном случае лучше переводить объем в более мощные величины – килобайты, мегабайты, гигабайты и т.д. Исходя из того, что, например, 1 килобайт равен 1024 байта (2 10 ), а мегабайт – 2 10 килобайт (1024 килобайта), нетрудно посчитать, что объем текста в информационно-математическом выражении для нашего примера составит 150000/1024=146,484375 килобайт или приблизительно 0,14305 мегабайт.

Вместо послеловия

В общем и целом, это вкратце и все, что касается рассмотрения вопроса, что такое мощность алфавита. Остается добавить, что в данном описании был использован чисто математический подход. Само собой разумеется, что смысловая нагрузка текста в данном случае не учитывается.

Но, если подходить к вопросам рассмотрения именно с позиции, которая дает человеку что-то для осмысления, набор бессмысленного сочетания или последовательностей символов в этом плане будет иметь нулевую информационную нагрузку, хотя, с точки зрения понятия информационного объема, результат все равно можно вычислить.

В целом же, знания о мощности алфавита и сопутствующих понятиях не так уж и сложны для понимания и элементарно могут применяться в смысле практических действий. При этом любой пользователь практически каждый день сталкивается с этим. Достаточно привести в пример популярный редактор Word или любой другой такого же уровня, в котором используется такая система. Но не путайте его с обычным «Блокнотом». Здесь мощность алфавита ниже, поскольку при наборе текста не используются, скажем, прописные буквы.

Для решения задач нам понадобится формула, связывающая между собой информационный вес каждого символа, выраженный в битах (b), и мощность алфавита (N):

N = 2 b

Задача 1:

Алфавит содержит 32 буквы. Какое количество информации несет одна буква?

Мощность алфавита N = 32 Какое количество информации несет одна буква?

1. 32 = 2 5 , значит вес одного символа b = 5 бит.

Ответ: одна буква несет 5 бит информации.

Задача 2:

Сообщение, записанное буквами из 16 символьного алфавита, содержит 10 символов. Какой объем информации в битах оно несет?

Мощность алфавита N = 16
текст состоит из 10 символов
Определить объем информации в битах.

1. 16 = 2 4 , значит вес одного символа b = 4 бита.

2. Всего символов 10, значит объем информации 10 * 4 = 40 бит.

Ответ: сообщение несет 40 бит информации (8 байт).

Задача 3:

Информационное сообщение объемом 300 бит содержит 100 символов. Какова мощность алфавита?

Объем сообщения = 300 бит
текст состоит из 100 символов
Какова мощность алфавита?

1. Определим вес одного символа: 300 / 100 = 3 бита.

2. Мощность алфавита определяем по формуле: 2 3 = 8.

Ответ: мощность алфавита N = 8.

Попробуйте следующие задачи решить самостоятельно.

Задача 4:

Объем сообщения, содержащего 20 символов, составил 100 бит. Каков размер алфавита, с помощью которого записано сообщение?

Проверить решение

Задача 5:

Сколько символов содержит сообщение, записанное с помощью 8 символьного алфавита, если объем его составил 120 бит?

Проверить решение

Задача 6:

В книге 100 страниц. На каждой странице 60 строк по 80 символов в строке. Вычислить информационный объем книги.

Развитие высоких технологий привело к появлению большого количества терминов и понятий, с которыми сталкиваются все пользователи в процессе работы с компьютерами. Продвинутые юзеры имеют представление о большинстве из них, однако, для новичков разобраться со всеми терминами очень сложно. Одним из таковых терминов, о которых имеют представление не все даже опытные пользователи, является мощность алфавита. Что подразумевается под этим понятием и как она рассчитывается?

Методы измерения информации в электронном виде

Мощность алфавита может пригодиться очень многим пользователям в процессе работы. Однако перед тем как дать определение этому термину и разобраться в методах его расчета необходимо немного поговорить о том, как измеряется электронная информация, поскольку это является материальной базой, на основании которой базируется дальнейшая теория.

Каждый человек знает о том, что любая величина имеет свою систему измерений. Например, температура измеряется в градусах, расстояние выражается в метрах, временные интервалы строятся из секунд и так далее. Однако немногие пользователи знают о том, в каких величинах измеряется текстовая информация в электронном виде. Для этих целей в информатике и было создано определение мощность алфавита.

Определение термина

Исходя из того, что значение абсолютно любой величины, известной в наши дни человечеству, является неким параметром, состоящим из набора измерительных единиц, то определение понятию мощности алфавита проще всего сделать следующим образом: мощность алфавита — это количество символов, которое входит в состав любого языка.
Однако это всего-лишь общее определение, которое отражает только поверхностное значение мощности алфавита, поскольку само определение носит более глубокий характер. Чтобы понять всю его суть необходимо разобраться с тем, что представляют собой символы, с точки зрения высоких технологий. Все символы, используемые в компьютере, включают в себя буквы, цифры, знаки препинания и набор специальных символов. Однако это еще не все, поскольку для определения мощности алфавита необходимо еще учитывать и пробел, который предназначен для разделения слов между собой.

Давайте в качестве примера рассмотрим русскую раскладку клавиатуры, которая используется для печати русскоязычного текста и состоит из 34 букв, 10 цифр и 11 дополнительных символов, суммарное количество которых составляет 54, что, в свою очередь, классифицируется как мощность алфавита русской раскладки клавиатуры..

Информационный вес символов

Давайте постепенно продвигаться далее. Мощность алфавита не заключается в одном лишь числе букв и цифр, которые используются в напечатанном тексте. Для определения этого параметра необходим более глубокий подход.
Давайте на секунду задумаемся о том, какой минимальный объем символов входит в состав одной буквы, цифры или специального знака? Правильный ответ — два. Каждый символ в компьютере обладает своим информационным весом, благодаря которому машина способна распознавать какую информацию ввел пользователь. Все дело в том, что машина не способна распознавать информацию в том виде, в котором ее представляют люди. Вместо этого, он использует специальный машинный язык, состоящий из нулей и единиц, при помощи которых происходит преобразование текстовой информации в двоичный код, понятный компьютерной системе.
Что касается информационного веса, то он выражается в битах и является стандартной единицей для измерения информации в электронном виде.

Немного о двоичном коде

Теперь мы имеем более-менее доступным для понимания определением мощности алфавита. Однако для понимания всей глубины теории представления электронной информации машинами необходимо иметь представление о двоичном коде. Давайте рассмотрим этот вопрос на примере мощности алфавита, состоящей из четырех любых символов, каждый из которых имеет вес два бита.

Следуя из всего вышесказанного, четыре символа будут иметь весь четыре бита, восемь — три и так далее. На основании этого принципа и происходит расчет веса текстовой информации, выраженной в электронном виде, компьютерными системами.

Вычисления мощности алфавита и ее практическое использование

С терминологией и основными теоретическими терминами мы разобрались, поэтому теперь давайте рассмотрим какая существует взаимосвязь между мощностью алфавита и его весом. Чтобы более наглядно провести взаимосвязь между ними давайте рассмотрим одну формулу: N=2b, в которой первая переменная соответствует количеству символов, а вторая — количеству знаков, используемых компьютерами в машинном языке.
Из этого математического выражения следует, что 21=2, 22=4, 23=8, 24=16 и так далее. На основании этого можно сделать весьма разумный и обоснованный вывод: число символов, используемых в машинном языке, представляет собой вес символа.

Как измеряется объем информации?

Рассмотренные выше примеры являются очень простыми, на примере которых можно дать общее представление мощности алфавита. Однако на деле все выглядит намного сложнее, поскольку каждый пользователь в процессе набора текста использует не только строчные, но и заглавные буквы, а также различные шрифты, языковую раскладку, знаки препинания, специальные символы, цвета и многое другое. Исходя из этого можно предположить, что общее число всех суммарных символов равняется 256. Поскольку 256 равняется 28 в двоичном коде, то в этом случае вес каждого символа составляет 8 битам или одному байту.

Таким образом, обладая всеми необходимыми параметрами, мы можем рассчитать объем электронной информации. Например, мы напечатали 30 страниц печатной информации, на каждой из которых содержится 50 строк по 60 различных символов. Используя известную нам формулу, производим необходимые вычисления:

— информационный вес одной строки будет равен: 50 х 60 = 3000 байт;
— а весь текст будет весить: 3000 х 50 = 150 000 байт.

Стоит отметить, что конечный результат можно выражать не только в байтах, а переводить стандартную единицу измерения в килобайты, мегабайты и другие. Для этого необходимо величину более младшего порядка разделить на 1024, поскольку именно столько единиц младшей величины образуют старшую единицу измерения.

Заключение

Прочитав эту статью, вы получили общее представление о том, что представляет собой мощность алфавита, а также о методах ее расчета. Однако был рассмотрен исключительно математический подход, в котором не учитываются некоторые другие параметры, основным из которых является смысловая нагрузка. Этот аспект является одним из наиболее важных для понимания, поскольку независимо от объема символов, если они не несут никакой информационной ценности, то его ценность равна нулю. Однако рассчитать вес бессмысленного набора символов все равно можно.

Если говорить в общем, то мощность алфавита, как один из терминов информатики, не представляет собой ничего сложного для понимания. Но многие пользователи пренебрегают этим терминов, поскольку считают его бесполезным, однако, на практике все обстоит совершенно иначе. В наши дни пользователи работают преимущественно с электронной информацией, которая со временем может полностью вытеснить печатную, поэтому необходимо иметь представление о том, как эта информация выражается в машинном виде и каким образом она рассчитывается.

Добавить комментарий