Как составить тезаурус основных понятий

Составление тезауруса считается одним из сложнейших
видов человеческой деятельности, которая требует участия различных
специалистов, в том числе лингвистов, специалистов по информационной
технологии, специалистов данной отрасли науки и технологии и т.д.

Термин «тезаурус»
употребляется по отношению к различным лингвистическим ресурсам и
словарям:

1). Во-первых, тезаурусом называется особый вид
словарей –
идеографический,
лексика в которых организуется по тематическому принципу. Первым
такого рода словарем явился знаменитый Тезаурус Роже, созданный в 19
веке. Основное назначение таких словарей – помощь в подборе
синонимов и близких по смыслу слов при написании текста.

2). Второй тип тезаурусов –
информационно-поисковые тезаурусы,
описывающие отношения между терминами предметной области. Такие
словари создаются экспертами в некоторой предметной области и
предназначены для помощи при информационном поиске.

3). Тезаурусами также называют относительно
недавно появившиеся
лингвистические
ресурсы
типа
WordNet
и
EuroWordNet
, описывающие отношения
между лексическими значениями естественного языка как иерархическую
систему групп синонимов – синсетов.

4) Ассоциативные
тезаурусы, которые используют материалы

двух принципиально разных ресурсов.

С одной стороны, ассоциативным тезаурусом называется словарь,
описывающий психологические ассоциации между словами, возникающие у
людей. Таким словарем, например, является Русский ассоциативный
словарь.

Кроме того, термин «ассоциативный тезаурус»
употребляется для ссылки на ресурсы, создаваемые автоматически на
основе обработки текстовых коллекций и показывающие совместную
встречаемость пар слов в документах.

Между всеми этими употреблениями термина
«тезаурус» есть существенное сходство. Никитина С.Е.
определяет
тезаурус
как словарь
с концептуальным входом
и
фиксированными семантическими связями
между его единицами. Она подчеркивает, что для определения тезауруса
существенны оба указанных независимых признака. В частности,
существуют словари, обеспечивающие концептуальный вход, например, по
набору синонимов, при этом отношения между словами описывают
традиционными толкованиями.

Далее рассматривается методика
построения информационно-поискового тезауруса, основные понятия и
назначение.

Под информационно-поисковым
тезаурусом (ИПТ)
понимается словарь
лексических единиц информационно-поискового языка, в котором заданы
парадигматические (базисные) смысловые отношения между этими
единицами [3, с. 5-7].

Информационно-поисковый язык, ИПЯ:
Формализованный искусственный язык, предназначенный для
индексирования документов, информационных запросов и описания фактов
с целью последующего хранения и поиска [4].

Информационно-поисковые тезаурусы строятся для
описания лексики дескрипторных ИПЯ, лексическими единицами которых
являются
дескрипторы.

Лексическая единица информационно-поискового
языка (ЛЕ)
. Обозначение отдельного
понятия, принятое в информационно-поисковом языке и неделимое в этой
функции.

Примечание –
лексические единицы могут представлять собой принятые в естественном
языке слова, устойчивые словосочетания, аббревиатуры, символы, даты,
общепринятые сокращения, лексически значимые компоненты сложных слов,
а также эквивалентные им кодовые или символические обозначения
искусственного языка, например коды классов классификационной системы
[4].

Дескриптор – это
ключевое слово, выбранное из группы условно эквивалентных ключевых
слов и представляющее данную группу при индексировании и поиске
информации.
Дескриптор
также описывается как смысловая доминанта, или основное понятие с
относящимся к нему словом, подобно заголовочному слову в толковом
словаре.
В роли дескрипторов выступают
термины, обозначающие отдельные понятия некоторой предметной области
и удовлетворяющие принципам общеупотребительности,
распространенности, краткости и терминологической точности.

Ключевое слово (КС)
– отдельное слово или словосочетание естественного языка,
выделяемое из текста информационного документа и отражающее его
основное содержание при индексировании.

Группа условно эквивалентных КС объединяет
не только те слова и словосочетания, которые признаются синонимами в
естественном языке, но и такие, которые можно считать условно
равнозначными с точки зрения информационного поиска, т. е. в рамках
данного ИПЯ.

Парадигматические
(базисные,
аналитические, ассоциативные)
отношения
выражают
постоянные семантические (смысловые) связи

между ЛЕ
ИПЯ, не
зависящие от текста. Таковыми признаются отношения «род –
вид», «целое – часть» и т. п. Они являются
стабильными для каждой предметной области и могут быть зафиксированы
в словаре.

Например, судак,
лещ, сибас, форель

относятся к семантической категории «
Рыбы»,
т.е. отношение «род-вид» между дескрипторами
рыбы
– судак

являются контекстуально не зависимыми. Это парадигматическое
отношение.

В ИПТ обычно фиксируются следующие парадигматические отношения:
родо–видовые, отношения эквивалентности, ассоциативные
отношения.

Отношение «род
– вид
» связывает два
дескриптора, если объем понятия, соответствующий одному из
дескрипторов, включает в себя объем понятия другого дескриптора,
например,
рыба – форель,
рыболовные снасти – удочка, способы ловли рыбы –
спиннинг.

Отношение синонимии означает, что поиск по одному из условных или
истинных синонимов позволит найти в базе данных автоматизированной
информационной системы (АИС) те документы, которым приписаны в
качестве ключевых слов остальные.

Например, рыболовство
= рыбная ловля = рыбный промысел.

Ассоциативные отношения устанавливаются между КС,
принадлежащими к одной и той же или разным смысловым категориям и
произвольным уровням иерархии. Они аналогичны ассоциативным связям в
сознании человека, когда возникающее представление об одном объекте
вызывает представления о других.

Например, при поиске по дескриптору Рыболовство
пользователю АИС можно предложить провести дополнительные поиски по
дескрипторам:
отрасль промышленности,
сырьевые ресурсы Мирового океана, водохранилища, виды рыб,
млекопитающие, моллюски, способы рыбной ловли, снасти
и
т.д.

Ассоциативные связи, как правило, не различают в
ИПТ по их семантике. Однако имеет смысл упомянуть следующие виды
ассоциаций: «целое – часть»;

«причина – следствие», «близость
в пространстве или во времени», «антонимия»,
«предмет – обычая область его применения» и т.д.

[3, с. 5-7].

В соответствии с определениями стандартов,
информационно-поисковый тезаурус – это нормативный словарь,
точно указывающий отношения между терминами и предназначенный для
описания содержания документов и поисковых запросов.

Основными целями разработки информационно-поисковых тезаурусов
являются следующие:

  • Обеспечение перевода документов и запросов
    пользователей на один и тот же словарь, используемый для
    индексирования и поиска. Таким образом, различия в лексическом
    составе документа и запроса пользователя сводятся к одним и тем же
    единицам тезауруса.

  • Обеспечение последовательного использования
    единиц индексирования.

  • Обеспечение отношений между терминами –
    отношения между единицами тезауруса позволяют найти оптимальный
    термин для описания документа или запроса.

  • Использование как поискового средства при поиске документов.

Информационно-поисковые тезаурусы создавались как
инструмент для ручного описания документов
специалистами-индексаторами. Поисковый запрос также предполагалось
формулировать на основе единиц тезауруса.

Итак, при разработке информационно-поисковых тезаурусов первой
задачей является отбор терминов для включения в тезаурус. Существует
несколько возможных источников терминов для разработки
информационно-поисковых тезаурусов.

Прежде всего, должны быть изучены существующие
тезаурусы в близких предметных областях. Они могут содержать
значительное количество полезных терминов для нового тезауруса.
Термины – кандидаты на внесение в тезаурус – могут быть
предложены экспертами предметной области. Кроме того, термины
тезауруса могут быть получены из текстов предметной области
применением автоматизированных методов или ручной обработки
документов. При ручной обработке документов сначала некоторое время
индексаторы индексируют поступающие документы наиболее релевантными
ключевыми словами, которые затем сводятся в единый список, способный
служить основой для тезауруса [1, с. 24-32].

После того, как список терминов-кандидатов
получен, из него исключаются слишком частотные термины, поскольку
предполагается, что они являются малоинформативными для различения
отдельных документов. Относительно малочастотные термины могут быть
удалены из списка или представлены как
аскрипторы
более общих или
более
частотных понятий.

Герд
предлагает исключать некоторые конкретные термины, так как тезаурус,
в котором много уровней иерархии, труден в использовании: возрастает
субъективность индексирования, т. к. индексаторы могут использовать
для индексирования документов дескрипторы разного уровня [7].

Если в списке обнаруживается несколько близких по
смыслу терминов, то из них выделяется наиболее частотный термин,
остальные термины могут быть исключены и переведены в аскрипторы [1,
с. 24-32].

Разработчики тезауруса LIV Исследовательской службы Конгресса США
(LIV, 1994) описывают правила включения терминов в тезаурус следующим
образом:

  • Термины тезауруса должны представлять понятия, которые реально
    упоминаются в литературе, и должны отбираться из соображений
    эффективности их использования в поиске документов.

  • Важным фактором включения термина является частотность его
    упоминания в текстах, которую необходимо периодически проверять.

  • Включение новых терминов в тезаурус должно
    происходить с учетом уже включенных тезаурусных терминов.
    Термины-кандидаты должны проверяться на предмет соответствия их
    общности / специфичности к другим терминам тезауруса. Также должно
    проверяться, представляет ли термин-кандидат отдельное понятие,
    которому нет соответствий среди существующих терминов тезауруса.
    Необходимо избегать включения терминов, чьи значения пересекаются со
    значениями уже существующих тезаурусных терминов настолько, что
    индексаторам и пользователям будет трудно различать их [6, с. 157
    ].

Таким образом, для разработки актуального и хорошего
информационно-поискового тезауруса, необходимо соблюдать следующие
основыне критерии:

  • набор дескрипторов тезауруса должен быть достаточен для описания
    произвольного документа предметной области, в частности,
    “Рыболовство”;

  • количество дескрипторов не должно быть слишком большим.

Литература:

  1. Архангельская В.А., Базарнова С.В.
    Информационно-поисковый тезаурус по экономике и демографии [Текст]
    /В.А. Архангельская, С.В. Базарнова – 2001, с. 24-32.

  2. Лавренова О.А. Моделирование семантической
    текстов научно-технического содержания в связи с автоматизацией
    информационных процессов. Диссертация кандидата филологических наук
    :
    10.02.21

  3. Лавренова О.А Методика разработки информационно-поискового тезауруса
    [Текст] / О.А. Лавренова – Москва, 2001-с.5-7.

  4. ГОСТ 7.74-96 СИБИД. Информационно-поисковые
    языки.
    Термины и определения.

  5. СИБИД. Тезаурус информационно-поисковый
    одноязычный: Правила разработки: структура, состав и форма
    представления: Межгосударственный стандарт 7.25. – Минск:
    Межгосударственный совет по стандартизации, метрологии и
    сертификации, 2001.

  6. Соловьев В.Д., Добров Б.В., Иванов В.В.,
    Лукашевич Н.В.
    Онтологии
    и тезаурусы: Учебное пособие [Текст] / В.Д. Соловьев, Б.В. Добров,
    Н.В. Лукашевич – Казань, Москва, 2006-с.157.

  7. ANSI/NISO Z39.19-2005, “Guidelines for the
    Construction, Format, and Management of Monolingual Controlled
    Vocabularies”,
    http://www.niso.org/standards/resources/Z39-19-2005.pdf

  8. http://like-money.ru/stati/124-osnovnye-princzipy-razrabotki-tezaurusov-chast-1.

Основные термины (генерируются автоматически): предметная область, тезаурус, отношение, термин, LIV, информационно-поисковый язык, дескриптор, естественный язык, информационно-поисковый тезаурус, термин тезауруса.

Разработка
информационно-поискового тезауруса
включает несколько этапов:

  • построение
    словаря (словника) ключевых слов;

  • дескрипторизация
    ключевых слов;

  • установление
    парадигматических отношений между
    дескрипторами;

  • оформление
    тезауруса.

Разработка
тезауруса требует исследования системы
и логики знаний тех областей, которые
найдут отражение в нем. Терминология,
которая будет использована в тезаурусе,
должна быть полной, однородной и
охватывать все основные тематические
группы. В свою очередь, тематические
группы могут быть расширены в целях
охвата смежных проблем. При отборе
массива документов необходимо соблюдать:

  • точное
    соответствие документов тематической
    направленности работы;

  • полный
    охват каждой области знаний, а также
    равномерное распределение их по
    отдельным тематическим областям как
    по характеру документов, так и по их
    количеству;

  • терминологическую
    насыщенность информационных документов
    и степень важности содержащейся в них
    информации;

  • освещение
    тематики с учетом различных аспектов
    (материалов исследований, сведений об
    устройстве, применении и т. д.).

Критериями
количественных и качественных параметров
представительного массива документов
и словника являются:

  • скорость
    роста массива документов и словника;

  • дифференцированность
    и устойчивость частотных характеристик
    элементов;

  • процентное
    содержание в словнике специальных,
    общих и смежных терминов;

  • вероятность
    использования элементов словника при
    индексировании и поиске документов.

Процесс
создания тезауруса включает научную
разработку классификационных схем
понятий и выявление терминологического
фонда из представительного фонда
информационных документов. Кроме того,
предполагается дополнение его терминами,
которые позаимствованы из вспомогательных
источников:

  • тезаурусов
    по родственной тематике;

  • терминологических
    и толковых словарей;

  • энциклопедических
    словарей;

  • научно-технических
    словарей и справочников;

  • таблиц
    универсальной десятичной (децимальной)
    классификации (УДК);

  • тематических
    рубрикаторов;

  • библиотечно-библиографической
    классификации (ББК);

  • государственных
    стандартов и других источников

9.3.1 Составление словаря ключевых слов

Составление
словаря ключевых слов происходит путем
отбора из заглавий, аннотаций, рефератов
и текстов документов слов естественного
языка, которые могут использоваться в
поисковых образах документов (ПОД) и
поисковых предписаниях (ПП). Важ­нейшим
требованием к словарю ключевых слов
является полнота охвата терминологии,
так как в тезаурус включают терминологию,
фигурирующую в документах, вводимых в
ИПС. Таким образом, в тезаурусе могут
отсутствовать термины, требующиеся для
описания содержательных или формальных
аспектов вводимых в ИПС текстов. Такой
тезаурус может оказаться недостаточно
полным. Существует прямая зависимость
работоспособности тезауруса от методики
индексирования документов. Процесс
индексирования заключается в следующем:

  • составление
    мысленной аннотации, в которой отражаются
    основные и второстепенные темы документа,
    представляющие интерес для пользователей
    ИПС;

  • выбор
    из этой аннотации ключевых слов.

Составление
поисковых аннотаций считается творческим
процессом, поэтому результат этого
процесса в той или иной мере зависит от
субъективных качеств индексатора.
Результат обработки одного и того же
документа разными индексаторами может
быть различным. Для того чтобы предотвратить
расхождения в индексировании, необходимо
стандартизировать построение поисковых
образов. Для того чтобы отделить ключевые
слова от «неключевых» (не подлежащих
вводу в тезаурус), индексаторы используют
общие методические указания:

  • служебные
    слова (предлоги, союзы, частицы и т. д.)
    следует считать неключевыми;

  • в
    качестве ключевых слов могут выступать
    существительные, прилагательные,
    числительные, причастия и их сочетания,
    наречия, деепричастия и местоимения в
    состав ключевых слов не входят, глаголы
    – очень редко;

  • не
    следует включать в словарь ключевых
    слов термины, которые очень редко
    встречаются в данном документном
    массиве, их можно учесть в отдельном
    списке в роли ключевых слов-кандидатов;

  • часто
    встречающиеся, но общие термины («метод»,
    «система», «описание», «устройство» и
    т. п.) надо либо исключить, либо использовать
    в сочетании с другими словами, которые
    сузили бы их значение;

  • не
    имеет смысла включать в словарь термины,
    не относящиеся к данной терминологической
    области;

  • полисемичные
    термины могут быть включены только в
    тех значениях, в которых они употребляются
    в данной тематической области, с
    соответствующими пояснениями.

После
того как произведен отбор ключевых слов
из текстов, необходимо решить вопрос
об их формулировке.

Существует
два подхода к этой проблеме:

  • ориентироваться
    на ключевые слова – развернутые
    словосочетания. Например: «коммерческие
    информационные службы»;

  • ориентироваться
    на ключевые слова – унитермы (отдельные
    лексические единицы). Например:
    «оформление», «механика», «логика».

В
зависимости от того, какой подход будет
использован при формулировке ключевых
слов, результат будет разным, т. е. будут
получены различные словари ключевых
слов, а значит и различные дескрипторные
языки. «Унитермная» ориентировка через
свободную манипуляцию элементами
поисковых образов обеспечит глубокое
и детальное индексирование и увеличит
количество точек доступа к разыскиваемым
документам. Но разделение устойчивых
словосочетаний, которые соответствуют
определенным научно- техническим
понятиям, грозит потерей информации
при поиске. Суть заключается в том, что
определенные понятия не всегда могут
быть выражены единичным термином. Иными
словами, ключевые слова, включаемые в
словарь, принимают с учетом точки зрения
интересов поиска информации для каждого
ключевого слова отдельно и с учетом их
лексикографической обработки.

Решение
о разделении или сохранении словосочетаний
или сложных слов принимают с учетом
лингвистических и прагматических
критериев. В лингвистике словосочетания
делятся на свободные
и устойчивые
(лексиколизованные) словосочетания.
Свободные словосочетания характерны
устной речи. Устойчивые словосочетания
являются цельными лексическими единицами
языка и по своим функциям эквивалентны
отдельным словам. Для координатного
индексирования рекомендуется вводить
в качестве ключевых слов устойчивые
словосочетания. При формировании
словника ключевых слов руководствуются
лингвистическими критериями. Словосочетание
является устойчивым, если:

  • при
    его образовании одно из слов изменяет
    свое значение – происходит переосмысление
    одного из компонентов словосочетания.
    Например: «легкая музыка», «легкая
    промышленность» (переосмысливается
    прилагательное «легкий»);

  • употребляется
    в единственном или во множественном
    числе. Например: «немецкий язык»,
    «европейские языки»;

  • имеет
    один или несколько синонимов. Например:
    «перспективы» = «будущее» = «перспективы
    развития» = «тенденции».

— при
замене составляющих его слов, изменении
порядка слов в нем или при преобразовании
прилагательного в существительное с
предлогом потеряется его смысл. Например:
«железная дорога».

К
устойчивым словосочетаниям относят
имена собственные или словосочетания,
включающие имена собственные. Например:
«Латинская Америка», «Таблица Менделеева».

Если
словосочетания соответствуют этим
критериям, они считаются устойчивыми.

На
решение о сохранении словосочетаний
влияют и прагматические соображения:

— рекомендуется
сохранять часто встречающиеся
словосочетания;

— рекомендуется
сохранять словосочетания, если их
компоненты не могут использоваться по
отдельности;

— рекомендуется
сохранять словосочетания как способ
устранения информационного шума.

Таким
образом, разработчикам тезауруса следует
ориентироваться на единичные ключевые
слова, сохраняя устойчивые словосочетания,
удовлетворяющие выше приведенным
лингвистическим и прагматическим
критериям.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Каков наилучший способ создать тезаурус, так как письмо всегда является самой сложной частью получения высоких баллов во многих языковых тестах?

Таким образом, многие учащиеся стараются как можно больше практиковаться в письме. Одним из многих советов по улучшению качества письма является использование тезауруса. Но что вы знаете о тезаурусе и о том, как эффективно создавать тезаурус?

В этой статье вы узнаете новое понимание тезауруса и полезные советы по созданию тезауруса, чтобы играть со словами как в формальном, так и в неформальном языковом употреблении.

Дополнительные советы с AhaSlides

  • Живой генератор облака слов
  • Генератор прилагательных
  • Случайные английские слова
generate thesaurus
Как создать тезаурус?

Содержание

  • Что такое тезаурус?
  • Список способов создания тезауруса
  • №1. AhaSlides — инструмент создания тезауруса
  • № 2. Thesaurus.com – инструмент для создания тезауруса
  • №3. Monkeylearn — инструмент для создания тезауруса
  • № 4. Synonyms.com – инструмент создания тезауруса
  • № 5. Word Hippos — инструмент для создания тезауруса
  • № 6. Визуальный тезаурус — инструмент создания тезауруса
  • № 7. WordArt.com — инструмент создания тезауруса
  • 4 альтернативы облаку слов AhaSlides
  • №1. Только одно слово
  • № 2. Синоним скремблировать
  • №3. Генератор прилагательных
  • № 4. Генератор синонимов имени
  • Преимущества «Создать тезаурус»
  • Заключение

Что такое тезаурус?

Если вы давно пользуетесь словарем, возможно, вы уже слышали о слове «тезаурус». Понятие тезауруса происходит от особого способа использования более функционального словаря, в котором люди могут искать ряд слов. синонимов и соответствующие концепции, а иногда антонимы слов в группе слов.

Слово тезаурус происходит от греческого слова «сокровище»; упрощенно, это также означает книгу. В 1852 году слово «тезаурус» стало популярным благодаря вкладу Питера Марка Роже, который использовал его в своем «Тезаурусе Роже». В современной жизни тезаурус является официальным словом в свете словаря синонимов. Кроме того, интересен тот факт, что Соединенные Штаты являются первой страной, отметившей «День национального тезауруса», который ежегодно отмечается 18 января. 

Список способов создания тезауруса

Есть много способов создать тезаурус с помощью генератора слов тезауруса. В эпоху цифровых технологий люди слишком привыкли использовать онлайн-словарь вместо печатного словаря, поскольку это более удобно и экономит время, некоторые из них бесплатны и переносимы на ваш мобильный телефон. Здесь мы даем вам 7 лучших онлайн-сайтов, создающих тезаурусы, чтобы найти похожие слова, на которые вы должны обратить внимание:

generate thesaurus
Эффективный тезаурус – Генератор синонимов – Synonym.com

№1. AhaSlides — инструмент создания тезауруса

Почему AhaSlides? Учебное программное обеспечение AhaSlides подходит для создания тезаурусов классами с помощью функции Word Cloud и может использоваться в любой точке взаимодействия в системах Android и iOS. Использование AhaSlides — это идеальный способ вовлечь учащихся в занятия в классе. Вы можете настроить различные игры и викторины на тематическом фоне, чтобы сделать генератор тезауруса более привлекательным и интересным. 

№ 2. Thesaurus.com – инструмент для создания тезауруса

Лучшим генератором синонимов, который можно упомянуть, является Thesaurus.com. Это полезная платформа для поиска синонимов со многими удобными функциями. Вы можете искать синоним к слову или фразе. Его впечатляющие функции, генератор слов дня, публикация одного синонима и кроссворд ежедневно — вот что этот веб-сайт показывает вам вместе с грамматикой и советами по написанию стратегии обучения навыкам написания. Он также предлагает различные игры, такие как Scrabble Word Finder, Outspell, Word Wipe Game и другие, которые помогут вам более эффективно создавать список тезауруса. 

№3. Monkeylearn — инструмент для создания тезауруса

Вдохновленное технологией искусственного интеллекта MonkeyLearn, сложное программное обеспечение для электронного обучения, его функция облака слов может использоваться в качестве генератора случайных слов-синонимов. Его чистый UX и пользовательский интерфейс позволяют пользователям удобно работать со своими приложениями, не отвлекаясь на рекламу.

Введя релевантные и целенаправленные ключевые слова в поле, автоматическое обнаружение сгенерирует необходимые синонимы и связанные термины. Кроме того, есть функция, которая поможет вам настроить цвет и шрифт в соответствии с вашими предпочтениями, а также настроить количество слов, чтобы упростить получение результатов. 

№ 4. Synonyms.com – инструмент создания тезауруса

Еще один онлайн-словарь для создания тезауруса — Synonyms.com, который работает очень похоже на Thesaurus.com, например, ежедневное скремблирование слов и считывание словарных карточек. После проведения исследования слова веб-сайт представит вам группу похожих слов, ряд определений, его историю и некоторые антонимы, а также гиперссылки с другими соответствующими понятиями. 

№ 5. Word Hippos — инструмент для создания тезауруса

Если вы хотите найти синоним напрямую, вы можете найти Word Hipps для вас. Простой в использовании пользовательский интерфейс поможет вам самым разумным образом. Помимо представления вам синонимов, он выделяет различные контексты использования рассматриваемого слова и синонимов более подходящим образом. Вы можете попробовать игру под названием «Слова из 5 букв, начинающиеся с буквы А», которую предлагает Word Hipps в качестве ледокола. 

№ 6. Визуальный тезаурус — инструмент создания тезауруса

Знаете ли вы, что изучение слова с помощью визуальных эффектов более эффективно? Инновационный генератор синонимов, такой как визуальный тезаурус, предназначен для максимального получения информации и поощряет исследование и обучение. Вы можете найти любой из необходимых вам тезаурусов, даже самый редкий, поскольку он предлагает 145,000 115,000 английских слов и XNUMX XNUMX значений. Например, генератор существительных слов, генератор старых английских слов и генератор причудливых слов с картами слов, разветвленными друг на друга.

№ 7. WordArt.com — инструмент создания тезауруса

Иногда сочетание генератора облака слов для тезауруса с формальным словарем синонимов является эффективным способом обучения новому языку в классе. WordArt.com может стать для вас хорошим учебным пособием. WordArt, ранее известный как Tagul, считается самым многофункциональным генератором облаков слов с потрясающими изображениями слов.

Альтернативы облаку слов AhaSlides

generate thesaurus
Генератор случайных словарных слов с помощью AhaSlides Wordcloud

Кажется, пришло время создать собственный генератор тезауруса с Облако слов AhaSlides. Итак, как создать генератор облака слов синонимов с АгаСлайды, вот несколько важных советов:

  • Представляем облако слов на AhaSlides, а затем пересылаем ссылку в верхней части облака вашей аудитории.
  • Получив ответы, отправленные аудиторией, вы можете транслировать вызов облака слов в прямом эфире на своем экране вместе с другими.
  • Настройте вопросы и типы вопросов в соответствии с общим дизайном вашей игры.

Alternative Text

Начните за секунды.

Узнайте, как использовать AhaSlides Live Word Cloud Generator для большего удовольствия на работе, в классе или просто для использования в сообществе!

🚀 Что такое облако слов?

Игры со словами — это интригующие занятия, которые повышают умственные способности, а также проверяют способность использовать словарный запас и другие языковые навыки. Поэтому мы даем вам несколько лучших идей для игр с генератором тезаурусов для повышения продуктивности вашего обучения в классе.

№1. Всего одно слово — сгенерируйте идею игры тезауруса

Это самое легкое и простое правило игры, которое вы когда-либо могли себе представить. Однако стать победителем в этой игре совсем не просто. Люди могут играть в группе или индивидуально с таким количеством раундов, сколько необходимо. Ключ к успеху — произнести слово как можно быстрее и сосредоточиться, избегая повторения рассматриваемого слова, если вы не хотите, чтобы вас уволили. Однако нет никакой гарантии, что у вас будет достаточно слов для победы. Вот почему мы должны учить новые слова из этой удивительной игры.

№ 2. Synonym scramble — Генерация идеи игры тезауруса

Вы легко можете встретить такой сложный тест во многих учебниках по языковой практике. Перепутать все буквы — лучший способ потренировать мозг в запоминании новой работы за ограниченное время. С помощью Word Cloud вы можете скремблировать один и тот же набор списков слов или антонимов, чтобы учащиеся могли быстро расширять свой словарный запас.

№3. Генератор прилагательных — сгенерируйте идею игры тезауруса

Вы когда-нибудь играли в MadLibs, одну из самых захватывающих онлайн-игр в слова? Существует задача повествования, когда вам нужно придумать кучу случайных прилагательных, чтобы они соответствовали сюжетной линии, которую вы создаете. Вы можете играть в такие игры в своем классе с помощью Word Cloud. Например, вы можете создать историю, а учащиеся должны придумать персонажей с одной и той же сюжетной линией. Каждая команда должна использовать ряд синонимов, чтобы их история звучала разумно, но не может повторять чужие прилагательные.

№ 4. Генератор синонимов имен — сгенерируйте идею игры тезауруса

Когда вы хотите назвать своих новорожденных, вы хотите выбрать самое красивое, оно должно нести в себе особый смысл. Для того же значения существует множество имен, которые могут вас запутать. Прежде чем перейти к последнему, вам может понадобиться Word Cloud, чтобы помочь вам создать как можно больше имен синонимов. Вы можете быть удивлены тем, что есть еще имена, о которых вы никогда раньше не думали, но они звучат точно так же, как то, что предназначено вашему ребенку.

№ 5. Создатель необычных заголовков — сгенерируйте идею игры тезауруса

Генератор синонимов имени немного отличается от генератора причудливых заголовков. Вы хотите назвать свой новый бренд уникальным, но уже существуют тысячи причудливых названий? Трудно найти тот, который имеет соответствующее значение для вашего фаворита. Так что использование тезауруса может вам как-то помочь. Вы можете создать игру, чтобы побудить участников придумать причудливые названия для названия вашего бренда или книги или чего-то еще, не теряя ее духа.

generate thesaurus
Красивый синоним – Облако слов AhaSlides

Преимущества создания тезауруса

«Создать тезаурус» — это распространенный способ показать свою языковую компетентность по четырем навыкам в разных контекстах. Понимание сути намеренного создания тезауруса полезно для вашего прогресса в обучении и других связанных с языком действий. Цель «создать тезаурус» состоит в том, чтобы помочь вам избежать пустых слов и повысить эффективность и точность вашего выражения. 

Кроме того, частое повторение одних и тех же фраз или слов является табу, что может сделать письмо скучным, особенно в творческом письме. Вместо того, чтобы говорить «Я очень устал», вы можете сказать, например, «Я устал».

Кроме того, вы можете создать генератор тезаурусных фраз с такой фразой, как «ваша одежда выглядит очень красиво», эксперт с динамическим списком синонимов может сделать ее более увлекательной во многих отношениях, например: «ваш костюм такой потрясающий» или « твой наряд необыкновенный»… 

В некоторых конкретных контекстах, таких как тесты на знание языка, копирайтинг, классные занятия и т. д., шаг «создать тезаурус» может быть огромным подспорьем, как показано ниже:

Практика тестирования на знание языка: возьмем, к примеру, IELTS. Существует тест высокого стандарта для изучающих иностранный язык, который они должны пройти, если хотят поехать за границу для учебы, работы или иммиграции. Подготовка к IELTS — долгий путь, так как чем выше целевая группа, тем сложнее.

Изучение синонимов и антонимов — лучший способ увеличить словарный запас. Для многих людей «создание тезауруса» является обязательным действием для создания конечного списка словарного запаса для использования в письменной и устной речи, чтобы учащиеся могли более активно и эффективно играть со словами в течение ограниченного времени для любого вопроса. 

Преимущества создания тезауруса в копирайтинге

В последние годы быть фрилансером в области копирайтинга — многообещающая карьера, поскольку это гибридная работа, в которой вы можете оставаться дома и писать текст в любое время, не беспокоясь о скучных 9-5 рабочих часах. Быть хорошим писателем требовало отличных навыков письменного общения и убедительного, повествовательного, пояснительного или описательного стиля письма.

Улучшение вашего стиля общения и письма путем создания собственного генератора слов важно, поскольку вы используете слова более гибко, а не застреваете, пытаясь найти идеальный способ выразить свою инициативу. Воспользовавшись преимуществами живого тезауруса в ваших предложениях, ваше письмо может быть намного более очаровательным.

Преимущества создания тезауруса в занятиях класса

Умение свободно пользоваться языком является обязательным для всех стран как на их национальном, так и на втором языке. Кроме того, есть много компаний, которые также пытаются внедрить курсы английского языка для своих сотрудников в качестве основного развивающего обучения.

Преподавание и изучение языка, особенно новой лексики, может быть более продуктивным процессом, в то же время получая огромное удовольствие от генераторов слов для игр. Некоторые словесные игры, такие как «Кроссворды» и «Эрудит», являются одними из любимых ледоколов класса, которые будут стимулировать участие учащихся в учебе.

Выводы

Если вы любите играть со словами или просто хотите улучшить свои навыки письма, не забывайте часто обновлять свой тезаурус и писать по одной статье каждый день.

Теперь, когда вы узнали о тезаурусе и о некоторых идеях по использованию Word Cloud для создания тезауруса, давайте приступим к созданию собственного тезауруса и игр Word Cloud с помощью Облако слов AhaSlides правильный путь.


Подборка по базе: 1 лекция Основные процессы пищевых производств.pdf, Тема 4.3 Менеджер в организации. Основные теории лидерства. Стил, основные понятия ГИА.pdf, Структура и архитектура вычислительной системы. Основные информа, Основные понятия и законы химии (2).pptx, 1 Свобода и справедливость как основные правовые ценности.docx, Тема 1.3. Педагогика как наука, ее основные… .pdf, Тема №2 Основные мероприятия, проводимые при введении различных , Основные понятия динамики.pdf, 1. Заикание. Определение понятия, исторические аспекты исследова


1. Основные понятия для составления тезауруса

Латинское слово informatio переводится как “разъяснение”, “сведения“. В быту под информацией мы обычно понимаем любые сведения или данные об окружающем нас мире и о нас самих. Однако дать общее определение информации весьма непросто. Более того, в каждой области зияний слово “информация” имеет свой смысл.

Философы говорят о том, что информация, как зеркало, отражает мир (реальный илы вымышленный). Биологи рассматривают информационные процессы в живой природе. Социологи изучают ценность и полезность информации в человеческом обществе. Специалистов по компьютерной технике в первую очередь интересует представление информации и виде знаков. [1]

Считается, что слово “информатика” в современном значении образовано в результате объединения двух слов: “информация” и “автоматика”. Таким образом, получается “автоматическая работа с информацией”.

Кибернетика – наука об управлении и связи. [1]

Информационные процессы – изменения, происходящие с информацией (т.е. изменения свойств носителя). [1]

Язык как способ представления информации.

Язык —это система знаков, используемая для хранения, передачи и обработки информации. [1]

Формальный язык задается алфавитом, синтаксисом и семантикой. Теоретические основы методов проектирования языков программирования, конструирования трансляторов рассматриваются в теории формальных языков.

Формальный язык — это язык, в котором однозначно определяется значение каждого слова, а также правила построения предложения и придания им смысла. [1]

На языке программирования пишется программа, позволяющая при ее выполнении компьютером (вычислительной системой) получить конкретные результаты. Язык программирования состоит из синтаксиса и семантики.

Алфавит представляет собой набор знаков, которые используются в языке. Эти символы называются буквами. Только символы, принадлежащие данному алфавиту. можно использовать для построения слов. Буква — это элемент алфавита. Например, алфавит языка Паскаль состоит из латинских букв (причем строчные и прописные буквы не различаются), цифр и специальных символов. [1]

Под символом понимается элемент алфавита, имеющий определенное значение. Символ, как правило, записывается в памяти компьютера восемью битами, или одними байтом.

Синтаксис (от греч. syntaxis — построение, порядок) — это набор правил построения слов, конструкций и структур текста в языке или системе. Некоторые авторы включают в синтаксис и алфавит. Ошибки, возникающие при написании программы и касающиеся только синтаксиса, выявляются при синтаксическом анализе, осуществляемом трансляторов.

В информатике понятие “слово” имеет несколько определений. приведем два из них: слово — это:

— упорядоченный набор символов в заданном алфавите, имеющий определенный смысл:

— единица данных, рассматриваемая как целое при переда-

Источник информации – это субъект или объект, порождающий информацию и представляющий ее в виде сообщения. [1]

Приемник информации – это субъект или объект, принимающий сообщение и способный правильно его интерпретировать. [1]

Носитель информации. Информация хранится на носителе, который обладает “памятью”, т.е. может находиться в разных состояниях, переходить из одного состояния в другое при каком-то внешнем воздействии, и сохранять своё состояние. [1]

Канал связи – технические средства, позволяющие осуществлять передачу данных на расстоянии. [1]

Бит – это количество информации, которую можно записать (закодировать) с помощью одной двоичной цифры. [1]

Свойства информации:

  • объективность ( не зависит от чьего-либо мнения);
  • понятность для получателя;
  • полезность ( позволяет получателю решать свои задачи);
  • достоверность ( получена из надежного источника);
  • актуальность ( значима в данный момент);
  • полнота ( достаточна для принятия решения). [1]

2. Ответьте на следующие методические вопросы

1. В чем причина проблемы определения понятия «информация»?

Латинское слово informatio переводится как “разъяснение”, “сведения“. В быту под информацией мы обычно понимаем любые сведения или данные об окружающем нас мире и о нас самих. Однако дать общее определение информации весьма непросто. Более того, в каждой области зияний слово “информация” имеет свой смысл.

Философы говорят о том, что информация, как зеркало, отражает мир (реальный илы вымышленный). Биологи рассматривают информационные процессы в живой природе. Социологи изучают ценность и полезность информации в человеческом обществе. Специалистов по компьютерной технике в первую очередь интересует представление информации и виде знаков.

Прежде всего информация “бестелесна”, или нематериальна, она не имеет формы, размеров, массы. С этой точки зрения информация – это то содержание, которое человек с помощью своего создания “выделяет” из окружающей среды.

Информация характеризует разнообразие (неоднородность) в окружающем мире.

Зачем вообще нам нужна информация? Дело в том, что нише знание всегда в чём-то неполно, в нём есть неопределённость. Например, вы стоите на остановке и не знаете, на каком именно автобусе вам нужно ехать в гости к другу (его адрес известен). Неопределённость мешает вам решить свою задачу. Нужный номер автобуса можно определить, например, по карте с маршрутами транспорта. Очевидно, что при этом вы получите новую информацию, которая увеличит знание и уменьшит неопределённость.

При получении информации уменьшается неопределённость знания.

Многие выдающиеся ученые ХХ века (Н. Винер, У. Эшби, К. Шеннон, А. Урсул, А. Моль, В. М. Глушков) давили свое определение информации, но ни одно из них не стало общепринятым. Дело в том, что слово .информация. используется в самых разных ситуациях для обозначения того общего, что есть в разговоре людей, обмене письмами, чтении книги, прослушивании музыки, передаче сообщения через компьютерную сеть и т. д. Поэтому даты строгое определение информации не удаётся, можно только объяснить значение этого слова на примерах и сравнить с другими понятиями. Норберт Винер, создатель кибернетики – науки об управлении и связи – писал: “Информация есть информация, а не материя и не энергия”. [1]

2. Как эволюционирует подход к линии информации и информационных процессов со сменой поколений школьных учебников?

В связи с этим с уверенностью можно говорить, что изучение вопросов представления информации становится неотъемлемой частью общеобразовательной подготовки человека к жизни, профессиональной деятельности в условиях новой информационной среды. Сформированные умения представлять информацию важны в любой области знания, в практической деятельности, сегодня они рассматриваются как универсальные способы деятельности. В целом, роль изучения вопросов представления информации в развитии мотивационных, операциональных (инструментальных) и когнитивных ресурсов личности постоянно возрастает, что, несомненно, обуславливает необходимость использования этого потенциала в школьном образовании.

В работах В.С.Леднева, А.А.Кузнецова, С.А.Бешенкова, Е.А.Ракитиной, И.И.Раскиной, Т.Н.Суворовой и других ученых в качестве основы идеологии построения полноценного общеобразовательного курса информатики, реализующей требования фундаментальности, системности, полноты школьного образования по информатике, предлагается подход «от информационных процессов к информационным технологиям». Его суть выражается в раскрытии условий перехода от естественных информационных процессов к искусственным, созданным человеком информационным технологиям. Это требует определенного выстраивания содержательных линий, обуславливающих структуру и логику содержания обучения информатике, чтобы они работали на реализацию этой идеи. Уже сегодня сделаны первые шаги отражения этого взгляда в некоторых школьных учебниках по информатике (например, в учебниках А.А.Кузнецова, С.А.Бешенкова, Е.А.Ракитиной и др.), в Стандарте по этому предмету, принятом в 2004 году, в Примерных программах, рекомендованных Министерством образования и науки РФ и др.

Роль линии «Представление информации» усиливается в связи с тем, что с точки зрения реализации идеи «от информационных процессов к информационным технологиям» важно понимать, что эффективность организации информационных процессов во многом определяется качеством представления информации.

3. Как объяснить ученикам разницу между декларативными и процедурными знаниями? Подберите серию примеров, иллюстрирующих эти понятия.

Знания различают декларативные и процедурные. Первые представляют собой утверждения об объектах предметной области, их свойствах и отношениях между ними, то есть “я знаю, что …”. По сути дела – это факты из предметной области, фактические знания. Процедурные знания (процедуры) описывают правила преобразования объектов предметной области, то есть “я знаю как …”. Это могут быть рецепты, алгоритмы, методики, инструкции, стратегии принятия решений. Различие между ними состоит в том, что декларативные знания – это правила связи, а процедурные знания – это правила преобразования.

В общем получается любой факт это декларативное знание.

Монитор квадратный

Трава зелёная

Вода мокрая

А процедурные знания это:

Чтобы превратить воду в лёд её нужно охладить до 0 градусов.

Чтобы приготовить яичницу, возьмите яйцо, разбейте на сковородку с разогретым маслом, жарьте в течении 5 минут.

4. Объясните методический смысл введения понятия «информативность сообщения».

Вопрос об информативности сообщения следует обсуждать на примерах, предлагаемых учителем и учениками. Правило: информативным назовем сообщение, которое пополняет знания человека, т.е. несет для него информацию. Для разных людей одно и то же сообщение с точки зрения его информативности может быть разным. Если сведения “старые” , т.е. человек это уже знает, или содержание сообщения непонятно человеку, то для него это сообщение неинформативно. Информативно то сообщение, которое содержит новые и понятные сведения.

Еще раз хочется подчеркнуть всю познавательную (для учеников) и методическую (для учителя) сложность данного материала. Нельзя отождествлять понятия “ин формация” и “информативность сообщения”. Следующий пример иллюстрирует различие понятий. Вопрос:

“Содержит ли информацию вузовский учебник по высшей математике, с точки зрения первоклассника?” Ответ: “Да, содержит с любой точки зрения! Потому что в учебнике заключены знания людей: авторов учебника, создателей математического аппарата (Ньютона, Лейбница и др.), современных математиков”. Эта истина – абсолютна. Другой вопрос: “Будет ли информативным текст этого учебника для первоклассника, если он попытается его прочитать? Иначе говоря, может ли первоклассник с помощью этого учебника пополнить собственные знания?” Очевидно, что ответ отрицательный. Читая учебник, т.е. получая сообщения, первоклассник ничего не поймет, а стало быть, не обратит его в собственные знания. Введение понятия “информативность сообщения” является первым подходом к изучению вопроса об измерении информации. Если сообщение неинформативно для человека, то количество информации в нем, с точки зрения этого человека, равно нулю. Количество информации в информативном сообщении больше нуля.

При объяснении этой темы можно предложить ученикам поиграть в своеобразную викторину. Например, учитель предлагает детям перечень вопросов, ответы на которые они молча записывают на бумагу. Если ученик не знает ответа, он ставит знак вопроса. После этого учитель дает правильные ответы на свои вопросы, а ученики, записав ответы учителя, отмечают, какие из ответов оказались для них информативными (+), какие – нет (-). При этом для сообщений, отмеченных минусом, нужно указать причину отсутствия информации: не новое (это я знаю), непонятное. Например, список вопросов и ответы одного из учеников могут быть такими, как в таблице на с. 6. 3. Определение бита – единицы измерения информации – может оказаться сложным для понимания. В этом определении содержится незнакомое детям понятие “неопределенность знаний”. Прежде всего нужно раскрыть его. Учитель должен хорошо понимать, что речь идет об очень частном случае: о сообщении, которое содержит сведения о том, что’ произошло одно из конечного множества (N) возможных событий. Например, о результате бросания монеты, игрового кубика; вытаскивания экзаменационного билета и т.п. Неопределенность знания о результате некоторого события – это число возможных вариантов результата. Для монеты – 2, для кубика – б, для билетов – 30 (если на столе лежало 30 билетов).

Вопрос учителя Ответ ученика Сообщение учителя Информативность сообщения Причина не информативности
1. Какой город является столицей Франции? Столица Франции – Париж Столица Франции – Париж  + Не новое
2. Что изучает коллоидная химия? ? Коллоидная химия изучает дисперсионные состояния систем, обладающих высокой степенью раздробленности + Непонятное
3. Каковы высота и вес Эйфелевой башни? ? Эйфелева башня имеет высоту 300 метров и вес 9000 тонн +

5. Как объяснить ученикам тот факт, что в информационной технике применяется алфавитный подход к измерению информации?

Способ, не связывающий количество информации с содержанием сообщения, называется алфавитным подходом.

Проще всего разобраться в этом на примере текста, написанного на каком-нибудь языке. Для нас удобнее, чтобы это был русский язык.

Всё множество используемых в языке символов будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел (промежуток между словами) .

Полное число символов алфавита принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из русских букв и дополнительных символов равна 54.

Представьте себе, что текст к вам поступает последовательно, по одному знаку, словно бумажная ленточка, выползающая из телеграфного аппарата. Предположим, что каждый появляющийся на ленте символ с одинаковой вероятностью может быть любым символом алфавита. В действительности это не совсем так, но для упрощения примем такое предположение.

В каждой очередной позиции текста может появиться любой из N символов. Каждый символ несёт i бит информации; число i можно определить из уравнения:

Для N – 54, используя таблицу, получаем:

i = 5,755 бит.

Вот сколько информации несёт один символ в русском тексте! А теперь для того, чтобы найти количество информации во всём тексте, нужно посчитать число символов в нём и умножить на i.

Возьмём с книжной полки какую-нибудь книгу и посчитаем количество информации на одной её странице. Пусть страница содержит 50 строк. В каждой строке – 60 символов. Значит, на странице умещается 50х60 = 17265 бит.

Следовательно, при алфавитном подходе к измерению информации количество информации от содержания не зависит. Количество информации зависит от объёма текста (то есть от числа знаков в тексте) и от мощности алфавита.

Отсюда следует, например, что нельзя сравнивать информационные объёмы текстов, написанных на разных языках, только по объёму. У них отличаются информационные веса одного символа так как мощности алфавитов разных языков – различные.

Но если книги написаны на одном языке, то понятно, что в толстой книге информации больше, чем в тонкой. При этом содержательная сторона книги в расчёт не берётся.

Сформулируем правило, как измерить информацию, используя для этого алфавитный подход.

Количество информации, содержащееся в символьном сообщении, равно , где К – число символов в тексте сообщения а i – информационный вес символа, который находится из уравнения , где N – мощность используемого алфавита.

Применение алфавитного подхода удобно, прежде всего, при использовании технических средств работы с информацией. В этом случае теряют смысл понятия «новые – старые» , «понятные – непонятные» сведения. Алфавитный подход является объективным способом измерения информации в отличие от субъективного, содержательного, подхода.

6. Приведите примеры равновероятных, не равновероятных событий и событий с разной вероятностью.

Пример равновероятного события:

Мы бросаем монету и пытаемся угадать, какой стороной она упадет на поверхность. Возможен один результат из двух: монета окажется в положении «орел» или «решка». Каждое из этих двух событий окажется равновероятным, т.е. ни одно из них не имеет преимущества перед другим.

В жизни же мы сталкиваемся не только с равновероятными событиями, но и событиями, которые имеют разную вероятность реализации.

Примеры не равновероятного события:

1. Когда сообщают прогноз погоды, то сведения о том, что будет дождь, более вероятно летом, а сообщение о снеге — зимой.

2. Если вы — лучший ученик в классе, то вероятность сообщения о том, что за контрольную работу вы получили 5, больше, чем вероятность получения двойки.

3. Если на озере живет 500 уток и 100 гусей, то вероятность подстрелить на охоте утку больше, чем вероятность подстрелить гуся.

4. Если в мешке лежат 10 белых шаров и 3 черных, то вероятность достать черный шар меньше, чем вероятность вытаскивания белого.

5. Если одна из сторон кубика будет более тяжелой, то вероятность выпадения этой стороны будет меньше, чем других сторон.

Пример событий с разной вероятностью:

В корзине лежат 8 черных шаров и 24 белых. Сколько бит информации несет сообщение о том, что достали черный шар?

7. В чем состоит ограниченность содержательного подход к определению и измерению информации? На каких примерах можно объяснить этот факт ученикам?

Для человека информация — это знания человека. Рассмотрим вопрос с этой точки зрения.

Получение новой информации приводит к расширению знаний. Если некоторое сообщение приводит к уменьшению неопределенности нашего знания, то можно говорить, что такое сообщение содержит информацию.

Отсюда следует вывод, что сообщение информативно (т.е. содержит ненулевую информацию), если оно пополняет знания человека. Например, прогноз погоды на завтра — информативное сообщение, а сообщение о вчерашней погоде неинформативно, т.к. нам это уже известно.

Нетрудно понять, что информативность одного и того же сообщения может быть разной для разных людей. Например: «2×2=4» информативно для первоклассника, изучающего таблицу умножения, и неинформативно для старшеклассника.

Но для того чтобы сообщение было информативно оно должно еще быть понятно. Быть понятным, значит быть логически связанным с предыдущими знаниями человека. Определение «значение определенного интеграла равно разности значений первообразной подынтегральной функции на верхнем и на нижнем пределах», скорее всего, не пополнит знания и старшеклассника, т.к. оно ему не понятно. Для того, чтобы понять данное определение, нужно закончить изучение элементарной математики и знать начала высшей.

Получение всяких знаний должно идти от простого к сложному. И тогда каждое новое сообщение будет в то же время понятным, а значит, будет нести информацию для человека.

Сообщение несет информацию для человека, если содержащиеся в нем сведения являются для него новыми и понятными.

Очевидно, различать лишь две ситуации: «нет информации» — «есть информация» для измерения информации недостаточно. Нужна единица измерения, тогда мы сможем определять, в каком сообщении информации больше, в каком — меньше.

Единица измерения информации была определена в науке, которая называется теорией информации. Эта единица носит название «бит». Ее определение звучит так:

Сообщение, уменьшающее неопределенность знаний в два раза, несет 1 бит информации.

Например, после сдачи зачета или выполнения контрольной работы ученик мучается неопределенностью, он не знает, какую оценку получил. Наконец, учитель объявляет результаты, и он получаете одно из двух информационных сообщений: «зачет» или «незачет», а после контрольной работы одно из четырех информационных сообщений: «2», «3», «4» или «5».

Информационное сообщение об оценке за зачет приводит к уменьшению неопределенности знания в два раза, так как получено одно из двух возможных информационных сообщений. Информационное сообщение об оценке за контрольную работу приводит к уменьшению неопределенности знания в четыре раза, так как получено одно из четырех возможных информационных сообщений.

Неопределенность знаний о некотором событии — это количество возможных результатов события.

Рассмотрим еще один пример.

На книжном стеллаже восемь полок. Книга может быть поставлена на любую из них. Сколько информации содержит сообщение о том, где находится книга?

Применим метод половинного деления. Зададим несколько вопросов уменьшающих неопределенность знаний в два раза.

Задаем вопросы:

Книга лежит выше четвертой полки?

– Нет.

– Книга лежит ниже третьей полки?

– Да .

– Книга — на второй полке?

– Нет.

– Ну теперь все ясно! Книга лежит на первой полке!

Каждый ответ уменьшал неопределенность в два раза.

Всего было задано три вопроса. Значит набрано 3 бита информации. И если бы сразу было сказано, что книга лежит на первой полке, то этим сообщением были бы переданы те же 3 бита информации.

Если обозначить возможное количество событий, или, другими словами, неопределенность знаний N, а буквой I количество информации в сообщении о том, что произошло одно из N событий, то можно записать формулу:

Количество информации, содержащееся в сообщении о том, что произошло одно из N равновероятных событий, определяется из решения показательного уравнения: .
9. Попробуйте на примере школьного урока проиллюстрировать следующие понятия: информационные процессы, носитель информации, хранилище информации, передача информации, шум и защита от шума, обработка информации.

ПОНЯТИЕ ОБ ИНФОРМАЦИОННЫХ ПРОЦЕССАХ

Информационный процесс – это момент взаимодействия данных с информационными методами. На примере книги это момент взаимодействия книги (данных) с человеком (его информационными методами).Это можно назвать частным информационным процессом. Для человека частные информационные процессы сливаются в один общий процесс, который длится всю его жизнь. Для технических устройств процесс длится пока к устройству подается питание.

НОСИТЕЛЬ ИНФОРМАЦИИ

Память самый первый инструмент хранения информации. Люди всегда понимали не надежность человеческой памяти и с давних времен стремились доступными им способами зафиксировать наиболее важную информацию на каких-либо внешних носителях. Для того чтобы узнать как хранили информацию в далекие времена мы с вами отправимся в прошлое с помощью машины времени. По наскальным росписям в пещерах мы можем судить о том, как охотились древние люди. Некоторое время спустя люди стали наносить информацию на создаваемые ими постройки (храмы, жилища). Одним из таких видов информации являются фрески. Фрески – это разноцветная роспись стен по мокрой штукатурке. Информацию, которая наносилась на стены зданий, нельзя было переносить, поэтому она была доступной только тем, кто посещал данное здание. А с появлением письменности появилась потребность в менее громоздких носителях информации. Люди стали наносить информацию на тонко раскатанную глину бамбуковыми палочками или косточками. Потом ее сушили и обжигали. Но все-таки они были не удобны для хранения информации, они ломались, и их хранение было очень трудоемким.

Примерно за 3000 лет до нашей эры в Египте разработали технологию изготовления тонкого листа из тростника. Разрезая тростинку в длину, половинки складывали одну за другой на ровную поверхность, а потом второй слой таких же полосок, но уже в поперечном направлении и чем-нибудь прижимали. Из тростника выделялся клейкий сок и склеивал полоски между собой. После просушивания получался материал, похожий на бумагу, – его тоже называли папирусом.

Когда листочек папируса исписывали до конца, то к нему приклеивали другой. Книга получалась все длиннее. Для хранения её сворачивали в трубочку – свиток.

Продолжительное время документы хранились на пергаментных свитках. Пергамент делался из кожи животных. Её выделывали и растягивали, чтобы получить тонкие листы.

На Руси для хранения и передачи документов использовали кору берёзы. Её аккуратно срезали с дерева так, чтобы получился прямоугольник. После заполнения её также скручивали в трубочку.

Во II веке нашей эры в Китае изобрели технологию изготовления бумаги. Но широкое распространение бумага только в XV- XVI века.

Для того чтобы хранить много информации на общую тему в одном месте отдельные листы бумаги скрепляли между собой с одной стороны. Так получались книги.

Со временем человечество научилось хранить и передавать звуковую и видео информацию. Первым носителем звуковой информации были валики с выступами которые использовались в музыкальных шкатулках, шарманках и т.д. Потом изобрели грампластинку, на смену которой пришла аудиокассета.

Первым носителем видеоинформации стала видеопленка, которую заменила магнитная видеопленка.

В настоящее время придуманы универсальные носители информации. Это CD и DVD-диски, флэш-карты.

Для сравнения можно вычислить:

  1. один учебник информатики 5 класса весит 310 г.;
  2. обычный CD диск весит 15 г.;
  3. на диск умещается 1500 книг;
  4. 1500 книг = 465 кг.

ХРАНЕНИЕ ИНФОРМАЦИИ

Человек хранит информацию в собственной памяти, а также в виде записей на различных внешних (по отношению к человеку) носителях: на камне, папирусе, бумаге, магнитных и оптических носителях и пр. Благодаря таким записям информация передается не только в пространстве (от человека к человеку), но и во времени — из поколения в поколение.

Разнообразие носителей информации

Информация может храниться в различных видах: в виде текстов, в виде рисунков, схем, чертежей; в виде фотографий, в виде звукозаписей, в виде кино- или видеозаписей. В каждом случае применяются свои носители. Носитель — это материальная среда, используемая для записи и хранения информации.

К основным характеристикам носителей информации относятся: информационный объем или плотность хранения информации, надежность (долговечность) хранения.

ПЕРЕДАЧА ИНФОРМАЦИИ

Посмотрите на эти объекты (на столе стоит компьютер, лежат телефон, книга, письмо, стопка тетрадей) и скажите, какое действие с информацией они помогут нам выполнить?

(Передать информацию, передача информации)

Люди постоянно участвуют в действиях, связанных с передачей информации. Приведите, пожалуйста, примеры из жизни, когда вы получали или передавали информацию?

(Звонок по телефону – и получал, и передавал информацию)

(Получал письмо, писал письмо)

(Смотрел новости по телевидению)

Сколько сторон участвует в процессе передачи информации?

(Две)

Одна – … (передает информацию). Другая – … (получает информацию).

Их называют источник информации и приёмник информации.

Кого мы называем источником информации?

(Того, кто передает информацию)

А приёмником?

(Того, кто получает информацию)

ШУМ И ЗАЩИТА ОТ ШУМА

Шум – это разного рода помехи, искажающие передаваемый сигнал и приводящие к потере информации.

Наличие шума приводит к потере передаваемой информации. В таких случаях необходима защита от шума. Шеннон разработал специальную теорию кодирования. Идея этой теории – передаваемый по линии связи код должен быть избыточным. За счет этого потеря информации при передаче может быть компенсирована

ОБРАБОТКА ИНФОРМАЦИИ

– Ребята, для того чтобы узнать, что означает обработка информации, можно решить задачу поиска его определения, например, в терминологическом словарике.

– Найдите в учебнике словарик и решите задачу.

(Ученики ищут определение понятия и поднимают руку. Один ученик по моему выбору читает определение вслух: « Обработка информации – это решение информационной задачи, или процесс перехода от исходных данных к результату».)

– Мы решили задачу поиска, в которой исходными данными было понятие обработка информации, а результатом стало его определение.

– Ребята, обратите внимание на доску. Слева я записываю то, что в наших задачах было исходными данными. Справа – что необходимо получить в результате.

– Подумайте, как можно иначе назвать решение наших задач?

(Ученик отвечает: «Обработкой информации». Я подписываю в заголовке среднего столбца – Обработка информации.)

– Обработка информации бывает двух типов. Мы сейчас изучили обработку, не изменяющую содержание информации, а связанную с изменением ее формы представления. Обрабатывая ребус, мы получили фразу того же содержания, только на русском языке, а, применив терминологический словарик, мы другими словами говорили о том же самом понятии.

– А вот, решая задачи на уроке математики, вы получаете новую информацию, не существующую в исходных данных, а созданную за счет их преобразования по некоторым правилам.

– Обрабатывать информацию может не только человек, но различные устройства.

– Устройством, которое может обрабатывать разные виды информации, является компьютер.

10. Приведите примеры систем, в которых должны быть выделены источник, приемник, носитель и канал передачи информации.

ТЕЛЕВИДЕНИЕ

Источник: телебашня(Останкинская, например).

Приёмник: антенна.

Носитель: телекомпания.

Канал передачи информации: волны.

УЧЕНИК И УЧИТЕЛЬ

Источник информации: учитель.

Приемник: ученик.

Носитель: звуковая волна.

Канал передачи: воздух.

КОМПЬЮТЕР И ЧЕЛОВЕК

Источник: компьютер.

Приемник: ученик.

Носитель: на экране изображение(документ или что-то подобное…).

Канал передачи: монитор.
11. Предложите вариант классификации языков, используемых в информатике.

Стили программирования(классификация системы программиро-вания):

  1. процедурный;
  2. функциональный;
  3. логический;
  4. объектно – ориентированный.

Процедурное программирование.

Процедурное (императивное) программирование является отражением архитектуры традиционных ЭВМ, которая была предложена Д. фон Нейманом  в 40–х г.г.

Языком программированияназывают систему обозначений, служащую в целях точного описания алгоритмов для ЭВМ или, по крайней мере, достаточную для автоматического нахождения такого алгоритма.

Языки общения с компьютером:

Низкого уровня:

  1. машинный: двоичный язык, шестнадцатеричный язык;
  2. язык детализированных схем программ; 
  3. символический язык: язык Ассемблера, язык Макроассемблера.

Высокого уровня:

  1. универсальные: Фортран, Basic, Алгол, Кобол, ПЛ1, Паскаль, Ада;
  2. специализированные.

Уровень языка программирования определяется смысловой емкостью его конструкций и его ориентацией на программиста – человека.

Двоичный язык – непосредственно машинный язык. В настоящее время такие языки программистами не применяются.

Шестнадцатеричный язык обеспечивает некоторое упрощение записи программы на машинном языке путем представления четырех двоичных цифр одной шестнадцатеричной. Этот язык используется в качестве дополнения к языкам высокого уровня, таким как Паскаль, для программирования критичных к времени выполнения фрагментов алгоритмов.

Язык детализированных схем программ – это не язык программирования, а язык представления алгоритмов при разработке программ, некогда широко используемый. В связи с низким уровнем этот язык в настоящее время на практике не применяется.

Язык Ассемблера – этот язык предназначен для представления в символической форме программ, записанных на машинном языке. Он позволяет программисту пользоваться мнемоническими кодами операций, по своему усмотрению присваивать символические имена регистрам ЭВМ и ячейкам памяти, а также задавать наиболее удобные в том или ином контексте схемы адресации.

Язык Макроассемблера – является расширением языка Ассемблера за счет включения макросредств, т.е. представляет средство определения и использования новых, более мощных команд, как последовательностей базовых инструкций, что несколько повышает его уровень.

Фортран – первый и распространенный язык, был разработан в 1956 г. сотрудником формы IBM Дж. Бекусом (математик). Язык за несколько лет совершенствуется и в 1966 г. – Фортран – 66 – стандартизирован Американским национальным институтом стандартов (ANSI). Всем хорош Фортран, но все – таки сложен для многих пользователей, которым желательно прежде всего простота. И такой язык был изобретен на базе Фортрана – это Бейсик.

BASIC – (многоцелевой язык символических инструкций для начинающих) создали его Дж. Кемени и Т. Куртц. Простой язык программирования, разработанный в 1964 г. для использования новичками в Дортмутском колледже, как средство для обучения программированию, язык популярен.

Алгол– создан в 1960 г. (поэтому его иногда называют Алгол – 60). Развитием языка Алгол – 60 является Алгол – 68, созданный в Западной Европе Международной Федерацией. Версия Алгол – 68 обладала богатым набором средств, высокой строгостью и стройностью, но и большой сложностью. Ее реализация затянулась на долгие годы, в результате чего время было упущено и данный язык в некотором смысле, пережил самого себя – устарел, практически прекратив свое существование.

Кобол – общий язык, ориентированный на экономические применения, на обработку коммерческой информации, разработан в 1960 г. для применения в экономике и за период своего существования, как и многие языки, претерпевший ряд изменений. В настоящее время используются стандарты COBOL – 74, 85.

ПЛ1 (PL/1) – этот язык является попыткой совместить все лучшее, что есть в Алголе и Коболе. Был создан на фирме IBM в 1966 – 67 г.г. в настоящее время практически не используется.

ПАСКАЛЬ (PASCAL) – этот язык является прямым развитием направления Алгола, он стал одним из наиболее популярных процедурных языков программирования среди прикладных программистов. Он разработан в 1970 г. швейцарским специалистом в области вычислительной техники профессором Н. Виртом, назван в честь французского математика Блеза Паскаля и, по замыслу автора, предназначался для обучения программированию. В настоящее время существует 3 PASCAL – стандарта:

  1. британский стандарт BS6192: 1982 г.,
  2. международный стандарт ISO 7185:1983г., идентичный предыдущему;
  3. ANSI – стандарт

АДА – разработан в 1979 г. ведущими специалистами в области программирования по заказу Министерства обороны США для использования во встроенных системах с управляющими ЭВМ, что требует поддержки режима реального времени. Язык назван в честь Августы Лады Лавлейс, она по праву считается первым в мире программистом. АДА является продолжением направления Алгола. Язык отталкивает своей громоздкостью, хотя с 1986 г. он стал обязательным для многих военных приложений в США.

Существующие универсальные языки моделирования GPSS, Симула, Симскрипт и другие, в сочетании с универсальными языками программирования, позволяют создавать специализированные пакеты моделирующих программ.

Язык С – первоначально разработан в начале 70–х гг. для реализации разработки систем, трансляторов, баз данных и других системных и прикладных программ, т.е. создавался не как учебный, а как инструментальный язык.

Modula – 2 – 1979 г. – создан Н. Виртом, но подобно С, в нем присутствуют низкоуровневые средства.

APL – был создан Иверсоном в 1969 г. и сразу получил широкое распространение. Основное его назначение – обработка массивов.

LOGO (ЛОГО) – с целью обучения детей в 1960 г. разработан и используется в настоящее время. Он отличается простотой, но весьма богатыми возможностями, среди которых процедуры, графическое средство и др. Создали С. Пейпер с коллегами из Массачусетского технологического института (США) – управление “черепахой” – программной моделью малого робота.

GPSS – общецелевая система моделирования
3. Ответьте на следующие содержательные вопросы

1. Количество информации, которое несет в тексте каждый символ (i) вычисляется по формуле: , где Nмощность алфавита. Данная формула имеет название …

Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой (равновероятно), то количество информации, которое несет каждый символ, вычисляется по формуле Хартли:

Формула Хартли задает связь между количеством возможных событий N и количеством информации i:

2. Язык HTML – пример … языка

SGML – это система описания языков разметки (markup). HTML – пример такого языка. Язык программирования HTML (Hypertext Markup Language) предназначен для создания гипертекстных документов, формат которых не зависит от ЭВМ или используемой ОС.

3. При содержательном подходе к измерению информации, сообщение информативно, если оно содержит … сведения.

Сообщение информативно для человека, если оно содержит новые сведения, и неинформативно, если сведения старые, известные. Таким образом, количество информации в сообщении зависит от того, насколько ново это сообщение для получателя и определяется объемом знаний, который несет это сообщение получающему его человеку.

4. При алфавитном подходе к измерению информации, мощностью алфавита некоторого языка называют …

Мощностью алфавита называется количество знаков в алфавите. Мощность алфавита обозначается буквой N.

Например:

  • мощность алфавита из русских букв равна 32 (без буквы ё);
  • мощность алфавита текста набранного с клавиатуры равна 256 (строчные и прописные латинские и русские буквы, цифры, знаки арифметических операций, скобки, знаки препинания и т.д.);
  • мощность двоичного алфавита равна 2;
  • мощность алфавита арифметических выражений равна 16 (цифры 0, 1, 2, 3, 4, 5, 6, 7, 8, 9; операции +, -, *, /, ; знак = ; запятая).

5. При алфавитном подходе к измерению информации, если К –количество символов в тексте, i – информационный вес символа в данном алфавите, то информационный объем текста V можно узнать по формуле V=…

Для расчёта информационного объёма текстового сообщения используется формула , где V – это информационный объём текстового сообщения, измеряющийся в байтах, килобайтах, мегабайтах; K – количество символов в сообщении, i – информационный вес одного символа, который измеряется в битах на один символ.

6. Сообщение несет один байт информации (при содержательном подходе), если неопределенность знаний уменьшается в __ раз(а).

В содержательном подходе количество информации, заключенное в сообщении, определяется объемом знаний, который это сообщение несет получающему его человеку.

Вспомним, что с «человеческой» точки зрения информация – это знания, которые мы получаем из внешнего мира. Количество информации, заключенное в сообщении, должно быть тем больше, чем больше оно пополняет наши знания.

1 бит – минимальная единица измерения количества информации.

В теории информации для бита дается следующее определение:

Сообщение, уменьшающее неопределенность знания в два раза, несет 1 бит информации.

7. Какова минимальная мощность алфавита, пригодного для передачи информации?

Минимальная мощность алфавита, пригодного для передачи информации, равна 2.

Такой алфавит называется двоичным алфавитом (0,1).

4. Решите следующие задачи

1. В рулетке общее количество лунок равно 32. Какое количество информации мы получаем в зрительном сообщения об остановке шарика в одной из лунок?

Решение:

2. Какое количество информации несет сообщение: «Встреча назначена на май»?

Решение:

Т ак как месяцев в году 12, то из этого количества сообщений нужно выбрать одно. Значит N = 16, а I = log212. Смотрим по таблице и видим, что I = 3,58496 бит.

3. Какое количество информации получит второй игрок при игре в крестики-нолики на поле 4х4, после первого хода первого игрока, играющего крестиками (рис. 8)?

4. Во сколько раз увеличится информационный объем страницы текста (текст не содержит управляющих символов форматирования) при его преобразовании из кодировки MS-DOS (таблица кодировки содержит 256 символов) в кодировку Unicode (таблица кодировки содержит 65536 символов)?

Решение:

В кодировке MS-DOS 256 символов = . Следовательно информационный объем 1-го символа равен 8 бит или 1 байт.

В кодировке Unicode 65536 символов = . Следовательно, информационный объем 1-го символа равен 16 бит или 2 байта.

Количество символов на странице в разных кодировках одинаково, следовательно информационный объем страницы текста увеличивается в 2 раза.

5. Сколько бит информации несет сообщение, что из колоды в 32 карты: а)пиковую даму б)достали туза??

а) При случайном вытаскивании карт из перемешанной колоды ни одна из карт не имеет преимущества по сравнению с другими быть выбранной. Следовательно, случайный выбор любой карты, в том числе и дамы пик, — события равновероятные. Отсюда следует, что неопределенность знаний о результате вытаскивания карты равна 32 — числу карт в колоде. Если i — количество информации в сообщении о результате вытаскивания одной карты (дамы пик), то имеем уравнение

бит

б) Всего в колоде 4 туза. Следовательно, вероятность достать туза равна: P=4/32=1/8. По формуле Хартли: бит

6. Каков информационный объем текста, содержащего слово ИНФОРМАТИКА, в 8-битной кодировке?

Решение:

Информационный объем текста равен: .

7. В корзине лежат 3 белых и 1 черный шар. Сколько бит информации несет сообщение о том, что извлечен черный шар?

3+1=4 – общее количество шаров в корзине

1/4=0,25 – вероятность того, что из корзины достали черный шар;

бита

Добавить комментарий