Как найти моду полученных данных в таблице

8.4. МОДА и МЕДИАНА (структурные средние)

 Мода и медиана наиболее часто используемые в экономической практике структурные средние.


Мода – это величина признака (варианта), который наиболее часто встречается  в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.


В дискретном ряду мода определяется в соответствии с определением, т.е. это одна из вариант признака, которая в ряду распределения имеет наибольшую частоту.


Для интервального ряда моду находим по формуле (8.16), сначала по наибольшей частоте определив модальный интервал:

Статистика Формула Мода для интервального ряда

(8.16 – формула Моды)


где хо – начальная (нижняя) граница модального интервала;

h – величина интервала;

fМо – частота модального интервала;

fМо-1 – частота интервала, предшествующая модальному;

fМо+1– частота интервала следующая за модальным.



Медианой  называется такое значение признака, которое приходится на середину ранжированного ряда, т.е. в ранжированном ряду распределения одна половина ряда имеет значение признака больше медианы, другая – меньше медианы.

В дискретном ряду медиана находится  непосредственно по накопленной частоте, соответствующей номеру медианы.

В случае интервального вариационного ряда медиану определяют по формуле:

Статистика Формула Медиана для интервального ряда                                           (8.17 – формула Медианы)


где хо – нижняя граница медианного интервала;

NМе– порядковый номер медианы (Σf/2);

S Me-1 – накопленная частота до медианного интервала;

fМе –  частота медианного интервала.


Пример вычисления Моды.

Рассчитаем моду и медиану по данным табл. 8.4.

Таблица 8.4 – Распределение семей города N  по размеру среднедушевого дохода в январе 2018 г. руб.(цифры условные)

Группы семей по размеру дохода, руб. Число

семей

Накоп-

ленные частоты

в % к итогу

До 5000 600 600 6
5000-6000 700 1300

(600+700)

13
6000-7000 1700 (fМо-1) 3000 (S Me-1 )

(1300+1700)

30
7000-8000

 (хо)

2500

(fМо)

(fМе)

5500 (S Me) 55
8000-9000 2200 (fМо+1) 7700 77
9000-10000 1500 9200 92
Свыше 10000 800 10000 100
Итого 10000

Пример вычисления Моды. Найдем моду по формуле (8.16) см. обозначения в таблице, а h = 8000-7000=1000, т.е. получаем:

Статистика. Пример расчета Моды (структурные средние)

Пример вычисления Моды


Пример вычисления Медианы интервального вариационного ряда. Рассчитаем медиану по формуле (8.17):

1) сначала находим  порядковый  номер медианы: NМе = Σfi/2= 5000.

2) по накопленным частотам в соответствии с номером медианы определяем, что 5000 находится в интервале (7000 – 8000), далее  значение медианы  определим по формуле (8.17):

Статистика. Пример Медиана

Пример вычисления Медианы


Вывод: по моде – наиболее часто встречается среднедушевой доход в размере 7730 руб., по медиане – что половина семей города имеет среднедушевой доход ниже 7800 руб., остальные семьи – более 7800 руб.


Пример .СРЕДНИЙ, МЕДИАННЫЙ И МОДАЛЬНЫЙ УРОВЕНЬ ДЕНЕЖНЫХ ДОХОДОВ НАСЕЛЕНИЯ  ЦЕЛОМ ПО РОССИИ И ПО СУБЪЕКТАМ РОССИЙСКОЙ ФЕДЕРАЦИИ ЗА 2013 год см. по ссылке. Источник: оценка на основании данных выборочного обследования бюджетов домашних хозяйств и макроэкономического показателя денежных доходов населения


Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию.

Если Мое имеет место правосторонняя асимметрия.

При Х<Мео следует сделать вы­вод о левосторонней асимметрии ряда.


Средние величины (арифметическая, гармоническая, геометрическая, квадратическая) см. по ссылке

Оценка статьи:

Загрузка…


Загрузить PDF


Загрузить PDF

Microsoft Excel выполняет ряд статистических функций, в их числе – подсчет среднего значения, медианы и моды. В то время как среднее значение (среднее арифметическое группы чисел) и медиана (число, которое является серединой группы) используются чаще, мода – наиболее часто встречающееся число в наборе чисел – тоже считается довольно полезной функцией. Она пригодится, например, чтобы использовать наиболее частую числовую оценку для определения эффективности метода обучения. Вот как рассчитывать моду с помощью Excel.

  1. Изображение с названием Calculate Mode Using Excel Step 1

    1

    Введите каждое число в отдельную ячейку. Для соблюдения принципа преемственности, вводите значения по порядку – в строку или в столбец – но для удобства столбец предпочтительнее.

  2. Изображение с названием Calculate Mode Using Excel Step 2

    2

    Введите функцию MODE в ячейку, в которой вы хотите увидеть результат. Формат функции следующий: “=MODE(Cx:Dy)», где C и D представляют букву столбца первой и последней ячейки набора чисел, а х и y – номер первой и последней строки набора чисел (хотя в этом примере используются разные буквы, вы будете использовать одну и ту же букву столбца для первой и последней ячейки, если будете вводить данные в столбец или тот же номер строки при вводе данных в строку).

    • Вы также можете указать каждую ячейку отдельно (до 255 ячеек), как в “=MODE(A1, A2, A3)», но рекомендуется делать это только тогда, если у вас очень мало данных и вы не планируете их добавлять в будущем. Можно использовать функцию с константами, например “=MODE(4,4,6)», но в этом случае нужно будет редактировать функцию каждый раз, когда вы захотите найти другую моду.
    • Для выделения в наборе чисел возможно отформатировать ячейку на отображение моды жирным шрифтом или курсивом.
  3. Изображение с названием Calculate Mode Using Excel Step 3

    3

    Посчитайте и отобразите результаты. Обычно в Excel это происходит автоматически, но если вы изменили его настройки на ручное вычисление, нажмите F9 для отображения моды.

    • Для набора данных 10, 7, 9, 8, 7, 0 и 4, введенных в ячейки с 1 по 8 колонки А, функция =MODE(A1:A8) отобразит результат 7, так как 7 появляется в наборе данных чаще других чисел.
    • Если в наборе данных имеется более одного числа, которое квалифицируется в качестве моды (например, 7 и 9 появляются дважды, а все остальные числа – по одному разу), то первое по списку число моды и будет результатом. Если ни одно значение не появляется чаще других, функция MODE отобразит сообщение об ошибке #N/A.
    • Функция MODE доступна во всех версиях Excel, включая Excel 2010, который включает ее для совместимости с электронными таблицами, созданными в более ранних версиях. Excel 2010 использует функцию MODE.SNGL, которая, за исключением синтаксиса (=MODE.SNGL(Cx:Dy)), работает фактически так же, как и функция MODE в более ранних версиях Excel.

    Реклама

  1. Изображение с названием Calculate Mode Using Excel Step 4

    1

    Введите каждое число в наборе данных в отдельную ячейку.

  2. Изображение с названием Calculate Mode Using Excel Step 5

    2

    Выберите диапазон ячеек, равный количеству мод, которые вы хотите найти в наборе данных. Если вы хотите найти три моды, выберите три ячейки. В противном случае, вы увидите количество мод, равное количеству выбранных ячеек.

  3. Изображение с названием Calculate Mode Using Excel Step 6

    3

    Введите функцию MODE.MULT в панель формул. Формат функции MODE.MULT следующий: “=MODE.MULT(Cx:Dy),» где C и D отображают букву колонки первой и последней ячеек диапазона, а x и y – число первой и последней строки (как и с функцией MODE, обычно данные вводят в ячейки одного столбца и используют при этом одну букву столбца для первой и последней диапазона или же в ячейки одной строки с использованием того же номера строки для первой и последней ячеек диапазона).

    • MODE.MULT также можно использовать с указанием отдельных ячеек или констант в скобках, но любой из этих вариантов следует использовать только с небольшим набором данных, которые вы не планируете менять.
  4. Изображение с названием Calculate Mode Using Excel Step 7

    4

    Используйте сочетание клавиш control+shift+enter для отображения результата в виде массива, в противном случае, он будет выведен так же, как и с функцией MODE.SNGL. Если вы изменили настройки на ручное вычисление, нажмите F9, чтобы увидеть результат.

  5. Изображение с названием Calculate Mode Using Excel Step 8

    5

    В отличие от MODE.SNGL, функция MODE.MULT показывает несколько результатов. Для набора данных 2,1,3,4,3,2,1,7,1,2,3,8, введенных в ячейки с 1 по 12 колонки A, формула =MODE.MULT(A1:A12) отобразит моды 1, 2 и 3, так как каждое число появляется в ряде данных три раза.

  6. Изображение с названием Calculate Mode Using Excel Step 9

    6

    Если ни одно число в ряде данных не появляется чаще других, функция MODE.MULT отобразит сообщение об ошибке “#N/A”.

  7. Изображение с названием Calculate Mode Using Excel Step 10

    7

    Функция MODE.MULT доступна только в Microsoft Excel 2010.

    Реклама

Советы

  • При добавлении новых чисел в набор данных проверяйте формулу, чтобы убедиться в правильности указания первой и последней ячеек набора данных. Если вы вставите строки перед начальным первым номером в наборе и введете в них данные, нужно отредактировать в теле функции первый номер ячейки в диапазоне. Если вы вставите строки и заполните их данными после последнего числа ряда данных – отредактируйте функцию, изменив последнюю ячейку. Если вы вставите строки в середину, диапазон ячеек изменится автоматически.

Реклама

Предупреждения

  • Использование формулы MODE.MULT для одновременного поиска большого количества мод может замедлить работу вашего компьютера, если ему не хватает достаточного количества памяти и вычислительной мощности.

Реклама

Об этой статье

Эту страницу просматривали 33 513 раз.

Была ли эта статья полезной?

В статистике есть целый набор показателей, которые характеризуют центральную тенденцию. Выбор того или иного индикатора в основном зависит от характера данных, целей расчетов и его свойств.

Что подразумевается под характером данных? Прежде всего, мы говорим о количественных данных, которые выражены в числах. Но набор числовых данных может иметь разное распределение. Под распределением понимаются частоты отдельных значений. К примеру, в классе из 23 человек 2 школьника написали контрольную работу на двойку, 5 – на тройку, 10 – на четверку и 6 – на пятерку. Это и есть распределение оценок. Распределение очень наглядно можно представить с помощью специальной диаграммы – гистограммы. Для данного примера получится следующая гистограмма.

Распределение оценок

Во многих случаях количество уникальных значений намного больше, а распределение похоже на нормальное. Ниже приведена примерная иллюстрация нормального распределения случайных чисел.

Нормальное распределение чисел

Итак, центральная тенденция. Если частоты анализируемых значений распределены по нормальному закону, то есть симметрично вокруг некоторого центра, то центральная тенденция определяется вполне однозначно – это есть тот самый центр, и математически он соответствует средней арифметической.

Как нетрудно заметить, в этом же центре находится и максимальная частота значений. То есть при нормальном распределении центральная тенденция есть не только средняя арифметическая, но и максимальная частота, которая в статистике называется модой или модальным значением.

Мода и среднее арифметическое при нормальном распределении

На диаграмме оба значения центральной тенденции совпадают и равны 10.

Но такое распределение встречается далеко не всегда, а при малом числе данных – совсем редко. Чаще бывает так, что частоты распределяются асимметрично. Тогда мода и среднее арифметическое не будут совпадать.

Мода и среднее арифметическое не совпадают

На рисунке выше среднее арифметическое по-прежнему составляет 10, а вот мода уже равна 9. Что в таком случае считать значением центральной тенденции? Ответ зависит от поставленных целей анализа. Если интересует уровень, сумма отклонений от которого равна нулю со всеми вытекающим отсюда свойствами и последствиями, то это средняя арифметическая. Если нужно максимально частое значение, то это мода.

Итак, зачем нужна мода? Приведу пару примеров. Экономист планово-экономического отдела обувной фабрики интересуется, какой размер обуви пользуется наибольшим спросом. Средний размер обуви, скорее всего, здесь не подойдет, тем более, что число может получится дробным. А вот мода – как раз нужный показатель.

Расчет моды

Теперь посмотрим, как рассчитать моду. Мода – это то значение в анализируемой совокупности данных, которое встречается чаще других, поэтому нужно посмотреть на частоты значений и отыскать максимальное из них. Например, в наборе данных 3, 4, 6, 7, 3, 5, 3, 4 модой будет значение 3 – повторяется чаще остальных. Это в дискретном ряду, и здесь все просто. Если данных много, то моду легче всего найти с помощью соответствующей гистограммы. Бывает так, что совокупность данных имеет бимодальное распределение.  

Двумодальное распределение

Без диаграммы очень трудно понять, что в данных не один, а два центра. К примеру, на президентских выборах предпочтения сельских и городских жителей могут отличаться. Поэтому распределение доли отданных голосов за конкретного кандидата может быть «двугорбым». Первый «горб» – выбор городского населения, второй – сельского.

Немного сложнее с интервальными данными, когда вместо конкретных значений имеются интервалы. В этом случае говорят о модальном интервале (при анализе доходов населения, например), то есть интервале, частота которого максимальна относительно других интервалов. Однако и здесь можно отыскать конкретное модальное значение, хотя оно будет условным и примерным, так как нет точных исходных данных. Представим, что есть следующая таблица с распределением цен.

Интервальные данные для расчета моды

Для наглядности изобразим соответствующую диаграмму.

Рисунок распределения интервальных данных

Требуется найти модальное значение цены.

Вначале нужно определить модальный интервал, который соответствует интервалу с наибольшей частотой. Найти его так же легко, как и моду в дискретном ряду. В нашем примере это третий интервал с ценой от 301 до 400 руб. На графике – самый высокий столбец. Теперь нужно определить конкретное значение цены, которое соответствует максимальному количеству. Точно и по факту сделать это невозможно, так как нет индивидуальных значений частот для каждой цены. Поэтому делается допущение о том, что интервалы выше и ниже модального в зависимости от своей частоты имеют разные вес и как бы перетягивают моду в свою сторону. Если частота интервала следующего за модальным больше, чем частота интервала перед модальным, то мода будет правее середины модального интервала и наоборот. Давайте еще раз посмотрим на рисунок, чтобы понять формулу, которую я напишу чуть ниже.

Мода на рисунке

На рисунке отчетливо видно, что соотношение высоты столбцов, расположенных слева и справа от модального определяет близость моды к левому или правому краю модального интервала. Задача по расчету модального значения состоит в том, чтобы найти точку пересечения линий, соединяющих модальный столбец с соседними (как показано на рисунке пунктирными линиями) и нахождении соответствующего значения признака (в нашем примере цены). Зная основы геометрии (7-й класс), по данному рисунку нетрудно вывести формулу расчета моды в интервальном ряду.

Формула моды имеет следующий вид.

Формула моды

Где Мо – мода,

x0 – значение начала модального интервала,

h – размер модального интервала,

fМо – частота модального интервала,

fМо-1 – частота интервала, находящего перед модальным,

fМо1 – частота интервала, находящего после модального.

Второе слагаемое формулы моды соответствует длине красной линии на рисунке выше.

Рассчитаем моду для нашего примера.

Расчет моды

Таким образом, мода интервального ряда представляет собой сумму, состоящую из значения начального уровня модального интервала и отрезка, который определяется соотношением частот ближайших интервалов от модального.

Расчет моды в Excel

В настоящее время большинство вычислений делается в MS Excel, где для расчета моды также предусмотрена специальная функция. В Excel 2013 я таких нашел ажно 3 штуки.

Мода в Excel

МОДА – пережиток старых изданий Excel. Функция оставлена для совмещения со старыми версиями.

МОДА.ОДН – рассчитывает моду по заданным значениям. Здесь все просто. Вставили функцию, указали диапазон данных и «Ок».

МОДА.НСК – позволяет рассчитать сразу несколько модальных значений (одинаковых максимальных частот) для одного ряда данных, если они есть. Функцию нужно вводить как формулу массива, перед этим выделив количество ячеек равное количеству требуемых модальных значений. Иногда действительно модальных значений может быть несколько. Однако для этих целей предварительно лучше посмотреть на диаграмму распределения. 

Моду для интервальных данных одной функцией в Excel рассчитать нельзя. То есть такая функция в готовом виде не предусмотрена. Придется прописывать вручную. 

Следующая статья посвящена медиане.

До встречи на statanaliz.info.

Поделиться в социальных сетях:

Как рассчитать моду из таблицы частот (с примерами)

  • Редакция Кодкампа

17 авг. 2022 г.
читать 2 мин


Мода таблицы частот представляет значение, которое встречается чаще всего.

На практике может быть:

  • Нулевые режимы , если ни одно значение не встречается чаще, чем любое другое.
  • Один режим , если одно значение встречается чаще всего.
  • Несколько режимов , если несколько значений встречаются чаще всего.

Чтобы определить режим таблицы частот, вам просто нужно определить значение (я) с самой высокой частотой.

В следующих примерах показано, как найти моду различных таблиц частот.

Пример 1: Поиск моды из таблицы частот (нулевые моды)

Следующая таблица частот показывает количество домашних животных, принадлежащих 10 разным семьям в определенном районе:

Обратите внимание, что каждое значение в таблице имеет одинаковую частоту.

Это означает, что для этой конкретной таблицы частот нет режима, поскольку каждое значение встречается одинаковое количество раз.

Пример 2: Поиск режима из таблицы частот (один режим)

В следующей таблице частоты показано общее количество побед 17 футбольных команд в определенной лиге:

Количество выигрышей с наибольшей частотой – 2 выигрыша.

Режим из таблицы частот

Таким образом, мода для этой таблицы частот равна 2 .

Пример 3: Поиск режима из таблицы частот (несколько режимов)

В следующей таблице частот показан размер домохозяйства различных домохозяйств в определенном районе:

Размеры домохозяйств с наибольшей частотой составляют 3 , 4 и 7 .

Таким образом, эта таблица частот фактически имеет три моды: 3 , 4 и 7 .

Дополнительные ресурсы

Как рассчитать медиану из таблицы частот
Как рассчитать среднее значение из таблицы частот

Написано

Редакция Кодкампа

Замечательно! Вы успешно подписались.

Добро пожаловать обратно! Вы успешно вошли

Вы успешно подписались на кодкамп.

Срок действия вашей ссылки истек.

Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.

Успех! Ваша платежная информация обновлена.

Ваша платежная информация не была обновлена.

Для различных аналитических целей часто требуется получить средний уровень различных показателей: средний возраст, средняя зарплата и т.д. Первое, что приходит на ум – это найти простое среднее арифметическое. Но всегда ли это правильно? В этой статье разберемся, что такое медиана, среднее арифметическое и мода. А также научимся считать их в Excel.

  • Среднее арифметическое
  • Медиана – чем отличается от среднего значения
  • Что лучше – медиана или среднее значение
  • Что такое мода
  • Средневзвешенное значение

Среднее арифметическое

Среднее арифметическое значение – это сумма всех элементов выборки, поделенная на количество этих элементов.

Например, есть список должностей и заработных плат. Чтобы посчитать среднюю заработную плату в Excel, воспользуемся функцией СРЗНАЧ.

Мода медиана и среднее значение как посчитать в excel

Медиана – чем отличается от среднего значения

Медиана – это середина набора чисел, отсортированного по возрастанию.

Другими словами, 50% наблюдений ниже медианы и 50% наблюдений выше медианы. Медиана всегда равно удалена от начала и от конца набора чисел.

Если набор чисел состоит из нечетного количества элементов, то медианой будет число, которое находится в середине.

Мода медиана и среднее значение как посчитать в excel

Если набор чисел состоит из четного числа элементов, то медиана будет равна среднему арифметическому между двумя центральными элементами списка.

Мода медиана и среднее значение как посчитать в excel

Чтобы наглядно увидеть, чем отличается медиана от среднеарифметического значения на нашем первом примере с зарплатой, отсортируем список по возрастанию.

Поскольку в списке 10 элементов – четное количество – то медианой будет среднее арифметическое 5 и 6 элементов.

Мода медиана и среднее значение как посчитать в excel

Чтобы посчитать медиану в Excel, воспользуемся функцией МЕДИАНА. В качестве аргументов функция принимает числовые значения ряда данных.

Мода медиана и среднее значение как посчитать в excel

Как видите, медиана не равна среднему значению.

Что лучше – медиана или среднее значение

На этот вопрос однозначного ответа нет, все зависит от целей вашего анализа.

Основные отличия медианы от среднего арифметического:

  1. Медиана в отличие от среднего арифметического игнорирует выбросы данных (выбросы – это значения, которые значительно отличаются от основного массива выборки).

Рассмотрим пример:

Мода медиана и среднее значение как посчитать в excel

В данном примере число 100 – это выброс, т.к. оно значительно отличается от основной других чисел в ряду. И при расчете среднего арифметического это число 100 исказило среднее – оно стало значительно больше остальных чисел.

Медиана же останется неизменной, даже если вместо 100 мы укажем 1000, т.к. середина ряда все равно будет число 6.

Это свойство медианы – игнорировать выбросы – особенно полезно, когда нужно посчитать среднюю зарплату или средний возраст. В целом, медиана более точно определяет середину выборки, чем среднее арифметическое, поскольку устойчива к искажениям.

  1. Свойство медианы игнорировать выбросы, на самом деле, не всегда полезно. Оно может скрыть из виду важные моменты, тогда как среднее арифметическое, завысив или занизив среднее, поможет обратить на них внимание.

В нашем примере с заработной платой среднее арифметическое заработных плат выше, чем медиана. Это может обратить внимание на то, что одна из заработных плат (в данном случае – директора) сильно отличается от заработных плат других сотрудников.

  1. Если ряд данных имеет нормальное или близкое к нормальному распределение, то медиана или среднее значение будут равны или близки друг к другу.
  2. Если среднее значение больше медианы, то распределение положительно искажено (т.е. имеет выбросы в сторону больших значений). И наоборот, если среднее значение меньше медианы, то выборка отрицательно искажена (преобладают меньшие значения).

Что такое мода

Мода – это наиболее часто встречающееся значение выборки.

В нашем примере мода – это заработная плата 40000, т.к. это значение встречается 3 раза, в то время, как остальные значения – один или два раза.

Мода медиана и среднее значение как посчитать в excel

Чтобы посчитать моду в Excel, используем функцию МОДА.

Мода медиана и среднее значение как посчитать в excel

Для чего считать моду? Пример использования моды на коммерческом предприятии: для планирования производства обуви необходимо определить размер, который наиболее часто приобретают покупатели.

Средневзвешенное значение

Средневзвешенное значение отличается от среднего арифметического тем, что каждому элементу ряда присваивается «вес» — или как бы «значимость» его в ряду.

Для того, что определить средневзвешенное, сумма элементов ряда, умноженная на их «вес», делится на количество элементов.

Рассмотрим на том же примере с зарплатой. Добавим к таблице два столбца: количество сотрудников и ФОТ (в этом столбце умножим заработную плату одного сотрудника на количество сотрудников).

Мода медиана и среднее значение как посчитать в excel

Чтобы посчитать средневзвешенную заработную плату, разделим сумму всех зарплат сотрудников на сумму количества сотрудников.

Мода медиана и среднее значение как посчитать в excel

Таким образом, зарплату каждого сотрудника мы «взвесили» на количество сотрудников каждой должности.

Если разложить формулу средневзвешенного подобно, то получается:

Мода медиана и среднее значение как посчитать в excel

Для данного примера медиана, среднее арифметическое, средневзвешенное и мода отличаются.

Таким образом, в этом статье мы разобрались, что такое медиана, среднее арифметическое и мода и узнали, при помощи каких функций их можно посчитать в Excel.


   Сообщество Excel Analytics | обучение Excel

    Канал на Яндекс.Дзен 


Вам может быть интересно:

Добавить комментарий