Как найти моду данного ряда


Загрузить PDF


Загрузить PDF

Среднее значение, медиана и мода — значения, которые часто используются в статистике и математике. Эти значения найти довольно легко, но их легко и перепутать. Мы расскажем, что они из себя представляют и как их найти.

  1. Изображение с названием Find Mean, Median, and Mode Step 1

    1

    Сложите все числа, которые вам даны. Допустим, вам даны числа 2, 3 и 4. Сложим их: 2 + 3 + 4 = 9.

  2. Изображение с названием Find Mean, Median, and Mode Step 2

    2

    Сосчитайте количество чисел. У нас есть три цифры.

  3. Изображение с названием Find Mean, Median, and Mode Step 3

    3

    Разделите сумму чисел на их количество. Берем 9, делим на 3. 9/3 = 3. Среднее значение в данном случае равно 3. Помните, что не всегда получается целое число.

    Реклама

  1. Изображение с названием Find Mean, Median, and Mode Step 4

    1

    Запишите все числа, которые вам даны, в порядке возрастания. Например, нам даны числа: 4, 2, 8, 1, 15. Запишите их от меньшего к большему, вот так: 1, 2, 4, 8, 15.

  2. Изображение с названием Find Mean, Median, and Mode Step 5

    2

    Найдите два средних числа. Мы расскажем, как это сделать, если у вас имеется четное количество чисел, и как это сделать, если количество чисел нечетное:

    • Если у вас нечетное количество чисел, вычеркните левое крайнее число, затем правое крайнее число и так далее. Один оставшийся номер и будет искомой медианой. Если вам дан ряд чисел 4, 7, 8, 11, 21, тогда 8 — медиана, так как 8 стоит посередине.
    • Если у вас четное количество чисел, вычеркните по одному числу с каждой стороны, пока у вас не останется два числа посередине. Сложите их и разделите на два. Это и есть значение медианы. Если вам дан ряд чисел 1, 2, 5, 3, 7, 10, то два средних числа — это 5 и 3. Сложим 5 и 3, получим 8, разделим на два, получим 4. Это и есть медиана.

    Реклама

  1. Изображение с названием Find Mean, Median, and Mode Step 6

    1

    Запишите все числа в ряд. Например, вам даны числа 2, 4, 5, 5, 4 и 5. Запишите их в порядке возрастания.

  2. Изображение с названием Find Mean, Median, and Mode Step 7

    2

    Найдите число, которое чаще всего встречается. В данном случае это 5. Если два числа встречаются одинаково часто, то этот ряд двухвершинный или бимодальный, а если больше — то мультимодальный.

    Реклама

Советы

  • Вам будет легче найти моду и медиану, если вы запишете числа в порядке возрастания.

Реклама

Об этой статье

Эту страницу просматривали 353 377 раз.

Была ли эта статья полезной?

Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 5 июня 2018 года; проверки требуют 8 правок.

У этого термина существуют и другие значения, см. Мода (значения).

Мо́да — одно или несколько значений во множестве наблюдений, которое встречается наиболее часто (мода = типичность). Иногда в совокупности встречается более чем одна мода, в данном случае модой будет арифметическая середина двух цифр(например: 6, 2, 6, 6, 8, 9, 9, 9, 0; (6+9)/2=7,5.)

Мода как средняя величина употребляется чаще для данных, имеющих нечисловую природу. Среди перечисленных цветов автомобилей — белый, чёрный, синий металлик, белый, синий металлик, белый — мода будет равна белому цвету. При экспертной оценке с её помощью определяют наиболее популярные типы продукта, что учитывается при прогнозе продаж или планировании их производства.

Для интервального ряда мода определяется по формуле:

{displaystyle Mo=X_{Mo}+h_{Mo}cdot (f_{Mo}-f_{Mo-1})/((f_{Mo}-f_{Mo-1})+(f_{Mo}-f_{Mo+1}))}

здесь X — левая граница модального интервала, hМо — длина модального интервала, fМо − 1 — частота премодального интервала, fМо — частота модального интервала, fМо + 1 — частота послемодального интервала[1].

Модой абсолютно непрерывного распределения называют любую точку локального максимума плотности распределения. Для дискретных распределений модой считают любые значения ai, вероятность которого pi больше, чем вероятности соседних значений[2].

См. также[править | править код]

  • Неравенство Чебышёва

Примечания[править | править код]

  1. Шмойлова Р.А., Минашкин В.Г., Садовникова Н.А. Практикум по теории статистики. — 3-е изд. — М.: Финансы и статистика, 2011. — С. 127. — 416 с. — ISBN 9785279032969.
  2. Н. И. Чернова. Теория вероятностей. — Сибирский государственный университет телекоммуникаций и информатики, 2009.

Литература[править | править код]

  • Мода // Меотская археологическая культура — Монголо-татарское нашествие. — М. : Большая российская энциклопедия, 2012. — С. 572. — (Большая российская энциклопедия : [в 35 т.] / гл. ред. Ю. С. Осипов ; 2004—2017, т. 20). — ISBN 978-5-85270-354-5. (Мода // Большая российская энциклопедия [Электронный ресурс]. — 2019.).

8.4. МОДА и МЕДИАНА (структурные средние)

 Мода и медиана наиболее часто используемые в экономической практике структурные средние.


Мода – это величина признака (варианта), который наиболее часто встречается  в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.


В дискретном ряду мода определяется в соответствии с определением, т.е. это одна из вариант признака, которая в ряду распределения имеет наибольшую частоту.


Для интервального ряда моду находим по формуле (8.16), сначала по наибольшей частоте определив модальный интервал:

Статистика Формула Мода для интервального ряда

(8.16 – формула Моды)


где хо – начальная (нижняя) граница модального интервала;

h – величина интервала;

fМо – частота модального интервала;

fМо-1 – частота интервала, предшествующая модальному;

fМо+1– частота интервала следующая за модальным.



Медианой  называется такое значение признака, которое приходится на середину ранжированного ряда, т.е. в ранжированном ряду распределения одна половина ряда имеет значение признака больше медианы, другая – меньше медианы.

В дискретном ряду медиана находится  непосредственно по накопленной частоте, соответствующей номеру медианы.

В случае интервального вариационного ряда медиану определяют по формуле:

Статистика Формула Медиана для интервального ряда                                           (8.17 – формула Медианы)


где хо – нижняя граница медианного интервала;

NМе– порядковый номер медианы (Σf/2);

S Me-1 – накопленная частота до медианного интервала;

fМе –  частота медианного интервала.


Пример вычисления Моды.

Рассчитаем моду и медиану по данным табл. 8.4.

Таблица 8.4 – Распределение семей города N  по размеру среднедушевого дохода в январе 2018 г. руб.(цифры условные)

Группы семей по размеру дохода, руб. Число

семей

Накоп-

ленные частоты

в % к итогу

До 5000 600 600 6
5000-6000 700 1300

(600+700)

13
6000-7000 1700 (fМо-1) 3000 (S Me-1 )

(1300+1700)

30
7000-8000

 (хо)

2500

(fМо)

(fМе)

5500 (S Me) 55
8000-9000 2200 (fМо+1) 7700 77
9000-10000 1500 9200 92
Свыше 10000 800 10000 100
Итого 10000

Пример вычисления Моды. Найдем моду по формуле (8.16) см. обозначения в таблице, а h = 8000-7000=1000, т.е. получаем:

Статистика. Пример расчета Моды (структурные средние)

Пример вычисления Моды


Пример вычисления Медианы интервального вариационного ряда. Рассчитаем медиану по формуле (8.17):

1) сначала находим  порядковый  номер медианы: NМе = Σfi/2= 5000.

2) по накопленным частотам в соответствии с номером медианы определяем, что 5000 находится в интервале (7000 – 8000), далее  значение медианы  определим по формуле (8.17):

Статистика. Пример Медиана

Пример вычисления Медианы


Вывод: по моде – наиболее часто встречается среднедушевой доход в размере 7730 руб., по медиане – что половина семей города имеет среднедушевой доход ниже 7800 руб., остальные семьи – более 7800 руб.


Пример .СРЕДНИЙ, МЕДИАННЫЙ И МОДАЛЬНЫЙ УРОВЕНЬ ДЕНЕЖНЫХ ДОХОДОВ НАСЕЛЕНИЯ  ЦЕЛОМ ПО РОССИИ И ПО СУБЪЕКТАМ РОССИЙСКОЙ ФЕДЕРАЦИИ ЗА 2013 год см. по ссылке. Источник: оценка на основании данных выборочного обследования бюджетов домашних хозяйств и макроэкономического показателя денежных доходов населения


Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию.

Если Мое имеет место правосторонняя асимметрия.

При Х<Мео следует сделать вы­вод о левосторонней асимметрии ряда.


Средние величины (арифметическая, гармоническая, геометрическая, квадратическая) см. по ссылке

Оценка статьи:

Загрузка…

В поисках средних значений: разбираемся со средним арифметическим, медианой и модой

В поисках средних значений: разбираемся со средним арифметическим, медианой и модой

как считать среднее арифметическое чисел

Иногда при работе с данными нужно описать множество значений каким-то одним числом. Например, при исследовании эффективности сотрудников, уровня вовлеченности в аккаунте, KPI или времени ответа на сообщения клиентов. В таких случаях используют меры центральной тенденции. Их можно называть проще — средние значения.

Но в зависимости от вводных данных, находить среднее значение нужно по-разному. Основной набор задач закрывается с использованием среднего арифметического, медианы и моды. Но если выбрать неверный способ — выводы будут необъективны, а результаты исследования нельзя будет признать действительными. Чтобы не допустить ошибку, нужно понимать особенности разных способов нахождения средних значений.

Cтратег, аналитик и контент-продюсер. Работает с агентством «Палиндром».

Как считать среднее арифметическое

Использовать среднее арифметическое стоит тогда, когда множество значений распределяются нормально ― это значит, что значения расположены симметрично относительно центра. Как выглядит нормальное распределение на графике и в таблице, можно посмотреть на примере:

 использование чужих публикаций

Если данные распределяются как в примерах — вам повезло. Можно без лишних заморочек считать среднее арифметическое и быть уверенным, что выводы будут объективны. Однако, нормальное распределение на практике встречается крайне редко, поэтому среднее арифметическое в большинстве случаев лучше не использовать.

Как рассчитать

Сумму значений нужно поделить на их количество. Например, вы хотите узнать средний ER за 4 дня при нормальном распределении значений и без аномальных выбросов. Для этого считаем среднее арифметическое: складываем ER всех дней и делим полученное число на количество дней.

курирование контента

Если хотите автоматизировать вычисления и узнать среднее арифметическое для большого числа показателей — используйте Google Таблицы:

  1. Заполните таблицу данными.
  2. Щелкните по пустой ячейке, в которую хотите записать среднее арифметическое.
  3. Введите «=AVERAGE(» и выделите ряд чисел, для которых нужно вычислить среднее арифметическое. Нажмите «Enter» после ввода формулы.

курирование контента

Когда можно не использовать

Если данные распределены ненормально, то наши расчеты не будут отражать реальную картину. На ненормальность распределения указывают:

  • Отсутствие симметрии в расположении значений.
  • Наличие ярко выраженных выбросов.

Как пример ненормального распределения (с выбросами) можно рассматривать среднее время ответа на комментарии по неделям:

курирование контента

Если посчитать среднее значение для такого набора данных с помощью среднего арифметического, то получится завышенное число. В итоге наши выводы будут более позитивными, чем реальное положение дел. Еще стоит учитывать, что выбросы могут не только завышать среднее значение, но и занижать его. В таком случае вы получите более скромный показатель, который не будет соответствовать реальности.

Например, в группе «Золотое Яблоко» во ВКонтакте иногда публикуют конкурсные посты. Они набирают более высокие показатели вовлеченности чем обычные публикации. Если посчитать средний ER с учетом конкурсов, мы получим 0,37%, а без учета конкурсов — только 0,29%. Аналогичная ситуация с числом комментариев. С конкурсами в среднем получаем 917 комментариев, а без конкурсов — всего лишь 503. Очевидно, что из-за розыгрышей средние показатели вовлеченности завышаются. В этом случае конкурсные посты следует исключить из анализа, чтобы объективно оценить эффективность контента в группе.

курирование контента

Еще часто бывает так, что данных очень много, заметны явные выбросы, но на их обработку и исключение аномальных значений не хватит ни времени, ни терпения. Тем более нет гарантий, что исключив выбросы, вы получите нормальное распределение. В таком случае лучше подсчитать средние значения, используя медиану.

Как найти медиану и когда ее применять

Если вы имеете дело с ненормальным распределением или замечаете значительные выбросы — используйте медиану. Так можно получить более адекватное среднее значение, чем при использовании среднего арифметического. Чтобы понять, как работать с медианой, рассмотрим аналогичный пример с ненормальным распределением времени ответов на комментарии.

курирование контента

Ниже в таблице уже введены данные из графика и рассчитано среднее время ответа с помощью среднего арифметического и медианы. Из расчетов видна наглядная разница между средним арифметическим и медианой ― она составляет 17 минут. Такое различие появляется из-за низкого темпа работы на выходных и в нестандартных ситуациях, когда к ответу на сообщения нужно относиться с особой ответственностью (события конца февраля). Подобные выбросы сильно завышают среднее арифметическое, а вот на медиану они практически не влияют. Поэтому если хотите посчитать среднее значение избегая влияния выбросов, — используйте медиану. Такие данные будут без искажений.

курирование контента

Как рассчитать

Разберем на примере. В аккаунте опубликовали семь постов и они набрали разное количество комментариев: 35, 105, 2, 15, 2, 31, 1. Чтобы вычислить медиану, нужно пройти два этапа:

  • Расположите числа в порядке возрастания. Итоговый ряд будет выглядеть так: 1, 2, 2, 15, 31, 35, 105.
  • Найдите середину сформированного ряда. В центре стоит число 15 — его и нужно считать медианой.

Немного сложнее найти медиану, если вы работаете с четным количеством чисел. Например, вы собрали количество лайков на последних шести постах: 32, 48, 36, 201, 52, 12. Чтобы найти медиану, выполните три действия:

  • Расставьте числа по возрастанию: 12, 32, 36, 48, 52, 201.
  • Возьмите два из них, наиболее близких к центру. В нашем случае — это 36 и 48.
  • Сложите два этих числа и разделите на два: (36 + 48) / 2 = 42. Результат и есть медиана.

Чтобы вычислять медиану быстрее и обрабатывать большие объемы данных — используйте Google Таблицы:

  • Внесите данные в таблицу.
  • Щелкните по свободной ячейке, в которую хотите записать медиану.
  • Введите формулу «=MEDIAN(» и выделите ряд чисел, для которых нужно рассчитать медиану. Нажмите «Enter», чтобы все посчиталось.

курирование контента

Когда можно не использовать

Если данные распределены нормально и вы не видите заметных выбросов — медиану можно не использовать. В этом случае значение среднего арифметического будет очень близким к медиане. Можете выбрать любой способ нахождения среднего, с которым вам работать проще. Результат от этого сильно не изменится.

Что такое мода и где ее использовать

Мода ― это самое популярное/часто встречающееся значение. Например, стоит задача узнать, сколько комментариев чаще всего набирают посты в аккаунте. В этом случае можно не высчитывать среднее арифметическое или медиану ― лучше и проще использовать моду.

Еще пример. Нужно узнать, в какое время аудитория чаще всего взаимодействует с публикациями. Для этого можно посчитать данные вручную или использовать готовую таблицу из LiveDune (вкладка «Вовлеченность» ― таблица «Лучшее время для поста»). По ее данным ― больше всего реакций пользователи оставляют в среду в 16 часов. Это время и есть мода. Таким образом, если вам нужно найти самое популярное значение, а не классическое среднее — проще использовать моду.

курирование контента

Как рассчитать

Чтобы найти наиболее часто встречающееся значение в наборе данных, нужно посмотреть, какое число встречается в ряду чаще всех. Например, для ряда 5, 4, 2, 4, 7 ― модой будет число 4.

Иногда в ряде значений встречается несколько мод. Например, ряду 7, 7, 21, 2, 5, 5 свойственны две моды — 7 и 5. В этом случае совокупность чисел называется мультимодальной. Также поиск моды можно упростить с помощью Google Таблиц:

  • Внесите значения в таблицу.
  • Щелкните по ячейке, в которую хотите записать моду.
  • Введите формулу «=MODE(» и выделите ряд чисел, для которых нужно вычислить моду. Нажмите «Enter».

курирование контента

Однако важно иметь в виду, что табличная функция выдает только самую меньшую моду. Поэтому будьте внимательны — можно упустить из виду несколько мод.

Когда использовать не стоит

Моду нет смысла использовать, если вас не просят найти самое популярное значение. Там, где надо найти классическое среднее значение, про моду лучше забыть.

Памятка по использованию

Среднее арифметическое

Как находим: сумма чисел / количество чисел.
Используем: если данные распределены нормально и нет ярких выбросов.
Не используем: если видим явные выбросы или ненормальное распределение.

Медиана

Как находим: располагаем числа в порядке возрастания и находим середину сформированного ряда.
Используем: если работаем с ненормальным распределением или видим выбросы.
Не используем: если выбросов нет и распределение нормальное.

Мода

Как находим: определяем значение, которое чаще всего встречается в ряду чисел.
Используем: если нужно найти не среднее, а самое популярное значение.
Не используем: если нужно найти классическое среднее значение.

Только важные новости в ежемесячной рассылке

Нажимая на кнопку, вы даете согласие на обработку персональных данных.

Подписывайся сейчас и получи гайд аудита Instagram аккаунта

Маркетинговые продукты LiveDune — 7 дней бесплатно

Наши продукты помогают оптимизировать работу в соцсетях и улучшать аккаунты с помощью глубокой аналитики

Анализ своих и чужих аккаунтов по 50+ метрикам в 6 соцсетях.

Оптимизация обработки сообщений: операторы, статистика, теги и др.

Автоматические отчеты по 6 соцсетям. Выгрузка в PDF, Excel, Google Slides.

Контроль за прогрессом выполнения KPI для аккаунтов Инстаграм.

Аудит Инстаграм аккаунтов с понятными выводами и советами.

Поможем отобрать «чистых» блогеров для эффективного сотрудничества.

Аннотация: Для получения более полной характеристики вариационного ряда помимо средней величины рассчитываются так называемые структурные показатели. К ним относятся мода, медиана, квартили, децили, перцентили, квартильные и децильные коэффициенты.

8.1. Мода

Мода (Мо) – это наиболее часто встречающееся значение признака, или иначе говоря, значение варианты с наибольшей частотой. В дискретных и интервальных рядах моду рассчитывают по-разному.

8.1.1. Определение моды в дискретных вариационных рядах

В дискретных вариационных рядах для определения моды не требуется специальных вычислений: значение признака, которому соответствует наибольшая частота, и будет значением моды.

Пример 8.1. По представленным ниже результатам проведения контрольной работы по статистике определим моду.

Здесь наибольшая частота – 10, она принадлежит варианте со значением 3, значит, Мо = 3. Таким образом, самой распространенной оценкой, полученной студентами за контрольную работу, была “тройка”.

8.1.2. Определение моды в интервальных вариационных рядах с равными интервалами

Для определения моды в интервальных вариационных рядах с равными интервалами сначала находят модальный интервал, которым является интервал с наибольшей частотой, а затем ведут расчет по формуле

где хМо – нижняя граница модального интервала;

d – величина интервала;

fMo – частота модального интервала;

fMo – 1 – частота интервала, предшествующего модальному;

fMo + 1 – частота интервала, следующего за модальным.

Пример 8.2. Имеются данные по группе банков.

Таблица
8.1.

Сумма выданных кредитов, млн ден. ед. Количество банков
До 40 8
40-60 15
60-80 21
80-100 12
100-120 9
120-140 7
140 и выше 4
Итого 77

Определим модальный размер выданных кредитов:

  1. модальным является интервал 60-80, так как ему соответствует наибольшая частота (21);
  2. нижняя граница модального интервала xМо = 60; величина интервала d = 20 (80 – 60 = 20);
  3. частота модального интервала fМо = 21; частота интервала, предшествующего модальному, fМо – 1 = 15; частота интервала, следующего за модальным, fМо + 1 = 12.

Подставив в формулу соответствующие величины, получим

Определить модальное значение признака можно и по графику. Для этого в случае дискретных вариационных рядов строится полигон распределения. Напомним, что у него на оси абсцисс помещаются значения признака (варианты), а на оси ординат – соответствующие им частоты. Значение абсциссы, соответствующее наибольшей вершине полигона, будет значением моды.

Пример 8.3. По результатам проведения контрольной работы по статистике, приведенным в примере 8.1, определим моду графическим способом.

Для этого построим полигон распределения и найдем абсциссу его вершины (рис. 8.1).

Определение моды по полигону распределения

Рис.
8.1.
Определение моды по полигону распределения

Если имеется интервальный вариационный ряд с равными интервалами, то для определения моды строится гистограмма, у которой на оси абсцисс находятся значения границ интервалов, а на оси ординат – соответствующие интервалам частоты. На гистограмме модальный интервал будет иметь наибольшую высоту столбца. Затем надо провести линии, соединяющие вершины модального столбца с прилегающими вершинами соседних столбцов. Для нахождения значения моды из точки пересечения проведенных линий на ось абсцисс опускают перпендикуляр. Абсцисса точки пересечения будет значением моды. Продемонстрируем это на примере.

Пример 8.4. По данным о распределении банков по сумме выданных кредитов, приведенным в примере 8.2, определим моду графическим способом (рис. 8.2).

Определение моды по гистограмме распределения

Рис.
8.2.
Определение моды по гистограмме распределения

Вариационный ряд может содержать несколько модальных значений. Чаще всего это происходит, когда в один ряд объединяют разнородные единицы наблюдения, которые желательно разделить на подгруппы и анализировать по отдельности. Вариационный ряд, имеющий одну моду, называется унимодальным, две – бимодальным, три и более – мультимодальным.

Добавить комментарий