Величина модального интервала как найти

В статистике есть целый набор показателей, которые характеризуют центральную тенденцию. Выбор того или иного индикатора в основном зависит от характера данных, целей расчетов и его свойств.

Что подразумевается под характером данных? Прежде всего, мы говорим о количественных данных, которые выражены в числах. Но набор числовых данных может иметь разное распределение. Под распределением понимаются частоты отдельных значений. К примеру, в классе из 23 человек 2 школьника написали контрольную работу на двойку, 5 – на тройку, 10 – на четверку и 6 – на пятерку. Это и есть распределение оценок. Распределение очень наглядно можно представить с помощью специальной диаграммы – гистограммы. Для данного примера получится следующая гистограмма.

Распределение оценок

Во многих случаях количество уникальных значений намного больше, а распределение похоже на нормальное. Ниже приведена примерная иллюстрация нормального распределения случайных чисел.

Нормальное распределение чисел

Итак, центральная тенденция. Если частоты анализируемых значений распределены по нормальному закону, то есть симметрично вокруг некоторого центра, то центральная тенденция определяется вполне однозначно – это есть тот самый центр, и математически он соответствует средней арифметической.

Как нетрудно заметить, в этом же центре находится и максимальная частота значений. То есть при нормальном распределении центральная тенденция есть не только средняя арифметическая, но и максимальная частота, которая в статистике называется модой или модальным значением.

Мода и среднее арифметическое при нормальном распределении

На диаграмме оба значения центральной тенденции совпадают и равны 10.

Но такое распределение встречается далеко не всегда, а при малом числе данных – совсем редко. Чаще бывает так, что частоты распределяются асимметрично. Тогда мода и среднее арифметическое не будут совпадать.

Мода и среднее арифметическое не совпадают

На рисунке выше среднее арифметическое по-прежнему составляет 10, а вот мода уже равна 9. Что в таком случае считать значением центральной тенденции? Ответ зависит от поставленных целей анализа. Если интересует уровень, сумма отклонений от которого равна нулю со всеми вытекающим отсюда свойствами и последствиями, то это средняя арифметическая. Если нужно максимально частое значение, то это мода.

Итак, зачем нужна мода? Приведу пару примеров. Экономист планово-экономического отдела обувной фабрики интересуется, какой размер обуви пользуется наибольшим спросом. Средний размер обуви, скорее всего, здесь не подойдет, тем более, что число может получится дробным. А вот мода – как раз нужный показатель.

Расчет моды

Теперь посмотрим, как рассчитать моду. Мода – это то значение в анализируемой совокупности данных, которое встречается чаще других, поэтому нужно посмотреть на частоты значений и отыскать максимальное из них. Например, в наборе данных 3, 4, 6, 7, 3, 5, 3, 4 модой будет значение 3 – повторяется чаще остальных. Это в дискретном ряду, и здесь все просто. Если данных много, то моду легче всего найти с помощью соответствующей гистограммы. Бывает так, что совокупность данных имеет бимодальное распределение.  

Двумодальное распределение

Без диаграммы очень трудно понять, что в данных не один, а два центра. К примеру, на президентских выборах предпочтения сельских и городских жителей могут отличаться. Поэтому распределение доли отданных голосов за конкретного кандидата может быть «двугорбым». Первый «горб» – выбор городского населения, второй – сельского.

Немного сложнее с интервальными данными, когда вместо конкретных значений имеются интервалы. В этом случае говорят о модальном интервале (при анализе доходов населения, например), то есть интервале, частота которого максимальна относительно других интервалов. Однако и здесь можно отыскать конкретное модальное значение, хотя оно будет условным и примерным, так как нет точных исходных данных. Представим, что есть следующая таблица с распределением цен.

Интервальные данные для расчета моды

Для наглядности изобразим соответствующую диаграмму.

Рисунок распределения интервальных данных

Требуется найти модальное значение цены.

Вначале нужно определить модальный интервал, который соответствует интервалу с наибольшей частотой. Найти его так же легко, как и моду в дискретном ряду. В нашем примере это третий интервал с ценой от 301 до 400 руб. На графике – самый высокий столбец. Теперь нужно определить конкретное значение цены, которое соответствует максимальному количеству. Точно и по факту сделать это невозможно, так как нет индивидуальных значений частот для каждой цены. Поэтому делается допущение о том, что интервалы выше и ниже модального в зависимости от своей частоты имеют разные вес и как бы перетягивают моду в свою сторону. Если частота интервала следующего за модальным больше, чем частота интервала перед модальным, то мода будет правее середины модального интервала и наоборот. Давайте еще раз посмотрим на рисунок, чтобы понять формулу, которую я напишу чуть ниже.

Мода на рисунке

На рисунке отчетливо видно, что соотношение высоты столбцов, расположенных слева и справа от модального определяет близость моды к левому или правому краю модального интервала. Задача по расчету модального значения состоит в том, чтобы найти точку пересечения линий, соединяющих модальный столбец с соседними (как показано на рисунке пунктирными линиями) и нахождении соответствующего значения признака (в нашем примере цены). Зная основы геометрии (7-й класс), по данному рисунку нетрудно вывести формулу расчета моды в интервальном ряду.

Формула моды имеет следующий вид.

Формула моды

Где Мо – мода,

x0 – значение начала модального интервала,

h – размер модального интервала,

fМо – частота модального интервала,

fМо-1 – частота интервала, находящего перед модальным,

fМо1 – частота интервала, находящего после модального.

Второе слагаемое формулы моды соответствует длине красной линии на рисунке выше.

Рассчитаем моду для нашего примера.

Расчет моды

Таким образом, мода интервального ряда представляет собой сумму, состоящую из значения начального уровня модального интервала и отрезка, который определяется соотношением частот ближайших интервалов от модального.

Расчет моды в Excel

В настоящее время большинство вычислений делается в MS Excel, где для расчета моды также предусмотрена специальная функция. В Excel 2013 я таких нашел ажно 3 штуки.

Мода в Excel

МОДА – пережиток старых изданий Excel. Функция оставлена для совмещения со старыми версиями.

МОДА.ОДН – рассчитывает моду по заданным значениям. Здесь все просто. Вставили функцию, указали диапазон данных и «Ок».

МОДА.НСК – позволяет рассчитать сразу несколько модальных значений (одинаковых максимальных частот) для одного ряда данных, если они есть. Функцию нужно вводить как формулу массива, перед этим выделив количество ячеек равное количеству требуемых модальных значений. Иногда действительно модальных значений может быть несколько. Однако для этих целей предварительно лучше посмотреть на диаграмму распределения. 

Моду для интервальных данных одной функцией в Excel рассчитать нельзя. То есть такая функция в готовом виде не предусмотрена. Придется прописывать вручную. 

Следующая статья посвящена медиане.

До встречи на statanaliz.info.

Поделиться в социальных сетях:

11
Структурные
средние величины

Мода
— применяется при определении размера
одежды, обуви, пользующейся наибольшим
спросом у покупателей.

Модой
для дискретного ряда является варианта,
обладающая наибольшей частотой.

При
вычислении моды для интервального
вариационного ряда необходимо сначала
определить модальный интервал (по
максимальной частоте), а затем — значение
модальной величины признака по формуле:

где:


  • значение
    моды


  • нижняя
    граница модального интервала


  • величина
    интервала


  • частота
    модального интервала


  • частота
    интервала, предшествующего модальному


  • частота
    интервала, следующего за модальным

Медиана
это
значение признака, которое лежит в
основе ранжированного ряда и делит этот
ряд на две равные по численности части.

Для
определения медианы в
дискретном ряду

при наличии частот сначала вычисляют
полусумму частот 
,
а затем определяют, какое значение
варианта приходится на нее. (Если
отсортированный ряд содержит нечетное
число признаков, то номер медианы
вычисляют по формуле:

Ме
= (n
(число
признаков в совокупности)

+ 1)/2,

в
случае четного числа признаков медиана
будет равна средней из двух признаков
находящихся в середине ряда).

При
вычислении медианы для
интервального вариационного ряда

сначала определяют медианный интервал,
в пределах которого находится медиана,
а затем — значение медианы по формуле:

где:


  • искомая
    медиана


  • нижняя
    граница интервала, который содержит
    медиану


  • величина
    интервала


  • сумма
    частот или число членов ряда


  • сумма накопленных частот интервалов,
    предшествующих медианному


  • частота
    медианного интервала

Пример.
Найти моду и медиану.

Возрастные
группы

Число
студентов

Сумма
накопленных частот ΣS

До
20 лет

346

346

20
— 25

872

1218

25
— 30

1054

2272

30
— 35

781

3053

35
— 40

212

3265

40
— 45

121

3386

45
лет и более

76

3462

Итого

3462

Решение:
В
данном примере модальный интервал
находится в пределах возрастной группы
25-30 лет, так как на этот интервал приходится
наибольшая частота (1054).

Рассчитаем
величину моды:

=27
лет.

Это
значит что модальный возраст студентов
равен 27 годам.

Вычислим
медиану. Медианный интервал нахится в
возрастной группе 25-30 лет, так как в
пределах этого интервала расположена
варианта, которая делит совокупность
на две равные части (Σfi/2
= 3462/2 = 1731). Далее подставляем в формулу
необходимые числовые данные и получаем
значение медианы:

Это
значит что одна половина студентов
имеет возраст до 27,4 года, а другая свыше
27,4 года.

Структурные
средние

Особый
вид средних величин – структурные
средние – применяется для изучения
внутреннего строения рядов распределения
значений признака, а также для оценки
средней величины (степенного типа), если
по имеющимся статистическим данным ее
расчет не может быть выполнен (например,
если бы в рассмотренном примере
отсутствовали данные и об объеме
производства, и о сумме затрат по группам
предприятий).

В
качестве структурных средних чаще всего
используют показатели моды

наиболее часто повторяющегося значения
признака – и медианы

величины признака, которая делит
упорядоченную последовательность его
значений на две равные по численности
части. В итоге у одной половины единиц
совокупности значение признака не
превышает медианного уровня, а у другой
– не меньше его.

Если
изучаемый признак имеет дискретные
значения, то особых сложностей при
расчете моды и медианы не бывает. Если
же данные о значениях признака Х
представлены в виде упорядоченных
интервалов его изменения (интервальных
рядов), расчет моды и медианы несколько
усложняется. Поскольку медианное
значение делит всю совокупность на две
равные по численности части, оно
оказывается в каком-то из интервалов
признака X. С помощью интерполяции в
этом медианном интервале находят
значение медианы:

,

где
XMe
– нижняя граница медианного интервала;
hMe
– его величина;
(Sum m)/2 – половина от
общего числа наблюдений или половина
объема того показателя, который
используется в качестве взвешивающего
в формулах расчета средней величины (в
абсолютном или относительном
выражении);
SMe-1
– сумма наблюдений (или объема
взвешивающего признака), накопленная
до начала медианного интервала;
mMe
– число наблюдений или объем взвешивающего
признака в медианном интервале (также
в абсолютном либо относительном
выражении).

В
нашем примере могут быть получены даже
три медианных значения – исходя из
признаков количества предприятий,
объема продукции и общей суммы затрат
на производство:

Таким
образом, у половины предприятий уровень
себестоимость единицы продукции
превышает 125,19 тыс. руб., половина всего
объема продукции производится с уровнем
затрат на изделие больше 124,79 тыс. руб.
и 50 % общей суммы затрат образуется при
уровне себестоимости одного изделия
выше 125,07 тыс. руб. Заметим также, что
наблюдается некоторая тенденция к росту
себестоимости, так как Ме2
= 124,79 тыс. руб., а средний уровень равен
123,15 тыс. руб.

При
расчете модального значения признака
по данным интервального ряда надо
обращать внимание на то, чтобы интервалы
были одинаковыми, поскольку от этого
зависит показатель повторяемости
значений признака X. Для интервального
ряда с равными интервалами величина
моды определяется как

,

где ХMo
– нижнее значение модального интервала;
mMo
– число наблюдений или объем взвешивающего
признака в модальном интервале (в
абсолютном либо относительном
выражении);
mMo-1
– то же для интервала, предшествующего
модальному;
mMo+1
– то же для интервала, следующего за
модальным;
h – величина интервала
изменения признака в группах.

Для
нашего примера можно рассчитать три
модальных значения исходя из признаков
числа предприятий, объема продукции и
суммы затрат. Во всех трех случаях
модальный интервал один и тот же, так
как для одного и того же интервала
оказываются наибольшими и число
предприятий, и объем продукции, и общая
сумма затрат на производство:

Таким
образом, чаще всего встречаются
предприятия с уровнем себестоимости
126,75 тыс. руб., чаще всего выпускается
продукция с уровнем затрат 126,69 тыс.
руб., и чаще всего затраты на производство
объясняются уровнем себестоимости в
123,73 тыс. руб.

Соседние файлы в папке статистика

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Примеры решений задач по статистике

Решение задач по статистике и выводы к ним

Задача по статистике №1. Найти параметры интервального ряда распределения по данным таблицы, а именно: моду, медиану, среднюю арифметическую величину, среднюю взвешенную величину, коэффициент вариации, среднее квадратическое отклонение.

№ группы

Группы компаний по основным производственным фондам, млн. руб. (х)

Число компаний (fi)

Середина интервала (Xi) = (начало интервала+конец интервала)/2

1

10 – 25

2

17,5

2

25 – 33

8

29

3

33 – 42

14

37,5

4

42 – 49

9

45,5

5

49 – 62

3

55,5

Всего:

36

Мы сразу добавили столбец «середина интервала». Для первой группы компаний рассчитали следующим образом: (10+25)/2=17,5 млн. руб. Для 2-5 групп расчеты произведены аналогично.

Теперь рассчитаем среднюю арифметическую величину.

средняя арифметическая = = (17,5+29+37,5+45,5+55,5)/5=37 млн. руб.

Далее рассчитаем среднюю взвешенную величину.

средняя взвешенная = = (17,5*2+29*8+37,5*14+45,5*9+55,5*3)/36=38 млн. руб.

Значение средневзвешенной величины можно считать более корректным, чем значение средней арифметической величины, поэтому далее в расчетах будем использовать среднюю взвешенную.

Теперь добавим в таблицу столбцы, данные которых нам понадобятся для расчета дисперсии.

Число компаний (f)

Середина интервала (Xi) = (начало интервала+конец интервала)/2

Xi*fi

2

17,5

35

-20,5

420,25

840,5

8

29

232

-9

81

648

14

37,5

525

-0,5

0,25

3,5

9

45,5

409,5

7,5

56,25

506,25

3

55,5

166,5

17,5

306,25

918,75

Итого: 36

1368

2917

Рассчитаем дисперсию.

=2917/36=81,03. (дисперсия не имеет размерности)

Среднеквадратическое отклонение рассчитывается как корень квадратный из дисперсии.

=9 (млн. руб.).

Рассчитаем коэффициент вариации по формуле:

=(9/38)*100%=23,68%.

Рассчитаем моду и медиану.

Найдем моду по формуле.

Модальный интервал находим по наибольшей частоте. Наибольшая частота, т.е. частота модального интервала fМо=14. Модальный интервал от 33 до 42 млн. руб. Значит величина модального интервала i = 42-33=9.

Нижняя граница модального интервала равна 33.

Частота предмодального интервала равна 8.

Частота постмодального интервала равна 9.

Мода будет равна = 33 + 9*((14-8)/(14-8+14-9))=37,9 млн. руб.

Найдем медиану по формуле.

Медианный интервал находим по накопленной частоте. Суммируются f частоты, пока не достигается значение, превышающее середину совокупности (36/2=18 млн. руб.).

Группы компаний по основным производственным фондам, млн. руб. (х)

Число компаний (f)

Накопленная частота S

10 – 25

2

2

25 – 33

8

10

33 – 42

14

24

42 – 49

9

33

49 – 62

3

36

Таким образом, медианный интервал от 33 до 42 млн. руб. Значит величина медианного интервала i = 42-33=9.

Частота медианного интервала fМе=14.

Нижняя граница медианного интервала равна 33.

Накопленная частота предмедианного интервала равна 10.

Медиана будет равна = 33 + 9*((36/2-10)/(14))=38,14 млн. руб.

Расчеты по теме “индексы”

Пример по выборке.

Задача по группировке.

Решение задачи по расчету средней.

Задача по кореляционному анализу

Контрольные и курсовые работы по общей теории статистики и экономической статистике по этим и другим темам представлены в соответствующем разделе сайта.

8.4. МОДА и МЕДИАНА (структурные средние)

 Мода и медиана наиболее часто используемые в экономической практике структурные средние.


Мода – это величина признака (варианта), который наиболее часто встречается  в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.


В дискретном ряду мода определяется в соответствии с определением, т.е. это одна из вариант признака, которая в ряду распределения имеет наибольшую частоту.


Для интервального ряда моду находим по формуле (8.16), сначала по наибольшей частоте определив модальный интервал:

Статистика Формула Мода для интервального ряда

(8.16 – формула Моды)


где хо – начальная (нижняя) граница модального интервала;

h – величина интервала;

fМо – частота модального интервала;

fМо-1 – частота интервала, предшествующая модальному;

fМо+1– частота интервала следующая за модальным.



Медианой  называется такое значение признака, которое приходится на середину ранжированного ряда, т.е. в ранжированном ряду распределения одна половина ряда имеет значение признака больше медианы, другая – меньше медианы.

В дискретном ряду медиана находится  непосредственно по накопленной частоте, соответствующей номеру медианы.

В случае интервального вариационного ряда медиану определяют по формуле:

Статистика Формула Медиана для интервального ряда                                           (8.17 – формула Медианы)


где хо – нижняя граница медианного интервала;

NМе– порядковый номер медианы (Σf/2);

S Me-1 – накопленная частота до медианного интервала;

fМе –  частота медианного интервала.


Пример вычисления Моды.

Рассчитаем моду и медиану по данным табл. 8.4.

Таблица 8.4 – Распределение семей города N  по размеру среднедушевого дохода в январе 2018 г. руб.(цифры условные)

Группы семей по размеру дохода, руб. Число

семей

Накоп-

ленные частоты

в % к итогу

До 5000 600 600 6
5000-6000 700 1300

(600+700)

13
6000-7000 1700 (fМо-1) 3000 (S Me-1 )

(1300+1700)

30
7000-8000

 (хо)

2500

(fМо)

(fМе)

5500 (S Me) 55
8000-9000 2200 (fМо+1) 7700 77
9000-10000 1500 9200 92
Свыше 10000 800 10000 100
Итого 10000

Пример вычисления Моды. Найдем моду по формуле (8.16) см. обозначения в таблице, а h = 8000-7000=1000, т.е. получаем:

Статистика. Пример расчета Моды (структурные средние)

Пример вычисления Моды


Пример вычисления Медианы интервального вариационного ряда. Рассчитаем медиану по формуле (8.17):

1) сначала находим  порядковый  номер медианы: NМе = Σfi/2= 5000.

2) по накопленным частотам в соответствии с номером медианы определяем, что 5000 находится в интервале (7000 – 8000), далее  значение медианы  определим по формуле (8.17):

Статистика. Пример Медиана

Пример вычисления Медианы


Вывод: по моде – наиболее часто встречается среднедушевой доход в размере 7730 руб., по медиане – что половина семей города имеет среднедушевой доход ниже 7800 руб., остальные семьи – более 7800 руб.


Пример .СРЕДНИЙ, МЕДИАННЫЙ И МОДАЛЬНЫЙ УРОВЕНЬ ДЕНЕЖНЫХ ДОХОДОВ НАСЕЛЕНИЯ  ЦЕЛОМ ПО РОССИИ И ПО СУБЪЕКТАМ РОССИЙСКОЙ ФЕДЕРАЦИИ ЗА 2013 год см. по ссылке. Источник: оценка на основании данных выборочного обследования бюджетов домашних хозяйств и макроэкономического показателя денежных доходов населения


Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию.

Если Мое имеет место правосторонняя асимметрия.

При Х<Мео следует сделать вы­вод о левосторонней асимметрии ряда.


Средние величины (арифметическая, гармоническая, геометрическая, квадратическая) см. по ссылке

Оценка статьи:

Загрузка…

Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 5 июня 2018 года; проверки требуют 8 правок.

У этого термина существуют и другие значения, см. Мода (значения).

Мо́да — одно или несколько значений во множестве наблюдений, которое встречается наиболее часто (мода = типичность). Иногда в совокупности встречается более чем одна мода, в данном случае модой будет арифметическая середина двух цифр(например: 6, 2, 6, 6, 8, 9, 9, 9, 0; (6+9)/2=7,5.)

Мода как средняя величина употребляется чаще для данных, имеющих нечисловую природу. Среди перечисленных цветов автомобилей — белый, чёрный, синий металлик, белый, синий металлик, белый — мода будет равна белому цвету. При экспертной оценке с её помощью определяют наиболее популярные типы продукта, что учитывается при прогнозе продаж или планировании их производства.

Для интервального ряда мода определяется по формуле:

{displaystyle Mo=X_{Mo}+h_{Mo}cdot (f_{Mo}-f_{Mo-1})/((f_{Mo}-f_{Mo-1})+(f_{Mo}-f_{Mo+1}))}

здесь X — левая граница модального интервала, hМо — длина модального интервала, fМо − 1 — частота премодального интервала, fМо — частота модального интервала, fМо + 1 — частота послемодального интервала[1].

Модой абсолютно непрерывного распределения называют любую точку локального максимума плотности распределения. Для дискретных распределений модой считают любые значения ai, вероятность которого pi больше, чем вероятности соседних значений[2].

См. также[править | править код]

  • Неравенство Чебышёва

Примечания[править | править код]

  1. Шмойлова Р.А., Минашкин В.Г., Садовникова Н.А. Практикум по теории статистики. — 3-е изд. — М.: Финансы и статистика, 2011. — С. 127. — 416 с. — ISBN 9785279032969.
  2. Н. И. Чернова. Теория вероятностей. — Сибирский государственный университет телекоммуникаций и информатики, 2009.

Литература[править | править код]

  • Мода // Меотская археологическая культура — Монголо-татарское нашествие. — М. : Большая российская энциклопедия, 2012. — С. 572. — (Большая российская энциклопедия : [в 35 т.] / гл. ред. Ю. С. Осипов ; 2004—2017, т. 20). — ISBN 978-5-85270-354-5. (Мода // Большая российская энциклопедия [Электронный ресурс]. — 2019.).

Добавить комментарий