Как найти медиану в статистике примеры

МедианаВ статистических исследованиях довольно широко применяются средние величины. Их нахождение позволяет выявить типичное значение признака исследуемой совокупности. Например, типичный уровень доходов покупателей или возраст большинства клиентов компании. При этом вычисление, к примеру, среднего арифметического не всегда уместно.

Представим такую ситуацию: мы опросили 10 человек на предмет их уровня доходов. У 9-х доходы оказались примерно одинаковыми и составили 10 тыс. руб. Что касается 10-ого опрошенного, то оказалось, что его доход равняется 410 тыс. руб. в месяц. Если мы вычислим простое среднее арифметическое, то типичный доход будет равняться 50 тыс. руб.! Но это явно не так. В таких ситуациях более объективную и правдоподобную картину дает вычисление моды или медианы, которые относятся к структурным средним показателям.

Понятие медианы

Медиана (Me) — значение признака в исследуемом ряду величин, которое делит этот ряд на две равные части.

То есть половина (50%) всех значений в исследуемом ряду будет меньше медианы, а другая половина — больше ее. Поэтому медиану еще называют 50-й перцентиль или квантиль 0,5.

Формула для расчета медианы

Если значений немного, то медиану можно определить «на глазок». Для этого достаточно расположить все значения в порядке возрастания и найти середину.

Если число случаев четное и в центре ряда находятся два разных числа, то медианой будет среднее между ними (даже если такого значения нет в самом ряду исследуемых случаев). Например, в ряду 1 2 3 4 5 6, медианой будет 3,5.

Для нахождения медианы в более сложных случаях (по интервальным рядам) используется специальная формула:

Формула медианы

где: Me — медиана;

Xme — нижняя граница медианного интервала (того интервала, накопленная частота которого превышает полусумму всех частот);

ime — величина медианного интервала;

f — частота (сколько раз в ряду встречается то или иное значение);

Sme-1 — сумма частот интервалов предшествующих медианному интервалу;

fme — число значений в медианном интервале (его частота).

Пример вычисления медианы

Был проведен опрос среди покупателей с целью выяснить их типичный возраст. По результатам опроса было установлено, что: 25 покупателей имеют возраст до 20 лет; 32 покупателя — 20-40 лет; 18 покупателей — 40-60 лет; 15 покупателей — свыше 60 лет. Найдем медиану.

Исходные данные для примера с медианой

Сначала находим медианный интервал. Для этого вычисляем сумму частот: 25 + 32 + 18 + 15 = 90. Половина этой суммы — 45. Это соответствует возрастной группе 20-40 лет (т. к. полученная полусумма частот — 45, и накопленная частота 1-й группы меньше ее, а 3-ей — больше). Тогда нижняя граница медианного интервала — 20 (лет), а величина медианного интервала — 20 (40 лет за вычетом 20). Сумма частот интервалов предшествующих медианному интервалу — 25. Число значений в медианном интервале — 32 (количество покупателей в возрасте 20-40 лет).

Пример расчета медианы

Расчетное значение медианы — 32,5. Округив его, получим средний возраст покупателя — 33 года.

Область применения медианы

При вычислении типичного признака неоднородных рядов, имеющих «выбросы» — значения во много раз отличающиеся от других значений ряда.

Особенности медианы

  • Медиана обладает высокой робастностью, то есть нечувствительностью к неоднородностям и ошибкам выборки;
  • Сумма разностей между членами ряда выборки и медианой меньше, чем сумма этих разностей с любой другой величиной. В том числе с арифметическим средним.

Источники

  1. Медиана // Википедия. URL: http://ru.wikipedia.org/wiki/Медиана_(статистика) (дата обращения: 23.10.2013)
  2. Минашкин В. Г. и др. Курс лекций по теории статистики. – М.: МЭСИ, 2001.

© Копирование любых материалов статьи допустимо только при указании прямой индексируемой ссылки на источник: Галяутдинов Р.Р.

Нашли опечатку? Помогите сделать статью лучше! Выделите орфографическую ошибку мышью и нажмите Ctrl + Enter.

Библиографическая запись для цитирования статьи по ГОСТ Р 7.0.5-2008:
Галяутдинов Р.Р. Медиана // Сайт преподавателя экономики. [2013]. URL: https://galyautdinov.ru/post/mediana (дата обращения: 17.05.2023).

8.4. МОДА и МЕДИАНА (структурные средние)

 Мода и медиана наиболее часто используемые в экономической практике структурные средние.


Мода – это величина признака (варианта), который наиболее часто встречается  в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.


В дискретном ряду мода определяется в соответствии с определением, т.е. это одна из вариант признака, которая в ряду распределения имеет наибольшую частоту.


Для интервального ряда моду находим по формуле (8.16), сначала по наибольшей частоте определив модальный интервал:

Статистика Формула Мода для интервального ряда

(8.16 – формула Моды)


где хо – начальная (нижняя) граница модального интервала;

h – величина интервала;

fМо – частота модального интервала;

fМо-1 – частота интервала, предшествующая модальному;

fМо+1– частота интервала следующая за модальным.



Медианой  называется такое значение признака, которое приходится на середину ранжированного ряда, т.е. в ранжированном ряду распределения одна половина ряда имеет значение признака больше медианы, другая – меньше медианы.

В дискретном ряду медиана находится  непосредственно по накопленной частоте, соответствующей номеру медианы.

В случае интервального вариационного ряда медиану определяют по формуле:

Статистика Формула Медиана для интервального ряда                                           (8.17 – формула Медианы)


где хо – нижняя граница медианного интервала;

NМе– порядковый номер медианы (Σf/2);

S Me-1 – накопленная частота до медианного интервала;

fМе –  частота медианного интервала.


Пример вычисления Моды.

Рассчитаем моду и медиану по данным табл. 8.4.

Таблица 8.4 – Распределение семей города N  по размеру среднедушевого дохода в январе 2018 г. руб.(цифры условные)

Группы семей по размеру дохода, руб. Число

семей

Накоп-

ленные частоты

в % к итогу

До 5000 600 600 6
5000-6000 700 1300

(600+700)

13
6000-7000 1700 (fМо-1) 3000 (S Me-1 )

(1300+1700)

30
7000-8000

 (хо)

2500

(fМо)

(fМе)

5500 (S Me) 55
8000-9000 2200 (fМо+1) 7700 77
9000-10000 1500 9200 92
Свыше 10000 800 10000 100
Итого 10000

Пример вычисления Моды. Найдем моду по формуле (8.16) см. обозначения в таблице, а h = 8000-7000=1000, т.е. получаем:

Статистика. Пример расчета Моды (структурные средние)

Пример вычисления Моды


Пример вычисления Медианы интервального вариационного ряда. Рассчитаем медиану по формуле (8.17):

1) сначала находим  порядковый  номер медианы: NМе = Σfi/2= 5000.

2) по накопленным частотам в соответствии с номером медианы определяем, что 5000 находится в интервале (7000 – 8000), далее  значение медианы  определим по формуле (8.17):

Статистика. Пример Медиана

Пример вычисления Медианы


Вывод: по моде – наиболее часто встречается среднедушевой доход в размере 7730 руб., по медиане – что половина семей города имеет среднедушевой доход ниже 7800 руб., остальные семьи – более 7800 руб.


Пример .СРЕДНИЙ, МЕДИАННЫЙ И МОДАЛЬНЫЙ УРОВЕНЬ ДЕНЕЖНЫХ ДОХОДОВ НАСЕЛЕНИЯ  ЦЕЛОМ ПО РОССИИ И ПО СУБЪЕКТАМ РОССИЙСКОЙ ФЕДЕРАЦИИ ЗА 2013 год см. по ссылке. Источник: оценка на основании данных выборочного обследования бюджетов домашних хозяйств и макроэкономического показателя денежных доходов населения


Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию.

Если Мое имеет место правосторонняя асимметрия.

При Х<Мео следует сделать вы­вод о левосторонней асимметрии ряда.


Средние величины (арифметическая, гармоническая, геометрическая, квадратическая) см. по ссылке

Оценка статьи:

Загрузка…

Формула для расчета медианы в статистике

Медианная формула в статистике относится к формуле, используемой для определения среднего числа в заданном наборе данных, расположенном в порядке возрастания. Согласно подсчету формулы количество элементов в наборе данных добавляется к единице. Таким образом, результаты будут разделены на два, чтобы получить место срединного значения, т. е. число, помещенное в идентифицированную позицию, будет средним значением.

Это инструмент для измерения центра набора числовых данных. Он суммирует большие объемы данных в одно значение. Его можно определить как среднее число группы чисел, отсортированных в порядке возрастания. Другими словами, медиана — это число, над которым и под ним будет одинаковое количество чисел в указанной группе данных. Это широко используемая мера наборов данных в статистике. В статистике статистика — это наука, стоящая за выявлением, сбором, организацией и обобщением, анализом, интерпретацией и, наконец, представлением таких данных, как качественных, так и количественных, что помогает принимать более эффективные и эффективные решения с уместностью. читать дальше и теория вероятностей.

Медиана = {(n+1)/2}-й

Медианная формула_1

Где «n» — количество элементов в наборе данных, а «th» означает (n)-е число.

Оглавление

  • Формула для расчета медианы в статистике
    • Расчет медианы (шаг за шагом)
    • Примеры формулы медианы в статистике
      • Пример №1
      • Пример #2
      • Пример №3
    • Актуальность и использование
    • Медианная формула в статистике (с шаблоном Excel)
    • Рекомендуемые статьи

Расчет медианы (шаг за шагом)

Выполните следующие шаги:

  1. Во-первых, отсортируйте числа в порядке возрастания. Числа располагаются по возрастанию при расположении от наименьшего к наибольшему порядку в этой группе.
  2. Метод нахождения медианы нечетных/четных чисел в группе приведен ниже.
  3. Если количество элементов в группе нечетное – Найдите {(n+1)/2}-й член. Значение, соответствующее этому термину, является медианой.
  4. Если количество элементов в группе четное — Найдите {(n+1)/2}-й член в этой группе. Средняя точка между числами по обе стороны от срединной позиции. Например, если имеется восемь наблюдений, медиана равна (8+1)/2-й позиции, то есть можно вычислить 4,5-ю медиану, добавив 4-й и 5-й члены в этой группе, которая затем делится на 2.

Примеры формулы медианы в статистике

.free_excel_div{фон:#d9d9d9;размер шрифта:16px;радиус границы:7px;позиция:относительная;margin:30px;padding:25px 25px 25px 45px}.free_excel_div:before{content:»»;фон:url(центр центр без повтора #207245;ширина:70px;высота:70px;позиция:абсолютная;верх:50%;margin-top:-35px;слева:-35px;граница:5px сплошная #fff;граница-радиус:50%} Вы можете скачать этот шаблон Excel с медианной формулой здесь – Шаблон медианной формулы Excel

Пример №1

Список чисел: 4, 10, 7, 15, 2. Вычислить медиану.

Решение: Расположим числа в порядке возрастания.

В порядке возрастания числа: 2,4,7,10,15.

Всего 5 номеров. Медиана равна (n+1)/2-му значению. Таким образом, медиана равна (5+1)/2-му значению.

Медиана = 3-е значение.

3-е значение в списке 2, 4, 710, 15 равно 7.

Таким образом, медиана равна 7.

Пример #2

Предположим, в организации 10 сотрудников, включая генерального директора. Генеральный директор Адам Смит считает, что зарплата сотрудников высока. Следовательно, он хочет оценить зарплату, получаемую группой, и, следовательно, принимать решения.

Ниже указана заработная плата сотрудников фирмы. Рассчитайте среднюю заработную плату. Заработная плата составляет 5 000 долларов, 6 000 долларов, 4 000 долларов, 7 000 долларов, 8 000 долларов, 7 500 долларов, 10 000 долларов, 12 000 долларов, 4 500 долларов, 10 00 000 долларов.

Решение:

Сначала расположим оклады в порядке возрастания. Заработная плата в порядке возрастания:

4000 долларов, 4500 долларов, 5000 долларов, 6000 долларов, 7000 долларов, 7500 долларов, 8000 долларов, 10000 долларов, 12000 долларов, 1000000 долларов

Медиана, например 2

Таким образом, расчет медианы будет следующим:

Поскольку элементов 10, медиана равна (10+1)/2-му элементу. Медиана = 5,5-й пункт.

Таким образом, медиана — это среднее значение 5-го и 6-го пунктов. Например, 5-й и 6-й предметы стоят 7000 и 7500 долларов.

= (7000 долл. США + 7500 долл. США)/2 = 7250 долл. США.

Таким образом, средняя заработная плата 10 сотрудников составляет 7250 долларов.

Пример №3

Джеффу Смиту, генеральному директору производственной организации, необходимо заменить семь машин новыми. Однако он обеспокоен понесенными затратами и звонит финансовому директору фирмы, чтобы тот помог ему рассчитать медианную стоимость семи новых машин.

Финансовый менеджер предположил, что можно покупать новые машины, если средняя цена машин ниже 85 000 долларов. Затраты следующие: 75 000 долларов, 82 500 долларов, 60 000 долларов, 50 000 долларов, 1 00 000 долларов, 70 000 долларов, 90 000 долларов. Рассчитайте среднюю стоимость машин. Затраты следующие: 75 000 долларов, 82 500 долларов, 60 000 долларов, 50 000 долларов, 1 00 000 долларов, 70 000 долларов, 90 000 долларов.

Решение:

Расположите затраты в порядке возрастания: 50 000 долларов, 60 000 долларов, 70 000 долларов, 75 000 долларов, 82 500 долларов, 90 000 долларов, 1 00 000 долларов.

Таким образом, расчет медианы будет следующим:

Поскольку элементов 7, медиана равна (7+1)/2-й элемент, т. е. 4-й элемент. Следовательно, 4-й предмет стоит 75 000 долларов.

Поскольку медиана ниже 85 000 долларов, можно купить новые машины.

Актуальность и использование

Основное преимущество медианы перед средними заключается в том, что на нее не оказывают чрезмерного влияния крайние значения, которые могут быть очень высокими и очень низкими. Таким образом, это дает человеку лучшее представление о репрезентативной ценности. Например, если вес 5 человек в кг равен 50, 55, 55, 60 и 150. Среднее значение равно (50+55+55+60+150)/5 = 74 кг. Однако 74 кг не является истинным репрезентативным значением, поскольку большинство весов находится в диапазоне от 50 до 60. Вычислим медиану в таком случае. Это будет (5+1)/2-й член = 3-й член. Третий член — 55 кг, что является медианой. Поскольку большинство данных находится в диапазоне от 50 до 60, 55 кг являются истинным репрезентативным значением данных.

Мы должны быть осторожны в интерпретации того, что означает медиана. Например, когда мы говорим, что средний вес составляет 55 кг, не все люди весят 55 кг. Кто-то может весить больше, а кто-то меньше. Однако 55 кг – это хороший показатель веса 5 человек.

В реальном мире, чтобы понять наборы данных, такие как доход домохозяйства или активы домохозяйства, которые сильно различаются, среднее значение может быть искажено небольшим количеством очень больших значений или малых значений. Таким образом, медиана используется, чтобы предположить, каким должно быть типичное значение.

Медианная формула в статистике (с шаблоном Excel)

Билл — владелец обувного магазина. Он хочет знать, какой размер обуви ему следует заказать. Он спрашивает 9 покупателей, какой у них размер обуви. Результатами являются 7, 6, 8, 8, 10, 6, 7, 9 и 6. Вычислите медиану, чтобы помочь Биллу принять решение о заказе.

Решение: Сначала мы должны расположить размеры обуви в порядке возрастания.

Это: 6, 6, 6, 7, 7, 8, 8, 9, 10

Ниже приведены данные для расчета медианы обувного магазина.

Медиана Пример 4

Поэтому вычисление медианы в excelMedian In ExcelMEDIAN в Excel дает медиану заданного набора чисел. МЕДИАНА Определяет положение центра группы чисел в статистическом распределении. Подробнее будет следующим:

Пример 4.1

В Excel можно использовать встроенную формулу для медианы, чтобы вычислить медиану группы чисел. Выберите пустую ячейку и введите это = МЕДИАНА (B2: B10) (B2: B10 указывает диапазон, из которого вы хотите вычислить медиану).

Медиана обувного магазина будет –

ПРИМЕР 4.2

Рекомендуемые статьи

Эта статья была руководством по медианной формуле в статистике. Здесь мы обсуждаем расчет медианы с использованием ее формулы и практических примеров в Excel и загружаемого шаблона Excel. Вы можете узнать больше об Excel из следующих статей: –

  • ФормулаФормулаНормальное распределение – это симметричное распределение, т.е. положительные и отрицательные значения распределения можно разделить на равные половины, и поэтому среднее значение, медиана и мода будут равны. У него два хвоста, один известен как правый хвост, а другой известен как левый хвост. Узнайте больше о нормальном распределении нормального распределения. на равные половины и, следовательно, среднее значение, медиана и мода будут равны. У него два хвоста, один известен как правый хвост, а другой известен как левый хвост.Подробнее
  • Вычислить стандартное нормальное распределениеВычислить стандартное нормальное распределениеСтандартное нормальное распределение — это симметричное распределение вероятностей относительно среднего или среднего значения, показывающее, что данные, близкие к среднему или среднему, встречаются чаще, чем данные, далекие от среднего или нормы. Таким образом, оценка называется «Z-оценка».Подробнее
  • Формула МЕДИАНА в ExcelФормула МЕДИАНА в Excel Функция МЕДИАНА в Excel дает медиану заданного набора чисел. МЕДИАНА Определяет расположение центра группы чисел в статистическом распределении.Подробнее
  • Вычислить среднее значение населенияВычислить среднее значение населенияСреднее значение населения представляет собой среднее значение всех значений в данной совокупности и рассчитывается как сумма всех значений в совокупности, обозначаемая суммой X, деленная на количество значений в совокупности, которое обозначается N. читать далее

Центральную тенденцию данных можно рассматривать не только, как значение с нулевым суммарным отклонением (среднее арифметическое) или максимальную частоту (мода), но и как некоторую отметку (значение в совокупности), делящую ранжированные данные (отсортированные по возрастанию или убыванию) на две равные части. Половина исходных данных меньше этой отметки, а половина – больше. Это и есть медиана

Итак, медиана в статистике – это уровень показателя, который делит набор данных на две равные половины. Значения в одной половине меньше, а в другой больше медианы. В качестве примера обратимся к набору нормально распределенных случайных чисел.

Симметричное распределение с медианой и средней арифметической

Очевидно, что при симметричном распределении середина, делящая совокупность пополам, будет находиться в самом центре – там же, где средняя арифметическая (и мода). Это, так сказать, идеальная ситуация, когда мода, медиана и средняя арифметическая совпадают и все их свойства приходятся на одну точку – максимальная частота, деление пополам, нулевая сумма отклонений – все в одном месте. Однако, жизнь не так симметрична, как нормальное распределение. 

Допустим, мы имеем дело с техническими замерами отклонений от ожидаемой величины чего-нибудь (содержания элементов, расстояния, уровня, массы и т.д. и т.п.). Если все ОК, то отклонения, скорее всего, будут распределены по закону, близкому к нормальному, примерно, как на рисунке выше. Но если в процессе присутствует важный и неконтролируемый фактор, то могут появиться аномальные значения, которые в значительной мере повлияют на среднюю арифметическую, но при этом почти не затронут медиану.

Медиана и среднее при наличие аномальных отклонений

Медиана выборки – это альтернатива средней арифметической, т.к. она устойчива к аномальным отклонениям (выбросам). 

Математическим свойством медианы является то, что сумма абсолютных (по модулю) отклонений от медианного значения дает минимально возможное значение, если сравнивать с отклонениями от любой другой величины. Даже меньше, чем от средней арифметической, о как! Данный факт находит свое применение, например, при решении транспортных задач, когда нужно рассчитать место строительства объектов около дороги таким образом, чтобы суммарная длина рейсов до него из разных мест была минимальной (остановки, заправки, склады и т.д. и т.п.). 

Формула медианы

Формула медианы в статистике для дискретных данных чем-то напоминает формулу моды. А именно тем, что формулы как таковой нет. Медианное значение выбирают из имеющихся данных и только, если это невозможно, проводят несложный расчет.

Первым делом данные ранжируют (сортируют по убыванию). Далее есть два варианта. Если количество значений нечетно, то медиана будет соответствовать центральному значению ряда, номер которого можно определить по формуле:

Определение порядка центрального значения

где

Me – номер значения, соответствующего медиане,

N – количество значений в совокупности данных.

Тогда медиана обозначается, как

Определение медианы по центральному значению

Это первый вариант, когда в данных есть одно центральное значение. Второй вариант наступает тогда, когда количество данных четно, то есть вместо одного есть два центральных значения. Выход прост: берется средняя арифметическая из двух центральных значений:

Определение медианы при четном количестве данных

В интервальных данных выбрать конкретное значение не представляется возможным. Медиану рассчитывают по определенному правилу. 

Для начала (после ранжирования данных) находят медианный интервал. Это такой интервал, через который проходит искомое медианное значение. Определяется с помощью накопленной доли ранжированных интервалов. Где накопленная доля впервые перевалила через 50% всех значений, там и медианный интервал.

Не знаю, кто придумал формулу медианы, но исходили явно из того предположения, что распределение данных внутри медианного интервала равномерное (т.е. 30% ширины интервала – это 30% значений, 80% ширины – 80% значений и т.д.). Отсюда, зная количество значений от начала медианного интервала до 50% всех значений совокупности (разница между половиной количества всех значений и накопленной частотой предмедианного интервала), можно найти, какую долю они занимают во всем медианном интервале. Вот эта доля аккурат переносится на ширину медианного интервала, указывая на конкретное значение, именуемое впоследствии медианой.

Обратимся к наглядной схеме.

Схема нахождения медианного значения

Немного громоздко получилось, но теперь, надеюсь, все наглядно и понятно. Чтобы при расчете каждый раз не рисовать такой график, можно воспользоваться готовой формулой. Формула медианы имеет следующий вид:

Формула медианы

где xMe — нижняя граница медианного интервала;

iMe — ширина медианного интервала;

∑f/2 — количество всех значений, деленное на 2 (два);

S(Me-1)— суммарное количество наблюдений, которое было накоплено до начала медианного интервала, т.е. накопленная частота предмедианного интервала;

fMe — число наблюдений в медианном интервале.

Как нетрудно заметить, формула медианы состоит из двух слагаемых: 1 – значение начала медианного интервала и 2 – та самая часть, которая пропорциональна недостающей накопленной доли до 50%. 

Для примера рассчитаем медиану по следующим данным.

Данные для расчета медианы

Требуется найти медианную цену, то есть ту цену, дешевле и дороже которой по половине количества товаров. Для начала произведем вспомогательные расчеты накопленной частоты, накопленной доли, общего количества товаров.

Расчет медианы

По последней колонке «Накопленная доля» определяем медианный интервал – 300-400 руб (накопленная доля впервые более 50%). Ширина интервала – 100 руб. Теперь остается подставить данные в приведенную выше формулу и рассчитать медиану.

Расчет медианы по формуле

То есть у одной половины товаров цена ниже, чем 350 руб., у другой половины – выше. Все просто. Средняя арифметическая, рассчитанная по этим же данным, равна 355 руб. Отличие не значительное, но оно есть.

Расчет медианы в Excel

Медиану для числовых данных легко найти, используя функцию Excel, которая так и называется — МЕДИАНА. Другое дело интервальные данные. Соответствующей функции в Excel нет. Поэтому нужно задействовать приведенную выше формулу. Что поделаешь? Но это не очень трагично, так как расчет медианы по интервальным данным – редкий случай. Можно и на калькуляторе разок посчитать.

Напоследок предлагаю задачку. Имеется набор данных. 15, 5, 20, 5, 10. Каково среднее значение? Четыре варианта:

а) 11;

б) 5;

в) 10;

г) 5, 10, 11.

Мода, медиана и среднее значение выборки – это разный способ определить центральную тенденцию в выборке.

Ниже видеоролик о том, как рассчитать медиану в Excel.

Поделиться в социальных сетях:

У этого термина существуют и другие значения, см. Медиана.

Медиа́на (от лат. mediāna «середина») или набора чисел — число, которое находится в середине этого набора, если его упорядочить по возрастанию, то есть такое число, что половина из элементов набора не меньше него, а другая половина не больше. Другое равносильное определение[1]: медиана набора чисел — это число, сумма расстояний (или, если более строго, модулей) от которого до всех чисел из набора минимальна. Это определение естественным образом обобщается на многомерные наборы данных и называется 1-медианой.

Например, медианой набора {11, 9, 3, 5, 5} является число 5, так как оно стоит в середине этого набора после его упорядочивания: {3, 5, 5, 9, 11}. Если в выборке чётное число элементов, медиана может быть не определена однозначно: тогда для числовых данных чаще всего используют полусумму двух соседних значений (то есть медиану набора {1, 3, 5, 7} принимают равной 4), подробнее см. ниже.
В математической статистике медиана может использоваться как одна из характеристик выборки или совокупности чисел.

Также определяется медиана случайной величины: в этом случае оно определяется как число, которое делит пополам распределение. Грубо говоря, медианой случайной величины является такое число, что вероятность получить значение случайной величины справа от него равна вероятности получить значение слева от него (и они обе равны 1/2), — более точное определение дано ниже.

Можно также сказать, что медиана является 50-м персентилем, 0,5-квантилем или вторым квартилем выборки или распределения.

Свойства медианы для случайных величин[править | править код]

Если распределение непрерывно, то медиана является одним из решений уравнения

F(x)=0.5,

где F — функция распределения случайной величины x, связанная с плотностью распределения f как

{displaystyle F(x)=int _{-infty }^{x}f(chi ),dchi }.

Если распределение является непрерывной строго возрастающей функцией, то решение уравнения однозначно. Если распределение имеет разрывы, то медиана может совпадать с минимальным или максимальным (крайним) возможным значением случайной величины, что противоречит «геометрическому» пониманию этого термина.

Медиана является важной характеристикой распределения случайной величины и, так же как математическое ожидание, может быть использована для центрирования распределения. Поскольку оценки медианы более робастны, её оценивание может быть более предпочтительным для распределений с т. н. тяжёлыми хвостами. Однако о преимуществах оценивания медианы по сравнению с математическим ожиданием можно говорить только в случае, если эти характеристики у распределения совпадают, в частности, для симметричных функций плотности распределения вероятностей.

Медиана определяется для всех распределений, а в случае неоднозначности, естественным образом доопределяется, в то время как математическое ожидание может быть не определено (например, у распределения Коши).

Пример использования[править | править код]

Рассмотрим финансовое состояние 19 малоимущих, у каждого из каких есть только 5 ₽, и одного миллионера, у которого буквально 1 млн ₽. Тогда в сумме у них получается 1 000 095 ₽. Если деньги равными долями разделить на 20 человек, получится 50 004,75 ₽. Это будет среднее арифметическое значение суммы денег, которая была у всех 20 человек в этой комнате.

Медиана же будет равна 5 ₽ (сумма «расстояния» от этой величины до состояния каждого из рассматриваемых людей минимальна). Это можно интерпретировать следующим образом: «разделив» всех рассматриваемых людей на две равные группы по 10 человек, мы получаем, что в первой группе у каждого не больше 5 ₽, во второй же — не меньше 5 ₽.

Из этого примера получается, что в качестве «серединного» состояния, грубо говоря, корректнее всего использовать именно медиану, а вот среднее арифметическое, наоборот, значительно превышает сумму наличных, имеющуюся у случайного человека из выборки.

Различны изменения в динамике и у средней арифметической с медианой, например в вышеприведённом примере, если у миллионера станет 1,5 млн. ₽ (+50 %), а у остальных станет 6 ₽ (+20 %), то средняя арифметическая выборки станет равна 75 005,70 ₽, то есть как бы у всех повысились равномерно на 50 %, при этом медиана станет равной 6 ₽ (+20 %).

Неуникальность значения[править | править код]

Если имеется чётное количество случаев и два средних значения различаются, то медианой, по определению, может служить любое число между ними (например, в выборке {1, 3, 5, 7} медианой может служить любое число из интервала (3,5)). На практике в этом случае чаще всего используют среднее арифметическое двух средних значений (в примере выше это число (3+5)/2=4). Для выборок с чётным числом элементов можно также ввести понятие «нижней медианы» (элемент с номером n/2 в упорядоченном ряду из n элементов; в примере выше это число 3) и «верхней медианы» (элемент с номером (n+2)/2; в примере выше это число 5)[2]. Эти понятия определены не только для числовых данных, но и для любой порядковой шкалы.

См. также[править | править код]

  • Мода — значение во множестве наблюдений, которое встречается наиболее часто.
  • Среднее арифметическое набора чисел — число, сумма квадратов расстояний от которого до всех чисел из набора минимальна[3].

Примечания[править | править код]

  1. Сущность медианы. Дата обращения: 9 мая 2021. Архивировано 9 мая 2021 года.
  2. Кормен, Томас Х., Лейзерсон, Чарльз И., Ривест Рональ Л., Штайн, Клиффорд. Алгоритмы. Построение и анализ. — 2-е издание. — М.: Издательский дом «Вильямс», 2005. — С. 240. — 1296 с.
  3. Почему это равносильные определения среднего арифметического.

Литература[править | править код]

  • Медиана // Маниковский — Меотида. — М. : Большая российская энциклопедия, 2012. — С. 479—480. — (Большая российская энциклопедия : [в 35 т.] / гл. ред. Ю. С. Осипов ; 2004—2017, т. 19). — ISBN 978-5-85270-353-8.
  • Медиана // Большая российская энциклопедия [Электронный ресурс]. — 2017.

Добавить комментарий