Как найти медиану статистические характеристики

У этого термина существуют и другие значения, см. Медиана.

Медиа́на (от лат. mediāna «середина») или набора чисел — число, которое находится в середине этого набора, если его упорядочить по возрастанию, то есть такое число, что половина из элементов набора не меньше него, а другая половина не больше. Другое равносильное определение[1]: медиана набора чисел — это число, сумма расстояний (или, если более строго, модулей) от которого до всех чисел из набора минимальна. Это определение естественным образом обобщается на многомерные наборы данных и называется 1-медианой.

Например, медианой набора {11, 9, 3, 5, 5} является число 5, так как оно стоит в середине этого набора после его упорядочивания: {3, 5, 5, 9, 11}. Если в выборке чётное число элементов, медиана может быть не определена однозначно: тогда для числовых данных чаще всего используют полусумму двух соседних значений (то есть медиану набора {1, 3, 5, 7} принимают равной 4), подробнее см. ниже.
В математической статистике медиана может использоваться как одна из характеристик выборки или совокупности чисел.

Также определяется медиана случайной величины: в этом случае оно определяется как число, которое делит пополам распределение. Грубо говоря, медианой случайной величины является такое число, что вероятность получить значение случайной величины справа от него равна вероятности получить значение слева от него (и они обе равны 1/2), — более точное определение дано ниже.

Можно также сказать, что медиана является 50-м персентилем, 0,5-квантилем или вторым квартилем выборки или распределения.

Свойства медианы для случайных величин[править | править код]

Если распределение непрерывно, то медиана является одним из решений уравнения

F(x)=0.5,

где F — функция распределения случайной величины x, связанная с плотностью распределения f как

{displaystyle F(x)=int _{-infty }^{x}f(chi ),dchi }.

Если распределение является непрерывной строго возрастающей функцией, то решение уравнения однозначно. Если распределение имеет разрывы, то медиана может совпадать с минимальным или максимальным (крайним) возможным значением случайной величины, что противоречит «геометрическому» пониманию этого термина.

Медиана является важной характеристикой распределения случайной величины и, так же как математическое ожидание, может быть использована для центрирования распределения. Поскольку оценки медианы более робастны, её оценивание может быть более предпочтительным для распределений с т. н. тяжёлыми хвостами. Однако о преимуществах оценивания медианы по сравнению с математическим ожиданием можно говорить только в случае, если эти характеристики у распределения совпадают, в частности, для симметричных функций плотности распределения вероятностей.

Медиана определяется для всех распределений, а в случае неоднозначности, естественным образом доопределяется, в то время как математическое ожидание может быть не определено (например, у распределения Коши).

Пример использования[править | править код]

Рассмотрим финансовое состояние 19 малоимущих, у каждого из каких есть только 5 ₽, и одного миллионера, у которого буквально 1 млн ₽. Тогда в сумме у них получается 1 000 095 ₽. Если деньги равными долями разделить на 20 человек, получится 50 004,75 ₽. Это будет среднее арифметическое значение суммы денег, которая была у всех 20 человек в этой комнате.

Медиана же будет равна 5 ₽ (сумма «расстояния» от этой величины до состояния каждого из рассматриваемых людей минимальна). Это можно интерпретировать следующим образом: «разделив» всех рассматриваемых людей на две равные группы по 10 человек, мы получаем, что в первой группе у каждого не больше 5 ₽, во второй же — не меньше 5 ₽.

Из этого примера получается, что в качестве «серединного» состояния, грубо говоря, корректнее всего использовать именно медиану, а вот среднее арифметическое, наоборот, значительно превышает сумму наличных, имеющуюся у случайного человека из выборки.

Различны изменения в динамике и у средней арифметической с медианой, например в вышеприведённом примере, если у миллионера станет 1,5 млн. ₽ (+50 %), а у остальных станет 6 ₽ (+20 %), то средняя арифметическая выборки станет равна 75 005,70 ₽, то есть как бы у всех повысились равномерно на 50 %, при этом медиана станет равной 6 ₽ (+20 %).

Неуникальность значения[править | править код]

Если имеется чётное количество случаев и два средних значения различаются, то медианой, по определению, может служить любое число между ними (например, в выборке {1, 3, 5, 7} медианой может служить любое число из интервала (3,5)). На практике в этом случае чаще всего используют среднее арифметическое двух средних значений (в примере выше это число (3+5)/2=4). Для выборок с чётным числом элементов можно также ввести понятие «нижней медианы» (элемент с номером n/2 в упорядоченном ряду из n элементов; в примере выше это число 3) и «верхней медианы» (элемент с номером (n+2)/2; в примере выше это число 5)[2]. Эти понятия определены не только для числовых данных, но и для любой порядковой шкалы.

См. также[править | править код]

  • Мода — значение во множестве наблюдений, которое встречается наиболее часто.
  • Среднее арифметическое набора чисел — число, сумма квадратов расстояний от которого до всех чисел из набора минимальна[3].

Примечания[править | править код]

  1. Сущность медианы. Дата обращения: 9 мая 2021. Архивировано 9 мая 2021 года.
  2. Кормен, Томас Х., Лейзерсон, Чарльз И., Ривест Рональ Л., Штайн, Клиффорд. Алгоритмы. Построение и анализ. — 2-е издание. — М.: Издательский дом «Вильямс», 2005. — С. 240. — 1296 с.
  3. Почему это равносильные определения среднего арифметического.

Литература[править | править код]

  • Медиана // Маниковский — Меотида. — М. : Большая российская энциклопедия, 2012. — С. 479—480. — (Большая российская энциклопедия : [в 35 т.] / гл. ред. Ю. С. Осипов ; 2004—2017, т. 19). — ISBN 978-5-85270-353-8.
  • Медиана // Большая российская энциклопедия [Электронный ресурс]. — 2017.

Медиана как статистическая характеристика

Автор статьи

Эксперт по предмету «Математика»

Задать вопрос автору статьи

Определение медианы

Понятие медианы — это одна из статистических величин, относящихся к конечному упорядоченному ряду чисел. Пусть нам дан конечный упорядоченный ряд чисел $a_1, a_2, dots , a_n$. Этот ряд может содержать как четное, так и нечетное количество чисел. Поэтому понятие медианы имеет два определения (в зависимости от количества чисел в конечном упорядоченном числовом ряду).

Определение

Медианой для конечного упорядоченного ряда чисел, имеющего нечетное число элементов, называется число, записанное в середине данного ряда.

Пример 1

Пусть дан ряд 1, 3, 5, 7, 9, 11, 13. Тогда медиана данного ряда равна 7.

Перед тем, как ввести второе определение, вспомним, что такое средне арифметическое двух чисел.

Определение

Среднее арифметическое $n$ чисел — это сумма этих чисел, поделенная на $n$.

Определение

Медианой для конечного упорядоченного ряда чисел, имеющего четное число элементов, называется среднее арифметическое двух чисел, записанных в середине данного ряда.

Пример 2

Пусть дан ряд 1, 3, 5, 7, 9, 11, 13, 15. Тогда медиана данного ряда равна

[frac{7+9}{2}=frac{16}{2}=8]

Рассмотрим теперь случай, когда ряд чисел $a_1, a_2, dots , a_n$ не упорядочен. В этом случае, перед тем как найти медиану, данный ряд сначала необходимо упорядочить, то есть расставить все числа в порядке возрастания. Только после этого мы можем применить определение понятия медианы.

«Медиана как статистическая характеристика» 👇

Пример 3

Пусть дан ряд 3, 7, 5, 4, 11, 6, 10, 9. Вначале упорядочим данный ряд, получим:

[3, 4, 5, 6, 7, 9, 10, 11]

Вычисляем по определению 3 медиану:

[frac{6+7}{2}=frac{13}{2}=6,5]

Свойства медианы

Для понятия медианы можно выделить два следующих свойства:

  1. Если распределение задано непрерывно, то значение медианы совпадает с одним из решений уравнения
  2. [Fleft(xright)=0,5]

    Напомним, что $Fleft(xright)$ — функция распределения случайной величины.

  3. Если ряд распределения имеет четное число членов и два средних члена $a_k$ и $a_{k+1}$ различны, то значение медианы принадлежит интервалу ${(a}_k,a_{k+1})$.

Примеры решения задач

Задача 1

Найти среднее арифметическое следующих рядов чисел.

  1. 3, 6, 13, 7, 3, 45, 24, 17, 8, 3.
  2. 10, 25, 43, 67, 13, 65, 34, 84, 46.

Решение:

  1. Так как данный ряд имеет 10 чисел, то среднее арифметическое равно
  2. [frac{3+6+13+7+3+45+24+17+8+3}{10}=frac{129}{10}=12,9]

  3. Так как данный ряд имеет 9 чисел, то среднее арифметическое равно
  4. [frac{10+25+43+67+13+65+34+84+46}{9}=frac{387}{9}=43]

Ответ: а) 12,9. б) 43.

Задача 2

Найти среднее арифметическое и медианы следующих числовых рядов:

  1. 2, 4, 8, 16, 32, 64, 128, 256
  2. 13, 24, 35, 46, 57, 68, 79

Решение:

  1. Так как ряд имеет 8 элементов, то среднее арифметическое равно:
  2. [frac{2+4+8+16+32+64+128+256}{8}=frac{510}{8}=63,75]

    Так как данный ряд чисел упорядочен и имеет четное число элементов, то мы сразу можем применить третье определение, получим, что медиана равна:

    [frac{16+32}{2}=frac{48}{2}=24]

  3. Так как ряд имеет 7 элементов, то среднее арифметическое равно:
  4. [frac{13+24+35+46+57+68+79}{7}=frac{322}{7}=46]

Так как данный ряд чисел упорядочен и имеет нечетное число элементов, то мы сразу можем применить первое определение, получим, что медиана равна 46.

Задача 3

Найти медиану следующих рядов чисел.

  1. 3, 6, 13, 7, 3, 45, 24, 17, 8, 3.
  2. 10, 25, 43, 67, 13, 65, 34, 89, 46.

Решение:

  1. Вначале нам необходимо упорядочить данный ряд, получим:
  2. [3, 3, 3, 6, 7, 8, 13, 17, 24, 45]

    Так как данный ряд чисел упорядочен и имеет четное число элементов, то мы сразу можем применить третье определение, получим, что медиана равна:

    [frac{7+8}{2}=frac{13}{2}=6,5]

  3. Вначале нам необходимо упорядочить данный ряд, получим:
  4. [10, 13, 25, 34, 43, 46, 65, 67, 89]

Так как данный ряд чисел упорядочен и имеет нечетное число элементов, то мы сразу можем применить первое определение, получим, что медиана равна 43.

Ответ: а) 6,5. б) 43.

Находи статьи и создавай свой список литературы по ГОСТу

Поиск по теме

Дата последнего обновления статьи: 29.01.2023

Центральную тенденцию данных можно рассматривать не только, как значение с нулевым суммарным отклонением (среднее арифметическое) или максимальную частоту (мода), но и как некоторую отметку (значение в совокупности), делящую ранжированные данные (отсортированные по возрастанию или убыванию) на две равные части. Половина исходных данных меньше этой отметки, а половина – больше. Это и есть медиана

Итак, медиана в статистике – это уровень показателя, который делит набор данных на две равные половины. Значения в одной половине меньше, а в другой больше медианы. В качестве примера обратимся к набору нормально распределенных случайных чисел.

Симметричное распределение с медианой и средней арифметической

Очевидно, что при симметричном распределении середина, делящая совокупность пополам, будет находиться в самом центре – там же, где средняя арифметическая (и мода). Это, так сказать, идеальная ситуация, когда мода, медиана и средняя арифметическая совпадают и все их свойства приходятся на одну точку – максимальная частота, деление пополам, нулевая сумма отклонений – все в одном месте. Однако, жизнь не так симметрична, как нормальное распределение. 

Допустим, мы имеем дело с техническими замерами отклонений от ожидаемой величины чего-нибудь (содержания элементов, расстояния, уровня, массы и т.д. и т.п.). Если все ОК, то отклонения, скорее всего, будут распределены по закону, близкому к нормальному, примерно, как на рисунке выше. Но если в процессе присутствует важный и неконтролируемый фактор, то могут появиться аномальные значения, которые в значительной мере повлияют на среднюю арифметическую, но при этом почти не затронут медиану.

Медиана и среднее при наличие аномальных отклонений

Медиана выборки – это альтернатива средней арифметической, т.к. она устойчива к аномальным отклонениям (выбросам). 

Математическим свойством медианы является то, что сумма абсолютных (по модулю) отклонений от медианного значения дает минимально возможное значение, если сравнивать с отклонениями от любой другой величины. Даже меньше, чем от средней арифметической, о как! Данный факт находит свое применение, например, при решении транспортных задач, когда нужно рассчитать место строительства объектов около дороги таким образом, чтобы суммарная длина рейсов до него из разных мест была минимальной (остановки, заправки, склады и т.д. и т.п.). 

Формула медианы

Формула медианы в статистике для дискретных данных чем-то напоминает формулу моды. А именно тем, что формулы как таковой нет. Медианное значение выбирают из имеющихся данных и только, если это невозможно, проводят несложный расчет.

Первым делом данные ранжируют (сортируют по убыванию). Далее есть два варианта. Если количество значений нечетно, то медиана будет соответствовать центральному значению ряда, номер которого можно определить по формуле:

Определение порядка центрального значения

где

Me – номер значения, соответствующего медиане,

N – количество значений в совокупности данных.

Тогда медиана обозначается, как

Определение медианы по центральному значению

Это первый вариант, когда в данных есть одно центральное значение. Второй вариант наступает тогда, когда количество данных четно, то есть вместо одного есть два центральных значения. Выход прост: берется средняя арифметическая из двух центральных значений:

Определение медианы при четном количестве данных

В интервальных данных выбрать конкретное значение не представляется возможным. Медиану рассчитывают по определенному правилу. 

Для начала (после ранжирования данных) находят медианный интервал. Это такой интервал, через который проходит искомое медианное значение. Определяется с помощью накопленной доли ранжированных интервалов. Где накопленная доля впервые перевалила через 50% всех значений, там и медианный интервал.

Не знаю, кто придумал формулу медианы, но исходили явно из того предположения, что распределение данных внутри медианного интервала равномерное (т.е. 30% ширины интервала – это 30% значений, 80% ширины – 80% значений и т.д.). Отсюда, зная количество значений от начала медианного интервала до 50% всех значений совокупности (разница между половиной количества всех значений и накопленной частотой предмедианного интервала), можно найти, какую долю они занимают во всем медианном интервале. Вот эта доля аккурат переносится на ширину медианного интервала, указывая на конкретное значение, именуемое впоследствии медианой.

Обратимся к наглядной схеме.

Схема нахождения медианного значения

Немного громоздко получилось, но теперь, надеюсь, все наглядно и понятно. Чтобы при расчете каждый раз не рисовать такой график, можно воспользоваться готовой формулой. Формула медианы имеет следующий вид:

Формула медианы

где xMe — нижняя граница медианного интервала;

iMe — ширина медианного интервала;

∑f/2 — количество всех значений, деленное на 2 (два);

S(Me-1)— суммарное количество наблюдений, которое было накоплено до начала медианного интервала, т.е. накопленная частота предмедианного интервала;

fMe — число наблюдений в медианном интервале.

Как нетрудно заметить, формула медианы состоит из двух слагаемых: 1 – значение начала медианного интервала и 2 – та самая часть, которая пропорциональна недостающей накопленной доли до 50%. 

Для примера рассчитаем медиану по следующим данным.

Данные для расчета медианы

Требуется найти медианную цену, то есть ту цену, дешевле и дороже которой по половине количества товаров. Для начала произведем вспомогательные расчеты накопленной частоты, накопленной доли, общего количества товаров.

Расчет медианы

По последней колонке «Накопленная доля» определяем медианный интервал – 300-400 руб (накопленная доля впервые более 50%). Ширина интервала – 100 руб. Теперь остается подставить данные в приведенную выше формулу и рассчитать медиану.

Расчет медианы по формуле

То есть у одной половины товаров цена ниже, чем 350 руб., у другой половины – выше. Все просто. Средняя арифметическая, рассчитанная по этим же данным, равна 355 руб. Отличие не значительное, но оно есть.

Расчет медианы в Excel

Медиану для числовых данных легко найти, используя функцию Excel, которая так и называется — МЕДИАНА. Другое дело интервальные данные. Соответствующей функции в Excel нет. Поэтому нужно задействовать приведенную выше формулу. Что поделаешь? Но это не очень трагично, так как расчет медианы по интервальным данным – редкий случай. Можно и на калькуляторе разок посчитать.

Напоследок предлагаю задачку. Имеется набор данных. 15, 5, 20, 5, 10. Каково среднее значение? Четыре варианта:

а) 11;

б) 5;

в) 10;

г) 5, 10, 11.

Мода, медиана и среднее значение выборки – это разный способ определить центральную тенденцию в выборке.

Ниже видеоролик о том, как рассчитать медиану в Excel.

Поделиться в социальных сетях:

Помимо моды, среднего арифметического и размаха ряда чисел существует также такое понятие, как медиана. Ее используют для того, чтобы охарактеризовать какой-либо числовой ряд. Медианой называют среднее число в представленном ряду, то есть то, которое будет стоять в его середине.

Медиана — это число, стоящее посередине упорядоченного по возрастанию ряда чисел (в случае, если количество чисел нечетное), или же полусумма двух стоящих в середине чисел (если количество чисел в ряду четное).

На письме медиану обозначают как $Me$.

Стоит отметить, что медиана и среднее арифметическое — это не одно и то же. В первом случае мы будем брать число из середины ряда, а во втором — среднее значение.

Рассмотрим на примере. Нам дан определенный числовой ряд, состоящий из $13$ значений:

$$-3, 0, 0, 0, 3, 4, textcolor{blue}{8}, 8, 8, 8, 12, 15, 100$$

В данном ряду все числа расставлены по возрастанию, поэтому из $13$ позиций нам нужно найти ту, которая будет стоять в центре ряда. Ей станет позиция под номером $7$. Если мы посмотрим на числовой ряд, то можем увидеть, что на седьмом месте стоит число $textcolor{blue}{8}$. Таким образом, мы нашли медиану данного числового ряда, а в ответе можем записать, что $Me=8$.

Алгоритм нахождения медианы

Искать медиану в числовом ряде достаточно просто, для этого достаточно всего лишь придерживаться определенного алгоритма:

  1. Первым шагом будет нужно упорядочить числовой набор, выписав все числа последовательно в порядке возрастания.
  2. Затем, чтобы было удобнее находить медиану, следует поочередно зачеркивать одновременно самое большое и самое маленькое числа, то есть одно значение из начала числового ряда, а другое — из его конца. Это нужно делать до тех пор, пока в середине не останется одно (если ряд имеет нечетное количество чисел) или два (если ряд имеет четного количества чисел) значения.
  3. При условии, что в центре остается одно число, его и считают медианой, поэтому в таком случае задача уже будет решена.
  4. Если же в середине осталось два числа, то нужно найти их полусумму. Полученное значение и будет являться медианой числового ряда.

Попробуем применить данный алгоритм на примере. У нас имеется следующий ряд чисел:

$$19, 7, 21, 2, 15, 5$$

Прежде всего запишем все числа в порядке возрастания друг за другом:

$$2, 5, 7, 15, 19, 21$$

Теперь начнем убирать самое большое и самое маленькое значения. Сначала зачеркиваем числа $21$ и $2$, затем $19$ и $5$. Мы видим, что в середине осталось два числа, так как числовой ряд состоял из четного количества чисел.

$$textcolor{red}{2}, textcolor{red}{5}, 7, 15, textcolor{red}{19}, textcolor{red}{21}$$

Чтобы найти медиану, нам нужно сложить числа $7$ и $15$, после чего разделить их на два. Получается такой пример:

$$frac{7+15}{2}=frac{22}{2}=11$$

Значение $11$ и будет являться искомой медианой, поэтому в ответе мы можем записать, что $Me=11$.


Загрузить PDF


Загрузить PDF

Среднее значение, медиана и мода — значения, которые часто используются в статистике и математике. Эти значения найти довольно легко, но их легко и перепутать. Мы расскажем, что они из себя представляют и как их найти.

  1. Изображение с названием Find Mean, Median, and Mode Step 1

    1

    Сложите все числа, которые вам даны. Допустим, вам даны числа 2, 3 и 4. Сложим их: 2 + 3 + 4 = 9.

  2. Изображение с названием Find Mean, Median, and Mode Step 2

    2

    Сосчитайте количество чисел. У нас есть три цифры.

  3. Изображение с названием Find Mean, Median, and Mode Step 3

    3

    Разделите сумму чисел на их количество. Берем 9, делим на 3. 9/3 = 3. Среднее значение в данном случае равно 3. Помните, что не всегда получается целое число.

    Реклама

  1. Изображение с названием Find Mean, Median, and Mode Step 4

    1

    Запишите все числа, которые вам даны, в порядке возрастания. Например, нам даны числа: 4, 2, 8, 1, 15. Запишите их от меньшего к большему, вот так: 1, 2, 4, 8, 15.

  2. Изображение с названием Find Mean, Median, and Mode Step 5

    2

    Найдите два средних числа. Мы расскажем, как это сделать, если у вас имеется четное количество чисел, и как это сделать, если количество чисел нечетное:

    • Если у вас нечетное количество чисел, вычеркните левое крайнее число, затем правое крайнее число и так далее. Один оставшийся номер и будет искомой медианой. Если вам дан ряд чисел 4, 7, 8, 11, 21, тогда 8 — медиана, так как 8 стоит посередине.
    • Если у вас четное количество чисел, вычеркните по одному числу с каждой стороны, пока у вас не останется два числа посередине. Сложите их и разделите на два. Это и есть значение медианы. Если вам дан ряд чисел 1, 2, 5, 3, 7, 10, то два средних числа — это 5 и 3. Сложим 5 и 3, получим 8, разделим на два, получим 4. Это и есть медиана.

    Реклама

  1. Изображение с названием Find Mean, Median, and Mode Step 6

    1

    Запишите все числа в ряд. Например, вам даны числа 2, 4, 5, 5, 4 и 5. Запишите их в порядке возрастания.

  2. Изображение с названием Find Mean, Median, and Mode Step 7

    2

    Найдите число, которое чаще всего встречается. В данном случае это 5. Если два числа встречаются одинаково часто, то этот ряд двухвершинный или бимодальный, а если больше — то мультимодальный.

    Реклама

Советы

  • Вам будет легче найти моду и медиану, если вы запишете числа в порядке возрастания.

Реклама

Об этой статье

Эту страницу просматривали 353 377 раз.

Была ли эта статья полезной?

Добавить комментарий