Как найти моду геометрия


Загрузить PDF


Загрузить PDF

Среднее значение, медиана и мода — значения, которые часто используются в статистике и математике. Эти значения найти довольно легко, но их легко и перепутать. Мы расскажем, что они из себя представляют и как их найти.

  1. Изображение с названием Find Mean, Median, and Mode Step 1

    1

    Сложите все числа, которые вам даны. Допустим, вам даны числа 2, 3 и 4. Сложим их: 2 + 3 + 4 = 9.

  2. Изображение с названием Find Mean, Median, and Mode Step 2

    2

    Сосчитайте количество чисел. У нас есть три цифры.

  3. Изображение с названием Find Mean, Median, and Mode Step 3

    3

    Разделите сумму чисел на их количество. Берем 9, делим на 3. 9/3 = 3. Среднее значение в данном случае равно 3. Помните, что не всегда получается целое число.

    Реклама

  1. Изображение с названием Find Mean, Median, and Mode Step 4

    1

    Запишите все числа, которые вам даны, в порядке возрастания. Например, нам даны числа: 4, 2, 8, 1, 15. Запишите их от меньшего к большему, вот так: 1, 2, 4, 8, 15.

  2. Изображение с названием Find Mean, Median, and Mode Step 5

    2

    Найдите два средних числа. Мы расскажем, как это сделать, если у вас имеется четное количество чисел, и как это сделать, если количество чисел нечетное:

    • Если у вас нечетное количество чисел, вычеркните левое крайнее число, затем правое крайнее число и так далее. Один оставшийся номер и будет искомой медианой. Если вам дан ряд чисел 4, 7, 8, 11, 21, тогда 8 — медиана, так как 8 стоит посередине.
    • Если у вас четное количество чисел, вычеркните по одному числу с каждой стороны, пока у вас не останется два числа посередине. Сложите их и разделите на два. Это и есть значение медианы. Если вам дан ряд чисел 1, 2, 5, 3, 7, 10, то два средних числа — это 5 и 3. Сложим 5 и 3, получим 8, разделим на два, получим 4. Это и есть медиана.

    Реклама

  1. Изображение с названием Find Mean, Median, and Mode Step 6

    1

    Запишите все числа в ряд. Например, вам даны числа 2, 4, 5, 5, 4 и 5. Запишите их в порядке возрастания.

  2. Изображение с названием Find Mean, Median, and Mode Step 7

    2

    Найдите число, которое чаще всего встречается. В данном случае это 5. Если два числа встречаются одинаково часто, то этот ряд двухвершинный или бимодальный, а если больше — то мультимодальный.

    Реклама

Советы

  • Вам будет легче найти моду и медиану, если вы запишете числа в порядке возрастания.

Реклама

Об этой статье

Эту страницу просматривали 352 737 раз.

Была ли эта статья полезной?

Среднее арифметическое, размах, мода и медиана

  1. Алгебра
  2. Среднее арифметическое, размах, мода и медиана
Статистические характеристики

количество чисел

Калькулятор вычислит среднее арифметическое чисел, а также размах ряда чисел, моду ряда
чисел, медиану ряда. Для вычисления укажите количество чисел, добавьте числа и нажмите
рассчитать.

Среднее арифметическое, размах, мода и медиана

Средним арифметическим ряда чисел называется частное от деления суммы этих
чисел на число слагаемых.

Для ряда a1,a1,..,an среднее арифметическое вычисляется по
формуле:

begin{align}
& overline{a}=frac{a_1+a_2+…+a_n}{n}\
end{align}

Найдем среднее арифметическое для чисел 5,24, 6,97, 8,56, 7,32 и 6,23.

begin{align}
& overline{a}=frac{5,24+6,97+8,56+7,32+6,23}{5}=6.864\
end{align}


Размахом ряда чисел называется разность между наибольшим и наименьшим из
этих чисел.

Размах ряда 5,24, 6,97, 8,56, 7,32, 6,23 равен 8,56-5,24=3.32


Модой ряда чисел называется число, которое встречается в данном ряду чаще
других.

Ряд чисел может иметь более одной моды, а может не иметь моды совсем.

Модой ряда 32, 26, 18, 26, 15, 21, 26 является число 26, встречается 3 раза.

В ряду чисел 5,24, 6,97, 8,56, 7,32 и 6,23 моды нет.

Ряд 1, 1, 2, 2, 3 содержит 2 моды: 1 и 2.


Медианой упорядоченного ряда чисел с нечётным числом членов называется
число, записанное посередине, а медианой упорядоченного ряда чисел с чётным
числом членов называется среднее арифметическое двух чисел, записанных посередине.

Медианой произвольного ряда чисел называется медиана соответствующего упорядоченного
ряда.

Медиана ряда 4, 1, 2, 3, 3, 1 равна 2.5.

Примеры

Рассмотрим примеры нахождения среднего арифметического чисел, а также размаха, медианы и моды
ряда.

  1. Среднее арифметическое чисел 30, 5, 23, 5, 28, 30

    begin{align}
    & overline{a}=frac{30+5+23+5+28+30}{6}=20frac{1}{6}\
    end{align}

    Размах ряда: 30-5=25

    Моды ряда: 5 и 30

    Медиана ряда: 25.5

  2. Среднее арифметическое чисел 40, 35, 30, 25, 30, 35

    begin{align}
    & overline{a}=frac{40+35+30+25+30+35}{6}=32frac{1}{2}\
    end{align}

    Размах ряда: 40-25=15

    Моды ряда: 30, 35

    Медиана ряда: 32.5

  3. Среднее арифметическое чисел 21, 18,5, 25,3, 18,5, 17,9

    begin{align}
    & overline{a}=frac{21+18,5+25,3+18,5+17,9}{5}=20,24\
    end{align}

    Размах ряда: 25,3-17,9=7,4

    Мода ряда: 18,5

    Медиана ряда: 18,5

Примеры

Примеры нахождения среднего арифметического отрицательных и вещественных чисел.

  1. Среднее арифметическое чисел 67,1, 68,2, 67,1, 70,4, 68,2

    begin{align}
    & overline{a}=frac{67,1+68,2+67,1+70,4+68,2}{5}=68,2\
    end{align}

    Размах ряда: 70,4-67,1=3,3

    Моды ряда: 67.1, 68.2

    Медиана ряда: 68.2

  2. Среднее арифметическое чисел 0,6, 0,8, 0,5, 0,9, 1,1

    begin{align}
    & overline{a}=frac{0,6+0,8+0,5+0,9+1,1}{5}=0.78\
    end{align}

    Размах ряда: 1,1-0,5=0.6

    Ряд не имеет моды

    Медиана ряда: 0.8

  3. Среднее арифметическое чисел -21, -33, -35, -19, -20, -22

    begin{align}
    & overline{a}=frac{(-21)+(-33)+(-35)+(-19)+(-20)+(-22)}{6}=-25\
    end{align}

    Размах ряда: (-19)-(-35)=16

    Ряд не имеет моды

    Медиана ряда: -21,5

  4. Среднее арифметическое чисел -4, -6, 0, -4, 0, 6, 8, -12

    begin{align}
    & overline{a}=frac{(-4)+(-6)+0+(-4)+0+6+8+(-12)}{8}=-1,5\
    end{align}

    Размах ряда: 8-(-12)=20

    Моды ряда: -4, 0

    Медиана ряда: -2

  5. Среднее арифметическое чисел 275, 286, 250, 290, 296, 315, 325

    begin{align}
    & overline{a}=frac{275+286+250+290+296+315+325}{7}=291\
    end{align}

    Размах ряда: 325-250=75

    Ряд не имеет моды

    Медиана ряда: 290

  6. Среднее арифметическое чисел 38, 42, 36, 45, 48, 45, 45, 42, 40, 47, 39

    begin{align}
    & overline{a}=frac{38+42+36+45+48+45+45+42+40+47+39}{11}=42frac{6}{11}\
    end{align}

    Размах ряда: 48-36=12

    Мода ряда: 45

    Медиана ряда: 42

  7. Среднее арифметическое чисел 3,8, 7,2, 6,4, 6,8, 7,2

    begin{align}
    & overline{a}=frac{3,8+7,2+6,4+6,8+7,2}{5}=6,28\
    end{align}

    Размах ряда: 7,2-3,8=3,4

    Мода ряда: 7,2

    Медиана ряда: 6,8

  8. Среднее арифметическое чисел 21,6, 37,3, 16,4, 12,6

    begin{align}
    & overline{a}=frac{21,6+37,3+16,4+12,6}{4}=21,025\
    end{align}

    Размах ряда: 37,3-12,6=24,7

    Мода ряда: 12,6

    Медиана ряда: 17,1

Расчет моды

Теперь посмотрим, как рассчитать моду. Мода – это то значение в анализируемой совокупности данных, которое встречается чаще других, поэтому нужно посмотреть на частоты значений и отыскать максимальное из них. Например, в наборе данных 3, 4, 6, 7, 3, 5, 3, 4 модой будет значение 3 – повторяется чаще остальных. Это в дискретном ряду, и здесь все просто. Если данных много, то моду легче всего найти с помощью соответствующей гистограммы. Бывает так, что совокупность данных имеет бимодальное распределение.  

Без диаграммы очень трудно понять, что в данных не

Без диаграммы очень трудно понять, что в данных не один, а два центра. К примеру, на президентских выборах предпочтения сельских и городских жителей могут отличаться. Поэтому распределение доли отданных голосов за конкретного кандидата может быть «двугорбым». Первый «горб» – выбор городского населения, второй – сельского.

Немного сложнее с интервальными данными, когда вместо конкретных значений имеются интервалы. В этом случае говорят о модальном интервале (при анализе доходов населения, например), то есть интервале, частота которого максимальна относительно других интервалов. Однако и здесь можно отыскать конкретное модальное значение, хотя оно будет условным и примерным, так как нет точных исходных данных. Представим, что есть следующая таблица с распределением цен.

Для наглядности изобразим соответствующую диаграмм

Для наглядности изобразим соответствующую диаграмму.

Требуется найти модальное значение цены.

Требуется найти модальное значение цены.

Вначале нужно определить модальный интервал, который соответствует интервалу с наибольшей частотой. Найти его так же легко, как и моду в дискретном ряду. В нашем примере это третий интервал с ценой от 301 до 400 руб. На графике – самый высокий столбец. Теперь нужно определить конкретное значение цены, которое соответствует максимальному количеству. Точно и по факту сделать это невозможно, так как нет индивидуальных значений частот для каждой цены. Поэтому делается допущение о том, что интервалы выше и ниже модального в зависимости от своей частоты имеют разные вес и как бы перетягивают моду в свою сторону. Если частота интервала следующего за модальным больше, чем частота интервала перед модальным, то мода будет правее середины модального интервала и наоборот. Давайте еще раз посмотрим на рисунок, чтобы понять формулу, которую я напишу чуть ниже.

На рисунке отчетливо видно, что соотношение высоты

На рисунке отчетливо видно, что соотношение высоты столбцов, расположенных слева и справа от модального определяет близость моды к левому или правому краю модального интервала. Задача по расчету модального значения состоит в том, чтобы найти точку пересечения линий, соединяющих модальный столбец с соседними (как показано на рисунке пунктирными линиями) и нахождении соответствующего значения признака (в нашем примере цены). Зная основы геометрии (7-й класс), по данному рисунку нетрудно вывести формулу расчета моды в интервальном ряду.

Формула моды имеет следующий вид.

Где Мо – мода,

Где Мо – мода,

x – значение начала модального интервала,

h – размер модального интервала,

fМо – частота модального интервала,

fМо-1 – частота интервала, находящего перед модальным,

fМо1 – частота интервала, находящего после модального.

Второе слагаемое формулы моды соответствует длине красной линии на рисунке выше.

Рассчитаем моду для нашего примера.

Таким образом, мода интервального ряда представляе

Таким образом, мода интервального ряда представляет собой сумму, состоящую из значения начального уровня модального интервала и отрезка, который определяется соотношением частот ближайших интервалов от модального.

Видео

Мода и медиана

Модой называют элемент, который встречается в выборке чаще других.

Рассмотрим следующую выборку: шестеро спортсменов, а также время в секундах за которое они пробегают 100 метров

Элемент 14 встречается в выборке чаще других, поэт

Элемент 14 встречается в выборке чаще других, поэтому элемент 14 назовем модой.

Рассмотрим еще одну выборку. Тех же спортсменов, а также смартфоны, которые им принадлежат

Элемент iphone встречается в выборке чаще других,

Элемент iphone встречается в выборке чаще других, значит элемент iphone является модой. Говоря простым языком, носить iphone модно.

Конечно элементы выборки в этот раз выражены не числами, а другими объектами (смартфонами), но для общего представления о моде этот пример вполне приемлем.

Рассмотрим следующую выборку: семеро спортсменов, а также их рост в сантиметрах:

Упорядочим данные в таблице так, чтобы рост спортс

Упорядочим данные в таблице так, чтобы рост спортсменов шел по возрастанию. Другими словами, построим спортсменов по росту:

Выпишем рост спортсменов отдельно:

Выпишем рост спортсменов отдельно:

180, 182, 183, 184, 185, 188, 190

В получившейся выборке 7 элементов. Посередине этой выборки располагается элемент 184. Слева и справа от него по три элемента. Такой элемент как 184 называют медианой упорядоченной выборки.

Медианой упорядоченной выборки называют элемент, располагающийся посередине.

Отметим, что данное определение справедливо в случае, если количество элементов упорядоченной выборки является нечётным.

В рассмотренном выше примере, количество элементов упорядоченной выборки было нечётным. Это позволило нам быстро указать медиану

Но возможны случаи, когда количество элементов выб

Но возможны случаи, когда количество элементов выборки чётно.

К примеру, рассмотрим выборку в которой не семеро спортсменов, а шестеро:

Построим этих шестерых спортсменов по росту:

Построим этих шестерых спортсменов по росту:

Выпишем рост спортсменов отдельно:

Выпишем рост спортсменов отдельно:

180, 182, 184, 186, 188, 190

В данной выборке не получается указать элемент, который находился бы посередине. Если указать элемент 184 как медиану, то слева от этого элемента будут располагаться два элемента, а справа — три. Если как медиану указать элемент 186, то слева от этого элемента будут располагаться три элемента, а справа — два.

В таких случаях для определения медианы выборки, нужно взять два элемента выборки, находящихся посередине и найти их среднее арифметическое. Полученный результат будет являться медианой.

Вернемся к нашим спортсменам. В упорядоченной выборке 180, 182, 184, 186, 188, 190 посередине располагаются элементы 184 и 186

Найдем среднее арифметическое элементов 184 и 186

Найдем среднее арифметическое элементов 184 и 186

Элемент 185 является медианой выборки, несмотря на

Элемент 185 является медианой выборки, несмотря на то, что этот элемент не является членом исходной и упорядоченной выборки. Спортсмена с ростом 185 нет среди остальных спортсменов. Рост в 185 см используется в данном случае для статистики, чтобы можно было сказать о том, что срединный рост спортсменов составляет 185 см.

Поэтому более точное определение медианы зависит от количества элементов в выборке.

Если количество элементов упорядоченной выборки нечётно, то медианой выборки называют элемент, располагающийся посередине.

Если количество элементов упорядоченной выборки чётно, то медианой выборки называют среднее арифметическое двух чисел, располагающихся посередине этой выборки.

Медиана и среднее арифметическое по сути являются «близкими родственниками», поскольку и то и другое используют для определения среднего значения. Например, для предыдущей упорядоченной выборки 180, 182, 184, 186, 188, 190 мы определили медиану, равную 185. Этот же результат можно получить путем определения среднего арифметического элементов 180, 182, 184, 186, 188, 190

Но медиана в некоторых случаях отражает более реал

Но медиана в некоторых случаях отражает более реальную ситуацию. Например, рассмотрим следующий пример:

Было подсчитано количество имеющихся очков у каждого спортсмена. В результате получилась следующая выборка:

0, 1, 1, 1, 2, 1, 2, 3, 5, 4, 5, 0, 1, 6, 1

Определим среднее арифметическое для данной выборки — получим значение 2,2

По данному значению можно сказать, что в среднем у

По данному значению можно сказать, что в среднем у спортсменов 2,2 очка

Теперь определим медиану для этой же выборки. Упорядочим элементы выборки и укажем элемент, находящийся посередине:

0, 0, 1, 1, 1, 1, 1, 1, 2, 2, 3, 4, 5, 5, 6

В данном примере медиана лучше отражает реальную ситуацию, поскольку половина спортсменов имеет не более одного очка.

Среднее арифметическое

Понятие среднего значения часто используется в повседневной жизни.

Примеры:

  • средняя зарплата жителей страны;
  • средний балл учащихся;
  • средняя скорость движения;
  • средняя производительность труда.

Речь идет о среднем арифметическом — результате деления суммы элементов выборки на их количество.

Среднее арифметическое — это результат деления суммы элементов выборки на их количество.

Вернемся к нашему примеру

Вернемся к нашему примеру

Узнаем сколько в среднем мы тратили в каждом из ше

Узнаем сколько в среднем мы тратили в каждом из шести дней:

Теория для решения данных задач. Формулы для расче

Теория для решения данных задач. Формулы для расчета моды и медианы

Модой в статистике называется величины признака (варианта), которая чаще всего встречается в данной совокупности.

Медианой в статистике называется варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам. Обозначают медиану символом.

Распределительные средние – мода и медиана, их сущность и способы исчисления.

Данные показатели относятся к группе распределительных средних и используются для формирования обобщающей характеристики величины варьирующего признака.

Мода это наиболее часто встречающееся значение варьирующего признака в вариационном ряду. Модой распределения называется такая величина изучаемого признака, которая в данной совокупности встречается наиболее часто, т.е. один из вариантов признака повторяется чаще, чем все другие. Для дискретного ряда (ряд, в котором значение варьирующего признака представлены отдельными числовыми показателями) модой является значение варьирующего признака обладающего наибольшей частотой. Для интервального ряда сначала определяется модальный интервал (т.е. содержащий моду), в случае интервального распределения с равными интервалами определяется по наибольшей частоте; с неравными интервалами – по наибольшей плотности, а определение моды требует проведения расчетов на основе следующих формул:

где: нижняя граница модального интервала;

 величина модального интервала; величина модального интервала;

 частота модального интервала; частота модального интервала;

 частота интервала, предшествующего модальному; частота интервала, предшествующего модальному;

 частота интервала, следующего за модальным; частота интервала, следующего за модальным;

Медиана (Ме) — это значение варьирующего признака, приходящееся на середину ряда, расположенного в порядке возрастания или убывания числовых значений признака, т.е. величина изучаемого признака, которая находится в середине упорядоченного вариационного ряда. Главное свойство медианы в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины:

Для определения медианы в дискретном ряду при наличии частот, сначала исчисляется полусумма частот, а затем определяется какое значение варьирующего признака ей соответствует. При исчислении медианы интервального ряда сначала определяются медианы интервалов, а затем определяется какое значение варьирующего признака соответствует данной частоте. Для определения величины медианы используется формула:

где: нижняя граница медианного интервала;

- величина медианного интервала;

накопленная частота интервала, предшествующего медианному;

частота медианного интервала;

Медианный интервал не обязательно совпадает с модальным.

Моду и медиану в интервальном ряду распределения можно определить графически. Мода определяется по гистограмме распределения. Для этого выбирается самый высокий прямоугольник, который в данном случае является модальным. Затем правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось абсцисс.

Теги

В статистике есть целый набор показателей, которые характеризуют центральную тенденцию. Выбор того или иного индикатора в основном зависит от характера данных, целей расчетов и его свойств.

Что подразумевается под характером данных? Прежде всего, мы говорим о количественных данных, которые выражены в числах. Но набор числовых данных может иметь разное распределение. Под распределением понимаются частоты отдельных значений. К примеру, в классе из 23 человек 2 школьника написали контрольную работу на двойку, 5 – на тройку, 10 – на четверку и 6 – на пятерку. Это и есть распределение оценок. Распределение очень наглядно можно представить с помощью специальной диаграммы – гистограммы. Для данного примера получится следующая гистограмма.

Распределение оценок

Во многих случаях количество уникальных значений намного больше, а распределение похоже на нормальное. Ниже приведена примерная иллюстрация нормального распределения случайных чисел.

Нормальное распределение чисел

Итак, центральная тенденция. Если частоты анализируемых значений распределены по нормальному закону, то есть симметрично вокруг некоторого центра, то центральная тенденция определяется вполне однозначно – это есть тот самый центр, и математически он соответствует средней арифметической.

Как нетрудно заметить, в этом же центре находится и максимальная частота значений. То есть при нормальном распределении центральная тенденция есть не только средняя арифметическая, но и максимальная частота, которая в статистике называется модой или модальным значением.

Мода и среднее арифметическое при нормальном распределении

На диаграмме оба значения центральной тенденции совпадают и равны 10.

Но такое распределение встречается далеко не всегда, а при малом числе данных – совсем редко. Чаще бывает так, что частоты распределяются асимметрично. Тогда мода и среднее арифметическое не будут совпадать.

Мода и среднее арифметическое не совпадают

На рисунке выше среднее арифметическое по-прежнему составляет 10, а вот мода уже равна 9. Что в таком случае считать значением центральной тенденции? Ответ зависит от поставленных целей анализа. Если интересует уровень, сумма отклонений от которого равна нулю со всеми вытекающим отсюда свойствами и последствиями, то это средняя арифметическая. Если нужно максимально частое значение, то это мода.

Итак, зачем нужна мода? Приведу пару примеров. Экономист планово-экономического отдела обувной фабрики интересуется, какой размер обуви пользуется наибольшим спросом. Средний размер обуви, скорее всего, здесь не подойдет, тем более, что число может получится дробным. А вот мода – как раз нужный показатель.

Расчет моды

Теперь посмотрим, как рассчитать моду. Мода – это то значение в анализируемой совокупности данных, которое встречается чаще других, поэтому нужно посмотреть на частоты значений и отыскать максимальное из них. Например, в наборе данных 3, 4, 6, 7, 3, 5, 3, 4 модой будет значение 3 – повторяется чаще остальных. Это в дискретном ряду, и здесь все просто. Если данных много, то моду легче всего найти с помощью соответствующей гистограммы. Бывает так, что совокупность данных имеет бимодальное распределение.  

Двумодальное распределение

Без диаграммы очень трудно понять, что в данных не один, а два центра. К примеру, на президентских выборах предпочтения сельских и городских жителей могут отличаться. Поэтому распределение доли отданных голосов за конкретного кандидата может быть «двугорбым». Первый «горб» – выбор городского населения, второй – сельского.

Немного сложнее с интервальными данными, когда вместо конкретных значений имеются интервалы. В этом случае говорят о модальном интервале (при анализе доходов населения, например), то есть интервале, частота которого максимальна относительно других интервалов. Однако и здесь можно отыскать конкретное модальное значение, хотя оно будет условным и примерным, так как нет точных исходных данных. Представим, что есть следующая таблица с распределением цен.

Интервальные данные для расчета моды

Для наглядности изобразим соответствующую диаграмму.

Рисунок распределения интервальных данных

Требуется найти модальное значение цены.

Вначале нужно определить модальный интервал, который соответствует интервалу с наибольшей частотой. Найти его так же легко, как и моду в дискретном ряду. В нашем примере это третий интервал с ценой от 301 до 400 руб. На графике – самый высокий столбец. Теперь нужно определить конкретное значение цены, которое соответствует максимальному количеству. Точно и по факту сделать это невозможно, так как нет индивидуальных значений частот для каждой цены. Поэтому делается допущение о том, что интервалы выше и ниже модального в зависимости от своей частоты имеют разные вес и как бы перетягивают моду в свою сторону. Если частота интервала следующего за модальным больше, чем частота интервала перед модальным, то мода будет правее середины модального интервала и наоборот. Давайте еще раз посмотрим на рисунок, чтобы понять формулу, которую я напишу чуть ниже.

Мода на рисунке

На рисунке отчетливо видно, что соотношение высоты столбцов, расположенных слева и справа от модального определяет близость моды к левому или правому краю модального интервала. Задача по расчету модального значения состоит в том, чтобы найти точку пересечения линий, соединяющих модальный столбец с соседними (как показано на рисунке пунктирными линиями) и нахождении соответствующего значения признака (в нашем примере цены). Зная основы геометрии (7-й класс), по данному рисунку нетрудно вывести формулу расчета моды в интервальном ряду.

Формула моды имеет следующий вид.

Формула моды

Где Мо – мода,

x0 – значение начала модального интервала,

h – размер модального интервала,

fМо – частота модального интервала,

fМо-1 – частота интервала, находящего перед модальным,

fМо1 – частота интервала, находящего после модального.

Второе слагаемое формулы моды соответствует длине красной линии на рисунке выше.

Рассчитаем моду для нашего примера.

Расчет моды

Таким образом, мода интервального ряда представляет собой сумму, состоящую из значения начального уровня модального интервала и отрезка, который определяется соотношением частот ближайших интервалов от модального.

Расчет моды в Excel

В настоящее время большинство вычислений делается в MS Excel, где для расчета моды также предусмотрена специальная функция. В Excel 2013 я таких нашел ажно 3 штуки.

Мода в Excel

МОДА – пережиток старых изданий Excel. Функция оставлена для совмещения со старыми версиями.

МОДА.ОДН – рассчитывает моду по заданным значениям. Здесь все просто. Вставили функцию, указали диапазон данных и «Ок».

МОДА.НСК – позволяет рассчитать сразу несколько модальных значений (одинаковых максимальных частот) для одного ряда данных, если они есть. Функцию нужно вводить как формулу массива, перед этим выделив количество ячеек равное количеству требуемых модальных значений. Иногда действительно модальных значений может быть несколько. Однако для этих целей предварительно лучше посмотреть на диаграмму распределения. 

Моду для интервальных данных одной функцией в Excel рассчитать нельзя. То есть такая функция в готовом виде не предусмотрена. Придется прописывать вручную. 

Следующая статья посвящена медиане.

До встречи на statanaliz.info.

Поделиться в социальных сетях:

Среднее арифметическое, мода и медиана

  1. Предмет, цели и методы математической статистики
  2. Метод выборочных исследований
  3. Средняя арифметическая, простая и взвешенная
  4. Мода и медиана
  5. Примеры

Предмет, цели и методы математической статистики

Начиная с XVIII века, в общем направлении статистических исследований начинает активно формироваться математическая статистика.

Математическая статистика – раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений.

В зависимости от предмета исследований математическая статистика делится на:

  • статистику чисел;
  • многомерный статистический анализ;
  • анализ функций (процессов) и временных рядов;
  • статистику объектов с нечисловыми характеристиками.

В зависимости от цели и методов исследований математическая статистика делится на: описательную статистику; теорию оценивания; теорию проверки гипотез.

Описательная статистика Теория оценивания Теория проверки гипотез
Цель Обработка и систематизация эмпирических данных Оценивание ненаблюдаемых данных и сигналов от объектов наблюдения на основе наблюдаемых данных Обоснование предположений о виде распределения и свойствах случайной величины
Методы

1. Наглядное представление в форме графиков и таблиц.

2. Количественное описание с помощью статистических показателей.

1. Параметрические методы (наименьших квадратов, максимального правдоподобия и др.).

2. Непараметрические методы.

1. Последовательный анализ.

2. Статистические критерии.

Метод выборочных исследований

Статистика получила признание в различных областях человеческой деятельности благодаря заметной экономии времени и прочих ресурсов. Её основная идея: не нужно измерять всё, измерьте только часть всего и сделайте предположение об остальном.

«Всё» в статистике называется генеральной совокупностью.

«Часть всего», которую мы тщательно исследуем, называется выборкой.

Метод выборочных исследований – способ определения свойств группы объектов (генеральной совокупности) на основании статистического исследования её части (выборки).

Например, чтобы оценить средние размеры апельсина, который продаётся в магазине в декабре, необязательно денно и нощно мерить все апельсины во всех ящиках (сколько же для этого нужно времени и людей?!). Достаточно сделать выборку – мерить по одному апельсину из каждого ящика в течение месяца (тут уже и один человек справится).

Статистика предоставляет методику и оценки для того, чтобы правильно провести выборку и на основании знаний о среднем размере апельсина в выборке (выборочной средней) судить о средних размерах всех декабрьских апельсин (генеральной средней).

Средняя арифметическая, простая и взвешенная

Статистическое исследование опирается на собранные данные о каком-то признаке (рост, вес, возраст, доход и т.п.).

Варианта – полученное эмпирическое значение признака.

Вариационный ряд – совокупность собранных вариант.

Пусть мы сделали выборку, провели N измерений и получили x_1,x_2,…,x_N вариант.

Вариационный ряд, состоящий из отдельных вариант, называют дискретным.

Чтобы найти выборочную среднюю дискретного вариационного ряда, нужно вычислить среднюю арифметическую простую:

$$ x_{cp} = frac{1}{N} sum_{i=1}^N x_i ,i = overline{1,N} $$

Знак Σ означает «сумма», i – это индекс полученных вариант, который пробегает все значения, от 1 до N.

Например:

На протяжении четверти школьник получил такие оценки по алгебре: 5,4,3,5,4,4,5,4,3,5,5,4,3,5,4,4. Найдите среднюю оценку за четверть.

Считаем среднюю арифметическую простую:

$$ x_cp = frac{5+4+3+⋯+4}{16} ≈ 4,2 $$

Нетрудно заметить, что оценки повторяются, и вычисления можно упростить, если вместо сложения одинаковых оценок использовать умножение оценок на их количество.

Чтобы найти выборочную среднюю при повторяющихся вариантах, удобно вычислять среднюю арифметическую взвешенную:

$$ x_{cp} = frac{1}{N} sum_{i=1}^K x_i n_i , N = sum_{i=1}^K n_i , i = overline{1,K} $$

где K – количество групп с повторяющимися вариантами, $x_i$ – значение варианты в -й группе, $n_i$ – частота варианты $x_i$.

Например:

Рассматриваем тот же ряд оценок: 5,4,3,5,4,4,5,4,3,5,5,4,3,5,4,4 и составляем таблицу:

$$ x_cp = frac{3cdot3+4cdot7+5cdot6}{3+7+6} ≈ 4,2 $$

Вычисления заметно упростились.

Мода и медиана

Мода дискретного вариационного ряда – это варианта с максимальной частотой. Мод может быть несколько. Тогда говорят, что ряд мультимодальный.

В примере с оценками по алгебре мода $M_0 = 4$ – эта оценка встречается чаще всего, её частота равна 7.

Медиана дискретного вариационного ряда – это значение варианты посредине упорядоченного ряда.

Алгоритм:

  1. Отсортировать ряд по возрастанию.

  2. Если общее количество измерений N нечётное, найти m = $lceil frac{N}{2}rceil$ и округлить в сторону увеличения. $M_e = x_m$ – искомая медиана.

  3. Если общее количество измерений N чётное, найти $m = frac{N}{2}$ и вычислить медиану как среднее $M_e = frac{x_m+x_{m+1}}{2}$.

В примере с оценками по алгебре N = 16 – четное. $m = frac{N}{2} = 8 $.

Сортируем ряд оценок по возрастанию: 3,3,3,4,4,4,4, 4,4, 4,5,5,5,5,5,5

$$ x_8 = 4, x_9 = 4 Rightarrow M_e = frac{4+4}{2} = 4 $$

Внимание!

Мода и медиана учитывают индивидуальные варианты и поэтому важны для характеристики вариационного ряда.

Особенное значение мода и медиана приобретают в рядах с выбросами – одиночными очень большими или очень малыми вариантами. В этом случае они оберегают от выводов на основании «средней температуры по больнице».

Примеры

Пример 1. В исследовании месячных доходов десяти человек были получены следующие данные: 200,100,300,300,1000,5000,100,200, 300,400 (дол.).

Найдите выборочную среднюю, моду и медиану.

Почему при оценке доходов мода и медиана предпочтительней выборочной средней?

Составим таблицу:

$x_i$, дол.

100

200

300

400

1000

5000

$sum$

$n_i$, чел.

2

2

3

1

1

1

10

$x_i n_i$

200

400

900

400

1000

5000

7900

Выборочная средняя:$ x_{cp} = frac{7900}{10} = 790$ (дол.)

Мода: $M_o$ = 300 (дол.) – максимальная частота 3

Медиана:

100, 100, 200, 200, 300, 300, 300, 400, 1000, 5000

$$ m = frac{10}{2} = 5, x_5 = x_6 = 300, M_e = frac{300+300}{2} = 300 (дол.) $$

Выборочная средняя не отражает доходов большей части людей в выборке, поскольку даже один человек с большими доходами может резко сместить оценку вправо. Мода и медиана хорошо отражают доходы большей части людей в выборке.

Пример 2. Исследовалось время решения задачи. В исследовании принимало участие 20 человек, из них двое задачу не решили. Время решения остальных участников:

$x_i$, мин

10

15

20

25

30

Найдите выборочную среднюю, моду и медиану.

При подборе задач для контрольной работы, сколько времени следует отвести на решение подобной задачи?

Проведём вычисления:

$x_i$

10

15

20

25

30

$sum$

$x_i n_i$

20

75

100

100

60

355

$$x_cp = frac{355}{18} ≈ 19,7 мин $$

В выборке 2 моды: $M_{o1}$ = 15 мин, $M_{o2}$ = 20 мин

Положение медианы: $m = frac{N}{2} = frac{18}{2} = 9, x_9 = x_10 = 20, Me = 20$ мин

Средняя, одна из мод и медиана равны 20 мин. Поэтому при составлении контрольной следует отвести на подобную задачу 20 мин.

Пример 3. работа по геометрии показала следующие результаты:

Найдите выборочную среднюю, моду и медиану.

Что вы можете сказать об уровне понимания материала?

Проведём вычисления:

$x_i n_i$

10

66

40

10

126

$$x_cp = frac{126}{39} ≈ 3,2$$

Мода: $M_o$ = 3 – эта оценка получена 22 раза

Положение медианы: $m = ⌈ frac{N}{2}⌉ = ⌈frac{39}{2}⌉ = 20, x_{20} = 3, Me = 3$

Средняя, мода и медиана равны 3.

Уровень понимания удовлетворительный, «на троечку».

Добавить комментарий