Например, средняя арифметическая для интервального ряда
При расчете средней арифметической для
интервального вариационного ряда
сначала определяют среднюю для каждого
интервала, как полусумму верхней и
нижней границ, а затем — среднюю всего
ряда. В случае открытых интервалов
значение нижнего или верхнего интервала
определяется по величине интервалов,
примыкающих к ним.
Пример
3. Определить
средний возраст студентов вечернего
отделения.
Возраст |
Число |
Среднее |
Произведение |
до |
65 |
(18 + |
1235 |
20 — |
125 |
(20 + |
2625 |
22 — |
190 |
(22 + |
4560 |
26 — |
80 |
(26 + |
2240 |
30 и |
40 |
(30 + |
1280 |
Итого |
500 |
11940 |
Средние, вычисляемые из интервальных
рядов являются приближенными.
-
Структурные средние величины
Кроме степенных средних в статистике
для относительной характеристики
величины варьирующего признака и
характеристики рядов распределения
пользуются структурными средними: модой
и медианой.
Мода
Мода— это наиболее часто
встречающийся вариант ряда. Мода
применяется, например, при определении
размера одежды, обуви, пользующейся
наибольшим спросом у покупателей.
Модой для дискретного ряда является
варианта, обладающая наибольшей частотой.
При вычислении моды для интервального
вариационного ряда необходимо:
-
сначала определить модальный интервал
(по максимальной частоте), -
затем — значение модальной величины
признака по формуле:
где:
-
—
значение моды -
—
нижняя граница модального интервала -
i —
величина интервала -
—
частота модального интервала -
—
частота интервала, предшествующего
модальному -
—
частота интервала, следующего за
модальным
Определение моды графически:
Мода определяется по гистограмме
распределения. Для этого
правую вершину модального
прямоугольника соединяют с правым
верхним углом предыдущего прямоугольника
, а левую
вершину модального прямоугольника –
с левым верхним углом
последующего прямоугольника. Абсцисса
точки пересечения этих прямых и будет
модой распределения.
Медиана
Медиана — это значение признака,
который делит вариационный ряд на две
равные по численности части.
Медиана для дискретного ряда.
Для определения медианы в дискретном
рядус нечетнымколичеством
единиц наблюдения сначалапорядковый
номер медианыпо формуле: ,
а затем определяют, какое значение
варианта обладает накопленной частотой,
равной номеру медианы.
Если ряд содержит четное
число элементов, то
медиана будет равна средней из двух
значений признака, находящихся в
середине. Номер первого из этих признаков
определяется по формуле: ,
для второго – .
= n
(количество элементов в ряду).
Медиана для интервального ряда
При вычислении медианы для
интервального вариационного ряда сначала
определяют медианный интервал, в пределах
которого находится медиана.
Для этого:
-
определяется номер медианы
по формуле: ,
полученное значение округляется до
целого большего числа. -
затем по
накопленной частоте определяется
интервал, в который входит элемент с
таким номером, -
затем — значение медианы по формуле:
где:
-
—
искомая медиана -
—
нижняя граница интервала, который
содержит медиану -
i
— ширина интервала -
—
сумма частот или число членов ряда -
–
накопленная частота интервала,
предшествующего медианному -
—
частота медианного интервала
Пример.
Найти моду и медиану для интервального
ряда.
Возрастные |
Число |
Сумма |
До 20 |
346 |
346 |
20 — 25 |
872 |
1218 |
25 |
1054 |
2272 |
30 — 35 |
781 |
3053 |
35 — 40 |
212 |
3265 |
40 — 45 |
121 |
3386 |
45 лет |
76 |
3462 |
Итого |
3462 |
Решение:
-
Определим моду
В
данном примере модальный интервал
находится в пределах возрастной группы
25-30 лет, так как на этот интервал приходится
наибольшая частота (1054).
Рассчитаем
величину моды:
Это значит, что модальный
возраст студентов равен 27 годам.
-
Определим медиану.
Медианный интервал
находится в возрастной группе 25-30 лет,
так как в пределах этого интервала
расположена варианта, которая делит
совокупность на две равные части (Σfi/2
= 3462/2 = 1731). Далее подставляем в формулу
необходимые числовые данные и получаем
значение медианы:
Это значит, что одна половина студентов
имеет возраст до 27,4 года, а другая свыше
27,4 года.
Графически медиана
определяется по кумуляте. Для ее
определения высоту наибольшей ординаты,
которая соответствует сумме всех частот,
делят пополам. Через полученную точку
проводят прямую,
параллельную оси абсцисс,
до
пересечения ее с кумулятой. Абсцисса
точки пересечения является медианой.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Среднее арифметическое, размах, мода и медиана
- Алгебра
- Среднее арифметическое, размах, мода и медиана
Статистические характеристики
количество чисел
Калькулятор вычислит среднее арифметическое чисел, а также размах ряда чисел, моду ряда
чисел, медиану ряда. Для вычисления укажите количество чисел, добавьте числа и нажмите
рассчитать.
Среднее арифметическое, размах, мода и медиана
Средним арифметическим ряда чисел называется частное от деления суммы этих
чисел на число слагаемых.
Для ряда a1,a1,..,an среднее арифметическое вычисляется по
формуле:
begin{align}
& overline{a}=frac{a_1+a_2+…+a_n}{n}\
end{align}
Найдем среднее арифметическое для чисел 5,24, 6,97, 8,56, 7,32 и 6,23.
begin{align}
& overline{a}=frac{5,24+6,97+8,56+7,32+6,23}{5}=6.864\
end{align}
Размахом ряда чисел называется разность между наибольшим и наименьшим из
этих чисел.
Размах ряда 5,24, 6,97, 8,56, 7,32, 6,23 равен 8,56-5,24=3.32
Модой ряда чисел называется число, которое встречается в данном ряду чаще
других.
Ряд чисел может иметь более одной моды, а может не иметь моды совсем.
Модой ряда 32, 26, 18, 26, 15, 21, 26 является число 26, встречается 3 раза.
В ряду чисел 5,24, 6,97, 8,56, 7,32 и 6,23 моды нет.
Ряд 1, 1, 2, 2, 3 содержит 2 моды: 1 и 2.
Медианой упорядоченного ряда чисел с нечётным числом членов называется
число, записанное посередине, а медианой упорядоченного ряда чисел с чётным
числом членов называется среднее арифметическое двух чисел, записанных посередине.
Медианой произвольного ряда чисел называется медиана соответствующего упорядоченного
ряда.
Медиана ряда 4, 1, 2, 3, 3, 1 равна 2.5.
Примеры
Рассмотрим примеры нахождения среднего арифметического чисел, а также размаха, медианы и моды
ряда.
-
Среднее арифметическое чисел 30, 5, 23, 5, 28, 30
begin{align}
& overline{a}=frac{30+5+23+5+28+30}{6}=20frac{1}{6}\
end{align}Размах ряда: 30-5=25
Моды ряда: 5 и 30
Медиана ряда: 25.5
-
Среднее арифметическое чисел 40, 35, 30, 25, 30, 35
begin{align}
& overline{a}=frac{40+35+30+25+30+35}{6}=32frac{1}{2}\
end{align}Размах ряда: 40-25=15
Моды ряда: 30, 35
Медиана ряда: 32.5
-
Среднее арифметическое чисел 21, 18,5, 25,3, 18,5, 17,9
begin{align}
& overline{a}=frac{21+18,5+25,3+18,5+17,9}{5}=20,24\
end{align}Размах ряда: 25,3-17,9=7,4
Мода ряда: 18,5
Медиана ряда: 18,5
Примеры
Примеры нахождения среднего арифметического отрицательных и вещественных чисел.
-
Среднее арифметическое чисел 67,1, 68,2, 67,1, 70,4, 68,2
begin{align}
& overline{a}=frac{67,1+68,2+67,1+70,4+68,2}{5}=68,2\
end{align}Размах ряда: 70,4-67,1=3,3
Моды ряда: 67.1, 68.2
Медиана ряда: 68.2
-
Среднее арифметическое чисел 0,6, 0,8, 0,5, 0,9, 1,1
begin{align}
& overline{a}=frac{0,6+0,8+0,5+0,9+1,1}{5}=0.78\
end{align}Размах ряда: 1,1-0,5=0.6
Ряд не имеет моды
Медиана ряда: 0.8
-
Среднее арифметическое чисел -21, -33, -35, -19, -20, -22
begin{align}
& overline{a}=frac{(-21)+(-33)+(-35)+(-19)+(-20)+(-22)}{6}=-25\
end{align}Размах ряда: (-19)-(-35)=16
Ряд не имеет моды
Медиана ряда: -21,5
-
Среднее арифметическое чисел -4, -6, 0, -4, 0, 6, 8, -12
begin{align}
& overline{a}=frac{(-4)+(-6)+0+(-4)+0+6+8+(-12)}{8}=-1,5\
end{align}Размах ряда: 8-(-12)=20
Моды ряда: -4, 0
Медиана ряда: -2
-
Среднее арифметическое чисел 275, 286, 250, 290, 296, 315, 325
begin{align}
& overline{a}=frac{275+286+250+290+296+315+325}{7}=291\
end{align}Размах ряда: 325-250=75
Ряд не имеет моды
Медиана ряда: 290
-
Среднее арифметическое чисел 38, 42, 36, 45, 48, 45, 45, 42, 40, 47, 39
begin{align}
& overline{a}=frac{38+42+36+45+48+45+45+42+40+47+39}{11}=42frac{6}{11}\
end{align}Размах ряда: 48-36=12
Мода ряда: 45
Медиана ряда: 42
-
Среднее арифметическое чисел 3,8, 7,2, 6,4, 6,8, 7,2
begin{align}
& overline{a}=frac{3,8+7,2+6,4+6,8+7,2}{5}=6,28\
end{align}Размах ряда: 7,2-3,8=3,4
Мода ряда: 7,2
Медиана ряда: 6,8
-
Среднее арифметическое чисел 21,6, 37,3, 16,4, 12,6
begin{align}
& overline{a}=frac{21,6+37,3+16,4+12,6}{4}=21,025\
end{align}Размах ряда: 37,3-12,6=24,7
Мода ряда: 12,6
Медиана ряда: 17,1
Среднее арифметическое нескольких величин – это отношение суммы величин к их количеству.
Правило. Чтобы вычислить среднее арифметическое нескольких чисел, нужно взять сумму этих чисел и разделить все на количество слагаемых. Частное и будет средним арифметическим этих чисел.
Например: найдем среднее арифметическое чисел 2; 6; 9; 15.
У нас четыре числа, значит надо их сумму разделить на четыре. Это и будет среднее арифметическое данных чисел: (2 + 6 + 9 + 15) : 4 = 8.
Размах ряда чисел – это разность между наибольшим и наименьшим из этих чисел.
Например: найдем размах чисел 2; 5; 8; 12; 33.
Наибольшее число здесь – 33, наименьшее – 2. Значит, размах составляет 31, т. е.: 33 – 2 = 31.
Мода ряда чисел – это число, которое встречается в данном ряду чаще других.
Например: найдем моду ряда чисел 1; 7; 3; 8; 7; 12; 22; 7; 11; 22; 8.
Чаще всего в этом ряде чисел встречается число 7 (3 раза). Оно и является модой данного ряда чисел.
Медианой упорядоченного ряда чисел с нечетным числом членов называется число, записанное посередине, а медианой упорядоченного ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине.
Медианой произвольного ряда чисел называется медиана соответствующего упорядоченного ряда.
Например: в ряде чисел 2; 5; 9; 15; 21 медианой является число 9, находящееся посередине.
Найдем медиану в ряде чисел 4; 5; 7; 11; 13; 19.
Здесь четное количество чисел (6). Поэтому ищем не одно, а два числа, записанных посередине. Это числа 7 и 11. Находим среднее арифметическое этих чисел: (7 + 11) : 2 = 9. Число 9 является медианой данного ряда чисел.
-
В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3; 5; 5; 4; 4; 4; 3; 2; 4; 5.
Какую оценку получали чаще всего? Каков средний балл сдавшей зачет группы?
-
Дан ряд чисел: 175; 172; 179; 171; 174; 170; 172; 169.
Найдите медиану и размах ряда.
-
Дан ряд чисел: 175; 172; 179; 171; 174; 170; 172; 169.
Найдите моду ряда и среднее арифметическое ряда.
-
Имеются следующие данные о месячной заработной плате пяти рабочих (тг): 126000; 138000; 132000; 141000; 150000.
Найдите среднюю заработную плату.
-
Магазин продает 8 видов булочек по следующим ценам: 31; 22; 24; 27; 30; 36; 19; 27.
Найдите разность среднего арифметического и медианы этого набора.
-
Найдите объем и медиану числового ряда.
9; 7; 1; 1; 11; 5; 1.
-
Товарные запасы хлопчатобумажных тканей в магазине за первое полугодие составили (тыс. тг) на начало каждого месяца:
I II III IV V VI VII 37 34 35 32 36 33 38 Определите средний товарный запас хлопчатобумажных тканей за первое полугодие.
-
Провели несколько измерений случайной величины: 2,5; 2,2; 2; 2,4; 2,9; 1,8.
Найдите среднее арифметическое этого набора чисел.
-
Провели несколько измерений случайной величины: 6; 18; 17; 14; 4; 22.
Найдите медиану этого набора чисел.
-
Провели несколько измерений случайной величины:
800; 3200; 2000; 2600; 2900; 2000. Найдите моду этого набора чисел.
-
Магазин продает 8 видов хлеба по следующим ценам: 60, 75, 80, 85, 90, 100, 110, 120 тенге.
Найдите разность среднего арифметического и медианы этого набора.
-
Дан числовой ряд: 1; 7; 3; 8; 7; 12; 22; 7; 11; 22; 7,8.
Найдите среднее арифметическое, размах и моду.
План урока:
Понятие выборки и генеральной совокупности
Среднее арифметическое выборки
Упорядоченный ряд и таблица частот
Размах выборки
Мода выборки
Медиана выборки
Ошибки в статистике
Понятие выборки и генеральной совокупности
Слово статистика, образованное от латинского status(состояние дел), появилось только в 1746 году, когда его употребил немец Готфрид Ахенвалль. Однако ещё в Древнем Китае проводились переписи населения, в ходе которых правители собирали информацию о своих владениях и жителях, проживающих в них.
В основе любого статистического исследования лежит массив информации, который называют выборкой данных. Покажем это на примере. Пусть в классе, где учится 20 учеников, проводился тест по математике, содержавший 25 вопросов. В результате учащиеся показали следующие результаты:
Ряд чисел, приведенный во второй строке таблицы (12, 19, 19, 14, 17, 16, 18, 20, 15, 25, 13, 20, 25, 16, 17, 12, 24, 13, 21, 13), будет выборкой. Также ее могут называть рядом данных или выборочной совокупностью.
В примере с классом выборка состоит из 20 чисел. Эту величину (количество чисел в ряду) называют объемом выборки. Каждое отдельное число в ряду именуют вариантой выборки.
В примере со школьным классом в выборку попали все его ученики. Это позволяет точно определить, насколько хорошо учащиеся написали математический тест. Однако иногда необходимо проанализировать очень большие группы населения, состоящие из десятков и даже сотен миллионов человек. Например, необходимо узнать, какая часть населения страны курит. Опросить каждого жителя государства невозможно, поэтому в ходе исследования опрашивают лишь его малую часть. В этом случае статистики выделяют понятие генеральная совокупность.
Так, если с помощью опроса 10 тысяч человек ученые делают выводы о распространении курения в России, то все российское население будет составлять генеральную совокупность исследования, а опрошенные 10 тысяч людей вместе образуют выборку.
Среднее арифметическое выборки
Сбор информации о выборке является лишь первой стадией статистического исследования. Далее ее необходимо обобщить, то есть получить некоторые цифры, характеризующие выборку. Самой часто используемой статистической характеристикой является среднее арифметическое.
Другими словами, для подсчета среднего арифметического необходимо просто сложить все числа в ряде данных, а потом поделить получившееся значение на количество чисел в ряде. Так, в примере с тестом по математике (таблица 1) средний балл учащихся составит: (12+19+19+14+17+16+18+20+15+25+13+20+25+16+17+12+24+13+21+13):20=
= 349:20 = 17,45.
Среднее арифметическое позволяет одним числом характеризовать какое-либо качество всех объектов группы. Чем больше средний балл учащихся в классе, тем выше их успеваемость. Чем меньше среднее количество голов, пропускаемых футбольной командой за один матч, тем лучше она играет в обороне. Если средняя зарплата программистов в городе составляет 90 тысяч рублей, а дворников – 25 тысяч рублей, то это значит, что программисты значительно более востребованы на рынке труда, а потому при выборе будущей профессии лучше предпочесть именно эту специальность.
Упорядоченный ряд и таблица частот
В ряде данных в таблице 1 числа приведены в произвольном порядке. Перепишем ряд так, чтобы все числа шли в неубывающем порядке, то есть от самого маленького к самому большому:
12, 12, 13, 13, 13, 14, 15, 16, 16, 17, 17, 18, 19, 19, 20, 20, 21, 24, 25, 25.
Такую запись называют упорядоченным рядом данных.
Его характеристики ничем не отличаются от изначальной выборки, однако с ним удобнее работать. С его помощью можно видеть, что ни одному ученику не удалось набрать 22 или 23 балла на тесте, но сразу двое учащихся дали 25 правильных ответов. На основе упорядоченного ряда данных несложно составить таблицу частот, в которой будет указано, как часто та или иная варианта выборки встречается в ряде. Выглядеть она будет так:
При составлении этой таблицы мы исключили из нее те варианты количества набранных баллов, частота которых равна нулю (от 0 до 12, 22 и 23).Заметим, что сумма чисел в нижней строке таблицы частот должна равняться объему выборки. Действительно,
2+3+1+1+2+2+1+2+2+1+1+2 = 20.
С помощью таблицы частот можно быстрее посчитать среднее арифметическое выборки. Для этого каждую варианту надо умножить на ее частоту, после чего сложить полученные результаты и поделить их на объем выборки:
(12•2+13•3+14•1+15•1+16•2+17•2+18•1+19•2+20•2+21•1+24•1+25•2):20 =
(24+39+14+15+32+34+18+38+40+42+24+50):20 = 349:20 = 17,45.
Размах выборки
Следующий важная характеристика ряда данных – это размах выборки.
Если выборка представлена в виде упорядоченного ряда данных, то достаточно вычесть из последнего числа ряда первое число. Так, размах выборки результатов теста в классе равен:
25 – 12 = 13,
так как самые лучшие ученики смогли решить все 25 заданий, а наихудший учащийся ответил правильно только на 13 вопросов.
Размах выборки характеризует стабильность, однородность исследуемых свойств. Например, пусть два спортсмена-стрелка в ходе соревнований производят по 5 выстрелов по круговой мишени, где за попадание начисляют от 0 до 10 очков. Первый стрелок показал результаты 8, 9, 9, 8, 9 очков. Второй же спортсмен в своих попытках показал результаты 7, 10, 10, 6, 10. Средние арифметические этих рядов равны:
(8+9+9+8+9):5 = 43:5 = 8,6;
(7+10+10+6+10):5 = 43:5 = 8,6.
Получается, что в среднем оба стрелка стреляют одинаково точно, однако первый спортсмен демонстрирует более стабильные результаты. У его выборки размах равен
9 – 8 = 1,
в то время как размах выборки второго спортсмена равен
10 – 6 = 4.
Размах выборки может быть очень важен в метеорологии. Например, в Алма-Ате и Амстердаме средняя температура в течение года почти одинакова и составляет 10°С. Однако в Алма-Ате в январе и феврале иногда фиксируются температуры ниже -30°С, в то время как в Амстердаме за всю историю наблюдений она никогда не падала ниже -20°С.
Мода выборки
Иногда важно знать не среднее арифметическое выборки, а то, какая из ее вариант встречается наиболее часто. Так, при управлении магазином одежды менеджеру не важен средний размер продаваемых футболок, а необходима информация о том, какие размеры наиболее популярны. Для этого используется такой показатель, как мода выборки.
В примере с математическим тестом сразу 3 ученика набрали по 13 баллов, а частота всех других вариант не превысила 2, поэтому мода выборки равна 13. Возможна ситуация, когда в ряде есть сразу две или более вариант, которые встречаются одинаково часто и чаще остальных вариант. Например, в ряде
1, 2, 3, 3, 3, 4, 5, 5, 5
варианты 3 и 5 встречаются по три раза. В таком случае ряд имеет сразу две моды – 3 и 5, а всю выборку именуют мультимодальной. Особо выделяется случай, когда в выборке все варианты встречаются с одинаковой частотой:
6, 6, 7, 7, 8, 8.
Здесь числа 6, 7 и 8 встречаются одинаково часто (по два раза), а другие варианты отсутствуют. В таких случаях говорят, что ряд не имеет моды.
Медиана выборки
Иногда, например, при расчете средней зарплаты, среднее арифметическое не вполне адекватно отражает ситуацию. Это происходит из-за наличия в выборке чисел, очень сильно отличающихся от среднего. Так, из-за огромных зарплат некоторых начальников большинство рядовых сотрудников компаний обнаруживают, что их зарплата ниже средней. В таких случаях целесообразно использовать такую характеристику, как медиану ряда. Это такое значение, которое делит ряд данных пополам. В упорядоченном ряде 2, 3, 6, 8, 8, 12, 15, 15, 18, 19, 25 медианой будет равна 12, так как именно она находится в середине ряда:
Однако таким образом можно найти только медиану ряда, в котором находится нечетное количество чисел. Если же их количество четное, то за медиану условно принимают среднее арифметическое двух средних чисел. Так, для ряда 2, 3, 6, 8, 8, 12, 15, 15, 18, 19, 25, 30, содержащего 12 чисел, медиана будет равна среднему значению 12 и 15, которые занимают 6-ое и 7-ое место в ряду:
Вернемся к примеру с математическим тестом в школе. Так как его сдавали 20 учеников, а 20 – четное число, то для расчета медианы следует найти среднее арифметическое 10-ого и 11-ого числа в упорядоченном ряде
12, 12, 13, 13, 13, 14, 15, 16, 16, 17, 17, 18, 19, 19, 20, 20, 21, 24, 25, 25.
Эти места занимают числа 17 и 17 (выделены жирным шрифтом). Медиана ряда будет равна
(17+17):2 = 34:2 = 17.
Три приведенные основные статистические характеристики выборки, а именно среднее арифметическое, мода и медиана, называются мерами центральной тенденции. Они позволяют одним числом указать значение, относительно которого группируются все числа ряда.
Рассмотрим для наглядности ещё один пример. Врач в ходе диспансеризации измерил вес мальчиков в классе. В результате он получил 10 значений (в кг):
39, 41, 67, 36, 60, 58, 46, 44, 39, 69.
Найдем среднее арифметическое, размах, моду и медиану для этого ряда.
Решение. Сначала перепишем ряд в упорядоченном виде:
36, 39, 39, 41, 44, 46, 58, 60, 67, 69.
Так как в ряде 10 чисел, то объем выборки равен 10. Найдем среднее арифметическое. Для этого сложим все числа в ряде и поделим их на объем выборки (то есть на 10):
(36+39+39+41+44+46+58+60+67+69):10 =
= 499:10 = 49,9 кг.
Размах выборки равен разнице между наибольшей и наименьшей вариантой в ней. Самый тяжелый мальчик весит 69 кг, а самый легкий – 36 кг, а потому размах ряда равен
69 – 36 = 33 кг.
В упорядоченном ряде только одно число, 39, встречается дважды, а все остальные числа встречаются по одному разу. Поэтому мода ряда будет равна 39 кг.
В выборке 10 чисел, а это четное число. Поэтому для нахождения медианы надо найти два средних по счету значение найти их среднее. На 5-ом и 6-ом месте в ряде находятся числа 44 и 46. Их среднее арифметическое равно
(44+46):2 = 90:2 = 45 кг.
Поэтому и медиана ряда будет равна 45 кг.
Ошибки в статистике
Статистика является очень мощным инструментом для исследований во всех областях человеческой деятельности. Однако иногда ее иронично называют самой точной из лженаук. Известно и ещё одно высказывание, приписываемое политику Дизраэли, согласно которому существует просто ложь, наглая ложь и статистика. С чем же связана такая репутация этой дисциплины?
Дело в том, что некоторые люди и организации часто манипулируют данными статистики, чтобы убедить других в своей правоте или преимуществах товара, которые они продают. Требуются определенные навыки, чтобы правильно пользоваться статистикой. Одна из самых распространенных ошибок – это неправильный выбор выборки.
В 1936 году перед президентскими выборами в США был проведен телефонный опрос, который показал, что с большим преимуществом победу должен одержать Альфред Лендон. Однако на выборах Франклин Рузвельт набрал почти вдвое больше голосов. Ошибка была связана с тем, что в те годы телефон могли позволить себе только богатые люди, которые в большинстве своем поддерживали Лендона. Однако бедные люди (а их, конечно же, больше, чем богатых) голосовали за Рузвельта.
Ещё один пример – это агитация в конце XIX века в США к службе на флоте. Пропагандисты в своей рекламе указывали, что, согласно статистике, смертность на флоте во время войны (испано-американской) составляет 0,09%, в то время как среди населения Нью-Йорка она равнялась 0,16%. Получалось, что служить на флоте в военное время безопаснее, чем жить мирной жизнью. Однако на самом деле причина таких цифр заключается в том, что во флот всегда отбирали молодых мужчин с хорошим здоровьем, которые не могли умереть от «старческих» болезней, в то время как в население Нью-Йорка входят больные и старые люди.
При указании среднего значения исследователь может использовать разные характеристики – среднее арифметическое, медиана, мода. При этом почти всегда среднее арифметическое несколько больше медианы. Именно поэтому большинство людей, узнающих о средней зарплате в стране, удивляются, так как они столько не зарабатывают. Правильнее ориентироваться на медианную зарплату.
Ну и наконец, нельзя забывать, что любая статистика может показать только корреляцию между двумя величинами, но это не всегда означает причинно-следственную связь. Так, известно, что чем больше в городе продается мороженого, тем больше в это же время людей тонет на пляжах. Означает ли это, что поедание мороженого увеличивает риск во время плавания? Нет. Дело в том, что оба этих показателя, продажи мороженого и количество утонувших, зависят от третьей величины – температуры в городе. Чем жарче на улице, тем большее количество людей ходят на пляж и тем больше мороженого продается в магазинах.
Среднее арифметическое, мода и медиана
- Предмет, цели и методы математической статистики
- Метод выборочных исследований
- Средняя арифметическая, простая и взвешенная
- Мода и медиана
- Примеры
Предмет, цели и методы математической статистики
Начиная с XVIII века, в общем направлении статистических исследований начинает активно формироваться математическая статистика.
Математическая статистика – раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений.
В зависимости от предмета исследований математическая статистика делится на:
- статистику чисел;
- многомерный статистический анализ;
- анализ функций (процессов) и временных рядов;
- статистику объектов с нечисловыми характеристиками.
В зависимости от цели и методов исследований математическая статистика делится на: описательную статистику; теорию оценивания; теорию проверки гипотез.
Описательная статистика | Теория оценивания | Теория проверки гипотез | |
Цель | Обработка и систематизация эмпирических данных | Оценивание ненаблюдаемых данных и сигналов от объектов наблюдения на основе наблюдаемых данных | Обоснование предположений о виде распределения и свойствах случайной величины |
Методы |
1. Наглядное представление в форме графиков и таблиц. 2. Количественное описание с помощью статистических показателей. |
1. Параметрические методы (наименьших квадратов, максимального правдоподобия и др.). 2. Непараметрические методы. |
1. Последовательный анализ. 2. Статистические критерии. |
Метод выборочных исследований
Статистика получила признание в различных областях человеческой деятельности благодаря заметной экономии времени и прочих ресурсов. Её основная идея: не нужно измерять всё, измерьте только часть всего и сделайте предположение об остальном.
«Всё» в статистике называется генеральной совокупностью.
«Часть всего», которую мы тщательно исследуем, называется выборкой.
Метод выборочных исследований – способ определения свойств группы объектов (генеральной совокупности) на основании статистического исследования её части (выборки).
Например, чтобы оценить средние размеры апельсина, который продаётся в магазине в декабре, необязательно денно и нощно мерить все апельсины во всех ящиках (сколько же для этого нужно времени и людей?!). Достаточно сделать выборку – мерить по одному апельсину из каждого ящика в течение месяца (тут уже и один человек справится).
Статистика предоставляет методику и оценки для того, чтобы правильно провести выборку и на основании знаний о среднем размере апельсина в выборке (выборочной средней) судить о средних размерах всех декабрьских апельсин (генеральной средней).
Средняя арифметическая, простая и взвешенная
Статистическое исследование опирается на собранные данные о каком-то признаке (рост, вес, возраст, доход и т.п.).
Варианта – полученное эмпирическое значение признака.
Вариационный ряд – совокупность собранных вариант.
Пусть мы сделали выборку, провели N измерений и получили x_1,x_2,…,x_N вариант.
Вариационный ряд, состоящий из отдельных вариант, называют дискретным.
Чтобы найти выборочную среднюю дискретного вариационного ряда, нужно вычислить среднюю арифметическую простую:
$$ x_{cp} = frac{1}{N} sum_{i=1}^N x_i ,i = overline{1,N} $$
Знак Σ означает «сумма», i – это индекс полученных вариант, который пробегает все значения, от 1 до N.
Например:
На протяжении четверти школьник получил такие оценки по алгебре: 5,4,3,5,4,4,5,4,3,5,5,4,3,5,4,4. Найдите среднюю оценку за четверть.
Считаем среднюю арифметическую простую:
$$ x_cp = frac{5+4+3+⋯+4}{16} ≈ 4,2 $$
Нетрудно заметить, что оценки повторяются, и вычисления можно упростить, если вместо сложения одинаковых оценок использовать умножение оценок на их количество.
Чтобы найти выборочную среднюю при повторяющихся вариантах, удобно вычислять среднюю арифметическую взвешенную:
$$ x_{cp} = frac{1}{N} sum_{i=1}^K x_i n_i , N = sum_{i=1}^K n_i , i = overline{1,K} $$
где K – количество групп с повторяющимися вариантами, $x_i$ – значение варианты в -й группе, $n_i$ – частота варианты $x_i$.
Например:
Рассматриваем тот же ряд оценок: 5,4,3,5,4,4,5,4,3,5,5,4,3,5,4,4 и составляем таблицу:
$$ x_cp = frac{3cdot3+4cdot7+5cdot6}{3+7+6} ≈ 4,2 $$
Вычисления заметно упростились.
Мода и медиана
Мода дискретного вариационного ряда – это варианта с максимальной частотой. Мод может быть несколько. Тогда говорят, что ряд мультимодальный.
В примере с оценками по алгебре мода $M_0 = 4$ – эта оценка встречается чаще всего, её частота равна 7.
Медиана дискретного вариационного ряда – это значение варианты посредине упорядоченного ряда.
Алгоритм:
-
Отсортировать ряд по возрастанию.
-
Если общее количество измерений N нечётное, найти m = $lceil frac{N}{2}rceil$ и округлить в сторону увеличения. $M_e = x_m$ – искомая медиана.
-
Если общее количество измерений N чётное, найти $m = frac{N}{2}$ и вычислить медиану как среднее $M_e = frac{x_m+x_{m+1}}{2}$.
В примере с оценками по алгебре N = 16 – четное. $m = frac{N}{2} = 8 $.
Сортируем ряд оценок по возрастанию: 3,3,3,4,4,4,4, 4,4, 4,5,5,5,5,5,5
$$ x_8 = 4, x_9 = 4 Rightarrow M_e = frac{4+4}{2} = 4 $$
Внимание!
Мода и медиана учитывают индивидуальные варианты и поэтому важны для характеристики вариационного ряда.
Особенное значение мода и медиана приобретают в рядах с выбросами – одиночными очень большими или очень малыми вариантами. В этом случае они оберегают от выводов на основании «средней температуры по больнице».
Примеры
Пример 1. В исследовании месячных доходов десяти человек были получены следующие данные: 200,100,300,300,1000,5000,100,200, 300,400 (дол.).
Найдите выборочную среднюю, моду и медиану.
Почему при оценке доходов мода и медиана предпочтительней выборочной средней?
Составим таблицу:
$x_i$, дол.
100
200
300
400
1000
5000
$sum$
$n_i$, чел.
2
2
3
1
1
1
10
$x_i n_i$
200
400
900
400
1000
5000
7900
Выборочная средняя:$ x_{cp} = frac{7900}{10} = 790$ (дол.)
Мода: $M_o$ = 300 (дол.) – максимальная частота 3
Медиана:
100, 100, 200, 200, 300, 300, 300, 400, 1000, 5000
$$ m = frac{10}{2} = 5, x_5 = x_6 = 300, M_e = frac{300+300}{2} = 300 (дол.) $$
Выборочная средняя не отражает доходов большей части людей в выборке, поскольку даже один человек с большими доходами может резко сместить оценку вправо. Мода и медиана хорошо отражают доходы большей части людей в выборке.
Пример 2. Исследовалось время решения задачи. В исследовании принимало участие 20 человек, из них двое задачу не решили. Время решения остальных участников:
$x_i$, мин
10
15
20
25
30
Найдите выборочную среднюю, моду и медиану.
При подборе задач для контрольной работы, сколько времени следует отвести на решение подобной задачи?
Проведём вычисления:
$x_i$
10
15
20
25
30
$sum$
$x_i n_i$
20
75
100
100
60
355
$$x_cp = frac{355}{18} ≈ 19,7 мин $$
В выборке 2 моды: $M_{o1}$ = 15 мин, $M_{o2}$ = 20 мин
Положение медианы: $m = frac{N}{2} = frac{18}{2} = 9, x_9 = x_10 = 20, Me = 20$ мин
Средняя, одна из мод и медиана равны 20 мин. Поэтому при составлении контрольной следует отвести на подобную задачу 20 мин.
Пример 3. работа по геометрии показала следующие результаты:
Найдите выборочную среднюю, моду и медиану.
Что вы можете сказать об уровне понимания материала?
Проведём вычисления:
$x_i n_i$
10
66
40
10
126
$$x_cp = frac{126}{39} ≈ 3,2$$
Мода: $M_o$ = 3 – эта оценка получена 22 раза
Положение медианы: $m = ⌈ frac{N}{2}⌉ = ⌈frac{39}{2}⌉ = 20, x_{20} = 3, Me = 3$
Средняя, мода и медиана равны 3.
Уровень понимания удовлетворительный, «на троечку».