Дисперсия и среднее квадратическое отклонение
Дисперсия
– это средняя арифметическая квадратов
отклонений каждого значения признака
от общей средней. Дисперсия обычно
называется средним квадратом отклонений.
В зависимости от исходных данных
дисперсия может вычисляться по средней
арифметической простой или взвешенной:
Для
не сгруппированных данных σ2
=,
Для
вариационного ряда σ2
=
.
Среднее
квадратическое
отклонение
представляет собой корень квадратный
из дисперсии:
Для
не сгруппированных данных σ =
,
Для
вариационного ряда σ =
.
Среднее
квадратическое отклонение – это
обобщающая характеристика абсолютных
размеров вариации признака в совокупности.
Выражается оно в тех же единицах
измерения, что и признак (в метрах,
тоннах, процентах, гектарах и т.д.).
Вычислению
среднего квадратического отклонения
предшествует расчёт дисперсии.
Определение
дисперсии и среднего квадратического
отклонения по индивидуальным значениям
Порядок
расчета:
-
по
значениям признака исчисляется средняя
арифметическая простая
;
-
определяются
отклонения каждой варианты от средней
; -
полученные
отклонения возводят в квадрат ()2; -
рассчитывается
сумма квадратов отклонений вариантов
от общей средней Σ()2
; -
сумма
квадратов отклонений вариантов от
общей средней делится на число значений
вариантов Σ()2
/ n
Задание
3. По примеру
двух бригад (задание 1) определите
дисперсию и среднее квалратическое
отклонение производительности труда.
Методика
решения:
Определение
дисперсии и среднего квадратического
отклонения в дискретных и интервальных
рядах распределения
Порядок
расчета:
-
вычисляется
средняя арифметическая взвешенная
; -
определяются
отклонения каждой варианты от средней
; -
полученные
отклонения возводят в квадрат ()2; -
квадраты
отклонений вариантов от общей средней
взвешиваются по частотам ()2f
; -
рассчитывается
сумма взвешенных квадратов отклонений
вариантов от общей средней Σ()2
f
; -
сумма
взвешенных квадратов отклонений
вариантов от общей средней делится на
сумму частот Σ()2
f
/ Σ f
.
Задание
4. Рассчитайте
дисперсию и среднее квадратическое
отклонение по данным типовой задачи.
Сделайте вывод.
Произведено |
Число |
хƒ |
|
||
8 |
7 |
||||
9 |
10 |
||||
10 |
15 |
||||
11 |
12 |
||||
12 |
6 |
||||
Итого |
Методика
решения:
Вывод:
Если
исходные данные представлены в виде
интервального ряда распределения, то
сначала надо определить дискретное
значение признака, а далее применить
тот же метод, что изложен выше.
Задание
5. Рассчитайте
дисперсию и среднее квадратическое
отклонение для интервального ряда по
данным распределения посевной площади
хозяйства по урожайности пшеницы:
Урожайность |
Посевная |
х |
хƒ |
|
||
14-16 |
100 |
|||||
16-18 |
300 |
|||||
18-20 |
400 |
|||||
20-22 |
200 |
|||||
Итого |
Методика
решения:
Вывод:
Расчет
дисперсии упрощенным способом.
Применение
приведенной формулы расчета дисперсии
не всегда удобно, хотя она хорошо отражает
суть показателя. Поэтому необходимо
знать другую формулу упрощенного способа
расчета, вытекающую из приведенной
выше:
,
где
–
средняя величина квадратов вариантов;
–
квадрат средней арифметической.
Порядок
расчета (если данные несгруппированы):
Задание
6. Имеются
данные о производительности труда
рабочих.Вычислить дисперсию упрощенным
способом.
№ рабочего |
Произведена |
|
1 |
12 |
|
2 |
16 |
|
3 |
11 |
|
4 |
18 |
|
5 |
13 |
|
Итого |
Методика
решения:
Вывод:
Порядок
расчета (если данные сгруппированы):
Задание
7. Имеются
данные о распределении сельскохозяйственных
предприятий по наличию основных фондов.
Вычислить дисперсию упрощенным способом.
Группы |
Число |
|
|||
2-4 |
11 |
||||
4-6 |
16 |
||||
6-8 |
16 |
||||
8-10 |
7 |
||||
Итого |
Методика
решения:
Вывод:
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Дисперсия и среднее квадратичное отклонение числового ряда.
Дисперсия и Среднее квадратичное отклонение
числового ряда
Задача
Дисперсией ряда чисел называется среднее арифметическое
Оля и Гуля проводили подготовку к соревнованиям по стрельбе из лука. Спортсменки произвели по 7 серий выстрелов. Каждая серия состояла из 12 выстрелов. Получили следующие данные:
Задача
Дисперсией ряда чисел называется среднее арифметическое
Оля и Гуля проводили подготовку к соревнованиям по стрельбе из лука. Спортсменки произвели по 7 серий выстрелов. Каждая серия состояла из 12 выстрелов. Получили следующие данные:
Оля: 11, 11, 12, 11, 9, 11, 12.
Задача
Дисперсией ряда чисел называется среднее арифметическое
Оля и Гуля проводили подготовку к соревнованиям по стрельбе из лука. Спортсменки произвели по 7 серий выстрелов. Каждая серия состояла из 12 выстрелов. Получили следующие данные:
Оля: 11, 11, 12, 11, 9, 11, 12.
Гуля: 12, 10, 9, 12, 11, 12, 11.
Задача
Дисперсией ряда чисел называется среднее арифметическое
По итогам полученных данных подведены
результаты попадания в цель.
Кто лучше готов к соревнованиям?
Оля: 11, 11, 12, 11, 9, 11, 12.
Гуля: 12, 10, 9, 12, 11, 12, 11.
СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ ряда
Дисперсией ряда чисел называется среднее арифметическое
Найдём среднее арифметическое результатов для каждого спортсмена:
Оля
Гуля
СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ ряда
Дисперсией ряда чисел называется среднее арифметическое
Найдём среднее арифметическое результатов для каждого спортсмена:
Оля
Гуля
СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ ряда
Дисперсией ряда чисел называется среднее арифметическое
Найдём среднее арифметическое результатов для каждого спортсмена:
Оля
Гуля
СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ ряда
Дисперсией ряда чисел называется среднее арифметическое
Найдём среднее арифметическое результатов для каждого спортсмена:
Значения одинаковы. Кто лучше готов к соревнованиям?
Оля
Гуля
ДИСПЕРСИЯ ряда
Дисперсией ряда чисел называется среднее арифметическое
Вычислим дисперсию результатов для каждого спортсмена:
ДИСПЕРСИЯ ряда
Дисперсией ряда чисел называется среднее арифметическое
Вычислим дисперсию результатов для каждого спортсмена:
Дисперсией ряда чисел называется
среднее арифметическое
квадратов их отклонений от среднего арифметического этого ряда.
ДИСПЕРСИЯ ряда
Дисперсией ряда чисел называется среднее арифметическое
Вычислим дисперсию результатов для каждого спортсмена:
ДИСПЕРСИЯ ряда
Дисперсией ряда чисел называется среднее арифметическое
Вычислим дисперсию результатов для каждого спортсмена:
ДИСПЕРСИЯ ряда
Дисперсией ряда чисел называется среднее арифметическое
Дисперсии данных результатов:
DОли = 0,86 DГули = 1,14
ДИСПЕРСИЯ ряда
Дисперсией ряда чисел называется среднее арифметическое
Дисперсии данных результатов:
DОли = 0,86 DГули = 1,14
Разброс данных у Оли меньше − это свидетельствует о
её лучшей подготовке.
ДИСПЕРСИЯ ряда
Дисперсией ряда чисел называется среднее арифметическое
Дисперсии данных результатов:
DОли = 0,86 DГули = 1,14
Разброс данных у Оли меньше − это свидетельствует о
её лучшей подготовке. Данный пример демонстрирует,
что при равных средних арифметических значениях,
именно дисперсия позволила выявить наименьший разброс данных среди результатов.
ДИСПЕРСИЯ ряда
Дисперсией ряда чисел называется среднее арифметическое
Дисперсии данных результатов:
DОли = 0,86 DГули = 1,14
Разброс данных у Оли меньше − это свидетельствует о
её лучшей подготовке. Данный пример демонстрирует,
что при равных средних арифметических значениях,
именно дисперсия позволила выявить наименьший разброс данных среди результатов.
Оля лучше готова и показала более стабильный результат.
Среднее квадратичное отклонение ряда
Дисперсией ряда чисел называется среднее арифметическое
Вычислим среднее квадратичное отклонение
результатов для каждого спортсмена:
Среднее квадратичное отклонение ряда
Дисперсией ряда чисел называется среднее арифметическое
Вычислим среднее квадратичное отклонение
результатов для каждого спортсмена:
Средним квадратичным отклонением числового ряда называют квадратный корень из дисперсии этого ряда.
Среднее квадратичное отклонение ряда
Вычислим среднее квадратичное отклонение
результатов для каждого спортсмена:
Среднее квадратичное отклонение ряда
Вычислим среднее квадратичное отклонение
результатов для каждого спортсмена:
On-line калькулятор, который выполняет расчеты среднего арифметического показателя, Дисперсии, Вариации, Среднеквадратичного отклонения, удобный в использовании. Для получения правильного результата необходимо правильно заполнить предложенную таблицу.
Такой онлайн калькулятор станет незаменимым помощником для осуществления математических расчетов. Указав нужные значения вам достаточно нажать кнопку “Расчет” и незамедлительно появится правильный результат. Простота в использовании делает калькулятор незаменимым и популярным. Им легко пользоваться на работе, дома, во время учебы. Он не требует выполнения сложных действий. Вы сможете сделать все вычисления для всех нужных величин.
×
Пожалуйста напишите с чем связна такая низкая оценка:
×
Для установки калькулятора на iPhone – просто добавьте страницу
«На главный экран»
Для установки калькулятора на Android – просто добавьте страницу
«На главный экран»
Смотрите также
Из предыдущей статьи мы узнали о таких показателях, как размах вариации, межквартильный размах и среднее линейное отклонение. В этой статье изучим дисперсию, среднеквадратичное отклонение и коэффициент вариации.
Дисперсия
Дисперсия случайной величины – это один из основных показателей в статистике. Он отражает меру разброса данных вокруг средней арифметической.
Сейчас небольшой экскурс в теорию вероятностей, которая лежит в основе математической статистики. Как и матожидание, дисперсия является важной характеристикой случайной величины. Если матожидание отражает центр случайной величины, то дисперсия дает характеристику разброса данных вокруг центра.
Формула дисперсии в теории вероятностей имеет вид:
То есть дисперсия — это математическое ожидание отклонений от математического ожидания.
На практике при анализе выборок математическое ожидание, как правило, не известно. Поэтому вместо него используют оценку – среднее арифметическое. Расчет дисперсии производят по формуле:
где
s2 – выборочная дисперсия, рассчитанная по данным наблюдений,
X – отдельные значения,
X̅– среднее арифметическое по выборке.
Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. Однако при увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной.
Простыми словами дисперсия – это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Теперь вы знаете, как найти дисперсию.
Генеральную и выборочную дисперсии легко рассчитать в Excel. Есть специальные функции: ДИСП.Г и ДИСП.В соответственно.
В чистом виде дисперсия не используется. Это вспомогательный показатель, который нужен в других расчетах. Например, в проверке статистических гипотез или расчете коэффициентов корреляции. Отсюда неплохо бы знать математические свойства дисперсии.
Свойства дисперсии
Свойство 1. Дисперсия постоянной величины A равна 0 (нулю).
D(A) = 0
Свойство 2. Если случайную величину умножить на постоянную А, то дисперсия этой случайной величины увеличится в А2 раз. Другими словами, постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат.
D(AX) = А2 D(X)
Свойство 3. Если к случайной величине добавить (или отнять) постоянную А, то дисперсия останется неизменной.
D(A + X) = D(X)
Свойство 4. Если случайные величины X и Y независимы, то дисперсия их суммы равна сумме их дисперсий.
D(X+Y) = D(X) + D(Y)
Свойство 5. Если случайные величины X и Y независимы, то дисперсия их разницы также равна сумме дисперсий.
D(X-Y) = D(X) + D(Y)
Среднеквадратичное (стандартное) отклонение
Если из дисперсии извлечь квадратный корень, получится среднеквадратичное (стандартное) отклонение (сокращенно СКО). Встречается название среднее квадратичное отклонение и сигма (от названия греческой буквы). Общая формула стандартного отклонения в математике следующая:
На практике формула стандартного отклонения следующая:
Как и с дисперсией, есть и немного другой вариант расчета. Но с ростом выборки разница исчезает.
Расчет cреднеквадратичного (стандартного) отклонения в Excel
Для расчета стандартного отклонения достаточно из дисперсии извлечь квадратный корень. Но в Excel есть и готовые функции: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В (по генеральной и выборочной совокупности соответственно).
Среднеквадратичное отклонение имеет те же единицы измерения, что и анализируемый показатель, поэтому является сопоставимым с исходными данными.
Коэффициент вариации
Значение стандартного отклонения зависит от масштаба самих данных, что не позволяет сравнивать вариабельность разных выборках. Чтобы устранить влияние масштаба, необходимо рассчитать коэффициент вариации по формуле:
По нему можно сравнивать однородность явлений даже с разным масштабом данных. В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной. В реальности, если коэффициент вариации превышает 33%, то специально ничего делать по этому поводу не нужно. Это информация для общего представления. В общем коэффициент вариации используют для оценки относительного разброса данных в выборке.
Расчет коэффициента вариации в Excel
Расчет коэффициента вариации в Excel также производится делением стандартного отклонения на среднее арифметическое:
=СТАНДОТКЛОН.В()/СРЗНАЧ()
Коэффициент вариации обычно выражается в процентах, поэтому ячейке с формулой можно присвоить процентный формат:
Коэффициент осцилляции
Еще один показатель разброса данных на сегодня – коэффициент осцилляции. Это соотношение размаха вариации (разницы между максимальным и минимальным значением) к средней. Готовой формулы Excel нет, поэтому придется скомпоновать три функции: МАКС, МИН, СРЗНАЧ.
Коэффициент осцилляции показывает степень размаха вариации относительно средней, что также можно использовать для сравнения различных наборов данных.
Таким образом, в статистическом анализе существует система показателей, отражающих разброс или однородность данных.
Ниже видео о том, как посчитать коэффициент вариации, дисперсию, стандартное (среднеквадратичное) отклонение и другие показатели вариации в Excel.
Поделиться в социальных сетях:
Загрузить PDF
Загрузить PDF
Дисперсия случайной величины является мерой разброса значений этой величины. Малая дисперсия означает, что значения сгруппированы близко друг к другу. Большая дисперсия свидетельствует о сильном разбросе значений. Понятие дисперсии случайной величины применяется в статистике. Например, если сравнить дисперсию значений двух величин (таких как результаты наблюдений за пациентами мужского и женского пола), можно проверить значимость некоторой переменной.[1]
Также дисперсия используется при построении статистических моделей, так как малая дисперсия может быть признаком того, что вы чрезмерно подгоняете значения.[2]
-
1
Запишите значения выборки. В большинстве случаев статистикам доступны только выборки определенных генеральных совокупностей. Например, как правило, статистики не анализируют расходы на содержание совокупности всех автомобилей в России – они анализируют случайную выборку из нескольких тысяч автомобилей. Такая выборка поможет определить средние расходы на автомобиль, но, скорее всего, полученное значение будет далеко от реального.
- Например, проанализируем количество булочек, проданных в кафе за 6 дней, взятых в случайном порядке. Выборка имеет следующий вид: 17, 15, 23, 7, 9, 13. Это выборка, а не совокупность, потому что у нас нет данных о проданных булочках за каждый день работы кафе.
- Если вам дана совокупность, а не выборка значений, перейдите к следующему разделу.
-
2
Запишите формулу для вычисления дисперсии выборки. Дисперсия является мерой разброса значений некоторой величины. Чем ближе значение дисперсии к нулю, тем ближе значения сгруппированы друг к другу. Работая с выборкой значений, используйте следующую формулу для вычисления дисперсии:[3]
-
3
Вычислите среднее значение выборки. Оно обозначается как x̅.[4]
Среднее значение выборки вычисляется как обычное среднее арифметическое: сложите все значения в выборке, а затем полученный результат разделите на количество значений в выборке.- В нашем примере сложите значения в выборке: 15 + 17 + 23 + 7 + 9 + 13 = 84
Теперь результат разделите на количество значений в выборке (в нашем примере их 6): 84 ÷ 6 = 14.
Выборочное среднее x̅ = 14. - Выборочное среднее – это центральное значение, вокруг которого распределены значения в выборке. Если значения в выборке группируются вокруг выборочного среднего, то дисперсия мала; в противном случае дисперсия велика.
- В нашем примере сложите значения в выборке: 15 + 17 + 23 + 7 + 9 + 13 = 84
-
4
Вычтите выборочное среднее из каждого значения в выборке. Теперь вычислите разность – x̅, где – каждое значение в выборке. Каждый полученный результат свидетельствует о мере отклонения конкретного значения от выборочного среднего, то есть как далеко это значение находится от среднего значения выборки.[5]
-
5
Возведите в квадрат каждый полученный результат. Как отмечалось выше, сумма разностей – x̅ должна быть равна нулю. Это означает, что средняя дисперсия всегда равна нулю, что не дает никакого представления о разбросе значений некоторой величины. Для решения этой проблемы возведите в квадрат каждую разность – x̅. Это приведет к тому, что вы получите только положительные числа, которые при сложении никогда не дадут 0.[6]
-
6
-
7
Полученный результат разделите на n – 1, где n – количество значений в выборке. Некоторое время назад для вычисления дисперсии выборки статистики делили результат просто на n; в этом случае вы получите среднее значение квадрата дисперсии, которое идеально подходит для описания дисперсии данной выборки. Но помните, что любая выборка – это лишь небольшая часть генеральной совокупности значений. Если взять другую выборку и выполнить такие же вычисления, вы получите другой результат. Как выяснилось, деление на n – 1 (а не просто на n) дает более точную оценку дисперсии генеральной совокупности, в чем вы и заинтересованы. Деление на n – 1 стало общепринятым, поэтому оно включено в формулу для вычисления дисперсии выборки.[7]
- В нашем примере выборка включает 6 значений, то есть n = 6.
Дисперсия выборки = 33,2
- В нашем примере выборка включает 6 значений, то есть n = 6.
-
8
Отличие дисперсии от стандартного отклонения. Заметьте, что в формуле присутствует показатель степени, поэтому дисперсия измеряется в квадратных единицах измерения анализируемой величины. Иногда такой величиной довольно сложно оперировать; в таких случаях пользуются стандартным отклонением, которое равно квадратному корню из дисперсии. Именно поэтому дисперсия выборки обозначается как , а стандартное отклонение выборки – как .
- В нашем примере стандартное отклонение выборки: s = √33,2 = 5,76.
Реклама
-
1
Проанализируйте некоторую совокупность значений. Совокупность включает в себя все значения рассматриваемой величины. Например, если вы изучаете возраст жителей Ленинградской области, то совокупность включает возраст всех жителей этой области. В случае работы с совокупностью рекомендуется создать таблицу и внести в нее значения совокупности. Рассмотрим следующий пример:
-
2
Запишите формулу для вычисления дисперсии генеральной совокупности. Так как в совокупность входят все значения некоторой величины, то приведенная ниже формула позволяет получить точное значение дисперсии совокупности. Для того чтобы отличить дисперсию совокупности от дисперсии выборки (значение которой является лишь оценочным), статистики используют различные переменные: [8]
-
3
Вычислите среднее значение совокупности. При работе с генеральной совокупностью ее среднее значение обозначается как μ (мю). Среднее значение совокупности вычисляется как обычное среднее арифметическое: сложите все значения в генеральной совокупности, а затем полученный результат разделите на количество значений в генеральной совокупности.
- Имейте в виду, что средние величины не всегда вычисляются как среднее арифметическое.
- В нашем примере среднее значение совокупности: μ = = 10,5
-
4
Вычтите среднее значение совокупности из каждого значения в генеральной совокупности. Чем ближе значение разности к нулю, тем ближе конкретное значение к среднему значению совокупности. Найдите разность между каждым значением в совокупности и ее средним значением, и вы получите первое представление о распределении значений.
- В нашем примере:
– μ = 5 – 10,5 = -5,5
– μ = 5 – 10,5 = -5,5
– μ = 8 – 10,5 = -2,5
– μ = 12 – 10,5 = 1,5
– μ = 15 – 10,5 = 4,5
– μ = 18 – 10,5 = 7,5
- В нашем примере:
-
5
Возведите в квадрат каждый полученный результат. Значения разностей будут как положительными, так и отрицательными; если нанести эти значения на числовую прямую, то они будут лежать справа и слева от среднего значения совокупности. Это не годится для вычисления дисперсии, так как положительные и отрицательные числа компенсируют друг друга. Поэтому возведите в квадрат каждую разность, чтобы получить исключительно положительные числа.
- В нашем примере:
( – μ) для каждого значения совокупности (от i = 1 до i = 6):
(-5,5) = 30,25
(-5,5) = 30,25
(-2,5) = 6,25
(1,5) = 2,25
(4,5) = 20,25
(7,5) = 56,25
- В нашем примере:
-
6
Найдите среднее значение полученных результатов. Вы нашли, как далеко каждое значение совокупности расположено от ее среднего значения. Найдите среднее значение суммы квадратов разностей, поделив ее на количество значений в генеральной совокупности.
- В нашем примере:
Дисперсия совокупности = 24,25
- В нашем примере:
-
7
Соотнесите это решение с формулой. Если вы не поняли, как приведенное выше решение соотносится с формулой, ниже представлено объяснение решения:
Реклама
Советы
- Дисперсию довольно сложно интерпретировать, поэтому в большинстве случаев она вычисляется как промежуточная величина, которая необходима для нахождения стандартного отклонения.
- При вычислении дисперсии выборки деление на n-1, а не просто на n, называется коррекцией Бесселя. Дисперсия выборки представляет собой только оценочное значение дисперсии генеральной совокупности, при этом выборочное среднее смещено, чтобы соответствовать этому оценочному значению. Коррекция Бесселя устраняет такое смещение.[9]
Это связано с тем, что при анализе n – 1 значения использование n-го значения уже ограничено, так как только определенные значения приводят к выборочному среднему (x̅), которое используется в формуле для вычисления дисперсии.[10]
Реклама
Об этой статье
Эту страницу просматривали 122 174 раза.