-
Теоретические и эмпирические частоты. Критерии согласия.
Эмпирические
частоты
получают в результате опыта (наблюдения).
Теоретические частоты рассчитывают по
формулам. Для нормального закона
распределения их можно найти следующим
образом:
,
(*)
где
–
сумма эмпирических (наблюдаемых) частот;
–
разность между двумя соседними вариантами
(то есть длина частичного интервала);
–
выборочное среднее квадратическое
отклонение;
;
–
выборочная средняя арифметическая;
–
середина
-го
частичного интервала; значения функции
находят по таблице (см. приложения).
Обычно эмпирические
и теоретические частоты различаются.
Возможно, что расхождение случайно и
связано с ограниченным количеством
наблюдений; возможно, что расхождение
неслучайно и объясняется тем, что для
вычисления теоретических частот
выдвинута статистическая гипотеза о
том, что генеральная совокупность
распределена нормально, а в действительности
это е так. Распределение генеральной
совокупности, которое она имеет в силу
выдвинутой гипотезы, называют
теоретическим.
Возникает
необходимость установить правило
(критерий), которое позволяло бы судить,
является ли расхождение между эмпирическим
и теоретическим распределениями
случайным или значимым. Если расхождение
окажется случайным, то считают, что
данные наблюдений (выборки) согласуются
с выдвинутой гипотезой о законе
распределения генеральной совокупности
и, следовательно, гипотезу принимают.
Если же расхождение окажется значимым,
то данные наблюдений не согласуются с
выдвинутой гипотезой, и её отвергают.
Критерием
согласия
называют критерий, который позволяет
установить, является ли расхождение
эмпирического и теоретического
распределений случайным или значимым,
то есть согласуются ли данные наблюдений
с выдвинутой статистической гипотезой
или не согласуются.
Имеются несколько
критериев согласия: критерий
(Пирсона), критерий Колмогорова, критерий
Романовского и др. Ограничимся описанием
того, как критерий
применяется к проверке гипотезы о
нормальном распределении генеральной
совокупности1
(предлагаем студентам
написать рефераты по различным критериям
согласия и их применению).
Допустим, что в
результате
наблюдений получена выборка:
-
Значения
признака.
. .Эмпирические
частота.
. .причём
Выдвинем
статистическую гипотезу: генеральная
совокупность, из которой извлечена
данная выборка, имеет нормальное
распределение. Требуется установить,
согласуется ли эмпирическое распределение
с этой гипотезой. Предположим, что по
формуле (*)
вычислены теоретические частоты
.
Обозначим
среднее арифметическое квадратов
разностей между эмпирическими и
теоретическим частотами, взвешенное
по обратным величинам теоретических
частот:
.
Чем больше
согласуются эмпирическое и теоретическое
распределения, тем меньше различаются
эмпирические и теоретические частоты
и тем меньше значение
.
Отсюда следует, что
характеризует близость эмпирического
и теоретического распределений. В разных
опытах
принимает различные, заранее неизвестные
значения, то есть является случайной
величиной. Плотность вероятности этого
распределения (для выборки достаточно
большого объёма) не зависит от проверяемого
закона распределения, а зависит от
параметра
,
называемого числом степеней свободы.
Так при проверке гипотезы о нормальном
распределении генеральной совокупности
,
где
–
число групп, на которые разбиты данные
наблюдений. Существуют таблицы (см.
приложения), в которых указана вероятность
того, что в результате влияния случайных
факторов величина
примет значение не меньше вычисленного
по данным выборки
.
Для определённости
примем уровень значимости 0,01. Если
вероятность, найденная по таблицам,
окажется меньше 0,01, то это означает, что
в результате влияния случайных причин
наступило событие, которое практически
невозможно. Таким образом, тот факт, что
приняло значение
,
нельзя объяснить случайными причинами;
его можно объяснить тем, что генеральная
совокупность не распределена нормально
и, значит, выдвинутая гипотеза о нормальном
распределении генеральной совокупности
должна быть отвергнута. Если вероятность,
найденная по таблицам, превышает 0,01, то
гипотеза о нормальном распределении
генеральной совокупности согласуется
с данными наблюдений и поэтому может
быть принята. Полученные выводы
распространяются и на другие уровни
значимости.
На практике надо,
чтобы объём выборки был достаточно
большим ()
и чтобы каждая группа содержала 5 – 8
значений признака.
Для проверки
гипотезы о нормальном распределении
генеральной совокупности нужно:
-
вычислить
теоретические частоты по формуле (*); -
вычислить
,
где
–
соответственно частоты эмпирические
и теоретические; -
вычислить число
степеней свободы
,
где
–
число групп, на которые разбита выборка; -
выбрать уровень
значимости; -
найти по таблице
(см. приложения) по найденным
и
вероятность
,
причём, если эта вероятность меньше
принятого уровня значимости, то гипотезу
о нормальном распределении генеральной
совокупности отвергают; если же
вероятность больше уровня значимости,
то гипотезу принимают.
ПРИМЕР 5.
Проверить, согласуются ли данные выборки
со статистической гипотезой о нормальном
распределении генеральной совокупности,
из которой извлечена выборка:
варианта |
15 |
20 |
25 |
30 |
35 |
40 |
45 |
50 |
55 |
частота |
6 |
13 |
38 |
74 |
106 |
85 |
30 |
10 |
4 |
Решение.
Вычислим выборочное среднее и выборочную
дисперсию:
;
.
Далее, вычислим
теоретические частоты по формуле (*):
|
|||||
15 |
6 |
– 19,7 |
– 2,67 |
0,0113 |
3 |
20 |
13 |
– 14,7 |
– 1,99 |
0,0551 |
14 |
25 |
38 |
– 9,7 |
– 1,31 |
0,1691 |
42 |
30 |
74 |
– 4,7 |
– 0,63 |
0,3271 |
82 |
35 |
106 |
0,3 |
0,05 |
0,3984 |
99 |
40 |
85 |
5,3 |
0,73 |
0,3056 |
76 |
45 |
30 |
10,3 |
1,41 |
0,1476 |
37 |
50 |
10 |
15,3 |
2,09 |
0,0449 |
11 |
55 |
4 |
20,3 |
2,77 |
0,0086 |
2 |
Найдём
.
Вычислим число степеней свободы,
учитывая, что число групп выборки
.
Уровень значимости примем равным 0,01.
По таблице (см. приложения) при
и
находим вероятность
;
при
вероятность
.
Используя линейную интерполяцию,
получаем приближённое значение искомой
вероятности 0,16 > 0,01.
Следовательно,
данные наблюдений согласуются с гипотезой
о нормальном распределении генеральной
совокупности.
1
Интервал
имеет случайные концы (их называют
доверительными границами). Действительно,
в разных выборках получаются различные
значения
.
Следовательно от выборки к выборке
будут изменяться и концы доверительного
интервала, то есть доверительные границы
сами являются случайными величинами
– функциями от
.
Так как случайной величиной является
не оцениваемый параметр
,
а доверительный интервал, то более
правильно говорить не о вероятности
попадания
в доверительный интервал, а о вероятности
того, что доверительный интервал покроет
.
1
Обычно при выполнении пп. 4 – 7 используют
статистику с нормальным распределением,
статистику Стьюдента, Фишера.
2
То есть – с математическим ожиданием.
1
Критерий применяется аналогично и для
других распределений
12
Соседние файлы в папке Теор.вер. (лекции)
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Критерии согласия. Теоретические и эмпирические частоты
Эмпирические частоты получают в результате опыта (наблюдения). Теоретические частоты рассчитывают по формулам. Для нормального закона распределения их можно найти следующим образом:
где — сумма эмпирических частот; — разность между двумя соседними вариантами; — выборочное среднеквадратическое отклонение; ; — выборочная средняя арифметическая; — см. прил. 1.
Обычно эмпирические и теоретические частоты различаются. Возможно, что расхождение случайно и связано с ограниченным количеством наблюдений; возможно, что расхождение неслучайно и объясняется тем, что для вычисления теоретических частот выдвинута статистическая гипотеза о том, что генеральная совокупность распределена нормально, а в действительности это не так. Распределение генеральной совокупности, которое она имеет в силу выдвинутой гипотезы, называют теоретическим.
Возникает необходимость установить правило (критерий), которое позволяло бы судить, является ли расхождение между эмпирическим и теоретическим распределениями случайным или значимым. Если расхождение окажется случайным, то считают, что данные наблюдений (выборки) согласуются с выдвинутой гипотезой о законе распределения генеральной совокупности и, следовательно, гипотезу принимают; если же расхождение окажется значимым, то данные наблюдений не согласуются с гипотезой, и ее отвергают.
Критерием согласия называют критерий, который позволяет установить, является ли расхождение эмпирического и теоретического распределений случайным или значимым, т. е. согласуются ли данные наблюдений с выдвинутой статистической гипотезой или не согласуются.
Имеется несколько критериев согласия: критерий хи-квадрат (Пирсона), критерий Колмогорова, критерий Романовского и др. Ограничимся описанием того, как критерий применяется к проверке гипотезы о нормальном распределении генеральной совокупности (критерий применяется аналогично и для других распределений).
Допустим, что в результате наблюдений получена выборка:
значение признака ;
эмпирическая частота .
Выдвинем статистическую гипотезу: генеральная совокупность, из которой извлечена данная выборка, имеет нормальное распределение. Требуется установить, согласуется ли эмпирическое распределение с этой гипотезой. Предположим, что по формуле (11.3) вычислены теоретические частоты .Обозначим среднее арифметическое квадратов разностей между эмпирическими и теоретическими частотами, взвешенное по обратным величинам теоретических частот:
Чем больше согласуются эмпирическое и теоретическое распределения, тем меньше различаются эмпирические и теоретические частоты и тем меньше значение . Отсюда следует, что характеризует близость эмпирического и теоретического распределений. В разных опытах принимает различные, наперед неизвестные значения, т. е. является случайной величиной. Плотность вероятности этого распределения (для выборки достаточно большого объема) не зависит от проверяемого закона распределения, а зависит от параметра , называемого числом степеней свободы. При проверке гипотезы о нормальном распределении генеральной совокупности , где — число групп, на которые разбиты данные наблюдений. Существуют таблицы (прил. 6), в которых указана вероятность того, что в результате влияния случайных факторов величина примет значение не меньше вычисленного по данным выборки .
Для определенности примем уровень значимости 0,01. Если вероятность, найденная по таблицам, окажется меньше 0,01, то это означает, что в результате влияния случайных причин наступило событие, которое практически невозможно. Таким образом, тот факт, что приняло значение нельзя объяснить случайными причинами; его можно объяснить тем, что генеральная совокупность не распределена нормально и, значит, выдвинутая гипотеза о нормальном распределении генеральной совокупности должна быть отвергнута. Если вероятность, найденная по таблицам, превышает 0,01, то гипотеза о нормальном распределении генеральной совокупности согласуется с данными наблюдений и поэтому может быть принята. Полученные выводы распространяются и на другие уровни значимости.
На практике надо, чтобы объем выборки был достаточно большим и чтобы каждая группа содержала не менее 5-8 значений признака.
Для проверки гипотезы о нормальном распределении генеральной совокупности нужно:
1) вычислить теоретические частоты по формуле (11.3);
2) вычислить , где — соответственно частоты эмпирические и теоретические;
3) вычислить число степеней свободы , где — число групп, на которые разбита выборка;
4) выбрать уровень значимости;
5) найти по таблице прил. 6 по найденным и вероятность причем если эта вероятность меньше принятого уровня значимости, то гипотезу о нормальном распределении генеральной совокупности отвергают; если вероятность больше уровня значимости, то гипотезу принимают.
Пример 5. Проверить, согласуются ли данные выборки со статистической гипотезой о нормальном распределении генеральной совокупности, из которой извлечена эта выборка:
Решение. Вычислим выборочное среднее и выборочную дисперсию по формулам из первой главы этой части: . Вычислим теоретические частоты по формулам (11.3)
Найдём . Вычислим число степеней свободы, учитывая, что число групп выборки Уровень значимости примем равным 0,01. По таблице прил. 6 при и находим вероятность ; при вероятность . Используя линейную интерполяцию, получаем приближённое значение искомой вероятности .
Следовательно, данные наблюдения согласуются с гипотезой о нормальном распределении генеральной совокупности.
Математический форум (помощь с решением задач, обсуждение вопросов по математике).
Если заметили ошибку, опечатку или есть предложения, напишите в комментариях.
Проверка гипотезы о нормальном распределении генеральной совокупности
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ
Краткая теория
Проверка дискретного распределения на нормальность
Пусть
эмпирическое распределение задано в виде последовательности равноотстоящих
вариант и соответствующих им частот:
|
|
|
… |
|
|
|
|
… |
|
Требуется, используя критерий Пирсона, проверить
гипотезу о том, что генеральная совокупность
распределена нормально.
Для того,
чтобы при заданном уровне значимости
проверить гипотезу о нормальном распределении
генеральной совокупности, надо:
1. Вычислить
выборочную среднюю
и выборочное среднее квадратическое отклонение
.
2.
Вычислить теоретические частоты
где
– объем выборки,
– шаг (разность между двумя соседними
вариантами)
3. Сравнить эмпирические и теоретические частоты
с помощью критерия Пирсона. Для этого:
а)
составляют расчетную таблицу (см. пример), по которой находят наблюдаемое
значение критерия
б) по
таблице критических точек распределения
, по заданному уровню
значимости
и числу степеней свободы
(
– число групп выборки) находят критическую
точку
правосторонней критической области.
Если
– нет оснований отвергнуть гипотезу о
нормальном распределении генеральной совокупности. Если
– гипотезу отвергают.
Проверка интервального распределения на нормальность
Пусть
эмпирическое распределение задано в виде последовательности интервалов
и соответствующих им частот
.
Требуется,
используя критерий Пирсона, проверить гипотезу о том, что генеральная
совокупность
распределена нормально.
Для того,
чтобы при уровне значимости
проверить гипотезу о нормальном распределении
генеральной совокупности, надо:
1.
Вычислить выборочную среднюю
и выборочное среднее квадратическое отклонение
, причем в качестве вариант
принимают среднее арифметическое концов
интервала:
2.
Пронормировать
, то есть перейти к
случайной величине
и
вычислить концы интервалов:
причем
наименьшее значение
, то есть
полагают равным
, а наибольшее, то есть
полагают равным
.
3. Вычислить теоретические
частоты:
где
– объем выборки
– вероятности попадания
в интервалы
– функция Лапласа.
4. Сравнить эмпирические и
теоретические частоты с помощью критерия Пирсона. Для этого:
а)
составляют расчетную таблицу (см. пример), по которой находят наблюдаемое
значение критерия
б) по
таблице критических точек распределения
, по заданному уровню
значимости
и числу степеней свободы
(
– число групп выборки) находят критическую
точку
правосторонней критической области.
Если
– нет оснований отвергнуть гипотезу о
нормальном распределении генеральной совокупности. Если
– гипотезу отвергают.
Замечание.
Малочисленные частоты
следует объединить, в этом случае и
соответствующие им теоретические частоты также надо сложить. Если производилось
объединение частот, то при определении числа степеней свободы по формуле
следует в качестве
принять число групп выборки, оставшихся после
объединения частот.
Примеры решения задач
Пример 1
Используя
критерий Пирсона при уровне значимости 0,05, проверить, согласуется ли гипотеза
с нормальным распределением генеральной совокупности X с заданным эмпирическим
распределением:
xi | -4.5 | -3.5 | -2.5 | -1.5 | -0.5 | 0.5 | 1.5 | 2.5 | 3.5 | 4.5 |
ni | 1 | 4 | 21 | 30 | 63 | 59 | 34 | 18 | 5 | 2 |
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Вычислим
характеристики распределения. Для этого составим расчетную таблицу.
Выборочная средняя:
Средняя
квадратов:
Выборочная
дисперсия:
Среднее квадратическое
отклонение:
Вычислим
теоретические частоты.
Вероятность
попадания в соответствующий интервал:
Теоретические
частоты:
где
-объем выборки
Составим
расчетную таблицу:
Проверим
степень согласия эмпирического и теоретического распределения по критерию
Пирсона. Объединяем малочисленные частоты (
).
Из
расчетной таблицы
Уровень
значимости
Число
степеней свободы
По
таблице критических точек распределения:
Нет
оснований отвергнуть гипотезу о нормальном распределении генеральной
совокупности.
Пример 2
Из большой партии по схеме случайной
повторной выборки было проверено 150 изделий с целью определения процента
влажности древесины, из которой изготовлены эти изделия. Получены следующие
результаты:
Процент влажности, xi |
11-13 |
13-15 |
15-17 |
17-19 |
19-21 |
Число изделий, ni |
8 |
42 |
51 |
37 |
12 |
На уровне значимости 0,05 проверить
гипотезу о нормальном законе распределения признака (случайной величины) X, используя критерий χ2 – Пирсона.
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Составим расчетную таблицу
Средняя:
Средняя квадратов:
Дисперсия:
Исправленная дисперсия:
Исправленное среднее квадратическое
отклонение:
Вычислим теоретические частоты.
Составим расчетную таблицу:
Вероятность попадания в
соответствующий интервал:
, где
– функция Лапласа
Теоретические частоты:
, где
-объем выборки
Составим расчетную таблицу:
Проверим степень согласия
эмпирического и теоретического распределения по критерию Пирсона:
Из расчетной таблицы
Уровень значимости
Число степеней свободы
По таблице критических точек
распределения:
Нет оснований отвергать гипотезу о
распределении случайной величины по нормальному закону.
Задачи контрольных и самостоятельных работ
Задача 1
Выборка X
объемом n=100 задана таблицей:
|
0.8 | 1.1 | 1.4 | 1.7 | 2 | 2.3 | 2.6 |
|
5 | 13 | 25 | 25 | 19 | 10 | 3 |
1) Построить
полигон относительных частот
.
2) Вычислить
среднее выборочное
, выборочную дисперсию
и среднее квадратическое отклонение
.
3) Вычислить
теоретические частоты
. Построить график
на одном рисунке с полигоном.
4) С помощью
критерия χ2 проверить гипотезу о нормальном распределении
генеральной совокупности при уровне значимости α=0.05.
Задача 2
Построить
нормальную кривую по опытным данным. Рассчитать теоретические (выравнивающие) частоты
и сравнить с опытным распределением.
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 3
Выборка X
объемом N=100 измерений задана таблицей:
|
0.6 | 1.5 | 2.4 | 3.3 | 4.2 | 5.1 | 6 |
|
5 | 13 | 26 | 24 | 19 | 10 | 3 |
а)
Построить полигон относительных частот
б)
вычислить среднее выборочное
, выборочную дисперсию
и среднее квадратическое отклонение
;
в) по
критерию χ2 проверить гипотезу о
нормальном распределении генеральной совокупности при уровне значимости α=0.05.
Задача 4
Для
изучения количественного признака
из генеральной совокупности извлечена выборка
объема n, имеющая данное
статистическое распределение.
а)
Построить полигон частот по данному распределению выборки.
б) Найти
выборочное среднее
, выборочное среднее
квадратическое отклонение
и исправленное среднее квадратическое
отклонение
.
в) При
данном уровне значимости
проверить по критерию Пирсона гипотезу о
нормальном распределении генеральной совокупности.
г) В
случае принятия гипотезы о нормальном распределении генеральной совокупности
найти доверительные интервалы для математического ожидания
и среднего квадратического отклонения σ при
данном уровне надежности γ=1-α; α=0.05
|
4 | 8 | 12 | 16 | 20 | 24 | 28 | 32 |
|
5 | 9 | 15 | 19 | 20 | 16 | 10 | 6 |
Задача 5
Для выборки
объема N=100, представленной вариационным рядом
|
-1 | 0 | 1 | 2 | 3 | 4 | 5 |
|
3 | 8 | 11 | 19 | 37 | 17 | 5 |
построить
полигон относительных частот и гистограмму накопленных частот. Найти выборочное
среднее
и выборочное среднее квадратичное отклонение
. Определить доверительный интервал с
доверительной вероятностью β=0,95 для оценки математического ожидания
генеральной совокупности в предположении, что среднее квадратическое отклонение
генеральной совокупности σ равно исправленному выборочному среднему s. Проверить
гипотезу о нормальности закона распределения генеральной совокупности,
используя критерий Пирсона с уровнем значимости α=0,05.
Задача 6
Для случайной величины X составить интервальный
вариационный ряд, вычислить выборочные средние характеристики, подобрать
теоретический закон распределения, проверить его согласование с теоретическим
критерием Пирсона при α=0,05.
7 | 4 | 4 | 15 | 1 | 1 | 7 | 15 | 19 | 4 |
0 | 4 | 8 | 14 | 10 | 0 | 1 | 11 | 8 | 2 |
6 | 2 | 5 | 3 | 12 | 2 | 9 | 6 | 2 | 5 |
13 | 5 | 7 | 3 | 3 | 10 | 0 | 11 | 17 | 11 |
9 | 6 | 11 | 7 | 20 | 1 | 14 | 6 | 7 | 4 |
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 7
Данные о
продолжительности телефонных разговоров, отобранные по схеме
собственно-случайной бесповторной выборки, приведены в таблице:
Время, мин | 1.5-2.5 | 2.5-3.5 | 3.5-4.5 | 4.5-5.5 | 5.5-6.5 | 6.5-7.5 | 7.5-8.5 | 8.5-9.5 | 9.5-10.5 | Итого |
Число разговоров | 3 | 4 | 9 | 14 | 37 | 12 | 8 | 8 | 5 | 100 |
Используя χ2-критерий Пирсона при уровне
значимости α=0.05 проверить гипотезу о том, что случайная величина X –
продолжительность телефонных разговоров – распределена по нормальному закону.
Построить на одном чертеже гистограмму и соответствующую нормальную кривую.
Задача 8
Распределение
случайной величины X – заработной платы сотрудников на фирме (в у.е.) –
задано в виде интервального ряда:
Найти:
. Построить теоретическое
нормальное распределение и сравнить его с эмпирическим с помощью критерия
согласия Пирсона χ2 при α=0,05.
Задача 9
Записать для выборки интервальное
распределение, построить гистограмму относительных частот. По критерию Пирсона
проверить гипотезу нормальном распределении.
7.81 | 3.15 | 2.27 | 32.64 | 4.72 | 5.33 | 8.51 | 7.72 | 30.23 | 20.12 |
9.83 | 8.33 | 9.61 | 31.83 | 8.52 | 27.22 | 27.22 | 8.43 | 15.91 | 25.46 |
24.82 | 26.54 | 46.73 | 17.31 | 13.05 | 53.24 | 5.23 | 18.28 | 40.93 | 17.44 |
32.34 | 28.26 | 9.75 | 3.72 | 8.16 | 22.91 | 0.74 | 12.97 | 12.05 | 1.53 |
43.15 | 45.57 | 2.02 | 32.23 | 8.67 | 4.83 | 9.12 | 6.77 | 6.48 | 19.22 |
36.42 | 47.81 | 40.64 | 5.45 | 0.21 | 26.51 | 17.36 | 3.62 | 15.57 | 23.21 |
58.73 | 62.52 | 10.15 | 38.36 | 35.55 | 6.10 | 3.04 | 4.54 | 1.95 | 5.24 |
64.71 | 67.63 | 1.21 | 0.81 | 2.03 | 10.17 | 5.51 | 8.35 | 43.76 | 8.74 |
4.72 | 17.54 | 17.32 | 29.43 | 5.91 | 6.92 | 4.72 | 16.04 | 57.54 | 15.46 |
13.31 | 36.45 | 3.45 | 16.15 | 15.77 | 2.43 | 14.24 | 2.25 | 15.63 | 23.72 |
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 10
Результаты наблюдений над случайной
величиной
оказались
лежащими на отрезке
и были
сгруппированы в 10 равновеликих интервалов. Значения
и частоты
попадания в интервалы приведены в таблице. Построить: гистограмму частот,
эмпирическую функцию распределения, найти медиану. Найти выборочное среднее
и исправленное
среднеквадратическое отклонение
. Указать 95-процентные доверительные интервалы для
. С помощью критерия Пирсона проверить гипотезу о
нормальном (с параметрами
) законе распределения (уровень значимости α=0.02
.
Задача 11
В таблице приведены результаты
измерения роста (см.) случайно отобранных 100 студентов:
Интервалы роста |
154-158 | 158-162 | 162-166 | 166-170 | 170-174 | 174-178 | 178-182 |
Число студентов,
|
10 | 14 | 26 | 28 | 12 | 8 | 2 |
С помощью критерия Пирсона при
уровне значимости α=0.05 проверить правдоподобие гипотезы о нормальном
распределении роста студентов.
Задача 12
При массовых стрельбах из пушек для
одинаковых общих условий были зафиксированы продольные ошибки (м) попадания
снарядов в цель:
На уровне значимости 0,05 проверить
гипотезу о нормальном законе распределения признака (случайной величины) L, используя критерий χ2– Пирсона.
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ
Эмпирические и выравнивающие частоты
Дискретное распределение.
Рассмотрим дискретную случайную величину , закон распределения которой неизвестен. Пусть произведено испытаний, в которых величина приняла раз значение , раза – значение раз – значение , причем
Определение 5. Эмпирическими частотами называют фактически наблюдаемые частоты .
Предположим, что у нас имеются основания предположить, что изучаемая величина распределена по некоторому определенному закону. Для того, чтобы проверить, согласуется ли это предположение с данными наблюдений, вычисляют частоты наблюдаемых значений, то есть находят теоретически сколько раз величина должна была принять каждое из наблюдаемых значений, если она распределена по наблюдаемому закону.
Определение 6. Выравнивающими (теоретическими), в отличии от фактически наблюдаемых эмпирических частот, называют частоты , найденные теоретически (вычислениями). Их находят по соотношению
где: число испытаний;
вероятность наблюдаемого значения , вычисленная при допущении, что имеет предполагаемое распределение.
Непрерывное распределение.
В случае непрерывного распределения, вероятности отдельных возможных значений равны нулю. Поэтому весь интервал возможных значений делят на непересекающихся интервалов и вычисляют вероятности попадания в й частичный интервал, а затем, как и для дискретного распределения, умножают число испытаний на эти вероятности.
Итак, выравнивающие частоты непрерывного распределения находят по соотношению:
где: число испытаний;
вероятность наблюдаемого значения , вычисленная при допущении, что имеет предполагаемое распределение.
В частности, если имеются основания предположить, что случайная величина (генеральная совокупность) распределена нормально, то выравнивающие частоты могут быть найдены по формуле
(IV.6)
где: число испытаний (объем выборки);
длина частичного интервала;
выборочное среднее квадратическое отклонение;
середина го частичного интервала
Замечание: Как известно, дифференциальная функция (функция плотности распределения вероятностей) общего нормального распределения имеет следующий вид
(IV.7)
При и получим дифференциальную функцию нормированного распределения
или, заменив обозначение аргумента
Далее, положив, имеем
(IV.8)
Сравнивая (IV.7) и (IV.8), можно сделать заключение, что
Если математическое ожидание и среднее квадратическое отклонение неизвестны, то в качестве оценок этих параметров принимают соответственно выборочную среднюю и выборочное среднее квадратическое отклонение Тогда
где
Пусть середина го частичного интервала (на которые разбита совокупность всех наблюдаемых значений нормально распределенной случайной величины ) длиною Тогда вероятность попадания в этот интервал приближенно равна произведению длины интервала на значение дифференциальной функции в любой точке интервала и, в частности, при
Следовательно, выравнивающая частота
где
Таким образом, формула (IV.5) получена.
Содержание:
Законы распределения:
Распределение случайных переменных: Каждая из случайных переменных имеет ряд возможных значений, могущих возникнуть с определенной вероятностью.
Случайные переменные величины могут носить прерывный (дискретный) и непрерывный характер. Возможные значения прерывной случайной переменной отделены друг от друга конечными интервалами. Возможные значения непрерывной случайной переменной не могут быть заранее перечислены и непрерывно заполняют некоторый промежуток.
Примерами прерывных случайных переменных могут служить:
- число попаданий при п выстрелах, если известна вероятность попадания при 1 выстреле. Число попаданий может быть 0, 1, 2….. n;
- число появлений герба при n бросаниях монеты.
Примеры непрерывных случайных переменных:
- ошибка измерения;
- дальность полета снаряда.
Если перечислить все возможные значения случайной переменной и указать вероятности этих значений, то получится распределение случайной переменной. Распределение случайной переменной указывает на соотношение между отдельными значениями случайной величины и их вероятностями.
Распределение случайной переменной будет задано законом распределения, если точно указать, какой вероятностью обладает каждое значение случайной переменной.
Закон распределения имеет чаще всего табличную -форму изложения. В этом случае перечисляются все возможные значения случайной переменной и соответствующие им вероятности:
Такая таблица называется также рядом распределения случайной переменной.
Для наглядности ряд распределения изображают графически, откладывая на прямоугольной системе координат по оси абсцисс возможные значения случайной переменной, а по оси ординат — их вероятности. В результате графического изображения получается многоугольник или полигон распределения (график 1). Многоугольник распределения является одной из форм закона распределения.
Функция распределения
Ряд распределения является исчерпывающей характеристикой прерывной случайной перемен-
Вероятность того, что Х<х, зависит от текущей переменной х и является функцией от х. Эта функция носит название функции распределения случайной переменной X.
F(x) = P(X
Функция распределения является одной из форм выражения закона распределения. Она является универсальной характеристикой случайной переменной и может существовать для прерывных и непрерывных случайных переменных.
Функция распределения F(x) называется также интегральной функцией распределения, или интегральным законом распределения.
Основные свойства функции распределения могут быть сформулированы так:
- F(x) всегда неотрицательная функция, т. е.
- Так как вероятность не может быть больше единицы, то
- Ввиду того что F(x) является неубывающей функцией, то при
- Предельное значение функции распределения при х= равно нулю, а при х= равно единице.
Если случайная переменная X дискретна и задана рядом распределения, то для нахождения F(x) для каждого х необходимо найти сумму вероятностей значений X, которые лежат до точки х.
Графическое изображение функции распределения представляет собой некоторую неубывающую кривую, значения которой начинаются с 0 и доходят до 1.
В случае дискретной случайной переменной величины вероятность F(x) увеличивается скачками всякий раз, когда х при своем изменении проходит через одно из возможных значений величины X. Между двумя соседними значениями функция F(x) постоянна. Поэтому графически функция F(x) в этом случае будет изображена в виде ступенчатой кривой (см. график 2).
В случае непрерывной случайной переменной величины функция F(x) при графическом изображении дает плавную, монотонно возрастающую кривую следующего вида (см. график 3).
Обычно функция распределения непрерывной случайной переменной представляет собой функцию, непрерывную во всех точках. Эта функция является также дифференцируемой функцией. График функции распределения такой случайной переменной является плавной кривой и имеет касательную в любой ее точке.
Плотность распределения
Если для непрерывной случайной переменной X с функцией распределения F(x) вычислять вероятность попадания ее на участок от х до х+ х, т. е. то оказывается, что эта вероятность равна приращению функции распределения на этом участке, т. е.
Если величину полагать бесконечно малой величиной и находить отношение вероятности попадания на участок к длине участка, то величину отношения в пределе можно выразить так:
т. е. производной от функции распределения, которая характеризует плотность, с которой распределяются значения случайной переменной в данной точке. Эта функция называется плотностью распределения и часто обозначается f(x). Ее называют также дифференциальной функцией распределения, или дифференциальным законом распределения.
Таким образом, функция плотности распределения f(x) является производной интегральной функции распределения F(x).
Вероятность того, что случайная переменная X примет значение, лежащее в границах от а до 6, равна определенному интегралу в тех же пределах от плотности вероятности, или:
Кривая, изображающая плотность распределения случайной переменной, называется кривой распределения (дифференциальной).
Построим кривую некоторой заданной функции плотности вероятности и найдем участок, ограниченный абсциссами а и b. Площадь, ограниченная соответствующими ординатами кривой распределения самой кривой и осью абсцисс, и отобразит вероятность того, что случайная переменная будет находиться в данных пределах (см. график 4).
Плотность распределения является одной из форм закона распределения, но существует только для непрерывных случайных величин.
Основные свойства плотности распределения могут быть сформулированы так:
1. Плотность распределения есть функция, не могущая принимать отрицательных значений, т. е.
Отсюда в геометрическом изображении плотности распределения (в кривой распределения) не может быть точек, лежащих ниже оси абсцисс.
2. Следовательно, вся площадь, ограниченная кривой распределения и осью абсцисс, равна единице.
Среди законов распределения большое значение имеют биномиальное распределение, распределение Пуассона и нормальное распределение.
Биномиальное распределение
Если производится n независимых испытаний, в каждом из которых вероятность появления данного события А есть величина постоянная, равная р, и, следовательно, вероятность непоявления события А также постоянна и равна q=1—р, то число появлений события А во всех n испытаниях представляет собой случайную переменную. Вероятность того, что событие А появится в n испытаниях m раз, равна:
т. е. m+1, члену разложения бинома Здесь q+p=1 и, следовательно, —число сочетаний из n элементов по m. Теорема верна для любых m, в том числе и для m = 0 и m=n. Вероятность появления события А образует распределение вероятностей случайной переменной m.
Ввиду того что вероятности связаны с разложением бинома распределение случайной переменной m называется биномиальным распределением. Биномиальное распределение является распределением дискретной случайной переменной, поскольку величины m могут принимать только вполне определенные целые значения.
График биномиального распределения, на котором по оси абсцисс откладываются числа наступлений события, а по оси ординат — вероятности этих чисел, представляет собой ломаную линию. Форма графика зависит от значений р, q и n.
Если р и q одинаковы, то график распределения симметричен. Если же р и q неодинаковы, то график распределения будет скошенным.
Одна из частот на графике имеет максимальное значение. Это наиболее вероятная частота. Ее значение можно определить приближенно, аналитически как произведение nр.
Найдем вероятности числа наступления события А при 20 испытаниях при p = 0,1 и р = 0,4 и построим график их распределений (см. график 5). Найдем вероятности частот при n = 20 для p = 0,1 и р=0,4.
График показывает, что приближение р к 0,5 вносит в распределение большую симметрию. Оказывается также, что при увеличении n распределение становится симметричным и для
Биномиальное распределение имеет широкое распространение в практической деятельности людей. Например, продолжительное наблюдение за качеством выпускаемой заводом продукции показало, что p-я часть ее является браком. Иначе говоря, мы выражаем через р вероятность для любого изделия оказаться бракованным. Биномиальное распределение показывает вероятность того, что в партии, содержащей n изделий, окажется m бракованных, где m = 0, 1, 2, 3 … n.
Предположим, имеется 100 изделий из партии изделий, в ко торой доля брака равна 0,05. Вероятность того, что из этих из делий окажется 10 бракованных, равна:
Закон биномиального распределения называется также схемой Бернулли. .
Нормальное распределение
Расчет вероятностей по формуле биномиального распределения при больших n очень громоздок. При этом значении m прерывны, и нет возможности аналитически отыскать их сумму в некоторых границах. Лаплас нашел закон распределения, являющийся предельным законом при неограниченном возрастании числа испытаний n и называемый законом нормального распределения.
Плотность вероятности нормального распределения выражается при этом формулой:
где t представляет собой нормированное отклонение частоты т от наиболее вероятной частоты nр, т. е. — среднее квадратическое отклонение случайной переменной m. Графическое изображение плотности распределения f(t) дает кривую нормального распределения (см. график 6).
Максимальная ордината кривой соответствует точке m=nр, т. е. математическому ожиданию случайной переменной m; величина этой ординаты равна .
Для практического нахождения вероятностей используют таблицу значений f(t).
Эмпирические и теоретические распределения
В примерах распределений, приведенных в разделе I, мы пользовались данными, почерпнутыми из наблюдений.
Поэтому всякий наблюденный ряд распределения назовем эмпирическим, а график, изображающий распределение
частот этого ряда, — эмпирической кривой распределения. Эмпирические кривые распределения могут быть представлены полигоном и гистограммой. При этом изображение в виде полигона применяется для рядов с прерывными значениями признака, а гистограмма— для рядов с непрерывными значениями признака.
Наблюдая многочисленные ряды распределения, математики стремятся описать эти распределения путем анализа образования величины признака, пытаются построить теоретическое распределение, исходя из данных об эмпирическом распределении.
Мы уже видели на примере распределения случайной переменной, что распределение ее задается законом распределения. Закон распределения, заданный в виде функции распределения, позволяет математически описать ряды распределения некоторых совокупностей.
Теоретическим законом распределения многих совокупностей, наблюдаемых на практике, является нормальное распределение. Иначе говоря, многие эмпирические подчинены закону нормального распределения, функция плотности вероятности которого приведена в предыдущем параграфе.
Чтобы эту формулу применять для нахождения теоретических данных по некоторому эмпирическому ряду, необходимо вероятностные характеристики заменить данными эмпирического ряда. При этой замене величина стандартизованного отклонения t будет представлять собой где х— текущие значения случайной переменной X, а и — соответствующие характеристики эмпирического распределения, а именно средняя арифметическая и среднее квадратическое отклонение.
Следовательно, нормальное распределение ряда распределения зависит от величин средней арифметической и его среднего квадратического отклонения.
Свойства кривой нормального распределения
Дифференциальный закон нормального распределения, заданный функцией:
имеет ряд свойств. Полагая =1, тем самым будем иметь измерение варьирующего признака в единицах среднего квадратического отклонения. Тогда функция нормального распределения упростится и примет вид:
Рассмотрим ее свойства.
- Кривая нормального распределения имеет ветви, удаленные в бесконечность, причем кривая асимптотически приближается к оси Ot.
- Функция является четной: t(—t) = f(t). Следовательно, кривая нормального распределения симметрична относительно оси Оу.
- Функция имеет максимум при t = 0. Величина этого максимума равна
Следовательно, модального значения кривая
достигает при t = 0, а так как то при
Наибольшую частоту кривая будет иметь при значении х, равном среднему арифметическому из отдельных вариантов. Средняя арифметическая является центром группирования частот ряда.
4. При t=±1 функция имеет точки перегиба. Это означает, что кривая имеет точки перегиба при отклонениях от центра
группирования равных среднему квадратическому отклонению.
5. Сумма частостей, лежащих в пределах от а до b, равна определенному интегралу в тех же пределах от функции f(t), т. е.
Если учесть действительную величину среднего квадратического отклонения, то окажется, что при больших величинах о значение f(t) мало, при малых, наоборот, велико. Отсюда изменяется и форма кривой распределения. При больших кривая нормального распределения становится плоской, растягиваясь вдоль оси абсцисс. При уменьшении кривая распределения вытягивается вверх и сжимается с боков.
На графике 7 показаны 3 кривые нормального распределения (I, II, III) при из них кривая I соответствует самому большому, а кривая III—самому малому значению
Зная общие свойства кривой нормального распределения, рассмотрим те условия, которые приводят к образованию кривых данного типа.
Формирование нормального распределения
Закон нормального распределения является наиболее распространенным законом не только потому, что он наиболее часто встречается, но и потому, что он является предельным законом распределения, к которому приближается ряд других законов распределения.
Нормальное распределение образуется в том случае, когда действует большое число независимых (или слабо зависимых), случайных причин. Подчиненность закону нормального распределения проявляется тем точнее, чем больше случайных величин действует вместе. Основное условие формирования нормального распределения состоит в том, чтобы все случайные величины, действующие вместе, играли в общей сумме примерно одинаковую роль. Если одна из случайных ошибок окажется по своему влиянию резко превалирующей над другими, то закон распределения будет обусловлен действием этой величины.
Если есть основания рассматривать изучаемую величину как сумму многих независимых слагаемых, то при соблюдении указанного выше условия ее распределение будет нормальным, независимо от характера распределения слагаемых.
Нормальное распределение встречается часто в биологических явлениях, отклонениях размеров изделий от их среднего размера, погрешностях измерения и т. д.
Если взять распределение людей по номеру носимой ими обуви, то это распределение будет нормальным. Но это правило применимо только в том случае, когда численность совокупности велика и сама совокупность однородна.
Из того факта, что нормальное распределение встречается нередко в разных областях, не следует, что всякий признак распределяется нормально. Наряду с нормальным распределением существуют другие различные распределения.
Но все же умение выявить нормальное распределение в некоторой эмпирической совокупности является важным условием для ряда практических расчетов и действий. Зная, что эмпирическое распределение является нормальным, можно определить оптимальные размеры предприятий, размеры резервов и т. д.
Важным условием определения характера данной эмпирической кривой является построение на основе эмпирических данных теоретического нормального распределения.
Построение кривой нормального распределения
Первый способ. Для того чтобы построить кривую нормального распределения, пользуются следующей егo формулой:
где N — число проведенных испытаний, равное сумме частот эмпирического распределения
k — величина интервала дробления эмпирического ряда распределения;
— среднее квадратическое отклонение ряда;
t—нормированное отклонение, т. е.
Величина табулирована и может быть найдена по таблице (см. приложение II).
Для нахождения значений теоретических частот (см. пример 1) сначала необходимо найти среднюю арифметическую эмпирического ряда распределения, т. е. для чего находим произведения хm. Затем находим дисперсию ряда, вос-пользовавшись формулой Поскольку средняя уже найдена, остается найти для чего по каждой строке находим (графы 4 и 5). Затем определяем величину t, последовательно записывая для каждой строки и (графы 6 и 7). Графа 7 дает величину t по строкам. Из таблицы значений f(t) (см. приложение II) для данных в графе 7 найдем соответствующие величины (графа 8). Осталось найденные величины умножить на общий для всех строк множитель
Найденная при умножении величина и составляет теоретическую частоту каждого варианта, записанного в строке (графа 9). Ввиду того что частоты могут быть только целыми числами, округляем их до целых и получим теоретические частоты, которые будем обозначать (графа 10).
Пример 1.
В таблице 3 приведено эмпирическое распределение веса 500 спиралей и расчет частот нормального распределения. (Вес спиралей х дан в миллиграммах.)
Из таблицы находим:
Строим график эмпирических и теоретических данных. На графике 8 сплошной линией дано изображение эмпирического распределения, а пунктирной — построенного на его основе теоретического распределения.
Пример 2.
В таблице 4 дается эмпирическое распределение ПО замеров межцентрового расстояния при шевинговании зубцов динамомашины 110412 и расчет теоретических частот.
Исчислим:
Построим графики эмпирического и теоретического распределений (см. график 9).
Оба эмпирических распределения хорошо воспроизводятся теоретическим нормальным распределением.
Второй способ построения кривой нормального распределения основан на применении функции стандартизованного нормального распределения, в котором = 1, т. е. величина наибольшей ординаты принимается за единицу.
За начало отсчета признака при этом способе построения берется его средняя арифметическая. Ей соответствует наибольшая ордината.
Вычисление ординат производится по формуле:
где N — число наблюдений;
k — величина интервала эмпирического распределения.
Так как значение наибольшей ординаты получается при
t = 0, когда то величина наибольшей ординаты будет:
Придавая t последовательно значения 0,5; 1,0; 1,5; 2,0, т. е. сначала меньшие, а потом увеличивающиеся, находим в таблице стандартизованного нормального распределения для данных t соответствующие и, умножив полученную величину на значение наибольшей ординаты, будем иметь ординаты для этих значений t.
Например, при t = 0,5 величина стандартизованного нормального распределения= 0,8825. Так как величина наибольшей ординаты то величина ординаты в точке t = 0,5 будет равна:
Пример 3.
Взяты результаты измерения 100 отклонений шага резьбы х от всей длины резьбы. Получен следующий ряд распределения, для которого по общим правилам производится расчет средней и дисперсии.
Отсюда;
Рассчитаем наибольшую ординату:
так как величина то:
Взяв значение t = 0,5 по таблице стандартизованного нормального распределения, находим При t = 0,5 оно равно 0,88251. Это и есть коэффициент, который при умножении на значение наибольшей ординаты дает величину ординаты в этой точке. Потом аналогично находим ординаты для t = ± 1 и т. д.
Для данного примера будем иметь:
Полученный результат наносим на график, а для сравнения наносим на график и результаты непосредственных измерений отклонений (см. график 10).
Как видно из графика, теоретическая кривая довольно близко воспроизводит полигон эмпирического распределения.
Пример 4.
Даны результаты измерений отклонений шага резьбы (х) в микронах на 1 витке от среднего значения. Приводятся эти данные с соответствующими расчетами:
Теоретические частоты (ординаты) рассчитываются так же, как и в предыдущем примере. Сначала находится величина наибольшей частоты:
затем другие частоты:
Эмпирические и теоретические частоты наносим на график (см. график 11) и убеждаемся, что эмпирическое распределение довольно близко воспроизводится теоретическим распределением.
Третий способ построения кривой нормального распределения (или вычисления теоретических частот) по имеющимся эмпирическим данным основан на применении функции:
которая дает площадь нормальной кривой, заключенной между —t и +t.
Вообще говоря, можно находить площадь нормальной кривой, заключенную между любыми точками как
применяя функцию F(t). Искомая площадь будет представлять собой причем для отрицательных t надо брать F(t) со знаком минус.
Пример 5.
Получены результаты 208 измерений межцентровых расстояний при шевинговании зубцов шестерни динамо-машины (см. табл. 7). Вычислим нужные параметры и теоретические частоты и построим графики эмпирического и теоретического распределений.
Колонки 1, 2, 3, 4 и 5 необходимы для расчетов и в колонке 6 рассчитаны отклонения концов интервалов от средней, в колонке 7 — величина стандартизованного отклонения Колонка 8 содержит значения F(t), взятые из приложения III, умноженные на т. е. на 104. В верхней строке приведено и значение t для конца интервала, предшествующего первому, т. е.
Чтобы получить теоретическую частоту для каждого интервала, достаточно из верхней строки (в 8-й колонке) вычесть число той же колонки, стоящее строкой ниже.
На графике 12 показано, что теоретическое распределение достаточно точно отражает эмпирически полученный материал, только наблюдается некоторое смещение теоретической кривой вправо, что, очевидно, вызвано большим удельным весом правого конца эмпирического распределения.
Пример 6.
Дается ряд распределения ударной вязкости в 240 испытаниях. Приведем этот ряд распределения и построим для него теоретическое распределение (см. график 13).
Критерии согласия
Определение близости эмпирических распределений к теоретическому нормальному распределению по графику может быть недостаточно точным, субъективным и по-разному оценивать расхождения между ними. Поэтому математики выработали ряд объективных оценок для того, чтобы определить, является ли данное эмпирическое распределение нормальным. Такие оценки называются критериями согласия. Критерии согласия были предложены разными учеными, занимавшимися этим вопросом. Рассмотрим критерии согласия Пирсона, Романовского, Колмогорова и Ястремского.
Критерий согласия Пирсона основан на определении величины которая вычисляется как сумма квадратов разностей эмпирических и теоретических частот, отнесенных к теоретическим частотам, т. е.
где m — эмпирические частоты;
m’ — теоретические частоты.
Для оценки того, насколько данное эмпирическое распределение воспроизводится нормальным распределением, исчисляют по распределению Пирсона вероятности достижения данного значения
Значения вычислены для разных табулированы и приводятся в приложении VI, в котором дается комбинационная таблица, где одним из аргументов (данные по строкам) являются значения а по другим (по столбцам) —значения k — число степеней свободы варьирования эмпирического распределения. Число степеней свободы вариации определяется для данного ряда распределения и равно числу групп в нем минус число исчисленных статистических характеристик (средняя, дисперсия, моменты распределения и т. д.), использованных при вычислении теоретического распределения.
Пересечение данного столбца с соответствующей строкой дает искомую вероятность
При вероятностях, значительно отличающихся от нуля, расхождение между теоретическими и эмпирическими частотами можно считать случайным.
Проф. В. И. Романовский предложил более простой метод оценки близости эмпирического распределения к нормальному, используя величину
Он предложил вычислять отношение:
где k — число степеней свободы.
Если указанное отношение имеет абсолютное значение, меньшее трех, то предлагается расхождение между теоретическим и эмпирическим распределениями считать несущественным; если же это отношение больше трех, то расхождение существенно. Несущественность расхождения (когда величина отношения Романовского меньше трех) говорит о возможности принять за закон данного эмпирического распределения нормальное распределение.
По данным примера 2 рассчитаем величину
Пример 7.
Вычисление Для распределения межцентрового расстояния в НО наблюдениях:
Из таблицы (приложение VI) для = 12 и k = 12 находим вероятность =0,4457; она достаточно велика, значит расхождение между теоретическими и эмпирическими частотами можно считать случайными, а распределение — подчиняющимся закону нормального распределения.
Находим отношение Романовского:
Это отношение значительно меньше трех, поэтому расхождение между теоретическими и эмпирическими частотами можно считать несущественными, и, таким образом, теоретическое распределение достаточно хорошо воспроизводит эмпирическое.
Пример 8.
Вычислим критерий Для распределения веса 500 спиралей.
По таблице находим вероятность = 0,9834, которая близка к достоверности, и поэтому расхождение между теоретическим и эмпирическим распределением может быть случайным.
Отношение Романовского
также значительно меньше трех, поэтому теоретическое воспро* изведение эмпирического ряда достаточно удовлетворительное.
Критерий Колмогорова. Критерий , предложенный А. Н. Колмогоровым, устанавливает близость теоретических и эмпирических распределений путем сравнения их интегральных распределений. исчисляется исходя из D — максимального верхнего предела абсолютного значения разности их накопленных частот, отнесенного к квадратному корню из числа наблюдений N:
где D — максимальная граница разности: — накопленных теоретических частот и М— накопленных эмпирических частот.
Приведем таблицу значений —вероятности того, что достигнет данной величины.
Если найденному значению соответствует очень малая вероятность то расхождение между эмпирическим и теоретическим распределением нельзя считать случайным и, таким образом, первое мало отражает второе. Наоборот, если — величина значительная (больше 0,05), то расхождение между частотами может быть случайным и распределения хорошо соответствуют одно другому.
Рассмотрим применение этого критерия на двух примерах.
Пример 9.
В таблице вероятностей находим для
Эта большая вероятность указывает на то, что расхождение между наблюдением и теоретическим распределением вполне могло быть случайным.
Пример 10.
Величина вероятности показывает несущественность расхождений между теоретическим и эмпирическим распределением.
Критерий Б. С. Ястремского. В общем виде критерий Ястремского можно записать следующим неравенством:
где
- — эмпирические частоты;
- — теоретические частоты;
- — число групп.
Для числа групп, меньших 20, = 0,6; q = 1 — р.
Значение I, меньшее в критерии Ястремского показывает несущественность расхождения между эмпирическими и теоретическими частотами в данном распределении.
При значениях I, больших расхождение между теоретическим и эмпирическим распределением существенно.
Пример 11.
Определим величину I и оценим эмпирическое распределение 500 спиралей (m) по сравнению с соответствующим нормальным (m’).
что говорит о нормальном распределении исследуемой совокупности.
Элементарные приемы определения «нормальности» распределения. Для определения элементарными способами близости данного опытного распределения к нормальному прибегают к числам Вестергарда и к сравнению средней арифметической, моды и медианы.
Числами Вестергарда являются: 0,3; 0,7; 1,1; 3. Для пользования ими определяют сначала основные характеристики — среднюю арифметическую и среднее квадратическое отклонение
Для того чтобы данное эмпирическое распределение было подчинено закону нормального распределения, необходимо, чтобы распределение удовлетворяло следующим условиям:
- в промежутке от была расположена часть всей совокупности;
- в промежутке от была расположена часть всей совокупности;
- в промежутке от было расположено всей совокупности;
- в промежутках от —3 до +3 было расположено 0,998 всей совокупности.
Для приводимого распределения 500 спиралей по весу (пример 1) все эти условия соблюдаются, что говорит о подчинении данного распределения закону нормального распределения.
К элементарным приемам определения «нормальности» следует отнести применение графического метода, особенно удобное с помощью полулогарифмической сетки Турбина. На сетке накопленные эмпирические частоты при нормальном их распределении дают прямую линию. Всякое отклонение от прямой свидетельствует об отклонении эмпирического распределения от «нормального».
Распределение Пуассона
Вероятности частот событий, редко встречающихся при некотором числе испытаний, находят по формуле:
где m — частота данного события;
n — число испытаний;
р — вероятность события при одном испытании;
е= 2,71828.
Это выражение носит название закона распределения Пуассона.
Подставим вместо nр среднее число фактически наблюдавшихся случаев в эмпирическом материале. Теоретические ординаты кривой распределения по закону Пуассона m’ найдем по формуле:
где х — переменное значение числа раз;
— среднее число раз в эмпирическом распределении;
n — число наблюдений.
При
Пример 12.
Наблюдалось следующее распределение растений сорняков в 1000 выборках посевов гороха. Результаты эксперимента записаны в следующей таблице:
Определим по закону Пуассона теоретические частоты разного числа растений сорняков. Для этого предварительно исчислим среднее число растений сорняков в одной выборке:
Из таблицы находим
Определим теоретическое число выборок, в которых число растений сорняков будет равно 0:
то же:
для числа растений сорняков, равного 1:
для числа растений сорняков, равного 2:
для числа растений сорняков, равного 3:
для числа растений сорняков более 3:
Графическое сопоставление обоих распределений говорит о соответствии между эмпирическим и теоретическим распределениями.
Распределение Максвелла
В технике часто встречается распределение по закону Максвелла. Это — распределение существенно положительных величин. Например, эмпирическое распределение эксцентриситетов биений теоретически воспроизводится распределением Максвелла.
Дифференциальный закон распределения Максвелла выражается следующей формулой:
где — параметр распределения, равный
Интегральный закон распределения выразится тогда:
Пример 13.
Заимствуем из книги А. М. Длина таблицу распределения симметричности гнезд относительно торцов в круглых плашках (в 0,01 мм) и проведем дополнительные расчеты.
Из этой таблицы легко определим среднюю симметричность:
и параметр рассеяния:
Формула интегрального распределения по закону Максвелла позволяет найти накопленные, а затем теоретические частости и частоты.
Изобразим на графике 15 данные эмпирического и теоретического рядов распределения.
Определим близость их по критерию согласия Ястремского. Для этого приведем в табл. 18 расчет величины С:
По критерию Ястремского находим
Величина I значительно меньше 3. Следовательно, данное эм лирическое распределение хорошо согласуется с законом распределения Максвелла.
- Дисперсионный анализ
- Математическая обработка динамических рядов
- Корреляция – определение и вычисление
- Элементы теории ошибок
- Статистические оценки
- Теория статистической проверки гипотез
- Линейный регрессионный анализ
- Вариационный ряд