Как составить безынтервальный вариационный ряд

Содержание:

Предмет математической статистики (МС) – любой объект, изучаемый с количественной стороны в целях более точной оценки его качественного состояния.

При этом имеются в виду групповые объекты, т.е. явления массовые, в сфере которых проявляют свое действие статистические законы.

Единица наблюдения – составной элемент или член группового объекта.

Статистическая совокупность – множество относительно однородных, но индивидуально различимых единиц, объединенных для совместного (группового) изучения. Например, недопустимо изучать показатели изменчивости человеческого организма, объединяя в одну совокупность людей разного возраста и пола.

Статистический комплекс слагается из разнородных групп, каждая из которых состоит из однородных элементов, для совместного (комплексного) изучения. Вопрос о форме объединения экспериментатор решает сам в зависимости от объекта и цели исследования.

Признак – свойство, проявлением которого один предмет отличается от другого.

Пример:

Исследуется признак Методы математической статистики - определение и вычисление с примерами решения

Характерное свойство признаков – варьирование величины признака в определенных пределах. Эти колебания величины одного и того же признака, наблюдаемые в массе однородных элементов статистической совокупности, называются вариациями, а отдельные числовые значения варьирующего признака называются вариантами.

Признаки делятся на качественные (атрибутивные) и количественные.

Качественные признаки не поддаются непосредственному измерению и учитываются по наличию их свойств у отдельных членов изучаемой группы.

Пример:

Признак Методы математической статистики - определение и вычисление с примерами решения

Количественные признаки поддаются непосредственному измерению или счету. Их делят на мерные и счетные.

Мерные признаки варьируют непрерывно, их величина может принимать в определенных пределах (от – до) любые числовые значения. Аналог мерного признака в теории вероятностей есть непрерывная случайная величина.

Счетные признаки варьируют прерывисто (дискретно), их числовые значения часто выражаются целыми числами (число зерен в колосьях и т.п.).

Аналогом счетного признака в теории вероятности является дискретная случайная величина.

Признаки обозначаем так же, как случайные величины: Методы математической статистики - определение и вычисление с примерами решения их варианты соответственно Методы математической статистики - определение и вычисление с примерами решения

Признаки варьируют под влиянием различных, в том числе и случайных причин. Наряду с естественным варьированием на величине признака сказываются и ошибки, неизбежно возникающие при измерении изучаемых объектов.

Погрешность или ошибка – разница между результатами измерений и действительно существующими значениями измеряемого признака.

Технические ошибки – связаны с неточностью измерительных приборов и инструментов.

Личные ошибки возникают из-за личных качеств исследователя, его навыков и мастерства.

Случайные ошибки возникают из-за целого ряда других, не поддающихся регулированию и неустранимых причин.

Технические + личные ошибки = систематические ошибки. Их можно преодолеть соответствующими методами.

Случайные ошибки, как независимые от воли человека, остаются и сказываются на результатах наблюдений. Следовательно, варьирование признака складывается из естественной изменчивости признака и ошибок измерений.

При измерении количественного признака и при вычислении его характеристик применяются два вида округления:

  • –    округление с недостатком: если за последней сохраняемой цифрой следуют цифры 0, 1,2, 4, то они отбрасываются. Например, точность измерения Методы математической статистики - определение и вычисление с примерами решения т.е. последняя сохраняемая цифра – вторая после запятой. Тогда Методы математической статистики - определение и вычисление с примерами решенияМетоды математической статистики - определение и вычисление с примерами решения
  • –    округление с избытком: если за последней сохраняемой цифрой следуют цифры 5, 6, 7, 8, 9, то последняя сохраняемая цифра увеличивается на единицу. Например, Методы математической статистики - определение и вычисление с примерами решения

Наблюдения над объектами могут охватывать все члены изучаемой совокупности без единого исключения или ограничиваться обследованием лишь некоторой части данной совокупности.

В первом случае наблюдения полные или сплошные, во втором – частичные или выборочные.

Полное обследование совокупности позволяет получить исчерпывающую информацию об объекте, но требует больших затрат времени, труда, ресурсов и в некоторых случаях невозможно или нецелесообразно. Например, чтобы определить всхожесть партии семян, нецелесообразно высеивать всю партию. Невозможно учесть всех обитателей фитопланктона для небольшого водоема и т.п.

Определение. Генеральной совокупностью называется вся совокупность объектов для изучения.

Выборкой или выборочной совокупностью называется отобранная тем или иным способом часть генеральной совокупности.

Количество членов генеральной совокупности обозначается Методы математической статистики - определение и вычисление с примерами решения теоретически Методы математической статистики - определение и вычисление с примерами решения Объем выборки обозначается Методы математической статистики - определение и вычисление с примерами решения

Чтобы выборка наиболее полно отображала структуру генеральной совокупности, необходимо, чтобы она была представительной (репрезентативной), т.е. для каждого элемента генеральной совокупности должна быть одинаковая возможность (вероятность) попасть в выборку, т.е. выборка должна быть случайной.

Отбор в выборку может быть повторный, если учтенная единица возвращается в генеральную совокупность и может попасть в выборку повторно.

Бесповторный отбор – учтенная единица не возвращается в генеральную совокупность, т.е. каждая отобранная единица регистрируется только один раз.

Таким образом, повторный отбор не влияет на состав генеральной совокупности и вероятность каждой единицы попасть в выборку не меняется. При бесповторном отборе вероятность единиц генеральной совокупности попасть в выборку изменяется, т.к. предшествующий отбор влияет на результаты последующего и на состав генеральной совокупности.

Идеальный случайный выбор производится по методу жеребьевки или лотереи, а также с помощью «случайных чисел». Существуют типический, серийный, механический и другие разновидности отборов.

Типический отбор используют тогда, когда генеральная совокупность расчленяется на отдельные типические группы. В таких случаях из каждой группы случайным образом отбирают одинаковое или пропорциональное число единиц. Затем вычисляют групповые характеристики, объединяемые далее в общую характеристику генеральной совокупности.

Серийный отбор используют, когда генеральная совокупность делится на серии обычно по территориальному принципу. Например, из 30 групп подростков намечено исследовать выборочно 6 групп, т.е. работают не с отдельными единицами, а с целыми сериями относительно однородных единиц.

Механический отбор используется, когда генеральную совокупность разбивают на несколько равных частей или групп. Затем из каждой группы отбирают по одной единице. Например, при исследовании посева ржи на урожайность намечено отобрать 100 растений, следовательно, поле должно быть разделено на 100 равных частей, из каждой части отбирается одна единица.

Отбор будет также механическим если из генеральной совокупности в выборку попадет каждая десятая, сотая и т.д. единица.

Систематизация наблюдений

Процесс систематизации результатов массовых наблюдений, объединения их в относительно однородные группы по некоторому признаку Методы математической статистики - определение и вычисление с примерами решения называется группировкой.

Наиболее распространенная форма группировки – статистические таблицы.

Особая форма группировки – статистические ряды, видное место среди них занимают вариационные ряды.

Определение. Вариационным рядом или рядом распределения называется двойной ряд чисел, показывающий как числовые значения признака (варианты) связаны с их повторяемостью в данной статистической совокупности.

Пример:

Методы математической статистики - определение и вычисление с примерами решения – количество изготовленных на станке деталей в смену. Количество смен Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения

Число Методы математической статистики - определение и вычисление с примерами решения называется абсолютной частотой или просто частотой (или весом) варианты Методы математической статистики - определение и вычисление с примерами решения Относительная частота варианты Методы математической статистики - определение и вычисление с примерами решения где Методы математической статистики - определение и вычисление с примерами решения– объем выборки, Методы математической статистики - определение и вычисление с примерами решения

Ранжированный вариационный ряд выстроен по возрастанию или убыванию членов ряда.

В примере имеем ранжированный вариационный ряд вида:

Методы математической статистики - определение и вычисление с примерами решения

Вариационные ряды есть безынтервальные, если признак дискретный, и интервальные, если признак непрерывный. Если признак варьирует дискретно, но в широких границах, то по данным наблюдений можно построить интервальный вариационный ряд. Будем рассматривать равноинтервальные ряды. Если признак варьирует непрерывно, то из интервального ряда можно построить безынтервальный ряд, т.е. разделение на ряды (безынтервальные и интервальные) по типу признака (дискретный или непрерывный) не однозначное.

Для получения хорошо обозримого вариационного ряда и обеспечения достаточной точности вычисляемых по нему числовых характеристик следует разбить вариацию признака (в пределах от Методы математической статистики - определение и вычисление с примерами решения до Методы математической статистики - определение и вычисление с примерами решения варианты) на такое число классов Методы математической статистики - определение и вычисление с примерами решения чтобы не искажались типичные черты варьирования и ряд получался не слишком растянутым:

Методы математической статистики - определение и вычисление с примерами решения где Методы математической статистики - определение и вычисление с примерами решения – ширина классового интервала, Методы математической статистики - определение и вычисление с примерами решения – число классов, на  которые необходимо разбить вариацию признака.

Существует формула Стерджеса Методы математической статистики - определение и вычисление с примерами решения и при Методы математической статистики - определение и вычисление с примерами решения можно использовать формулу Методы математической статистики - определение и вычисление с примерами решения (Брукс, Карузерс). На практике можно руководствоваться следующими правилами:

Методы математической статистики - определение и вычисление с примерами решения

Техника построения вариационного ряда:

  1. Найдем Методы математической статистики - определение и вычисление с примерами решения
  2. Вычислим Методы математической статистики - определение и вычисление с примерами решения
  3. Значение Методы математической статистики - определение и вычисление с примерами решения должно попасть примерно в середину первого классового интервала, поэтому нижняя граница Методы математической статистики - определение и вычисление с примерами решения первого классового интервала будет Методы математической статистики - определение и вычисление с примерами решения Прибавив к Методы математической статистики - определение и вычисление с примерами решения число Методы математической статистики - определение и вычисление с примерами решения получим верхнюю границу первого классового интервала, затем найдем верхнюю границу второго классового интервала и т.д. до тех пор, пока не получим интервал, в который попадет Методы математической статистики - определение и вычисление с примерами решения
  4. Верхние границы интервалов уменьшаем на величину Методы математической статистики - определение и вычисление с примерами решения равную точности, принятой при измерении признака, для того, чтобы избежать момента, когда варианта совпадает с границей.
  5. Подсчитаем количество вариант Методы математической статистики - определение и вычисление с примерами решения попавших в каждый интервал.

Пример:

Наблюдается признак Методы математической статистики - определение и вычисление с примерами решения – количество пропусков занятий (лекций и практических) в семестре у 64 студентов.

Выборка имеет вид: 8, 10, 6, 10, 8, 5, 11, 7, 10, 6, 9, 7, 8, 7, 9, 11, 8, 9, 10, 8, 7, 8, 11, 8, 7, 10, 8, 8, 5, 11, 8, 10, 12, 7, 5, 7, 9, 7, 10, 5, 8, 9, 7, 12, 8, 9, 6, 7, 8, 7, 11, 8, 6, 7,9, 10,6, 6,6,7,8, 10, И, 12.

Методы математической статистики - определение и вычисление с примерами решения

Если Методы математической статистики - определение и вычисление с примерами решения то ряд будет безынтервальным, классами данного ряда будут сами ранжированные варианты:
Методы математической статистики - определение и вычисление с примерами решения

Полученный вариационный ряд выражает зависимость между отдельными вариантами и частотой (повторяемостью) вариант.

Пример:

Наблюдается признак Методы математической статистики - определение и вычисление с примерами решения – среднегодовая температура в некотором населенном пункте Крыма в течение ста лет, Методы математической статистики - определение и вычисление с примерами решения

Выборка имеет вид:

Методы математической статистики - определение и вычисление с примерами решения

1) Лимиты выборки: Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения

Классовые интервалы:

Методы математической статистики - определение и вычисление с примерами решения

4) Уменьшаем верхние границы интервалов на величину точности, принятой при измерении, т.е. на величину Методы математической статистики - определение и вычисление с примерами решения для подсчета Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения
Итак, интервальный вариационный ряд имеет вид:

Методы математической статистики - определение и вычисление с примерами решения

Соответствующий безынтервальный ряд, построенный по интервальным данным, будет иметь вид:
Методы математической статистики - определение и вычисление с примерами решения

где Методы математической статистики - определение и вычисление с примерами решения – серединное значение Методы математической статистики - определение и вычисление с примерами решения интервала, называется классовой вариантой, в отличии от варианты статистической совокупности.

Графики вариационных рядов

Более наглядное изображение закономерности варьирования количественного признака – график вариационного ряда.

Полигон распределения

Полигон распределения (или многоугольник распределения) строится для безынтервального ряда: по оси Методы математической статистики - определение и вычисление с примерами решения откладываем статистические варианты или классовые варианты Методы математической статистики - определение и вычисление с примерами решения по оси Методы математической статистики - определение и вычисление с примерами решения – частоты Методы математической статистики - определение и вычисление с примерами решения Полученные точки Методы математической статистики - определение и вычисление с примерами решениясоединяем ломаной линией, которая называется вариационной кривой или кривой распределения. Полученная при этом плоская фигура называется полигон или многоугольник распределения.

Методы математической статистики - определение и вычисление с примерами решения

Гистограмма распределения частот

Гистограмма распределения частот Методы математической статистики - определение и вычисление с примерами решения строится для интервального ряда: по Методы математической статистики - определение и вычисление с примерами решения откладываем границы классовых интервалов, по Методы математической статистики - определение и вычисление с примерами решения – соответствующие частоты Методы математической статистики - определение и вычисление с примерами решения Гистограмма – клеточная диаграмма; ширина клетки равна Методы математической статистики - определение и вычисление с примерами решения высота клетки равна Методы математической статистики - определение и вычисление с примерами решения Площадь клетки Методы математической статистики - определение и вычисление с примерами решения Площадь всей гистограммы Методы математической статистики - определение и вычисление с примерами решения

Пример:

Методы математической статистики - определение и вычисление с примерами решения

 Гистограмма данного распределения изображена на рис. 5.2. Если на приведенной гистограмме верхнее основание клетки поделить пополам точкой, соединить полученные точки ломаной, то получим вариационную кривую.

Методы математической статистики - определение и вычисление с примерами решения

Аналогично можно построить гистограмму относительных частот Методы математической статистики - определение и вычисление с примерами решения(высота клетки равна Методы математической статистики - определение и вычисление с примерами решения или гистограмму плотности частот Методы математической статистики - определение и вычисление с примерами решения (при этом высота клетки равна Методы математической статистики - определение и вычисление с примерами решения или гистограмму плотности относительных частот Методы математической статистики - определение и вычисление с примерами решения (высота клетки равна Методы математической статистики - определение и вычисление с примерами решения

Кумулята

Кумулята (или график накопленных частот Методы математической статистики - определение и вычисление с примерами решения в отличие от вариационной кривой, имеющей куполообразную форму, имеет вид Методы математической статистики - определение и вычисление с примерами решения-образной кривой.

По оси Методы математической статистики - определение и вычисление с примерами решения откладываем значения вариант Методы математической статистики - определение и вычисление с примерами решения по оси Методы математической статистики - определение и вычисление с примерами решения – накопленные частоты Методы математической статистики - определение и вычисление с примерами решения полученные точки соединяем ломаной, график которой называется кумулятой.

Пример:

Методы математической статистики - определение и вычисление с примерами решенияМетоды математической статистики - определение и вычисление с примерами решения

Огива

По оси Методы математической статистики - определение и вычисление с примерами решения откладываем накопленные частоты Методы математической статистики - определение и вычисление с примерами решения по оси Методы математической статистики - определение и вычисление с примерами решения – значения вариант Методы математической статистики - определение и вычисление с примерами решения Полученные точки соединяем ломаной линией, график которой называется огива

Пример:

Методы математической статистики - определение и вычисление с примерами решения

Огива данного распределения приведена на рис. 5.4. Огива служит для сравнения вариационных рядов с разным количеством наблюдений.

Методы математической статистики - определение и вычисление с примерами решения

Эмпирическая функция распределения

Эмпирическая функция распределения Методы математической статистики - определение и вычисление с примерами решения – накопленные относительные частоты Методы математической статистики - определение и вычисление с примерами решения По оси Методы математической статистики - определение и вычисление с примерами решения откладываем варианты Методы математической статистики - определение и вычисление с примерами решения по оси Методы математической статистики - определение и вычисление с примерами решения Полученные точки соединяем ломаной линией, график которой называется эмпирической функцией распределения Методы математической статистики - определение и вычисление с примерами решения

Пример:

Методы математической статистики - определение и вычисление с примерами решения

Эмпирическая функция данного распределения приведена на рис. 5.5.
Методы математической статистики - определение и вычисление с примерами решения

Аналогом Методы математической статистики - определение и вычисление с примерами решения в теории вероятностей является функция распределения Методы математической статистики - определение и вычисление с примерами решения – накопленные вероятности. Методы математической статистики - определение и вычисление с примерами решения есть оценка теоретической функции распределения Методы математической статистики - определение и вычисление с примерами решения по данным наблюдений.

Основные характеристики варьирующих признаков

Средние величины:

Средние величины обладают способностью характеризовать целую группу однородных единиц одним (средним) числом. Например, средний рост, средняя продуктивность, средняя успеваемость и т.п.

Значение средних заключается в их свойстве аккумулировать или уравновешивать все индивидуальные отклонения, в результате чего проявляется то наиболее устойчивое и типичное, что характеризует качественное своеобразие варьирующего объекта, позволяет отличать один групповой объект от другого.

Средние величины могут характеризовать только однородную совокупность вариант, в противном случае средняя величина фиктивная. Средняя величина -это абстрактная величина, т.к. в действительности не существует, а иногда и не может существовать, но очень подходит для сравнения признаков.

При вычислении средних величин не обязательно группировать исходные данные в вариационный ряд.

Средняя арифметическая

Средняя арифметическая Методы математической статистики - определение и вычисление с примерами решения – центр распределения, около которого группируются все варианты статистической совокупности.

В случае, если выборка не сгруппированная, то Методы математической статистики - определение и вычисление с примерами решения вычисляем по формуле:

Методы математической статистики - определение и вычисление с примерами решения где Методы математической статистики - определение и вычисление с примерами решения – объем выборки. При этом Методы математической статистики - определение и вычисление с примерами решения называется «простая арифметическая средняя». Если выборка сгруппированная, то Методы математической статистики - определение и вычисление с примерами решения вычисляем по формуле:

Методы математической статистики - определение и вычисление с примерами решения где Методы математической статистики - определение и вычисление с примерами решения – частота варианты Методы математической статистики - определение и вычисление с примерами решения называется «взвешенная арифметическая средняя».

Свойства Методы математической статистики - определение и вычисление с примерами решения

1) если каждую варианту Методы математической статистики - определение и вычисление с примерами решения уменьшить или увеличить на одно и то же число Методы математической статистики - определение и вычисление с примерами решения уменьшится или увеличится на это же число.

2) Если каждую варианту Методы математической статистики - определение и вычисление с примерами решения разделить или умножить на одно и то же постоянное число Методы математической статистики - определение и вычисление с примерами решения уменьшится или увеличится в Методы математической статистики - определение и вычисление с примерами решения раз.

Средняя квадратическая

Средняя квадратическая Методы математической статистики - определение и вычисление с примерами решения вычисляется по формуле Методы математической статистики - определение и вычисление с примерами решения если выборка не сгруппирована, и по формуле Методы математической статистики - определение и вычисление с примерами решения если выборка сгруппирована.

Пример:

Измерение диаметров нефтяных пятен при загрязнении водоема дало следующие результаты: 15, 20, 10, 25, 30 м.

Требуется определить средний диаметр нефтяного пятна. Применим формулу Методы математической статистики - определение и вычисление с примерами решения

Средняя арифметическая диаметров Методы математической статистики - определение и вычисление с примерами решения не дает верного результата. Проверим по правилу единства суммарного действия: общая

площадь всех пяти пятен равна Методы математической статистики - определение и вычисление с примерами решения Если взять пять одинаковых кругов диаметром Методы математической статистики - определение и вычисление с примерами решения то общая площадь составит Методы математической статистики - определение и вычисление с примерами решения что гораздо меньше общей фактической площади. Если же взять пять одинаковых кругов диаметром Методы математической статистики - определение и вычисление с примерами решения то , то общая площадь будет Методы математической статистики - определение и вычисление с примерами решения

Средняя кубическая

Средняя кубическая Методы математической статистики - определение и вычисление с примерами решения вычисляется по формуле Методы математической статистики - определение и вычисление с примерами решения если выборка не сгруппирована, и по формуле Методы математической статистики - определение и вычисление с примерами решения если выборка сгруппирована.

Средняя кубическая Методы математической статистики - определение и вычисление с примерами решения является характеристикой объемных признаков.

Средняя гармоническая

Средняя гармоническая Методы математической статистики - определение и вычисление с примерами решения вычисляется по формуле Методы математической статистики - определение и вычисление с примерами решениявыборка не сгруппирована, и по формуле Методы математической статистики - определение и вычисление с примерами решения если выборка сгруппирована. Средняя гармоническая применяется при усреднении меняющихся скоростей.

Пример:

Пять рабочих в течение одного часа (60 мин.) изготовили: первый – 10 деталей, второй – 20, третий – 25, четвертый – 30, пятый – 20. Всего за один час изготовлено 105 деталей. Средние количества деталей за один час Методы математической статистики - определение и вычисление с примерами решения По Методы математической статистики - определение и вычисление с примерами решения легко определяется общее количество деталей, изготовленных за 1 час пятью рабочими.

С помощью Методы математической статистики - определение и вычисление с примерами решения определим среднее время, затраченное одним рабочим на изготовление одной детали:

Методы математической статистики - определение и вычисление с примерами решения

Найдем количество минут, затраченное на одну деталь каждым рабочим:

Методы математической статистики - определение и вычисление с примерами решения

Найдем среднее время, затраченное на одну деталь одним рабочим:

Методы математической статистики - определение и вычисление с примерами решения

Количество деталей в среднем изготовленных за час будет:

Методы математической статистики - определение и вычисление с примерами решения

Аналогичный результат получим, если используем формулу среднего гармонического:

Методы математической статистики - определение и вычисление с примерами решения

Следовательно, в случае усреднения меняющихся производительностей ил скоростей надо применять Методы математической статистики - определение и вычисление с примерами решения

Показатели вариации

Лимиты и размах выборки:

Простейшими показателями вариации (показателями разнообразия) являются лимиты: Методы математической статистики - определение и вычисление с примерами решения и размах выборки Методы математической статистики - определение и вычисление с примерами решения

Пример:

Методы математической статистики - определение и вычисление с примерами решения

Признаки Методы математической статистики - определение и вычисление с примерами решения имеют одинаковые лимиты и размах, но степень разнообразия в группах явно различная. Размах Методы математической статистики - определение и вычисление с примерами решения не отражает существенные черты варьирования. Но в некоторых случаях лимиты могут служить единственной характеристикои признака, например, при описании простеиших: кишечная амеба – 20-30 мк, инфузория толстых кишок – 30-150 мк.

Среднее линейное отклонение

Среднее линейное отклонение Методы математической статистики - определение и вычисление с примерами решения вычисляется по формуле Методы математической статистики - определение и вычисление с примерами решения если выборка не сгруппирована, и по формуле Методы математической статистики - определение и вычисление с примерами решения если выборка сгруппирована.

В условиях предыдущего примера линейные отклонения признаков:

Методы математической статистики - определение и вычисление с примерами решения

Отсюда Методы математической статистики - определение и вычисление с примерами решения

Следовательно, признак Методы математической статистики - определение и вычисление с примерами решения варьирует сильнее, чем признак Методы математической статистики - определение и вычисление с примерами решения

Дисперсия

Дисперсия Методы математической статистики - определение и вычисление с примерами решения имеет наибольшее распространение по сравнению с другими показателями вариации (dispersio – рассеяние, лат.).

Методы математической статистики - определение и вычисление с примерами решения есть среднее арифметическое квадратов отклонений вариант от центра распределения Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения

Расчетная формула дисперсии:

Методы математической статистики - определение и вычисление с примерами решения

Таким образом, Методы математической статистики - определение и вычисление с примерами решения т.е. дисперсия равна среднему арифметическому

квадрата величины минус квадрат среднего арифметического.

Аналог в теории вероятностей – дисперсия Методы математической статистики - определение и вычисление с примерами решения .

Свойства дисперсии:

1) если каждую варианту Методы математической статистики - определение и вычисление с примерами решения уменьшить или увеличить на одно и то же число Методы математической статистики - определение и вычисление с примерами решения то дисперсия не изменится. Действительно

Методы математической статистики - определение и вычисление с примерами решения

Следовательно, можно вычислять не только по Методы математической статистики - определение и вычисление с примерами решения но и по их отклонениям Методы математической статистики - определение и вычисление с примерами решения от постоянного Методы математической статистики - определение и вычисление с примерами решения

2) Если каждую варианту Методы математической статистики - определение и вычисление с примерами решения разделить или умножить на одно и то же постоянное число Методы математической статистики - определение и вычисление с примерами решения уменьшится или увеличится в Методы математической статистики - определение и вычисление с примерами решения раз. Действительно

Методы математической статистики - определение и вычисление с примерами решения

Следовательно, при наличии в совокупности многозначных вариант их можно сократить на некоторое постоянное число Методы математической статистики - определение и вычисление с примерами решения Полученный после вычисления результат надо умножить на Методы математической статистики - определение и вычисление с примерами решения что и дает искомую величину дисперсии.

Свойства Методы математической статистики - определение и вычисление с примерами решения используются в методе «условных вариант» для расчета числовых характеристик выборки. Заметим, что Методы математической статистики - определение и вычисление с примерами решения называется выборочной дисперсией и является смещенной оценкой генеральной дисперсии. Чтобы получить несмещенную оценку дисперсии, которую используют в прикладных расчетах и теоретических выкладках, необходимо «исправить» выборочную дисперсию Методы математической статистики - определение и вычисление с примерами решения ввести в ее формулу поправку Бесселя – множитель на «смещенность»; полученная дисперсия называется исправленной:  Методы математической статистики - определение и вычисление с примерами решения

При Методы математической статистики - определение и вычисление с примерами решения можно использовать Методы математической статистики - определение и вычисление с примерами решения

Пример:

Пусть признак Методы математической статистики - определение и вычисление с примерами решения имеет распределение:

Методы математической статистики - определение и вычисление с примерами решения

Обозначим сумму квадратов отклонений значений признака от центра Методы математической статистики - определение и вычисление с примерами решения Тогда для признака Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения

Дисперсия выборочная Методы математической статистики - определение и вычисление с примерами решения

Дисперсия исправленная Методы математической статистики - определение и вычисление с примерами решения

Пусть признак Методы математической статистики - определение и вычисление с примерами решения имеет распределение:

Методы математической статистики - определение и вычисление с примерами решения

Дисперсия выборочная Методы математической статистики - определение и вычисление с примерами решения

Дисперсия исправленная Методы математической статистики - определение и вычисление с примерами решения

Среднее квадратическое отклонение

Среднее квадратическое отклонение (СКО) более удобная характеристика, чем дисперсия, т.к. выражается в тех же единицах, что Методы математической статистики - определение и вычисление с примерами решения Среднее квадратическое отклонение равно корню квадратному из дисперсии. Существует СКО выборочное Методы математической статистики - определение и вычисление с примерами решения и СКО исправленное Методы математической статистики - определение и вычисление с примерами решения

В условиях предыдущего примера

Методы математической статистики - определение и вычисление с примерами решения

При одинаковых лимитах и размахе дисперсия и СКО не одинаковы. На их величине сказался различный характер варьирования признака.

Поправка Шеппарда.

При создании безынтервального вариационного ряда из интервального ряда частоты Методы математической статистики - определение и вычисление с примерами решения относят к средним значениям классовых интервалов без учета внутриклассового разнообразия. Но варианты внутри классов распределяются неравномерно, накапливаясь больше у тех границ, которые ближе к Методы математической статистики - определение и вычисление с примерами решения Следовательно, при вычислении обобщающих характеристик для непрерывно варьирующих признаков допускают систематическую погрешность. Чем шире классовый интервал, тем больше эта погрешность. Учитывая это, в 1898 г. В. Шеппард установил, что разность между фактической и расчетной величиной дисперсии составляет Методы математической статистики - определение и вычисление с примерами решения где Методы математической статистики - определение и вычисление с примерами решения – ширина классового интервала, т.е. поправка Шеппарда должна вычитаться из величины Методы математической статистики - определение и вычисление с примерами решения Обычно поправку применяют при требовании высокой точности расчетов или при большом числе наблюдений Методы математической статистики - определение и вычисление с примерами решения поправка не используется.

Пример:

Методы математической статистики - определение и вычисление с примерами решения

Введем поправку Шеппарда: Методы математической статистики - определение и вычисление с примерами решения

Анализируя результат, приходим к выводу, что в этом примере данную поправку можно не использовать.

Коэффициент вариации

Дисперсия Методы математической статистики - определение и вычисление с примерами решения являются основными показателями разнообразия вариант в изучаемой группе. При этом СКО Методы математической статистики - определение и вычисление с примерами решения служит непосредственным показателем разнообразия только при соблюдении следующих условий: 1) сравниваются только одинаковые признаки;

2) средние сравниваемых групп незначительно отличаются друг от друга. Если указанные условия не выполняются и необходимо сравнить разнообразие разных признаков или одинаковых при значительном различии средних, то СКО непосредственно не может быть использовано. В этих случаях используют не абсолютные, а относительные показатели вариации.

Коэффициент вариации Методы математической статистики - определение и вычисление с примерами решения есть среднее квадратическое отклонение, выраженное в процентах от величины средней арифметической:

Методы математической статистики - определение и вычисление с примерами решения

Примеры:

1) Сравнить два варьирующих признака. Для первого признака среднее Методы математической статистики - определение и вычисление с примерами решения для второго Методы математической статистики - определение и вычисление с примерами решения Следует ли отсюда, что Методы математической статистики - определение и вычисление с примерами решения варьирует сильнее, чем Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения

Следовательно, сильнее варьирует признак Методы математической статистики - определение и вычисление с примерами решения

2) Средняя длина зеркального карпа в одном садке Методы математической статистики - определение и вычисление с примерами решения а во втором садке Методы математической статистики - определение и вычисление с примерами решения В данном случае вывод делаем по СКО: во

втором садке разнообразия больше и рыбы менее стандартны.

Отметим, варьирование признака Методы математической статистики - определение и вычисление с примерами решения считается слабым, если Методы математической статистики - определение и вычисление с примерами решения средним, если Методы математической статистики - определение и вычисление с примерами решения значительным, если Методы математической статистики - определение и вычисление с примерами решения

Структурные средние

На величину средней арифметической Методы математической статистики - определение и вычисление с примерами решения могут значительно влиять крайние члены ранжированного вариационного ряда, которые как раз и наименее характерны для данной совокупности. Структурные средние представляют собой конкретные варианты имеющейся совокупности, которые занимают особое место в ряду распределения.

Медиана

Медиана Методы математической статистики - определение и вычисление с примерами решения – средняя, которая делит ряд распределения на две равные части. По обе стороны от медианы располагается одинаковое число вариант.

Если число вариант небольшое, то данные ранжируют и при нечетном Методы математической статистики - определение и вычисление с примерами решения центральная варианта и есть медиана. Например,

Методы математической статистики - определение и вычисление с примерами решения

В данном случае медиана Методы математической статистики - определение и вычисление с примерами решения

Если число вариант четное, то медиана равна полусумме его центральных членов. Например, Методы математической статистики - определение и вычисление с примерами решения

В этом случае медиана Методы математической статистики - определение и вычисление с примерами решения

Если имеем вариационный интервальный ряд, то медиану находим по формуле Методы математической статистики - определение и вычисление с примерами решения

Вначале находим класс или интервал, к которому принадлежит медиана Методы математической статистики - определение и вычисление с примерами решения обозначим его Методы математической статистики - определение и вычисление с примерами решения-класс. Для этого частоты Методы математической статистики - определение и вычисление с примерами решения ряда кумулируют (накапливают) в направлении от меньших к большим значениям классов до величины, превосходящей половину всех членов данной совокупности, т.е. Методы математической статистики - определение и вычисление с примерами решения Первая величина в ряду накопленных частот, которая больше Методы математической статистики - определение и вычисление с примерами решения соответствует медианному классу; частота этого класса Методы математической статистики - определение и вычисление с примерами решения нижняя граница Методы математической статистики - определение и вычисление с примерами решения-класса обозначается Методы математической статистики - определение и вычисление с примерами решения -величина классового интервала; Методы математической статистики - определение и вычисление с примерами решения – накопленная частота класса, предшествующего Методы математической статистики - определение и вычисление с примерами решения-классу.

Пример:

Методы математической статистики - определение и вычисление с примерами решения
Если из интервального вариационного ряда сформирован безынтервальный вариационный ряд, то медиану находим по формуле Методы математической статистики - определение и вычисление с примерами решения

где Методы математической статистики - определение и вычисление с примерами решения – классовая варианта предшествующего класса; Методы математической статистики - определение и вычисление с примерами решения – классовая варианта Методы математической статистики - определение и вычисление с примерами решения-класса .

Пример:

Методы математической статистики - определение и вычисление с примерами решения

Пример:

Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения

По предыдущей формуле: Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения

Мода

Мода Методы математической статистики - определение и вычисление с примерами решения – значение, наиболее часто встречающееся в данной совокупности. Класс с наибольшей частотой называется модальным Методы математической статистики - определение и вычисление с примерами решения-класс).

Если ряд безынтервальный, то Методы математической статистики - определение и вычисление с примерами решения есть то значение Методы математической статистики - определение и вычисление с примерами решения для которого частота будет наибольшей. В примере* Методы математической статистики - определение и вычисление с примерами решения

Если ряд интервальный, то моду находим по формуле

Методы математической статистики - определение и вычисление с примерами решения
где Методы математической статистики - определение и вычисление с примерами решения – нижняя граница Методы математической статистики - определение и вычисление с примерами решения -класса, т.е. класса с наибольшей частотой Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения – частота класса, предшествующего Методы математической статистики - определение и вычисление с примерами решения -классу;

Методы математической статистики - определение и вычисление с примерами решения – частота класса, следующего за Методы математической статистики - определение и вычисление с примерами решения -классом;

Методы математической статистики - определение и вычисление с примерами решения – ширина классового интервала.

Пример:
Методы математической статистики - определение и вычисление с примерами решения
 

Квантили

Квантили – значения признака Методы математической статистики - определение и вычисление с примерами решения отсекающие в пределах статистического ряда определенную часть его членов.

Квартили – три значения признака Методы математической статистики - определение и вычисление с примерами решения – делящие ранжированный вариационный ряд на четыре равные части.

Децили – девять значений делят ряд на десять равных частей.

Перцентили – 99 значений делят ряд на 100 равных частей. Обозначают перцентили Методы математической статистики - определение и вычисление с примерами решения

Точечные и интервальные оценки генеральных параметров

Числовые показатели, характеризующие генеральную совокупность, называются генеральными показателями. Например, математическое ожидание генеральной совокупности Методы математической статистики - определение и вычисление с примерами решения дисперсия Методы математической статистики - определение и вычисление с примерами решения и т.д.

Числовые показатели, характеризующие выборку, называются выборочными характеристиками или статистиками. Например, Методы математической статистики - определение и вычисление с примерами решения и т.д.

Выборочные характеристики – это величины случайные, варьирующие около своих генеральных параметров и являющиеся их приближенными оценками.

Пусть исследуется количественный признак Методы математической статистики - определение и вычисление с примерами решения и из генеральной совокупности извлечено Методы математической статистики - определение и вычисление с примерами решения выборок по Методы математической статистики - определение и вычисление с примерами решения наблюдений:

Методы математической статистики - определение и вычисление с примерами решения

По каждой выборке подсчитаем некоторую статистику Методы математической статистики - определение и вычисление с примерами решения генерального параметра Методы математической статистики - определение и вычисление с примерами решения Получим ряд возможных значений случайной величины Методы математической статистики - определение и вычисление с примерами решения или ее выборочное распределение: Методы математической статистики - определение и вычисление с примерами решения

В большинстве случаев средние характеристики имеют нормальный закон распределения.

Определение. Характеристики, вычисленные одним числом, называются точечными оценками генеральных параметров.

Такие оценки должны удовлетворять условиям:

  1. состоятельность, т.е. оценка Методы математической статистики - определение и вычисление с примерами решения стремится по вероятности к оцениваемому параметру Методы математической статистики - определение и вычисление с примерами решения
  2. эффективность, т.е. оценка Методы математической статистики - определение и вычисление с примерами решения должна иметь наименьшую дисперсию по сравнению с другими аналогичными оценками. Например, для трех показателей, описывающих положение центра нормального распределения признака Методы математической статистики - определение и вычисление с примерами решенияМетоды математической статистики - определение и вычисление с примерами решения – наиболее эффективной будет оценка Методы математической статистики - определение и вычисление с примерами решения наименее эффективной – Методы математической статистики - определение и вычисление с примерами решения Для дисперсий этих оценок характерно неравенствоМетоды математической статистики - определение и вычисление с примерами решения
  3. несмещенность оценки, т.е. математическое ожидание ее выборочного распределения совпадает со значением генерального параметра: Методы математической статистики - определение и вычисление с примерами решения При соблюдении этого условия оценка не содержит систематических ошибок в сторону занижения или завышения.

Доказано, что наилучшими оценками для генеральных параметров Методы математической статистики - определение и вычисление с примерами решениядисперсии Методы математической статистики - определение и вычисление с примерами решения являются соответственно Методы математической статистики - определение и вычисление с примерами решения

При выборке малого объема точечная оценка параметра может значительно отличаться от генерального значения. В таких случаях используют интервальные оценки. Интервальная оценка определяется двумя числами – границами интервала; такая оценка позволяет установить точность и надежность оценки.

Пусть по данным выборки подсчитана статистика Методы математической статистики - определение и вычисление с примерами решения – оценка генерального параметра Методы математической статистики - определение и вычисление с примерами решения тем точнее определяет Методы математической статистики - определение и вычисление с примерами решения чем меньше Методы математической статистики - определение и вычисление с примерами решения или при Методы математической статистики - определение и вычисление с примерами решенияМетоды математической статистики - определение и вычисление с примерами решения где Методы математической статистики - определение и вычисление с примерами решения называется точностью оценки.

Так как работаем со статистическим материалом (массовыми однородными объектами), то категорически утверждать, что оценка Методы математической статистики - определение и вычисление с примерами решения удовлетворяет неравенству Методы математической статистики - определение и вычисление с примерами решения нельзя. Можно говорить лишь о вероятности Методы математической статистики - определение и вычисление с примерами решения с которой это неравенство осуществляется.

Определение. Доверительной вероятностью или надежностью называется вероятность Методы математической статистики - определение и вычисление с примерами решения

На практике наиболее часто задают надежность Методы математической статистики - определение и вычисление с примерами решения равную 0,9; 0,95; 0,99; 0,9999, в зависимости от объекта и целей исследования Методы математической статистики - определение и вычисление с примерами решения – вероятность практически достоверного события).

Противоположная вероятность Методы математической статистики - определение и вычисление с примерами решения называется уровнем значимости Методы математической статистики - определение и вычисление с примерами решения – вероятность практически невозможного события), Методы математической статистики - определение и вычисление с примерами решения 0,1; 0,05; 0,001; 0,0001. Интервал Методы математической статистики - определение и вычисление с примерами решения называется доверительным, Методы математической статистики - определение и вычисление с примерами решения – нижняя граница, Методы математической статистики - определение и вычисление с примерами решения – верхняя граница интервала.

Говорим, что доверительный интервал заключает в себе Методы математической статистики - определение и вычисление с примерами решения с вероятностью (надежностью) Методы математической статистики - определение и вычисление с примерами решения

Для любой выборочной характеристики по соответствующей методике можно найти доверительный интервал с надежностью Методы математической статистики - определение и вычисление с примерами решения

Например, пусть количественный признак Методы математической статистики - определение и вычисление с примерами решения распределен нормально, причем Методы математической статистики - определение и вычисление с примерами решения неизвестно, а Методы математической статистики - определение и вычисление с примерами решения известно. Найдем доверительный интервал параметра Методы математической статистики - определение и вычисление с примерами решения (по-другому, Методы математической статистики - определение и вычисление с примерами решения есть истинное значение случайного признака Методы математической статистики - определение и вычисление с примерами решенияБудем оценивать неизвестное математическое ожидание признака Методы математической статистики - определение и вычисление с примерами решения по выборочной средней Методы математической статистики - определение и вычисление с примерами решения С одной стороны Методы математической статистики - определение и вычисление с примерами решения С другой стороны

Методы математической статистики - определение и вычисление с примерами решения Для Методы математической статистики - определение и вычисление с примерами решения Тогда Методы математической статистики - определение и вычисление с примерами решения

Обозначим Методы математической статистики - определение и вычисление с примерами решения и найдем Методы математической статистики - определение и вычисление с примерами решения называется точностью оценки или ошибкой выборки. Необходимый объем выборки Методы математической статистики - определение и вычисление с примерами решения вычисляется по формуле . Методы математической статистики - определение и вычисление с примерами решенияСледовательно, Методы математической статистики - определение и вычисление с примерами решения Итак, имеем Методы математической статистики - определение и вычисление с примерами решения и Методы математической статистики - определение и вычисление с примерами решения Отсюда Методы математической статистики - определение и вычисление с примерами решения и значение Методы математической статистики - определение и вычисление с примерами решения можно найти по таблице функции Методы математической статистики - определение и вычисление с примерами решения

Таким образом, интервал Методы математической статистики - определение и вычисление с примерами решения будет доверительным для параметра Методы математической статистики - определение и вычисление с примерами решения с надежностью Методы математической статистики - определение и вычисление с примерами решения

Пример:

Количественный признак Методы математической статистики - определение и вычисление с примерами решения распределен нормально и Методы математической статистики - определение и вычисление с примерами решения Найти доверительный интервал для параметра Методы математической статистики - определение и вычисление с примерами решения с надежностью Методы математической статистики - определение и вычисление с примерами решения если проведено Методы математической статистики - определение и вычисление с примерами решения наблюдений и Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения

Точность оценки Методы математической статистики - определение и вычисление с примерами решения

Доверительный интервал: Методы математической статистики - определение и вычисление с примерами решения

Надежность Методы математической статистики - определение и вычисление с примерами решения указывает, что, если будет произведено большое количество Методы математической статистики - определение и вычисление с примерами решения выборок, то в 95% из них параметр Методы математической статистики - определение и вычисление с примерами решения действительно заключен в этих границах; в 5% этих выборок параметр Методы математической статистики - определение и вычисление с примерами решения может выйти за эти границы, т.е. доверительная вероятность Методы математической статистики - определение и вычисление с примерами решения не связана с оцениваемым параметром, она связана с границами доверительного интервала, которые изменяются от выборки к выборке.

Рассмотрим случай, когда СКО Методы математической статистики - определение и вычисление с примерами решения неизвестно и признак Методы математической статистики - определение и вычисление с примерами решения распределен нормально. Задача была решена английским статистиком В. Госсетом (псевдоним Стьюдент).

Случайная величина Методы математической статистики - определение и вычисление с примерами решения имеет закон распределения, который называется Методы математической статистики - определение и вычисление с примерами решения-распределением или распределением Стьюдента. Это распределение определяется параметром Методы математической статистики - определение и вычисление с примерами решения – объемом выборки и не зависит от Методы математической статистики - определение и вычисление с примерами решения

Дифференциальная функция этого распределения (плотность вероятности) обозначается Методы математической статистики - определение и вычисление с примерами решения Тогда Методы математической статистики - определение и вычисление с примерами решения

Доверительный интервал: Методы математической статистики - определение и вычисление с примерами решения

Величина Методы математической статистики - определение и вычисление с примерами решения табулирована при любых Методы математической статистики - определение и вычисление с примерами решения

Пример:

Количественный признак Методы математической статистики - определение и вычисление с примерами решения генеральной совокупности распределен нормально. По выборке объемом Методы математической статистики - определение и вычисление с примерами решения найдены Методы математической статистики - определение и вычисление с примерами решения Требуется оценить неизвестное значение Методы математической статистики - определение и вычисление с примерами решения признака Методы математической статистики - определение и вычисление с примерами решения с помощью доверительного интервала при надежности Методы математической статистики - определение и вычисление с примерами решения

При Методы математической статистики - определение и вычисление с примерами решения найдем по таблице значение Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения

Замечание. Можно доказать, что при Методы математической статистики - определение и вычисление с примерами решения-распределение стремится к нормальному распределению. Поэтому при оценке Методы математической статистики - определение и вычисление с примерами решения нормально распределенного признака при Методы математической статистики - определение и вычисление с примерами решения можно вместо Методы математической статистики - определение и вычисление с примерами решения-распределения пользоваться нормальным распределением.

Построение нормальной кривой по опытным данным

Пусть признак Методы математической статистики - определение и вычисление с примерами решения по предположению имеет нормальное распределение. Тогда плотность вероятности имеет вид:

Методы математической статистики - определение и вычисление с примерами решения

Если Методы математической статистики - определение и вычисление с примерами решения то случайная величина Методы математической статистики - определение и вычисление с примерами решения называется нормальной нормированной случайной величиной, ее плотность вероятности Методы математической статистики - определение и вычисление с примерами решенияИзменим обозначение аргумента Методы математической статистики - определение и вычисление с примерами решения Положим, Методы математической статистики - определение и вычисление с примерами решения получим

Методы математической статистики - определение и вычисление с примерами решения

Сравниваем (5.1) и (5.2), получим: Методы математической статистики - определение и вычисление с примерами решения

Если параметры Методы математической статистики - определение и вычисление с примерами решения неизвестны, то в качестве их оценок принимаем Методы математической статистики - определение и вычисление с примерами решения и СКО выборочное Методы математической статистики - определение и вычисление с примерами решения Тогда Методы математической статистики - определение и вычисление с примерами решения

Пусть имеем безынтервальный вариационный ряд, где Методы математической статистики - определение и вычисление с примерами решения – середина интервала (класса) шириной Методы математической статистики - определение и вычисление с примерами решения Тогда вероятность попадания случайной величины Методы математической статистики - определение и вычисление с примерами решения в этот интервал приближенно равна произведению Методы математической статистики - определение и вычисление с примерами решения на длину интервала Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения

Величина Методы математической статистики - определение и вычисление с примерами решения определяет теоретическую долю попавших в данный интервал

наблюдений выборки объемом Методы математической статистики - определение и вычисление с примерами решения Отсюда теоретическая частота Методы математической статистики - определение и вычисление с примерами решения

Один из способов построения нормальной кривой по данным наблюдений следующий:

1) поданным наблюдений вычислим параметры Методы математической статистики - определение и вычисление с примерами решения

2) найдем выравнивающие (теоретические) частоты по формуле Методы математической статистики - определение и вычисление с примерами решения

где Методы математической статистики - определение и вычисление с примерами решения – сумма наблюдаемых частот (объем выборки), Методы математической статистики - определение и вычисление с примерами решения – разность между двумя соседними вариантами –Методы математической статистики - определение и вычисление с примерами решения дифференциальная функция Лапласа, табулированная;

3) строим точки Методы математической статистики - определение и вычисление с примерами решения в прямоугольной системе координат и соединяем их плавной кривой. В этой же системе координат строим полигон распределения наблюдаемых частот.

Пример:

Пусть статистическое распределение признака Методы математической статистики - определение и вычисление с примерами решения имеет вид:

Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения

Найдем выравнивающие (теоретические) частоты Методы математической статистики - определение и вычисление с примерами решения Данные сведем в расчетную таблицу.

Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения

На рис.5.6 построены нормальная (теоретическая) кривая и полигон наблюдаемых частот. Сравнение графиков показывает, что построенная теоретическая кривая удовлетворительно отражает данные наблюдений.

Статистическая гипотеза

Статистическая проверка гипотез является вторым после статистического оценивания параметров распределения и в то же время важнейшим разделом математической статистики.

Методы математической статистики позволяют проверить предположения о законе распределения некоторой случайной величины (генеральной совокупности), о значениях параметров этого закона (например Методы математической статистики - определение и вычисление с примерами решения о наличии корреляционной зависимости между случайными величинами, определенными на множестве объектов одной и той же генеральной совокупности.

Пусть по некоторым данным имеются основания выдвинуть предположения о законе распределения или о параметре закона распределения случайной величины (или генеральной совокупности, на множестве объектов которой определена эта случайная величина). Задача заключается в том, чтобы подтвердить или опровергнуть это предположение, используя выборочные (экспериментальные) данные.

Проверить статистическую гипотезу – это значит проверить, согласуются ли данные, полученные из выборки с этой гипотезой. Проверка осуществляется с помощью статистического критерия.

Определение 1. Статистический критерий – правило, устанавливающее условия, по которым статистическая гипотеза принимается или отвергается.

Этот критерий называют еще критерием согласия (имеется в виду согласие принятой гипотезы с результатами, полученными из выборки).

Определение 2. Статистический критерий – это случайная величина Методы математической статистики - определение и вычисление с примерами решения с известным законом распределения, которая служит для проверки гипотезы.

Гипотезу, выдвинутую для проверки ее согласия с выборочными данными, называют нулевой гипотезой и обозначают Методы математической статистики - определение и вычисление с примерами решения Вместе с гипотезой Методы математической статистики - определение и вычисление с примерами решения выдвигается альтернативная или конкурирующая гипотеза, которая обозначается Методы математической статистики - определение и вычисление с примерами решения Например: Методы математической статистики - определение и вычисление с примерами решения

При проверке статистических гипотез можно допустить ошибку двух видов. Относительно гипотезы Методы математической статистики - определение и вычисление с примерами решения может быть два предположения: гипотеза верна или гипотеза ложна – и два действия: гипотеза отвергается или принимается.

Методы математической статистики - определение и вычисление с примерами решения
Определение. Уровнем значимости Методы математической статистики - определение и вычисление с примерами решения критерия называется вероятность Методы математической статистики - определение и вычисление с примерами решениядопустить ошибку I рода: Методы математической статистики - определение и вычисление с примерами решения

Чем меньше уровень значимости Методы математической статистики - определение и вычисление с примерами решения тем меньше вероятность отвергнуть правильную гипотезу. Поэтому Методы математической статистики - определение и вычисление с примерами решения

Тогда вероятность события Методы математической статистики - определение и вычисление с примерами решения равная Методы математической статистики - определение и вычисление с примерами решения называется доверительной вероятностью или надежностью.

Определение. Критической областью Методы математической статистики - определение и вычисление с примерами решения проверяемой гипотезы, называется множество тех значений характеристики Методы математической статистики - определение и вычисление с примерами решения при которых Методы математической статистики - определение и вычисление с примерами решения отвергается.

Критическая область Методы математической статистики - определение и вычисление с примерами решения выбирается так, чтобы:

  1. вероятность попадания Методы математической статистики - определение и вычисление с примерами решения при условии справедливости Методы математической статистики - определение и вычисление с примерами решения была равна Методы математической статистики - определение и вычисление с примерами решения при минимальном Методы математической статистики - определение и вычисление с примерами решения
  2. вероятность попадания Методы математической статистики - определение и вычисление с примерами решения если справедлива Методы математической статистики - определение и вычисление с примерами решения должна быть такой, что вероятность ошибки II рода, т.е. Методы математической статистики - определение и вычисление с примерами решения должна быть минимальной. Вероятность не допуска ошибки II рода Методы математической статистики - определение и вычисление с примерами решения называется мощностью критерия Методы математической статистики - определение и вычисление с примерами решения эта величина должна быть максимальной.
  3. единственный способ одновременного уменьшения вероятностей ошибок I и II рода состоит в увеличении объема выборки.

Критерии согласия

Обычно эмпирические Методы математической статистики - определение и вычисление с примерами решения и теоретические Методы математической статистики - определение и вычисление с примерами решения частоты различаются. Возможно, что расхождение случайно и связано с ограниченным числом наблюдений; возможно, что расхождение неслучайно (значимо) и объясняется тем, что для вычисления выравнивающих частот была выдвинута статистическая гипотеза о том, что генеральная совокупность распределена нормально, а в действительности это не так. Распределение генеральной совокупности, которое она имеет в силу выдвинутой гипотезы, назовем теоретическим.

Возникает необходимость установить критерий (правило), который позволит судить, является ли расхождение между Методы математической статистики - определение и вычисление с примерами решения случайным или значимым.

Если расхождение случайно, то говорим, что данные выборки согласуются с гипотезой о распределении генеральной совокупности и, следовательно, гипотезу можно принять. Если же расхождение значимо, то гипотезу следует отвергнуть.

Критерий согласия (критерий соответствия) – критерий, который позволяет судить о том, что расхождение эмпирического и теоретического распределений случайно или значимо (принимать гипотезу или отвергать).

Критерий «хи-квадрат» Пирсона

Критерий «хи-квадрат» Пирсона Методы математической статистики - определение и вычисление с примерами решения

Пусть количественный признак Методы математической статистики - определение и вычисление с примерами решения задан статистическим распределением в виде интервального или безинтервального вариационных рядов (эмпирическое распределение Методы математической статистики - определение и вычисление с примерами решения

Выдвигается нулевая гипотеза Методы математической статистики - определение и вычисление с примерами решения относительно закона распределения признака Методы математической статистики - определение и вычисление с примерами решения (теоретическое распределение Методы математической статистики - определение и вычисление с примерами решения

Вычисляется статистическая характеристика:

Методы математической статистики - определение и вычисление с примерами решения
Критерий Методы математической статистики - определение и вычисление с примерами решения позволяет судить, является ли расхождение между Методы математической статистики - определение и вычисление с примерами решения (или Методы математической статистики - определение и вычисление с примерами решения случайным (незначимым) или неслучайным (значимым). Чем больше согласуются теоретическое и эмпирическое распределения, тем меньше число Методы математической статистики - определение и вычисление с примерами решения.

Величина Методы математической статистики - определение и вычисление с примерами решения – случайная, ее дифференциальная функция распределения зависит только от числа Методы математической статистики - определение и вычисление с примерами решения степенной свободы.

Число степеней свободы Методы математической статистики - определение и вычисление с примерами решения равно числу классов Методы математической статистики - определение и вычисление с примерами решения минус число независимых условий (связей), наложенных на частоты Методы математической статистики - определение и вычисление с примерами решения Примерами таких условий может быть: Методы математической статистики - определение и вычисление с примерами решения если мы требуем, чтобы Методы математической статистики - определение и вычисление с примерами решения Это требование накладывается во всех случаях.

Если подбираем теоретическое распределение с тем условием, чтобы совпадали теоретическое и статистическое средние, то Методы математической статистики - определение и вычисление с примерами решения – классовая варианта. Если требуем совпадений теоретической и статистической дисперсий, то Методы математической статистики - определение и вычисление с примерами решения и т.д.

В случае, если признак Методы математической статистики - определение и вычисление с примерами решения распределен нормально, то оценками Методы математической статистики - определение и вычисление с примерами решения будут Методы математической статистики - определение и вычисление с примерами решения (дисперсия либо выборочная, либо исправленная), т.е. на выборку наблюдений наложены две независимых связи. Число степеней свободы в этом случае Методы математической статистики - определение и вычисление с примерами решения 

Если проверяем равномерный закон распределения, то его параметры Методы математической статистики - определение и вычисление с примерами решения находим по значениям Методы математической статистики - определение и вычисление с примерами решения (две связи), тогда Методы математической статистики - определение и вычисление с примерами решения

В случае закона Пуассона параметр Методы математической статистики - определение и вычисление с примерами решения (одна связь) и Методы математической статистики - определение и вычисление с примерами решения

Если проверяем биномиальный закон распределения, то Методы математической статистики - определение и вычисление с примерами решения (обязательная связь) и Методы математической статистики - определение и вычисление с примерами решения

Если закон показательный, то его параметр Методы математической статистики - определение и вычисление с примерами решения вычисляется через Методы математической статистики - определение и вычисление с примерами решения (одна связь) и Методы математической статистики - определение и вычисление с примерами решения

Вычисляем число степеней свободы Методы математической статистики - определение и вычисление с примерами решения для данного теоретического закона распределения и задаем уровень значимости Методы математической статистики - определение и вычисление с примерами решения

Итак, при проверке гипотезы о нормальном распределении Методы математической статистики - определение и вычисление с примерами решения где Методы математической статистики - определение и вычисление с примерами решения – число классов, на которые разбиты данные наблюдений. Далее, при выбранном уровне значимости Методы математической статистики - определение и вычисление с примерами решения (или доверительной вероятности Методы математической статистики - определение и вычисление с примерами решения по таблице приложения найдем Методы математической статистики - определение и вычисление с примерами решения Если расхождение случайно, то Методы математической статистики - определение и вычисление с примерами решения и гипотеза о нормальном распределении выборки принимается. Если расхождение значимо, то Методы математической статистики - определение и вычисление с примерами решения гипотеза отвергается.

При использовании критерия «хи-квадрат» необходимо интервалы с числом Методы математической статистики - определение и вычисление с примерами решения объединять в один интервал, после чего заново подсчитать окончательное число Sклассов.

Пример:

Пусть количественный признак Методы математической статистики - определение и вычисление с примерами решения задан статистическим распределением:

Методы математической статистики - определение и вычисление с примерами решения

Такое задание признака Методы математической статистики - определение и вычисление с примерами решения называется безинтервальным рядом. По данному

вариационному ряду вычислим основные числовые характеристики:

Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения – центр распределения выборки

Методы математической статистики - определение и вычисление с примерами решения

У нас Методы математической статистики - определение и вычисление с примерами решения – мера разброса Методы математической статистики - определение и вычисление с примерами решения около Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения – мера разброса Методы математической статистики - определение и вычисление с примерами решения около Методы математической статистики - определение и вычисление с примерами решения

Выдвигаем нулевую гипотезу Методы математической статистики - определение и вычисление с примерами решения признак Методы математической статистики - определение и вычисление с примерами решения распределен нормально. Для вычисления Методы математической статистики - определение и вычисление с примерами решения необходимо найти теоретические (выравнивающие) частоты

Методы математической статистики - определение и вычисление с примерами решения (или Методы математической статистики - определение и вычисление с примерами решения Напомним что Методы математической статистики - определение и вычисление с примерами решения – четная, т.е. Методы математической статистики - определение и вычисление с примерами решения Методы математической статистики - определение и вычисление с примерами решения – теоретическая частота, Методы математической статистики - определение и вычисление с примерами решения относительная частота.
Приведем расчетную таблицу.

Методы математической статистики - определение и вычисление с примерами решения

Сравниваем графы Методы математической статистики - определение и вычисление с примерами решения (или Методы математической статистики - определение и вычисление с примерами решения видим, что есть расхождение. Случайное оно или неслучайное?
Вычисляем Методы математической статистики - определение и вычисление с примерами решения  Дополним таблицу:

Методы математической статистики - определение и вычисление с примерами решения

Вычисляем число степеней свободы Методы математической статистики - определение и вычисление с примерами решения для нормального закона распределения: Методы математической статистики - определение и вычисление с примерами решения – число классов или групп в статистическом распределении, тогда Методы математической статистики - определение и вычисление с примерами решения степеней свободы.

Задаем уровень значимости Методы математической статистики - определение и вычисление с примерами решения По таблице приложений Методы математической статистики - определение и вычисление с примерами решения находим значение Методы математической статистики - определение и вычисление с примерами решения

Вывод: Методы математической статистики - определение и вычисление с примерами решения следовательно, расхождение Методы математической статистики - определение и вычисление с примерами решения (или Методы математической статистики - определение и вычисление с примерами решения и Методы математической статистики - определение и вычисление с примерами решенияслучайное (незначимое) и гипотеза о нормальном распределении признака Методы математической статистики - определение и вычисление с примерами решения принимается.

Критерий Романовского

Найдем величину (число) Методы математической статистики - определение и вычисление с примерами решения

В примере Методы математической статистики - определение и вычисление с примерами решения

Если Методы математической статистики - определение и вычисление с примерами решения то расхождение между теоретическим (предполагаемым нормальным) и статистическим случайно или незначимо.

У нас: Методы математической статистики - определение и вычисление с примерами решения – гипотеза о нормальном распределении не отвергается.

Если Методы математической статистики - определение и вычисление с примерами решения то гипотезу отвергаем.

Критерий Колмогорова.

Этот критерий в расчетную таблицу требует еще три графы.

Графа Методы математической статистики - определение и вычисление с примерами решения – накопленные Методы математической статистики - определение и вычисление с примерами решения графа Методы математической статистики - определение и вычисление с примерами решения – накопленные Методы математической статистики - определение и вычисление с примерами решения

Методы математической статистики - определение и вычисление с примерами решения

Найдем величину Методы математической статистики - определение и вычисление с примерами решения

В примере Методы математической статистики - определение и вычисление с примерами решения

Вычислим Методы математической статистики - определение и вычисление с примерами решения В примере Методы математической статистики - определение и вычисление с примерами решения

По таблице Методы математической статистики - определение и вычисление с примерами решения находим вероятность Методы математической статистики - определение и вычисление с примерами решения

Вывод. Если Методы математической статистики - определение и вычисление с примерами решения то гипотеза отвергается. Если Методы математической статистики - определение и вычисление с примерами решения значительно больше 0,05, то гипотеза принимается.

В примере: Методы математической статистики - определение и вычисление с примерами решения – гипотеза о нормальном распределении принимается.

  • Комбинаторика – правила, формулы и примеры
  • Классическое определение вероятности
  • Геометрические вероятности
  • Теоремы сложения и умножения вероятностей
  • Дисперсионный анализ
  • Математическая обработка динамических рядов 
  • Корреляция – определение и вычисление
  • Элементы теории ошибок

Основная
форма представления выборочной
совокупности – вариационные
ряды.

Пусть
посредством независимых испытаний,
проведенных в одинаковых условиях,
получены числовые значения х1,
х
2,
. . ., х
п.
Располагают эти значения в порядке
возрастания

и
называют полученную последовательность
вариационным
рядом
, а сами
значения

вариантами.

Число,
показывающее, сколько раз встречается
в выборке вариант

,
называют частотой
варианта
и
обозначают


,
причем

(k
– количество различных вариант).

Отношение
числа вариантов к объему выборки (или
общему числу наблюдений)

называют относительной
частотой наблюдения
.

Вариационный ряд
показывает, каким образом варианты
связаны с их частотами в выборке.

Вариационные
ряды бывают двух типов: интервальные
и безынтервальными.

В
интервальном
вариационном ряду

частоты характеризующие повторяемость
вариант в выборке, распределяются по
интервалам группировки. Интервальный
вариационный ряд строится, если изучаемый
признак варьирует непрерывно, но
используется и для дискретно варьирующих
признаков в тех случаях, когда признак
варьирует в широких пределах.

Пример
7.3.

Превышение
разрешенной скорости движения (км/ч)

20 – 30

30 – 40

40 – 50

50 – 60

больше
60

Количество
нарушений

50

32

26

11

5

В
безынтервальном
вариационном ряду частоты распределяются
непосредственно по значениям варьирующего
признака. Для построения безынтервального
вариационного ряда необходимо варианты
выборки расположить в порядке возрастания
или убывания (проранжировать) и затем
подсчитать, сколько раз каждая из них
встречается в выборке. Безынтервальный
вариационный ряд применяется в тех
случаях, когда исследуемый признак
варьирует дискретно и слабо.

Пример
7
.4.

Экзаменационная
оценка

1

2

3

4

5

6

7

8

9

10

Количество
учащихся

1

4

3

3

2

5

3

1

2

1

7.6. Графическое представление вариационных рядов

Для
повышения наглядности вариационных
рядов, используется их графическое
представление. Наиболее распространенными
способами графического представления
являются гистограмма
и полигон частот.

Гистограмма

Гистограмма
используется для графического
представления распределений непрерывно
варьирующих
признаков и
состоит из примыкающих друг к другу
прямоугольников. Основание каждого
прямоугольника равно ширине интервала
группировки, а высота его такова, что
площадь
прямоугольника пропорциональна частоте
(или относительной частоте) попадания
в данный интервал. Если ряд безинтервальный,
то ширина всех столбцов выбирается
произвольной, но одинаковые.

На
графике гистограммы основание
прямоугольников откладывается по оси
x,
а высота — по оси у
прямоугольной системы координат.

Пример
7.5.

Рис
7.1
. Гистограмма
количества нарушений скорости (пример
6.3.)

Рис.
7.2.
Гистограмма
итогов сдачи экзамена (пример 6.4.)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Пример  Случайным образом
(наудачу) отобрано 25 клубней картофеля, в которых подсчитывали число «глазков»
Х.

Варианты xi

6

9

5

7

10

8

11

12

Число вариант ni

1

7

1

2

6

4

3

1

n = 25

Число
ni называется абсолютной частотой или просто частотой
(или весом) варианты xi, . Относительная
частота варианты , где n – объем выборки,
.

Ранжированный вариационный
ряд выстроен по возрастанию или убыванию членов ряда.

В
примере имеем ранжированный вариационный ряд вида:

xi

5

6

7

8

9

10

11

12

ni

1

1

2

4

7

6

3

1

Вариационные
ряды есть безынтервальные, если признак дискретный, и интервальные,
если признак непрерывный. Если признак варьирует дискретно, но в широких
границах, то по данным наблюдений можно построить интервальный вариационный ряд.
Будем рассматривать равноинтервальные ряды. Если признак варьирует непрерывно,
то из интервального ряда можно построить безынтервальный ряд, т.е. разделение
на ряды (безынтервальные и интервальные) по типу признака (дискретный или
непрерывный) не однозначное.

Для
получения хорошо обозримого вариационного ряда и обеспечения достаточной
точности вычисляемых по нему числовых характеристик следует разбить вариацию
признака (в пределах от min до max
варианты) на такое число классов k, чтобы не искажались типичные черты варьирования и
ряд получался не слишком растянутым:

, где λ – ширина классового
интервала, k – число классов, на которые необходимо разбить
вариацию признака.

Существует
формула Стерджеса  и при  можно использовать формулу (Брукс, Карузерс).

Из генеральной совокупности извлечена выборочная совокупность, получены значения величины. Составить безынтервальный вариационный ряд, построить полигон. Вычислить выборочное среднее значение, дисперсию, среднее квадратическое отклонение, коэффициент вариации, статистическую ошибку выборочной средней. Указать моду и медиану.
Значения
67 73 69 64 69 71 59 67 69 65 63 67 71 60 69 67 71 59 67 63

Составим безынтервальный вариационный ряд:
xi
59 50 63 64 65 67 69 71 73
ni
2 1 2 1 1 5 4 3 1
n=i=19ni=20
Полигон частот:
Составим расчётную таблицу:
xi
59 50 63 64 65 67 69 71 73 Сумма
ni
2 1 2 1 1 5 4 3 1 20
xini
118 50 126 64 65 335 276 213 73 1320
xi2ni
6962 2500 7938 4096 4225 22445 19044 15123 5329 87662
Выборочное среднее значение
x=1ni=19xini=132220=66
Дисперсия
x2=1ni=19xi2ni=8766220=4383.1
σx2=x2-x2=27.1
Среднее квадратическое отклонение:
σx=σx2≈5.206
Коэффициент вариации:
V=σxx∙100%=5.20666∙100%=7.89%
Статистическая ошибка выборочной средней:
σx=σxn≈1.164.
Мода Mo=67 x=67 встречается наибольшее число раз-5.
Медиана (x-упорядоченная по возрастанию выборка):
Me=x10+x112=67+672=67

Добавить комментарий