Как найти статистическую оценку

Содержание:

  1. Точечные статистические оценки параметров генеральной совокупности 
  2. Методы определения точечных статистических оценок
  3. Законы распределения вероятностей для 
  4. Интервальные статистические оценки для параметров генеральной совокупности 
  5. Построение доверчивого интервала для  при известном значении  с заданной надежностью  
  6. Построение доверительного интервала для  при неизвестном значении  из заданной надежности 
  7. Построение доверительных интервалов с заданной надежностью  для 
  8. Построение доверительного интервала для  генеральной совокупности с заданной надежностью 
  9. Построение доверительного интервала для  с помощью неравенства Чебишова с заданной надежностью 

Информация, которую получили на основе обработки выборки про признак генеральной совокупности, всегда содержит определенные погрешности, поскольку выборка содержит только незначительную часть от нее Статистические оценки то есть объем выборки значительно меньше объема генеральной совокупности. 

Потому, следует организовать выборку так, чтобы эта информация была более полной (выборка может быть репрезентабельной) и обеспечивала с наибольшей степенью доверия о параметрах генеральной совокупности ил закон распределение ее признака. 

Параметры генеральной совокупности Статистические оценки являются величинами постоянными, но их числовые значения неизвестные. Эти параметры оцениваются параметрами выборки:  Статистические оценки которые получаются при обработке выборки. Они являются величинами непредсказуемыми, то есть случайными. Схематично это можно показать так (рис. 115). 

Статистические оценки

Тут через  Статистические оценки обозначен оценочный параметр генеральной совокупности, а через  Статистические оценки  – его статистическую оценку, Которую называют еще статистикой. При этом Статистические оценки  а Статистические оценки – случайная величина, что имеет полный закон распределения вероятностей. заметим, что для реализации выборки каждую ее варианту рассматривают как случайную величину, что имеет закон распределения вероятностей признака генеральной совокупности с соответственными числовыми характеристиками: 

Статистические оценки

Точечные статистические оценки параметров генеральной совокупности 

Статистическая оценка Статистические оценки , которая обозначается одном числом, называется точечной. Возьмем во внимание, что Статистические оценки является случайной величиной, точечная статистическая оценка может быть смещенной или несмещенной: когда математическое надежда этой оценки точно равны оценочному параметру Статистические оценки а именно: 

Статистические оценки

то Статистические оценки называется несмещенной; в противоположном случае, то есть когда 

Статистические оценки 

точечная статистическая оценка  Статистические оценки   называется смещенной относительно параметра генеральной совокупности Статистические оценки

 Разница 

Статистические оценки

называется смещением статистической оценки Статистические оценки

Оценочный параметр может иметь несколько точечных несмещенных статистических оценок, что можно изобразить так (рис. 116):

Статистические оценки

Например, пусть Статистические оценки которая имеет две несмещенные точечные статистические оценки – Статистические оценки  и Статистические оценки Тогда плотность вероятностей для Статистические оценки Статистические оценки  имеют такой вид (рис. 117): 

Статистические оценки

Из графиков плотности видим, что оценка  Статистические оценки сравнено с оценкой Статистические оценки имеет то преимущество, что около параметра Статистические оценкиСтатистические оценки  Отсюда получается,  что оценка Статистические оценки чаще получает значение в этой области, чем оценка Статистические оценки

Но на “хвостах” распределений имеет другую картину: большие отклонения от Статистические оценки будут наблюдаться для статистической оценки Статистические оценки, чаще, чем для Статистические оценки Потому, сравнивая дисперсии статистических Статистические оценки как меру рассеивания, видим, что Статистические оценки  имеет меньшую дисперсию, чем оценка Статистические оценки

Точечная статистическая оценка называется эффективной, когда при заданном объеме выборки она имеет минимальную дисперсию. Следует, оценка Статистические оценки будет несмещенной и эффективной. 

Точечная статистическая оценка называется основой, если в случае неограниченного увеличения объема выборки Статистические оценки приближается к оценке параметра Статистические оценки, а именно: 

Статистические оценки

Методы определения точечных статистических оценок

Существует три метода определения точечных статистических оценок для параметров генеральной совокупности. 

Метод аналогий. Этот метод основывается на том, что для параметров генеральной совокупности выбирают такие же параметры выборки, то есть для оценки Статистические оценки выбирают аналогичные статистики – Статистические оценки

Метод наименьших квадратов. Согласно с этим методом статистические оценки обозначаются с условием минимизации суммы квадратов отклонений вариант выборки от статистической оценки Статистические оценки

Итак, используя метод наименьших квадратов, можно, например, обозначить статистическую оценку для Статистические оценки Для этого воспользуемся функцией Статистические оценки  Используя условие экстремума, получим: 

Статистические оценки

Отсюда, для Статистические оценки точечной статистической оценкой будет Статистические оценки – выборочная средняя. 

Метод максимальной правдоподобности. Этот метод занимает центральное место в теории статистической оценки параметров Статистические оценки На него в свое время обратил внимание К. Гаусс, а  разработал его Р. Фишер. Этот метод рассмотрим подробнее. 

Пусть признак генеральной совокупности Статистические оценки  обозначается только одном параметром Статистические оценки  и имеет плотность вероятности Статистические оценки  В случае реализации выборки с вариантами Статистические оценки  плотность вероятности выборки будет такой: 

Статистические оценки

В этом варианте рассматриваются как независимые случайные величины, которые имеют один и тот же закон распределения, что ее признак генеральной совокупности Статистические оценки

Суть этого метода состоит в том, что фиксируя значение вариант Статистические оценки,  обозначают такие значение параметра  Статистические оценки, при котором функция  Статистические оценки максимизуется. Она называется функцией максимальной правдоподобности и обозначается так: Статистические оценки

Например, когда признак генеральной совокупности  Статистические оценки имеет нормальный закон распределения, то функция максимальной правдоподобности приобретет такой вид: 

Статистические оценки

При этом статистические оценки Статистические оценки  выбирают и ее значения, по которых заданная выборка будет верной, то есть функция Статистические оценки  достигает максимума. 

На практике удобно от функции Статистические оценки перейти к ее логарифму, а именно: 

Статистические оценки

согласно с необходимым условием экстремума для этой функции получим: 

Статистические оценки

Из первого уравнения системы  Статистические оценки  получим: 

Статистические оценки

из уравнение системы Статистические оценки  получим: 

Статистические оценки

Следует, для Статистические оценки точечной функции статистической оценкой будет  Статистические оценки  для  Статистические оценки

Свойства Статистические оценки Исправленная дисперсия, исправленное среднее квадратичное отклонение. Точечной несмещенной статистической оценкой для Статистические оценки  будет Статистические оценки

И на самом деле, 

Статистические оценки  учитывая то. что Статистические оценки Статистические оценки

Следует, Статистические оценки

Проверим на несмещенность статистической оценки Статистические оценки

Статистические оценки

Статистические оценки

Статистические оценки

Таким образом, получим Статистические оценки

Следует, Статистические оценки будет точечной смещенной статистической оценкой для Статистические оценки,  где  Статистические оценки – коэффициент смещения, который уменьшается с увеличением объема выборки  Статистические оценки

Когда Статистические оценки умножить на Статистические оценки  то получим Статистические оценки

Тогда 

Статистические оценки

Следует, Статистические оценки будут точеной несмещенной статистической оценкой для Статистические оценки Ее называли исправленной дисперсией и обозначили через  Статистические оценки

Отсюда точечной несмещенной статистической оценкой для Статистические оценки будет исправленная дисперсия  Статистические оценки  или 

Статистические оценки

Величину 

Статистические оценки

называют исправленным средним квадратичным отклонением.

Исправленное среднее квадратичное отклонение, следует подчеркнуть, будет смещенной точечной статистической оценкой для    Статистические оценки  поскольку 

Статистические оценки

где Статистические оценки является ступенью свободы;

Статистические оценки  – коэффициенты смещения. 

Пример. 200 однотипных деталей были отданы на шлифование. Результаты измерения приведены как дискретное статистическое распределение, подан в табличной форме: 

Статистические оценки

Найти точечные смещенные статистические оценки для Статистические оценки Статистические оценки

Решение. Поскольку точечной несмещенной оценки для Статистические оценки  будет Статистические оценки  то вычислим 

Статистические оценки

Для обозначение точечной несмещенной статистической оценки для Статистические оценки  вычислим Статистические оценки

Статистические оценки

Статистические оценки

тогда точечная несмещенная статистическая оценка для Статистические оценки равно: 

Статистические оценки

Пример. Граничная нагрузка на стальной болт Статистические оценки  что измерялась в лабораторных условий, задано как интервальное статистическое распределение: 

Статистические оценки

Обозначить точечные несмещенные статистические оценки для Статистические оценки

Решение. Для обозначения точечных несмещенных статистических распределений к дискретному, который приобретает такой вид: 

Статистические оценки

Вычислим Статистические оценки

Статистические оценки

Следует, точечная несмещенная статистическая оценка для Статистические оценки Статистические оценки

Для обозначения Статистические оценки  вычислим Статистические оценки

Статистические оценки

Отсюда точечная несмещенная статистическая оценка для Статистические оценки  будет Статистические оценки

Законы распределения вероятностей для Статистические оценки

Как уже обозначалось, числовые характеристики выборки являются случайными величинами, что имеют определенные законы распределения вероятностей. Так,  Статистические оценки (выборочная средняя) на основании центральной граничной теоремы теории вероятностей (теоремы Ляпунова) имеем нормальный закон распределения с числовыми характеристиками 

Статистические оценки

следует, случайная величина  Статистические оценки имеет закон распределения Статистические оценки

Чтобы обозначить закон распределения для Статистические оценки необходимо выявить связь между Статистические оценки и распределением Статистические оценки

Пусть признак генеральной совокупности  Статистические оценки  имеет нормальный закон распределения Статистические оценки. При реализации выборки каждую из вариант Статистические оценки  рассматривают как случайную величину. то также имеет закон распределения Статистические оценки. При этом вариант выборки является независимым, то есть Статистические оценки  а случайная величина Статистические оценки  соответственно имеет закон распределения Статистические оценки

Рассмотрим случай,  когда варианты выборки имеют частоты Статистические оценки тогда 

Статистические оценки 

Перейдем от случайных величин Статистические оценки к случайным величинам Статистические оценки которые линейно выражаются через Статистические оценки а именно:  

Статистические оценки

Поскольку случайные величины  Статистические оценки  будут линейными комбинациями случайных величин Статистические оценки то Статистические оценки тоже имеют нормальный закон распределения с числовыми характеристиками: 

Статистические оценки

Статистические оценки

Следует, случайные величины Статистические оценки имеют закон распределения Статистические оценки

Построим матрицу  Статистические оценки элементы которой будут коэффициенты при  Статистические оценки  в линейных зависимостях для Статистические оценки

Статистические оценки

Транспортируем матрицу Статистические оценки получим:

Статистические оценки

Если перемножить матрицы Статистические оценки и Статистические оценки то получим: 

Статистические оценки

где Статистические оценки  будет единичная матрица. 

Следует, случайные величины Статистические оценки обозначены ортогональными преобразованиями случайных величин Статистические оценки  В векторной – матричной форме это можно записать так: 

Из курса алгебры известно, что во время ортогональных преобразований вектора сохраняется его длина, то есть 

Статистические оценки

Тогда из формулы для Статистические оценки  получим: 

Статистические оценки

Поскольку Статистические оценки  далее вычислим: 

Статистические оценки

Следует, получим Статистические оценки

Когда поделим левую и правую часть  Статистические оценки  на Статистические оценки то получим, 

Статистические оценки

Поскольку Статистические оценки имеет закон распределения Статистические оценки  то Статистические оценки получим закон распределения Статистические оценки то есть нормированный нормальный закон. 

То случайная величина 

Статистические оценки

получим распределение Статистические оценки  из Статистические оценки  ступенями свободы. 

Отсюда получается, что случайная величина Статистические оценки  получим распределение Статистические оценки из  Статистические оценки ступенями свободы. 

Таким образом, приведена: случайная величина Статистические оценки тут символ Статистические оценки нужно читать “распределена как”; 

случайная величина Статистические оценки

случайная величина Статистические оценки

Интервальные статистические оценки для параметров генеральной совокупности 

Точечные статистические оценки Статистические оценки  являются случайными величинами, а потому приближенная замена Статистические оценки  на Статистические оценки часто приводит к существенным погрешностям, особенно когда объем выборки не большой. В этом случае используют интервальные статистические оценки.

Статистическая оценка, что обозначается двумя числами, концами интервалов, называется интервальной

Разница между статистической оценкой Статистические оценки и ее оценкой параметром Статистические оценки  взята с абсолютным значением, называется точностью оценки, а именно: 

Статистические оценки

где Статистические оценки  является точностью оценки. 

Поскольку Статистические оценки является случайной величиной, то и Статистические оценки будет случайной, потому неравенство Статистические оценки  справедливо с определенной вероятностью. 

Вероятность, с которой берется неравенство Статистические оценки, то есть 

Статистические оценки

называется надежностью

Равенство Статистические оценки можно записать так:

Статистические оценки

Интервал Статистические оценки что покрывает оценочный параметр Статистические оценки генеральной совокупности с заданной надежностью Статистические оценки называют доверчивым

Построение доверчивого интервала для Статистические оценки при известном значении Статистические оценки с заданной надежностью Статистические оценки 

Пусть признак Статистические оценки генеральной совокупностью имеет нормальный закон распределению. Построим доверительный интервал для Статистические оценки зная числовое значение среднего квадратичному отклонению генеральной совокупности  Статистические оценки   с заданной надежностью Статистические оценки Поскольку Статистические оценки как точечная несмещенная статистическая оценка для Статистические оценки  имеет нормальный закон распределения с числовыми характеристиками Статистические оценки  Статистические оценки то воспользовавшись Статистические оценки получим 

Статистические оценки

Случайная величина Статистические оценки имеет нормальный закон распределения с числовыми характеристиками 

Статистические оценки

Потому Статистические оценки  будет нормированный нормальный закон распределения Статистические оценки

Отсюда равенство Статистические оценки  можно записать, обозначив Статистические оценки так; 

Статистические оценки

или 

Статистические оценки

Согласно с формулой нормированного нормального закона 

Статистические оценки

для Статистические оценки она получает такой вид: 

Статистические оценки

Из равенства Статистические оценки  находим аргументы  Статистические оценки а именно: 

Статистические оценки

Аргумент  Статистические оценки находим значение функции Лапласа, которая равна Статистические оценки  по таблице (дополнение 2). 

Следует, доверительный интервал равен: 

Статистические оценки

что можно изобразить условно на рисунке 118. 

Статистические оценки

Величина  Статистические оценки  называется точностью оценки, или погрешностью выборки

Пример. Измеряя 40 случайно отобранных после изготовления деталей, нашли выборку средней, что равна 15 см. Из надежности  Статистические оценки построить доверительный интервал для средней величины всей партии деталей, если генеральная дисперсия равна Статистические оценки

 Решение. Для построенного доверчивого интервала необходимо найти: Статистические оценки

Из условия задачи имеем: Статистические оценки Статистические оценки Величина Статистические оценки вычисляется из уравнения

Статистические оценки

Статистические оценки {с таблицей значения функции Лапласа}. 

Найдем числовые значения концов доверчивого интервала: 

Статистические оценки

Таким образом, получим: Статистические оценки

Следует, с надежностью Статистические оценки  (99%  гарантии) оценочный параметр Статистические оценки  пребывает в середина интервала Статистические оценки

Пример. Имеем такие данные про размеры основных фондов (в млн руб.) на 30-ти случайно выбранных предприятий: 

Статистические оценки

построить интервальное статистическое распределение с длиной шага Статистические оценки млн рублей. 

С надежностью Статистические оценки найти доверительный интеграл для Статистические оценки если Статистические оценки млн рублей. 

Решение. Интервальное статистическое распределение будет таким: 

Статистические оценки

Для обозначение Статистические оценки необходимо построить дискретное статистическое распределение, что имеет такой вид: 

Статистические оценки

Тогда 

Статистические оценки

Статистические оценки  млн рублей. 

Для построения доверительного интервала с заданной надежностью Статистические оценки необходимо найти Статистические оценки

Статистические оценки

Вычислим концы интервала: 

Статистические оценки млн руб.

Статистические оценкимлн руб.

Следует, доверительный интервал для Статистические оценки будет Статистические оценки

Пример. Какое значение может получит надежность оценки Статистические оценки чтобы за объем выборки Статистические оценки погрешность ее не превышала Статистические оценки при Статистические оценки

Решение. Обозначим погрешность выборки 

Статистические оценки

Далее получим: 

Статистические оценки

как видим, надежность мала. 

Пример. Обозначить объем выборки Статистические оценки по которому погрешность Статистические оценки гарантируется с вероятностью Статистические оценки  если Статистические оценки

 Решение. По условию задачи Статистические оценки Поскольку Статистические оценки  то получим: Статистические оценки Величину Статистические оценки  находим из равенства Статистические оценки Тогда Статистические оценки

Построение доверительного интервала для Статистические оценки при неизвестном значении Статистические оценки из заданной надежности Статистические оценки

Для малых выборок, с какими сталкиваемся, исследуя разные признаки в техники или сельском хозяйстве, для оценки Статистические оценки  при неизвестном значении Статистические оценки невозможно воспользоваться нормальным законом распределения. Потому для построения доверительного интервала используется случайная величина. 

Статистические оценки

что имеет распределение Стьюдента с Статистические оценки ступенями свободы. 

Тогда Статистические оценки получает вид: 

Статистические оценки

поскольку Статистические оценки для распределения Стьюдента является функцией четной. 

Вычислив по данному статистическому распределению Статистические оценки Статистические оценки и обозначив по таблице распределения Стьюдента значения Статистические оценки построим доверительный интервал 

Статистические оценки

Тут Статистические оценки вычислим по заданной надежностью  Статистические оценки и числом степеней свободы Статистические оценки  по таблице (дополнение 3).

Пример. Случайно выбранная партия из двадцати примеров была испытана относительно срока безотказной работы каждого из них Статистические оценки Результаты испытаний приведено в виде дискретного статистического распределения: 

Статистические оценки

С надежностью Статистические оценки построить доверительный интервал для Статистические оценки (среднего времени безотказной работы прибора.)

Решение. Для построения доверительного интеграла необходимо найти среднее выборочное и исправленное среднее квадратичное отклонение. 

Вычислим Статистические оценки

Статистические оценки

следует, получили Статистические оценки часов. 

Обозначим Статистические оценки

Статистические оценки

следует, Статистические оценки

Исправленное среднее квадратичное отклонение равно: 

Статистические оценки часов.

По таблице значений Статистические оценки (дополнение 3) распределение Стьюдента по заданной надежностью Статистические оценки  и числом ступеней свободы Статистические оценки находим значение Статистические оценки

Вычислим концы доверительного интервала: 

Статистические оценки час.

Статистические оценки час. 

Следует, с надежностью Статистические оценки можно утверждать, что Статистические оценки  будет содержится в интервале 

Статистические оценки

При больших объемах выборки, а именно: Статистические оценки на основании центральной граничной теоремы теории вероятностей (теоремы Ляпунова) распределение Стьюдента приближается к нормальному закону. В этом случае Статистические оценки находиться по таблице значений функции Лапласа. 

Пример. В таблице приведены отклонения диаметров валиков, изготовленных на станке, от номинального размера: 

Статистические оценки

с надежностью Статистические оценки построить доверительный интервал для Статистические оценки

Решение. Для постройки доверительного интервала необходимо найти Статистические оценки

Для этого от интегрального статистического распределения, приведенного в условии задачи, необходимо перейти к дискретному, а именно: 

Статистические оценки

Вычислим Статистические оценки

Статистические оценки поскольку Статистические оценки

Статистические оценки

Следует, Статистические оценки

Обозначим Статистические оценки

Статистические оценки

Вычислим исправленное среднее квадратичное отклонение Статистические оценки

Статистические оценки

Учитывая  на большой Статистические оценки объем выборки можно считать, что распределение Стьюдента близкий к нормальному закону. Тогда по таблице значения функции Лапласа

Статистические оценки

Вычислим концы интервалов: 

Статистические оценки

Статистические оценки

Итак, доверчивый интервал для среднего значения отклонений будет таким: Статистические оценки

Отсюда с  надежностью Статистические оценки можно утверждать, чтоСтатистические оценки

Построение доверительных интервалов с заданной надежностью Статистические оценки для Статистические оценки

В случае, если признак Статистические оценки имеем нормальный закон распределения, для построения доверительного интервала с заданной надежностью Статистические оценки для Статистические оценки  используем случайную величину 

Статистические оценки

что имеет распределение Статистические оценки из Статистические оценки ступенями свободы. 

Поскольку случайные действия 

Статистические оценки и Статистические оценки

являются равновероятными, то есть их вероятности равны Статистические оценки получим: 

Статистические оценки

Подставляя в Статистические оценки Статистические оценки получим 

Статистические оценки

Следует, доверительный интервал для Статистические оценки получит вид: 

Статистические оценки

Тогда доверительный интервал для Статистические оценки получается из Статистические оценки и будет таким: 

Статистические оценки

Значения Статистические оценки находятся по таблице (дополнение 4) согласно с равенствами: 

Статистические оценки

где Статистические оценки

Пример. Проверена  партия однотипных телевизоров Статистические оценки на чувствительность к видео-программ  Статистические оценки данные проверки приведены как дискретное статистическое распределение: 

Статистические оценки

С надежностью Статистические оценки построить доверительные интервалы для Статистические оценки

Решение. Для построении доверительных интервалов  необходимо найти значения Статистические оценки

Вычислим значения Статистические оценки

Статистические оценки так как Статистические оценки

Статистические оценки

Вычислим Статистические оценки

Статистические оценки

Статистические оценки

Следует Статистические оценки

Исправленная дисперсия и исправленное среднее квадратичное отклонение равны:  

Статистические оценки

Поскольку Статистические оценки то согласно с Статистические оценки находим значения Статистические оценки а именно: 

Статистические оценки

По таблице (дополнение 4) находим: 

Статистические оценки

вычислим концы доверительного интервала для Статистические оценки

Статистические оценки

Статистические оценки

Следует, доверительный интеграл для Статистические оценки будет таким: 

Статистические оценки

Доверительный интервал для Статистические оценки станет

Статистические оценки

Доверительный интервал для Статистические оценки можно построить с заданной надежностью Статистические оценки взяв распределение Статистические оценки

Поскольку 

Статистические оценки

то равенство Статистические оценки можно записать так: 

Статистические оценки

или 

Статистические оценки

Обозначив Статистические оценки получим

Статистические оценки

чтобы найти Статистические оценки возьмем случайную величину 

Статистические оценки

что имеет распределение Статистические оценки

Учитывая то, что события

Статистические оценки и Статистические оценки

при Статистические оценки является равновероятными, получим: 

Статистические оценки

Если умножить все члены двойного неравенства Статистические оценкиСтатистические оценки на Статистические оценки то получим: 

Статистические оценки

Отсюда получим: 

Статистические оценки

Из уравнения Статистические оценки по заданной надежностью Статистические оценки и объемом выборки Статистические оценки находим по таблице (дополнение 5) значение величины Статистические оценки

Доверительный интервал будет таким: 

Статистические оценки

Пример. С надежностью Статистические оценки построить доверительный интервал вычислим значения Статистические оценки по таблице (дополнение 5). Статистические оценки

Обозначим концы интервала: 

Статистические оценки

Следует, доверительный интервал для Статистические оценки с надежностью Статистические оценки будет такой 

Статистические оценки

Построение доверительного интервала для Статистические оценки генеральной совокупности с заданной надежностью Статистические оценки

Как величина, полученная по результатам выборки, Статистические оценки является случайной и представляет собой точечную несмещенную статистическую оценку для Статистические оценки

Исправленное среднее квадратичное отклонение для  Статистические оценки

Статистические оценки

Для построения доверительного интервала для Статистические оценки используется случайная величина

Статистические оценки

что имеет нормированный нормальный закон распределения Статистические оценки 

Воспользовавшись Статистические оценки получим 

Статистические оценки

Следует. доверительный интервал для Статистические оценкибудет таким: 

Статистические оценки

где Статистические оценки находим из равенства 

Статистические оценки

по таблице значений функции Лапласа. 

Пример. Случайно выбранных студентов из потока университета были подвергнуты тестированию по математике и химии. Результаты этих тестирования преподнесено статистическим распределением, где Статистические оценки – оценки по математике, Статистические оценки – по химии. Ответы оценивались по десятибалльной системе: 

Статистические оценки

Необходимо: 

1) с надежностью Статистические оценки построить доверительный интервал для Статистические оценки  если Статистические оценки

2) с надежностью Статистические оценки построить доверительный интервал для Статистические оценки

Решение. Вычислим основные числовые характеристики признак Статистические оценки и Статистические оценки а также Статистические оценки Поскольку Статистические оценки получим: 

Статистические оценки

Статистические оценки

1. Построим доверительный интервал с надежностью Статистические оценки для Статистические оценки если Статистические оценки

Статистические оценки

нам известные значения Статистические оценки Значения  Статистические оценки вычисляем из уравнения  

Статистические оценки

где Статистические оценки находим по таблице значений функции Лапласа. 

Обозначим концы интервала: 

Статистические оценки

Следует, доверительный интервал для Статистические оценки будет таким: 

Статистические оценки

2. Построим доверительный интервал с надежностью Статистические оценки для Статистические оценки

Поскольку  Статистические оценки  нам не известно, то доверительный интервал в этом случае обозначается так: 

Статистические оценки

На известное значение Статистические оценки находим по таблице распределения Стьюдента (дополнение 3),

Статистические оценки

Вычислим концы доверительного интервала: 

Статистические оценки

Таким образом, доверительный интервал для Статистические оценки будет в таких границах: 

Статистические оценки

Доверительный интеграл с надежностью Статистические оценки для Статистические оценки будет таким: 

Статистические оценки

Нам известно значение Статистические оценки Учитывая, что Статистические оценки найдем по таблице (дополнение 5) значения Статистические оценки

Обозначим концы доверительного интервала: 

Статистические оценки

Следует, доверительный интервал для Статистические оценки подается таким неравенством: 

Статистические оценки

Доверительный интервал для Статистические оценки с заданной надежностью Статистические оценки будет таким: 

Статистические оценки

Нам известны значения Статистические оценки обозначаем по таблице значений функции Лапласа Статистические оценки где Статистические оценки

Обозначим концы доверительного интервала: 

Статистические оценки

таким образом, доверительный интервал для Статистические оценки будет в таких границах: 

Статистические оценки

Построение доверительного интервала для Статистические оценки с помощью неравенства Чебишова с заданной надежностью 

В случае, если отсутствует информация про закон распределения признака генеральной совокупности Статистические оценки  оценка вероятностей события Статистические оценки где Статистические оценки и построение доверительного интервала для Статистические оценки с заданной надежностью Статистические оценки выполняется с использованием неравенства Чебишова по условию, что известно значение Статистические оценки  а именно: 

Статистические оценки

Из Статистические оценки обозначаем величину Статистические оценки

Статистические оценки

Доверительный интервал дается таким неравенством: 

Статистические оценки

Когда Статистические оценки неизвестно, используем исправленную дисперсию Статистические оценки и доверительный интервал приобретает такой вид: 

Статистические оценки

Пример. Полученные данные с 100 наугад выбранных предприятий относительно возрастания выработки на одного работника Статистические оценки которые имеют такой интервальное статистическое распределение: 

Статистические оценки

Воспользовавшись неравенством Чебишова, построить доверительный интервал для Статистические оценки если известно значение Статистические оценки с надежностью Статистические оценки

Решение. Для построения доверительного интервала с помощью неравенства Чебишова необходимо вычислить Статистические оценки Чтобы обозначить Статистические оценки перейдем от интервального к дискретному статистическому распределению, а именно: 

Статистические оценки

Тогда получим: 

Статистические оценки

Воспользовавшись Статистические оценки вычислим Статистические оценки

Статистические оценки

таким образом, доверительный интервал для Статистические оценки преподноситься такими неравенствами: 

Статистические оценки

или 

Статистические оценки

Пример. Заданы размеры основных фондов Статистические оценки на 30- ти предприятий дискретным статистическим распределением: 

Статистические оценки

Воспользовавшись неравенством Чебишова с надежностью Статистические оценки построить доверительный интервал для Статистические оценки

Решение. Для постройки доверительного интервала для  Статистические оценки  с помощью неравенства Чебишова необходимо вычислить Статистические оценки

Статистические оценки

Статистические оценки млн руб. 

Следует, Статистические оценки млн рублей. 

Статистические оценки

Статистические оценки  млн рублей.

Обозначить концы доверительного интервала: 

Статистические оценки млн рублей

Статистические оценкин рублей

Итак, доверительный интервал для Статистические оценки подается неравенствами

Статистические оценки

Лекции:

  • Статистические гипотезы
  • Корреляционный и регрессионный анализ
  • Комбинаторика основные понятия и формулы с примерами
  • Число перестановок
  • Количество сочетаний
  • Действия над событиями. Теоремы сложения и умножения вероятностей примеры с решением
  • Примеры решения задач на тему: Случайные величины
  • Примеры решения задач на тему: основные законы распределения
  • Примеры решения задач на тему: совместный закон распределения двух случайных величин
  • Статистические распределения выборок и их числовые характеристики

Содержание:

Оценки и методы их получения:

Приближенные значения параметров, входящих в законы распределения, определяемые каким-либо способом по выборкам, называются оценками или статистиками. Оценки бывают точечными и интервальными. Точечные оцен­ки представляются одним числом, интервальные – двумя числами Статистические оценки - определение и вычисление с примерами решения

Метод моментов

Пусть генеральная случайная величина X имеет плотность распределения Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения                                   (8.1)

Статистические оценки - определение и вычисление с примерами решения                              (8.2)

По выборке Статистические оценки - определение и вычисление с примерами решения определяем выборочные начальные и центральные моменты:

Статистические оценки - определение и вычисление с примерами решения                (8.3)

Статистические оценки - определение и вычисление с примерами решения           (8.4 )

Метод моментов состоит в том, что генеральные моменты (8.1, 8.2), в которые входят оцениваемые параметры, приблизительно приравниваются к со­ответствующим выборочным моментам (8.3), (8.4). Составляется система уравнений:
Статистические оценки - определение и вычисление с примерами решения                             (8.5)
Статистические оценки - определение и вычисление с примерами решения                                (8.6)

Решая систему (8.5), (8.6), находим оцениваемые параметры.
Особо важную роль играет Статистические оценки - определение и вычисление с примерами решения – выборочный начальный момент 1-го по­ рядка, он называется выборочным средним и обозначается Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения    (8.7)

Следующим по важности выборочным моментом является выборочный центральный момент 2-го порядка Статистические оценки - определение и вычисление с примерами решения который называется выборочной дисперсией и обозначается Статистические оценки - определение и вычисление с примерами решения
Статистические оценки - определение и вычисление с примерами решения                                    (8.8)

Наиболее часто используются две формулы метода моментов.
Статистические оценки - определение и вычисление с примерами решения                                        (8.9)

Статистические оценки - определение и вычисление с примерами решения         (8.10)

Сформулируем метод моментов в общем виде.
 

Пусть Статистические оценки - определение и вычисление с примерами решенияплотность распределения случайной величины Статистические оценки - определение и вычисление с примерами решения где Статистические оценки - определение и вычисление с примерами решения – неизвестные параметры. Чтобы найти оценки Статистические оценки - определение и вычисление с примерами решения выражаем первые Статистические оценки - определение и вычисление с примерами решения начальных или центральных моментов случайной величины X через параметры Статистические оценки - определение и вычисление с примерами решения затем генеральные моменты аппроксимируем соответствующими выборочными. В результате имеем систему из Статистические оценки - определение и вычисление с примерами решения уравнений с Статистические оценки - определение и вычисление с примерами решениянеизвестными, откуда и получаем Статистические оценки - определение и вычисление с примерами решения
 

Пример:

Пусть генеральная случайная величина X имеет показательный закон распределения с плотностью Статистические оценки - определение и вычисление с примерами решения По выборке Статистические оценки - определение и вычисление с примерами решения методом моментов найти оценку параметра Статистические оценки - определение и вычисление с примерами решения

 1. Определяем Статистические оценки - определение и вычисление с примерами решения используя (8.1): 

Статистические оценки - определение и вычисление с примерами решения

2. По (8.3) или (8.7) находим выборочный начальный момент 1-го поряд­ка или Статистические оценки - определение и вычисление с примерами решения и составляем выражение вида (8.5) или (8.9):

Статистические оценки - определение и вычисление с примерами решения
3. Заменяя в п. 2 Статистические оценки - определение и вычисление с примерами решения на оценку Статистические оценки - определение и вычисление с примерами решения составим уравнение: Статистические оценки - определение и вычисление с примерами решения

4. Откуда определим оценку параметра Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения
 

Метод наибольшего правдоподобия

Этот метод предложен математиком Фишером в 1912 г.
 

Пусть Статистические оценки - определение и вычисление с примерами решения – плотность распределения генеральной случайной величины X, где Статистические оценки - определение и вычисление с примерами решения – неизвестные параметры. Согласно методу, наилучшими оценками Статистические оценки - определение и вычисление с примерами решения параметров Статистические оценки - определение и вычисление с примерами решения являются такие, для которых функция правдоподобия L принимает наибольшее значение.

Для непрерывной случайной величины

Статистические оценки - определение и вычисление с примерами решения   (8.11)

Для дискретной случайной величины

Статистические оценки - определение и вычисление с примерами решения                  (8.12)
Здесь Статистические оценки - определение и вычисление с примерами решения– выборка из генеральной случайной величины X.
Априорные выборочные значения Статистические оценки - определение и вычисление с примерами решения – являются независимыми случайными величинами, закон распределения которых совпадает с законом распределения генеральной случайной величины X. Тогда правую часть (8.11) на основании теоремы умножения законов распределений (см. раздел 3.5) можно рассматривать как плотность распределения вероятности Статистические оценки - определение и вычисление с примерами решениямерного вектора Статистические оценки - определение и вычисление с примерами решения Согласно методу, для наилучших оценок Статистические оценки - определение и вычисление с примерами решения случайный вектор Статистические оценки - определение и вычисление с примерами решения будет иметь наибольшую плотность распределения. То есть надо найти такие оценки Статистические оценки - определение и вычисление с примерами решения для которых функция правдоподобия L – максимальна. Для этого составляют и решают такую систему уравнений:
Статистические оценки - определение и вычисление с примерами решения                                   (8.13)

Так как функция и ее логарифм достигают экстремума в одной точке, то часто для упрощения решения задачи используют логарифмическую функцию правдоподобия. В случае логарифмической функции правдоподобия составляется система следующих уравнений:
Статистические оценки - определение и вычисление с примерами решения                            (8.14)
 

Пример:

Пусть генеральная случайная величина X имеет показательный закон распределения с плотностью Статистические оценки - определение и вычисление с примерами решения По выборке Статистические оценки - определение и вычисление с примерами решенияметодом наибольшего правдоподобия найти оценку параметра Статистические оценки - определение и вычисление с примерами решения

 1. Так как нам необходимо оценить один параметр Статистические оценки - определение и вычисление с примерами решения то надо составить и решить одно уравнение. Найдем функцию правдоподобия, используя (8.11):

Статистические оценки - определение и вычисление с примерами решения

2. Составим логарифмическую функцию правдоподобия:

Статистические оценки - определение и вычисление с примерами решения

3. Для определения максимума логарифмической функции правдоподо­бия составляем и решаем следующее уравнение:

Статистические оценки - определение и вычисление с примерами решения

Откуда оценка 0 параметра 0 определяется так:
Статистические оценки - определение и вычисление с примерами решения
При сравнение это выражение с оценкой Статистические оценки - определение и вычисление с примерами решения полученной по методу моментов (см. раздел 8.1), мы понимаем, что они одинаковы. Методы, рассмотренные нами, как видим, абсолютно разные. Это свидетельствует о их достоверности.

Свойства оценок

Пусть Статистические оценки - определение и вычисление с примерами решения – выборка из генеральной совокупности. Обозначим оценку параметра Статистические оценки - определение и вычисление с примерами решения через Статистические оценки - определение и вычисление с примерами решения Ранее мы показали, что эта оценка определяется с помощью различных методов по полученной выборке , т. е. являляется функцией от Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения

Так как любая выборка типа Статистические оценки - определение и вычисление с примерами решения– случайна, то и выборочные функции Статистические оценки - определение и вычисление с примерами решения – тоже являются случайными. Следовательно, она тоже имеет свои характеристики.
 

1. Оценка Статистические оценки - определение и вычисление с примерами решения называется несмещенной, если ее математическое ожида­ние совпадает с самим оцениваемым параметром:
Статистические оценки - определение и вычисление с примерами решения

В противном случае оценка называется смещенной.
Статистические оценки - определение и вычисление с примерами решения
 

Полную погрешность Статистические оценки - определение и вычисление с примерами решения возникшую от замены 0 на 0, можно пред­ставить так:

Статистические оценки - определение и вычисление с примерами решения

Таким образом, если оценка несмещенная, то систематическая погреш­ность равна нулю, т. е. Статистические оценки - определение и вычисление с примерами решения

Наиболее опасна систематическая ошибка, если она заранее неизвестна или среднее квадратичное отклонение не очень большое. Среднее значение случайной ошибки Статистические оценки - определение и вычисление с примерами решения

Мы уже отмечали, что Статистические оценки - определение и вычисление с примерами решения– независимые случайные величины, имеющие тот же закон распределения, что и Статистические оценки - определение и вычисление с примерами решения генеральная случайная величина, в частности, выборочное математическое ожидание и дисперсия имеет те же числовые характеристики, т. е. справедливы тождества:

Статистические оценки - определение и вычисление с примерами решения                                   (*)

Проверим смещенность оценки математического ожидания выборочной средней Статистические оценки - определение и вычисление с примерами решения Используя обычные свойства математического ожидания, найдем Статистические оценки - определение и вычисление с примерами решения
Статистические оценки - определение и вычисление с примерами решения
 

Обозначим Статистические оценки - определение и вычисление с примерами решения видим, чтоСтатистические оценки - определение и вычисление с примерами решения значит, выборочное среднее Статистические оценки - определение и вычисление с примерами решения является несмещенной оценкой математического ожидания.

Проверим смещенность оценки дисперсии выборочной дисперсией Статистические оценки - определение и вычисление с примерами решения Найдем математическое ожидание от выборочной дисперсии:

Статистические оценки - определение и вычисление с примерами решения

То есть дисперсия выборочной средней в Статистические оценки - определение и вычисление с примерами решения раз меньше дисперсии генеральной случайной величины. Тогда

Статистические оценки - определение и вычисление с примерами решения

Обозначим Статистические оценки - определение и вычисление с примерами решения значит, выборочная дисперсия Статистические оценки - определение и вычисление с примерами решения является смещенной оценкой дисперсии. Можно отметить, что выборочная дисперсия Статистические оценки - определение и вычисление с примерами решения является асимптотически несмещенной оценкой, т. к. при Статистические оценки - определение и вычисление с примерами решения стремящемся к бесконечности, смещение стремится к нулю.

При решении практических задач часто используется несмещенная оцен­ка дисперсии – это модифицированная выборочная дисперсия:

Статистические оценки - определение и вычисление с примерами решения

Найдем математическое ожидание от Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения

Обозначим Статистические оценки - определение и вычисление с примерами решения как видим, Статистические оценки - определение и вычисление с примерами решения значит, оценка Статистические оценки - определение и вычисление с примерами решения уже несмещенная. При малых Статистические оценки - определение и вычисление с примерами решения этой формулой пользоваться лучше (при и > 30 оценки совпадают). На практике используют еще одну несмещенную оценку дисперсии – когда известно математическое ожидание:

Статистические оценки - определение и вычисление с примерами решения

Найдем Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения

Обозначим Статистические оценки - определение и вычисление с примерами решения значит, оценка Статистические оценки - определение и вычисление с примерами решения несмещенная.
 

2. Оценка Статистические оценки - определение и вычисление с примерами решения параметра Статистические оценки - определение и вычисление с примерами решения называется состоятельной, если она сходит­ся по вероятности к параметру Статистические оценки - определение и вычисление с примерами решения, т. е. если Статистические оценки - определение и вычисление с примерами решения выполняется:

Статистические оценки - определение и вычисление с примерами решения                            Статистические оценки - определение и вычисление с примерами решения

Условие Статистические оценки - определение и вычисление с примерами решенияна практике проверить трудно. Поэтому для проверки состоятельности оценок применяют более простые условия:

а) Статистические оценки - определение и вычисление с примерами решения

б) Статистические оценки - определение и вычисление с примерами решения

Как видим, оценка Статистические оценки - определение и вычисление с примерами решения будет состоятельной, если при Статистические оценки - определение и вычисление с примерами решения смещение устраняется и дисперсия оценки стремится к нулю.
 

Пример:

Проверим состоятельность оценки математического ожидания выборочной средней Статистические оценки - определение и вычисление с примерами решения. Ранее мы показали, что Статистические оценки - определение и вычисление с примерами решения является несмещенной оценкой математического ожидания, т. е. условие а) выполняется и без вычисления предела. Проверим условие б), найдем  Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения

Видим, что при Статистические оценки - определение и вычисление с примерами решения предел Статистические оценки - определение и вычисление с примерами решения будет стремиться к нулю, значит условие б) выполняется. Следовательно, Статистические оценки - определение и вычисление с примерами решения является состоятельной оценкой математического ожидания.

3. Несмещенная оценка Статистические оценки - определение и вычисление с примерами решения параметра Статистические оценки - определение и вычисление с примерами решения называется эффективной, если она имеет наименьшую дисперсию среди всех оценок при одном и том же объеме выборки Статистические оценки - определение и вычисление с примерами решения
Для определения наименьшей дисперсии эффективной оценки Статистические оценки - определение и вычисление с примерами решения параметра Статистические оценки - определение и вычисление с примерами решения применяется формула Рао-Крамера:

Статистические оценки - определение и вычисление с примерами решения                   (8.15)

где Статистические оценки - определение и вычисление с примерами решения – плотность распределения генеральной случайной величины X.
Отметим, если оценка Статистические оценки - определение и вычисление с примерами решения смещенная, то малость ее дисперсии еще не говорит о ее эффективности. Например, если в качестве оценки Статистические оценки - определение и вычисление с примерами решения взять любую постоянную величину с, то ее дисперсия будет равна нулю, а ошибка может быть какой угодно большой.
 

Пример:

Задана нормальная случайная величина Статистические оценки - определение и вычисление с примерами решения с плотностью распределения

Статистические оценки - определение и вычисление с примерами решения

Проверим эффективность оценки математического ожидания выборочной средней Статистические оценки - определение и вычисление с примерами решения.

Найдем дисперсию эффективной оценки параметра Статистические оценки - определение и вычисление с примерами решения Обозначим эффективную оценкуСтатистические оценки - определение и вычисление с примерами решения Чтобы воспользоваться формулой Рао-Крамера (8.15), вычислим

Статистические оценки - определение и вычисление с примерами решения

Найдем производную:

Статистические оценки - определение и вычисление с примерами решения

Подставим полученное выражение в (8.15): 

Статистические оценки - определение и вычисление с примерами решения

Ранее мы показали, что такую же дисперсию имеет Статистические оценки - определение и вычисление с примерами решения (см. формулу Статистические оценки - определение и вычисление с примерами решения
Видим, что правые части формул (8.16) и Статистические оценки - определение и вычисление с примерами решения совпадают, следовательно, выборочное среднее Статистические оценки - определение и вычисление с примерами решения является эффективной оценкой параметра Статистические оценки - определение и вычисление с примерами решения

Отметим, что оценки, полученные методом наибольшего правдоподобия, являются состоятельными. Если существуют эффективная оценка, то метод наибольшего правдоподобия позволяет найти ее, но не всегда оценки, полученные этим методом, являются несмещенными.

  • Теория статистической проверки гипотез
  • Линейный регрессионный анализ
  • Вариационный ряд
  • Законы распределения случайных величин
  • Статистические решающие функции
  • Случайные процессы
  • Выборочный метод
  • Статистическая проверка гипотез

ЛЕКЦИЯ
16

Статистические
оценки параметров генеральной
совокупности. Статистические гипотезы

  1. Определение
    статистической оценки. Точечные
    статистические оценки.

Пусть требуется
изучить количественный признак
генеральной совокупности. Допустим,
что из теоретических соображений удалось
установить, какое именно распределение
имеет признак. Отсюда возникает задача
оценки параметров, которыми определяется
это распределение. Например, если
известно, что изучаемый признак
распределён в генеральной совокупности
по нормальному закону, то необходимо
оценить (приближённо найти) математическое
ожидание и среднеквадратическое
отклонение, так как эти два параметра
полностью определяют нормальное
распределение. Если же имеются основания
считать, что признак имеет распределение
Пуассона, то необходимо оценить параметр
,
которым это распределение определяется.

Обычно в распределении
исследователь имеет лишь данные выборки,
например, значения количественного
признака
,
полученные в результате

наблюдений (здесь и далее наблюдения
предполагаются независимыми). Через
эти данные и выражают оцениваемый
параметр.

Рассматривая

как значения независимых случайных
величин
,
можно сказать, что найти статистическую
оценку неизвестного параметра
теоретического распределения означает
найти функцию от наблюдаемых случайных
величин, которая и даёт приближённое
значение оцениваемого параметра.
Например, как будет показано далее, для
оценки математического ожидания
нормального распределения служит
функция (среднее арифметическое
наблюдаемых значений признака):

.

Итак, статистической
оценкой

неизвестного параметра теоретического
распределения называют функцию от
наблюдаемых случайных величин.
Статистическая оценка неизвестного
параметра генеральной совокупности,
записанная одним числом, называется
точечной.
Рассмотрим следующие точечные оценки:
смещенные и несмещённые, эффективные
и состоятельные.

Для того, чтобы
статистические оценки давали «хорошие»
приближения оцениваемых параметров,
они должны удовлетворять определённым
требованиям. Укажем эти требования.

Пусть

есть статистическая оценка неизвестного
параметра

теоретического распределения. Допустим,
что при выборке объёма

найдена оценка
.
Повторим опыт, то есть извлечём из
генеральной совокупности другую выборку
того же объёма и по её данным найдём
оценку

и т.д. Повторяя опыт многократно, получим
числа
,
которые, вообще говоря, будут различаться
между собой. Таким образом, оценку

можно рассматривать как случайную
величину, а числа

как возможные её значения.

Ясно, что если
оценка

даёт приближённое значение

с избытком, то каждое найденное по данным
выборок число

будет больше истинного значения
.
Следовательно, что в этом случае и
математическое (среднее значение)
случайной величины

будет больше, чем
,
то есть
.
Очевидно, что если

даёт приближённое значение

с недостатком, то
.

Поэтому, использование
статистической оценки, математическое
ожидание которой не равно оцениваемому
параметру, приводит к систематическим
(одного знака) ошибкам. По этой причине
естественно потребовать, чтобы
математическое ожидание оценки

было равно оцениваемому параметру. Хотя
соблюдение этого требования, в общем,
не устранит ошибок (одни значения

больше, а другие меньше чем
),
ошибки разных знаков будут встречаться
одинакова часто. Однако соблюдение
требования

гарантирует невозможность получения
систематических ошибок, то есть устраняет
систематические ошибки.

Несмещённой
называют статистическую оценку (ошибку)
,
математическое ожидание которой равно
оцениваемому параметру

при любом объёме выборки, то есть
.

Смещённой
называют статистическую оценку
,
математическое ожидание которой не
равно оцениваемому параметру

при любом объёме выборки, то есть
.

Однако было бы
ошибочным считать, что несмещённая
оценка всегда даёт хорошее приближение
оцениваемого параметра. Действительно,
возможные значения

могут быть сильно рассеяны вокруг своего
среднего значения, то есть дисперсия

может быть значительной. В этом случае,
найденная по данным одной выборки
оценка, например
,
может оказаться весьма удалённой от
среднего значения
,
а значит, и от самого оцениваемого
параметра
.
Таким образом, приняв

в качестве приближённого значения
,
мы допустим большую ошибку. Если же
потребовать, чтобы дисперсия

была малой, то возможность допустить
большую ошибку будет исключена. По этой
причине к статистической оценке
предъявляется требование эффективности.

Эффективной
называют статистическую оценку, которая
(при заданном объёме выборки
)
имеет наименьшую возможную дисперсию.

Далее, при
рассмотрении выборок большого объёма
(
достаточно велико!) к статистическим
оценкам предъявляется требование
состоятельности.

Состоятельной
называют статистическую оценку, которая
при

стремится по вероятности к оцениваемому
параметру, то есть, справедливо равенство:

.

Например, если
дисперсия несмещённой оценки при

стремится к нулю, то такая оценка
оказывается также состоятельной.

Рассмотрим вопрос
о том, какие выборочные характеристики
лучше всего в смысле несмещённости,
эффективности и состоятельности
оценивают генеральную среднюю и
дисперсию.

Пусть изучается
дискретная генеральная совокупность
относительно некоторого количественного
признака
.

Генеральной
средней


называется среднее арифметическое
значений признака генеральной
совокупности. Она вычисляется по формуле:

Замечание:
пусть генеральная совокупность объёма

содержит объекты с различными значениями

признака
.
Представим себе, что из этой совокупности
наудачу извлекается один объект.
Вероятность того, что будет извлечён
объект со значением признака, например
,
очевидно, равна
.
С этой же вероятностью может быть
извлечён и любой другой объект. Таким
образом, величину признака

можно рассматривать как случайную
величину, возможные значения

которой имеют одинаковые вероятности,
равные
.
Нетрудно, в этом случае, найти математическое
ожидание
:

Итак, если
рассматривать обследуемый признак

генеральной совокупности как случайную
величину, то математическое ожидание
признака равно генеральной средней
этого признака:
.
Этот вывод мы получили, считая, что все
объекты генеральной совокупности имеют
различные значения признака. Такой же
итог будет получен, если допустить, что
генеральная совокупность содержит по
несколько объектов с одинаковым значением
признака.

Обобщая полученный
результат на генеральную совокупность
с непрерывным распределением признака
,
определим генеральную среднюю как
математическое ожидание признака:
.

Пусть для изучения
генеральной совокупности относительно
количественного признака

извлечена выборка объёма
.

Выборочной
средней


называют среднее арифметическое значений
признака выборочной совокупности. Она
вычисляется по формуле:

Замечание:
выборочная средняя, найденная по данным
одной выборки есть, очевидно, определённое
число. Если же извлекать другие выборки
того же объёма из той же генеральной
совокупности, то выборочная средняя
будет изменяться от выборки к выборке.
Таким образом, выборочную среднюю можно
рассматривать как случайную величину,
а следовательно, можно говорить о
распределениях (теоретическом и
эмпирическом) выборочной средней и о
числовых характеристиках этого
распределения1,
в частности, о математическом ожидании
и дисперсии выборочного распределения.

Далее, если
генеральная средняя неизвестна и
требуется оценить её по данным выборки,
то в качестве оценки генеральной средней
принимают выборочную среднюю, которая
является несмещённой и состоятельной
оценкой (предлагаем это
утверждение доказать самостоятельно).
Из сказанного
следует, что если по нескольким выборкам
достаточно большого объёма из одной и
той же генеральной совокупности будут
найдены выборочные средние, то они будут
приближённо равны между собой. В этом
состоит свойство устойчивости
выборочных средних
2.

Отметим, что если
дисперсии двух совокупностей одинаковы,
то близость выборочных средних к
генеральным не зависит от отношения
объёма выборки к объёму генеральной
совокупности. Она зависит от объёма
выборки: чем объём выборки больше, тем
меньше выборочная средняя отличается
от генеральной. Например, если из одной
совокупности отобран 1% объектов, а из
другой совокупности отобрано 4% объектов,
причём объём первой выборки оказался
большим, чем второй, то первая выборочная
средняя будет меньше отличаться от
соответствующей генеральной средней,
чем вторая.

Для того чтобы
охарактеризовать рассеяние значений
количественного признака

генеральной совокупности вокруг своего
среднего значения, вводят сводную
характеристику – генеральную дисперсию.
Генеральной
дисперсией


называется среднее арифметическое
квадратов отклонений значений признака
генеральной совокупности от их среднего
значения
,
и вычисляется по формуле:

,
или
.

Для того чтобы
охарактеризовать рассеяние наблюдаемых
значений количественного выборки вокруг
своего среднего значения, вводят сводную
характеристику – выборочную дисперсию.
Выборочной
дисперсией


называется среднее арифметическое
квадратов отклонений наблюдаемых
значений признака выборочной совокупности
от их среднего значения
,
и вычисляется по формуле:

,
или
.

Вычисление
дисперсии, безразлично, выборочной или
генеральной, можно упростить, если
воспользоваться следующей теоремой:
дисперсия
равна среднему квадратов значений
признака минус квадрат общей средней
:
.
Действительно, справедливость теоремы
вытекает из преобразований:

Кроме дисперсии
для характеристики рассеяния значений
признака генеральной (выборочной)
совокупности вокруг своего среднего
значения используют сводную характеристику
– среднее квадратическое отклонение.
Генеральным
(выборочным)
средним квадратическим отклонением

называют квадратный корень из генеральной
(выборочной) дисперсии:

().

Далее, пусть из
генеральной совокупности в результате

независимых наблюдений над количественным
признаком

извлечена повторная выборка объёма
:

Значения
признака

.
. .

частота

.
. .

причём

Требуется по данным
выборки оценить (приближённо найти)
неизвестную генеральную дисперсию
.
Если в качестве оценки генеральной
дисперсии принять выборочную дисперсию,
то эта оценка будет приводить к
систематическим ошибкам, давая заниженное
значение генеральной дисперсии.
Объясняется это тем, что как можно
доказать, выборочная дисперсия является
смещённой оценкой генеральной дисперсии
.
Другими словами, математическое ожидание
выборочной дисперсии не равно оцениваемой
генеральной дисперсии, а равно

.

Легко «исправить»
выборочную дисперсию так, чтобы её
математическое ожидание было равно
генеральной дисперсии. Для этого
достаточно умножить

на дробь
.
Сделав это, получим «исправленную
дисперсию», которую обычно принято
обозначать через
:

.

«Исправленная
дисперсия» является, конечно, несмещённой
оценкой генеральной дисперсии.
Действительно

.

Итак, в качестве
оценки генеральной дисперсии принимают
«исправленную дисперсию»

.

Для оценки же
среднего квадратического отклонения
генеральной совокупности используют
соответственно «исправленное» среднее
квадратическое отклонение, которое
равно квадратному корню из «исправленной
дисперсии»:

.

Подчеркнём, что

не является несмещённой оценкой; чтобы
отразить этот факт мы написали и будем
писать далее так: «исправленное» среднее
квадратическое отклонение.

Замечание:
сравнивая формулы


и

видим, что они
отличаются лишь знаменателем. Очевидно,
при достаточно больших значениях

объёма выборки, выборочная и «исправленная»
дисперсии различаются мало. На практике
пользуются «исправленной дисперсией»,
если примерно
.

1
Данное распределение называют выборочным.

2
Полученные выводы применимы и для
бесповторной выборки, если её объём
значительно меньше объёма генеральной
совокупности. Это положение часто
используется на практике.

7

Соседние файлы в папке Теор.вер. (лекции)

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Статистическая оценка — это статистика, которая используется для оценивания неизвестных параметров распределений случайной величины.

Определение[править | править код]

Например, если X_{1},ldots ,X_{n} — это независимые случайные величины, с заданным нормальным распределением {displaystyle N(mu ,1)}, то mu будет средним арифметическим результатов наблюдений.

Задача статистической оценки формулируется так:

Пусть {displaystyle xi =(xi _{1},ldots ,xi _{n})} — выборка из генеральной совокупности с распределением {displaystyle F_{xi }(x,theta )}. Распределение {displaystyle F_{xi }} имеет известную функциональную форму, но зависит от неизвестного параметра theta . Этот параметр может быть любой точкой заданного параметрического множества Theta . Используя статистическую информацию, содержащуюся в выборке xi, сделать выводы о настоящем значении параметра theta .

Точечная оценка[править | править код]

Оценка является случайной величиной так как представляет собой функцию от случайных величин X_{1},ldots ,X_{n}[1]:

{displaystyle {hat {theta }}={hat {theta }}(X_{1},ldots ,X_{n})}

Функция распределения оценки зависит от распределения величины X (и от параметра theta ), а также от размера выборки n.

Оценка {hat {theta }} может обладать рядом «хороших» свойств[1]:

На практике не всегда есть возможность получать оценки с заданными свойствами, из-за чего приходится довольствоваться компромиссными вариантами[1].

Интервальная оценка[править | править код]

Для оценивания промежутка, на котором лежит оцениваемый параметр theta , можно использовать следующие методы[2]:

  • Метод доверительных интервалов
  • Метод фидуциальных интервалов
  • Достоверный Байесовский интервал (англ. Credible interval)

См. также[править | править код]

  • Достаточная статистика

Примечания[править | править код]

  1. 1 2 3 Е. С. Вентцель, Теория вероятностей. М.: Наука, 1969 г
  2. Кендалл Морис Дж., Стьюарт Алан. Статистические выводы и связи. — М.: Наука. 1973

Литература[править | править код]

  •  Вентцель Е. С. Теория вероятностей. — М.: Наука, 1969.
  • Кендалл Морис Дж., Стьюарт Алан. Статистические выводы и связи. — М.: Наука. 1973.

Ссылки[править | править код]

  • vseslova — Статистические оценки
  • Shao, Jun (1998), Mathematical Statistics, New York: Springer, ISBN 0-387-98674-X
  • Bol’shev, L. N. (2001), Statistical Estimator, in Hazewinkel, Michiel, Encyclopaedia of Mathematics, Springer, ISBN 978-1556080104
Автор статьи

Елена Борисовна Калюжная

Эксперт по предмету «Математика»

Задать вопрос автору статьи

Распределения в математической статистике характеризуется многими статистическими параметрами. Оценка неизвестных параметров распределения на основе различных данных выборки позволяет построить распределения случайной величины.

Найти статистическую оценку неизвестного параметра распределения — найти функцию от наблюдаемых случайных величин, которая даст приближенное значение оцениваемого параметра.

Статистические оценки можно разделить на несмещенные, смещенные, эффективные и состоятельные.

Определение 1

Несмещенная оценка — статистическая оценка $Q^*$, которая при любом значении объема выборки, имеет математическое ожидание, равное оцениваемому параметру, то есть

[Mleft(Q^*right)=Q]

Логотип iqutor

Сделаем домашку
с вашим ребенком за 380 ₽

Уделите время себе, а мы сделаем всю домашку с вашим ребенком в режиме online

Бесплатное пробное занятие

*количество мест ограничено

Определение 2

Смещенная оценка — статистическая оценка $Q^*$, которая при любом значении объема выборки, имеет математическое ожидание, не равное оцениваемому параметру, то есть

[Mleft(Q^*right)ne Q]

Определение 3

Эффективная оценка — статистическая оценка, которая имеет наименьшее возможное значение дисперсии при заданном объеме выборки.

Определение 4

Состоятельная оценка — статистическая оценка, при которой при объеме выборки, стремящейся к бесконечности, стремится по вероятности к оцениваемому параметру $Q.$

Определение 5

Состоятельная оценка — статистическая оценка, при которой при объеме выборки, стремящейся к бесконечности, дисперсия несмещенной оценки стремится к нулю.

«Статистические оценки параметров распределения» 👇

Генеральная и выборочная средние

Определение 6

Генеральная средняя — среднее арифметическое значений вариант генеральной совокупности.

Определение 7

Выборочная средняя — среднее арифметическое значений вариант выборочной совокупности.

Величины генерального и выборочного среднего можно найти по следующим формулам:

  1. Если значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$, то
  1. Если значения вариант $x_1, x_2,dots ,x_k$ различны, то

С этим понятием связано такое понятие как отклонение от средней. Данная величина находится по следующей формуле:

Среднее отклонение обладает следующими свойствами:

  1. $sum{n_ileft(x_i-overline{x}right)=0}$

  2. Среднее значение отклонения равно нулю.

Генеральная, выборочная и исправленная дисперсии

Еще одними из основных параметров является понятие генеральной и выборочной дисперсии:

Генеральная дисперсия:

Выборочная дисперсия:

С этими понятия связаны также генеральная и выборочная средние квадратические отклонения:

В качестве оценки генеральной дисперсии вводится понятие исправленной дисперсии:

Также вводится понятие исправленного стандартного отклонения:

Пример решения задачи

Пример 1

Генеральная совокупность задана следующей таблицей распределения:

Рисунок 1.

Найдем для нее генеральное среднее, генеральную дисперсию, генеральное среднее квадратическое отклонение, исправленную дисперсию и исправленное среднее квадратическое отклонение.

Решение:

Для решения этой задачи для начала сделаем расчетную таблицу:

Рисунок 2.

Величина $overline{x_в}$ (среднее выборочное) находится по формуле:

[overline{x_в}=frac{sumlimits^k_{i=1}{x_in_i}}{n}]

То есть

[overline{x_в}=frac{sumlimits^k_{i=1}{x_in_i}}{n}=frac{87}{30}=2,9]

Найдем генеральную дисперсию по формуле:

[D_в=frac{sumlimits^k_{i=1}{{{(x}_i-overline{x_в})}^2n_i}}{n}=frac{60,7}{30}=2,023]

Генеральное среднее квадратическое отклонение:

[{sigma }_в=sqrt{D_в}approx 1,42]

Исправленная дисперсия:

[{S^2=frac{n}{n-1}D}_в=frac{30}{29}cdot 2,023approx 2,09]

Исправленное среднее квадратическое отклонение:

[S=sqrt{S^2}approx 1,45]

Находи статьи и создавай свой список литературы по ГОСТу

Поиск по теме

Добавить комментарий