Как исправить выборочную дисперсию

Выборочная дисперсия, описание

Выборочная дисперсия является сводной характеристикой для наблюдения рассеяния количественного признака выборки вокруг среднего значения.

Определение

Выборочная дисперсия – это среднее арифметическое значений вариантов части отобранных объектов генеральной совокупности (выборки).

Связь выборочной и генеральной дисперсии

Генеральная дисперсия представляет собой среднее арифметическое квадратов отступлений значений признаков генеральной совокупности от их среднего значения.

Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.

Определение

Генеральная совокупность – это комплекс всех возможных объектов, относительно которых планируется вести наблюдение и формулировать выводы.

Выборочная совокупность или выборка является частью генеральной совокупности, выбранной для изучения и составления заключения касательной всей генеральной совокупности.

Как вычислить выборочную дисперсию

Выборочная дисперсия при различии всех значений варианта выборки находится по формуле:

({widehat D}_В=frac{displaystylesum_{i-1}^n{(x_i-{overline x}_В)}^2}n)

Для значений признаков выборочной совокупности с частотами n1, n2,…,nформула выглядит следующим образом:

({widehat D}_В=frac{displaystylesum_{i-1}^kn_i{(x_i-{overline x}_В)}^2}n)

Квадратный корень из выборочной дисперсии характеризует рассеивание значений вариантов выборки вокруг своего среднего значения. Данная характеристика называется выборочным средним квадратическим отклонением и имеет вид:

({widehatsigma}_В=sqrt{{widehat D}_В})

Упрощенный способ вычисления выборочной или генеральной дисперсии производят по формуле:

(D=overline{x^2}-left[overline xright]^2)

Если вариационный ряд выборочной совокупности интервальный, то за xi принимается центр частичных интервалов. 

Пример

Найти выборочную дисперсию выборки со значениями:

  • xi: 1, 2, 3, 4;
  • ni: 20, 15, 10, 5.

Решение

Для начала необходимо определить выборочную среднюю:

({overline x}_В=frac1{50}(1cdot20+2cdot15+3cdot10+4cdot5)=frac1{50}cdot100=2)

Затем найдем выборочную дисперсию:

(D_В=frac1{50}({(1-2)}^2cdot20+{(2-2)}^2cdot15+{(3-2)}^2cdot10+{(4-2)}^2cdot5)=1)

Исправленная дисперсия

Математически выборочная дисперсия не соответствует генеральной, поскольку выборочная используется для смещенного оценивания генеральной дисперсии. По этой причине математическое ожидание выборочной дисперсии вычисляется так:

(Mleft[D_Bright]=frac{n-1}nD_Г)

В данной формуле DГ – это истинное значение дисперсии генеральной совокупности.

Исправить выборочную дисперсию можно путем умножения ее на дробь:

(frac n{n-1})

Получим формулу следующего вида:

(S^2=frac n{n-1}cdot D_В=frac{displaystylesum_{i=1}^kn_i{(x_i-{overline x}_В)}^2}{n-1})

Исправленная дисперсия используется для несмещенной оценки генеральной дисперсии и обозначается S2

Среднеквадратическая генеральная совокупность оценивается при помощи исправленного среднеквадратического отклонения, которое вычисляется по формуле:

(S=sqrt{S^2})

При нахождении выборочной и исправленной дисперсии разнятся лишь знаменатели в формулах. Различия в этих характеристиках при больших n незначительны. Применение исправленной дисперсии целесообразно при объеме выборки меньше 30.

Для чего применяют исправленную выборочную дисперсию

Исправленную выборочную используют для точечной оценки генеральной дисперсии.

Пример

Длину стержня измерили одним и тем же прибором пять раз. В результате получили следующие величины: 92 мм, 94 мм, 103 мм, 105 мм, 106 мм. Задача найти выборочную среднюю длину предмета и выборочную исправленную дисперсию ошибок измерительного прибора.

Решение

Сначала вычислим выборочную среднюю:

({overline x}_В=frac{92+94+103+105+106}5=100)

Затем найдем выборочную дисперсию:

(D_В=frac{displaystylesum_{i=1}^k{(x_i-{overline x}_В)}^2}n=frac{{(92-100)}^2+{(94-100)}^2+{(103-100)}^2+{(105-100)}^2+{(106-100)}^2}5=34)

Теперь рассчитаем исправленную дисперсию:

(S^2=frac5{5-1}cdot34=42,5)

Автор статьи

Евгений Николаевич Беляев

Эксперт по предмету «Математика»

Задать вопрос автору статьи

Генеральная дисперсия

Пусть нам дана генеральная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Определение 1

Генеральная совокупность — совокупность случайно отобранных объектов данного вида, над которыми проводят наблюдения с целью получения конкретных значений случайной величины, проводимых в неизменных условиях при изучении одной случайной величины данного вида.

Определение 2

Генеральная дисперсия — среднее арифметическое квадратов отклонений значений вариант генеральной совокупности от их среднего значения.

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда генеральная дисперсия вычисляется по формуле:

Логотип baranka

Сдай на права пока
учишься в ВУЗе

Вся теория в удобном приложении. Выбери инструктора и начни заниматься!

Получить скидку 3 000 ₽

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае генеральная дисперсия вычисляется по формуле:

С этим понятием также связано понятие генерального среднего квадратического отклонения.

Определение 3

Генеральное среднее квадратическое отклонение — квадратный корень из генеральной дисперсии:

[{sigma }_г=sqrt{D_г}]

Выборочная дисперсия

Пусть нам дана выборочная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Определение 4

Выборочная совокупность — часть отобранных объектов из генеральной совокупности.

Определение 5

Выборочная дисперсия — среднее арифметическое значений вариант выборочной совокупности.

«Дисперсия: генеральная, выборочная, исправленная» 👇

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда выборочная дисперсия вычисляется по формуле:

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае выборочная дисперсия вычисляется по формуле:

С этим понятием также связано понятие выборочного среднего квадратического отклонения.

Определение 6

Выборочное среднее квадратическое отклонение — квадратный корень из генеральной дисперсии:

[{sigma }_в=sqrt{D_в}]

Исправленная дисперсия

Для нахождения исправленной дисперсии $S^2$ необходимо умножить выборочную дисперсию на дробь $frac{n}{n-1}$, то есть

С этим понятием также связано понятие исправленного среднего квадратического отклонения, которое находится по формуле:

!!! В случае, когда значение вариант не являются дискретными, а представляют из себя интервалы, то в формулах для вычисления генеральной или выборочной дисперсий за значение $x_i$ принимается значение середины интервала, которому принадлежит $x_i.$

Пример задачи на нахождение дисперсии и среднего квадратического отклонения

Пример 1

Выборочная совокупность задана следующей таблицей распределения:

Рисунок 1.

Найдем для нее выборочную дисперсию, выборочное среднее квадратическое отклонение, исправленную дисперсию и исправленное среднее квадратическое отклонение.

Решение:

Для решения этой задачи для начала сделаем расчетную таблицу:

Рисунок 2.

Величина $overline{x_в}$ (среднее выборочное) в таблице находится по формуле:

[overline{x_в}=frac{sumlimits^k_{i=1}{x_in_i}}{n}]

То есть

[overline{x_в}=frac{sumlimits^k_{i=1}{x_in_i}}{n}=frac{305}{20}=15,25]

Найдем выборочную дисперсию по формуле:

[D_в=frac{sumlimits^k_{i=1}{{{(x}_i-overline{x_в})}^2n_i}}{n}=frac{523,75}{20}=26,1875]

Выборочное среднее квадратическое отклонение:

[{sigma }_в=sqrt{D_в}approx 5,12]

Исправленная дисперсия:

[{S^2=frac{n}{n-1}D}_в=frac{20}{19}cdot 26,1875approx 27,57]

Исправленное среднее квадратическое отклонение:

[S=sqrt{S^2}approx 5,25]

Находи статьи и создавай свой список литературы по ГОСТу

Поиск по теме

Выборочная средняя

,n
– объем выборки.

Если дано распределение
непрерывной случайной величины, то
вместо хi
берут середину интервала (хi,…,
хi+1),
то есть
.

Выборочная и исправленная дисперсия

Чтобы охарактеризовать
рассеяние наблюдаемых значений
количественного признака выборки вокруг
своего среднего значения
вводят выборочную дисперсию.

Выборочной дисперсией DB
называют среднее арифметическое
квадратов отклонения наблюдаемых
значений признака от их среднего значения
.

.

Часто для вычисления выборочной дисперсии
используют следующую формулу:

.

Выборочная дисперсия имеет
систематическую ошибку, приводящую к
уменьшению дисперсии. Чтобы это устранить,
вводят поправку, умножая DB
на n/(n-1).
Получают исправленную дисперсию:

или:

.

На практике используют другую, равносильную
ей формулу:

.

Мода

Модой М0
называют значение признака, которое
имеет наибольшую частоту (ni
= max).

Медиана

Медианой me
называют значение признака, которое
делит статистическое распределение на
две равные части:

me
= xk+1,
если
n = 2k + 1,

me
= (xk
+ xk+1)/2,
если
n = 2k.

Выборочное среднее квадратическое
отклонение

Выборочным средним квадратическим
отклонением
(стандартом) называют
квадратный корень из выборочной
дисперсии:


=

Исправленное среднее квадратическое
отклонение:

S
=

Коэффициент вариации

Коэффициентом вариации
V
называется отношение выборочного
среднего квадратического отклонения
к выборочной средней, выраженное в
процентах:

V
=
.

Коэффициент вариации служит для
сравнивания меры рассеяния значений
признаков около выборочной средней в
разных выборках.

Статистические оценки параметров
распределения

Пусть требуется изучить количественный
признак генеральной совокупности. Пусть
удалось установить, какое именно
распределение имеет признак. Возникает
задача оценки параметров, которыми
определяется это распределение.

Например, если известно,
что изучаемый признак распределен в
генеральной совокупности нормально,
то требуется оценить, то есть приближенно
найти математическое ожидание (а)
и среднее квадратическое отклонение
(δ), так как эти два параметра полностью
задают нормальное распределение. Если
же известно, что признак имеет распределение
Пуассона, то необходимо оценить параметр
“”,
которым оно определяется.

Обычно оцениваемый параметр
выражают через данные выборки, например,
через значения количественного признака
х1,
х2,…,хn,
полученные в результате наблюдений.

Статистической оценкой
неизвестного параметра теоретического
распределения называют его приближенное
значение, зависящее от данных выборки
1,
х2,…,
хk;
n1,
n2
,…,nk),
то есть некоторую функцию этих величин.

x1,
х2,
…,хk
– значения признака;
n1,
n2,
…, nk
– частоты. Статистическая
оценка является случайной величиной.

Пусть Θ
– оцениваемый параметр, Θ*
– его статистическая оценка. Ясно, что
Θ*
тем точнее определяет параметр Θ,
чем меньше абсолютная величина разности

– Θ*|.
Другими словами, если δ >0 и |Θ
– Θ*|<
δ, то чем меньше δ, тем оценка точнее.
Таким образом, величину |Θ
– Θ*|
называют точностью
оценк
и,
а число δ характеризует точность оценки.

Чтобы оценка Θ*
имела практическое значение, она не
должна содержать систематической ошибки
и вместе с тем иметь возможно меньшую
дисперсию. При этом если оценка Θ*
дает приближенное значение Θ
с избытком (Θ*
> Θ),
то и математическое ожидание (среднее
значение) M(Θ*)>Θ;
если же Θ*
дает оценку с недостатком (Θ*
< Θ),
то и M
(Θ*)
< Θ.
На основании этого делаем вывод, что
соблюдение требований M(Θ*)
= Θ
гарантирует от получения систематических
ошибок.

Оценка параметра называется
несмещенной,
если ее математическое ожидание M
(Θ*)
равно оцениваемому параметру Θ,
то есть M
(Θ*)
= Θ
и смещенной, если M(Θ*)

Θ.

Оценка Θ*
называется эффективной,
если при заданном объеме выборки “n”
она имеет наименьшую дисперсию.

Оценка Θ*
называется состоятельной,
если при любом δ > 0:

lim
P
(|Θ
– Θ*|<
δ) = 1, то есть оценка Θ*
сходится по вероятности к Θ.

Теорема1.
Выборочная средняя
является несмещенной и состоятельной
оценкой математического ожидания.

является и эффективной оценкойM
(Х).

Теорема 2.
Исправленная выборочная дисперсия

является несмещенной и состоятельной
оценкой дисперсии D(Х).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Несмещенная оценка выборочной дисперсии

Краткая теория


Пусть из генеральной совокупности в результате

 независимых наблюдений над количественным
признаком

 извлечена повторная выборка объема

:

При этом

Требуется по данным выборки оценить (приближенно найти) неизвестную
генеральную дисперсию

.
Если в качестве оценки генеральной дисперсии принять выборочную дисперсию, то
эта оценка будет приводить в систематическим ошибкам, давая заниженное значение
генеральной дисперсии. Объясняется это тем, что, как можно доказать, выборочная
дисперсия является смещенной оценкой

,
другими словами, математическое ожидание выборочной дисперсии не равно
оцениваемой генеральной дисперсии, а равно:

Легко «исправить» выборочную дисперсию так, чтобы ее математическое
ожидание было равно генеральной дисперсии. Достаточно для этого умножить

 на дробь

.
Сделав это, получим исправленную дисперсию, которую обычно обозначают через

:

Исправленная дисперсия является, конечно, несмещенной оценкой
генеральной дисперсии. Действительно:

Итак, в качестве оценки генеральной дисперсии принимают
исправленную дисперсию:

Для оценки среднего квадратического
отклонения генеральной совокупности используют исправленное среднее квадратическое отклонение, которое равно квадратному корню
из исправленной дисперсии:

При достаточно больших значениях

 объема выборки выборочная и исправленная
дисперсия отличаются мало. На практике используются исправленной дисперсией,
если примерно

.

Пример решения задачи


Задача

Найти
несмещенную выборочную дисперсию на основании данного распределения выборки.

Решение

На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:

ВКонтакте
WhatsApp
Telegram

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.

Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.

Выборочная дисперсия является смещенной оценкой генеральной дисперсии, поэтому в статистике применяют также исправленную выборочную дисперсию, которая является несмещенной оценкой генеральной дисперсии.

Сумма
частот:

Вычислим
среднюю:

Средняя квадратов:

Несмещенная
выборочная дисперсия:

Ответ:

Кроме этой задачи на другой странице сайта есть

пример расчета исправленной выборочной дисперсии и среднего квадратического отклонения для интервального вариационного ряда

ЛЕКЦИЯ 13

ТЕМА: СТАТИСТИЧЕСКИЕ
ОЦЕНКИ ПАРАМЕТРОВ ВЫБОРКИ


1.
Точечные оценки параметров распределения.

1.1.
Генеральная средняя.

1.2.
Выборочная средняя.

1.3.
Генеральная дисперсия.

1.4.
Выборочная дисперсия.

1.5.
Исправленная дисперсия.


2.
Интервальные оценки параметров
распределения.

2.1.
Интервальные оценки параметров
нормального распределения.

2.1.1.
Доверительный интервал для оценки
математического ожидания при известном
s.

2.1.2.

Доверительный
интервал для оценки математического
ожидания при неизвестном
s.

2.1.3.
Доверительный интервал для оценки
дисперсии и среднего квадратического
отклонения.

2.2.
Интервальная оценка вероятности
биноминального распределения по
относительной частоте.

1.     
Точечные
оценки параметров распределения.

Пусть
требуется изучить количественный признак
генеральной совокупности. Допустим, что из
теоретических соображений удалось
установить, какое именно распределение
имеет признак. Возникает задача оценки
параметров, которыми определяется это
распределение.

Обычно
в распоряжении исследователя имеются лишь
данные выборки, полученные в результате
n
наблюдений (здесь и далее наблюдения
предполагаются независимыми). Через эти
данные и выражают оцениваемый параметр.
Рассматривая значения количественного
признака как независимые случайные
величины, можно сказать, что найти
статистическую оценку неизвестного
параметра теоретического распределения –
это значит найти функцию от наблюдаемых
случайных величин, которая и дает
приближенное значение оцениваемого
параметра.


Итак, статистической
оценкой неизвестного параметра
теоретического распределения называют
функцию от наблюдаемых случайных величин.

Для
того чтобы статистические оценки давали «хорошие»
приближения оцениваемых параметров, они
должны удовлетворять определенным
требованиям: оценка должна быть несмещенной,
эффективной и состоятельной.

Поясним
каждое из понятий.

 
Несмещенной
называют статистическую оценку
Q*, математическое ожидание которой
равно оцениваемому параметру
Q при любом объеме выборки, т. е.

M(Q*)
= Q.


Смещенной
называют оценку, математическое ожидание
которой не равно оцениваемому параметру.

 
Эффективной
называют статистическую оценку, которая (при
заданном объеме выборки п) имеет наименьшую 
возможную дисперсию.

При
рассмотрении выборок большого объема (
n велико!) к статистическим
оценкам предъявляется требование
состоятельности.

 
Состоятельной
называют статистическую оценку, которая
при

п
®¥
стремится по вероятности
к оцениваемому параметру. Например, если
дисперсия несмещенной оценки при
п
®¥
 стремится
к нулю, то такая оценка оказывается и
состоятельной.


Рассмотрим
точечные оценки параметров
распределения, т.е.

оценки, которые
определяются одним числом
Q*
=f( x1, x2,…,xn), где x1, x2,…,xn– выборка.

1.1.Генеральная средняя.

Пусть
изучается генеральная совокупность
относительно количественного признака Х.

 
Генеральной
средней называют среднее арифметическое
значений признака генеральной
совокупности.

Если все
значения признака различны, то


Если значения признака имеют частоты N1, N2, …, Nk, где N1 +N2+…+Nk= N, то


1.2.Выборочная средняя.

Пусть для
изучения генеральной совокупности
относительно количественного признака Х
извлечена выборка объема
n.

 
Выборочной
средней называют среднее арифметическое
значение признака выборочной совокупности.

Если
все значения признака выборки различны, то


если
же все значения имеют частоты
n1
, n2,…,nk, то


Выборочная
средняя является несмещенной и
состоятельной  оценкой
генеральной средней.

Замечание:
Если выборка представлена интервальным
вариационным рядом, то за
xi
принимают середины частичных интервалов.

 

1.3.
Генеральная дисперсия.

Для
того чтобы охарактеризовать рассеяние
значений количественного признака Х генеральной совокупности вокруг
своего среднего значения, вводят сводную
характеристику — генеральную дисперсию.

 
Генеральной
дисперсией

Dг
называют
среднее арифметическое квадратов
отклонений значений признака генеральной
совокупности от их среднего значения

.

Если
все значения признака генеральной
совокупности объема N
различны, то


Если
же значения признака имеют соответственно
частоты
N1, N2, …, Nk, где N1 +N2+…+Nk= N, то


Кроме
дисперсии для характеристики рассеяния зна­чений
признака генеральной совокупности вокруг
своего среднего значения пользуются
сводной характеристикой— средним
квадратическим отклонением.

 
Генеральным
средним квадратическим отклонением
(стандартом) называют квадратный корень из
генеральной дисперсии:


1.4.Выборочная
дисперсия.

Для
того, чтобы наблюдать рассеяние
количественного признака значений выборки
вокруг своего среднего значения , вводят
сводную характеристику- выборочную
дисперсию.

 
Выборочной дисперсией

называют
среднее арифметическое квадратов
отклонения наблюдаемых значений признака
от их среднего значения

.

Если все
значения признака выборки различны, то


 если же все значения имеют
частоты
n1, n2,…,nk, то



Для
характеристики рассеивания значений
признака выборки вокруг своего среднего
значения пользуются сводной
характеристикой – средним квадратическим
отклонением.

 
Выборочным средним
квадратическим отклоненим называют
квадратный корень из выборочной дисперсии:


Вычисление
дисперсии- выборочной или генеральной,
можно упростить, используя формулу:


Замечание:
если выборка представлена интервальным
вариационным рядом, то за
xi

принимают середины частичных интервалов.

1.5.Исправленная
дисперсия.

Выборочная
дисперсия является смещенной оценкой
генеральной дисперсии, т.е. математическое
ожидание выборочной дисперсии не равно
оцениваемой генеральной дисперсии, а равно

 

 
Для
исправления выборочной дисперсии
достаточно умножить ее на дробь



получим
исправленную
дисперсию
S2. Исправленная дисперсия
является несмещенной оценкой.

В
качестве оценки генеральной дисперсии
принимают исправленную дисперсию.

Для
оценки среднего квадратического
генеральной совокупности используют исправленное среднее
квадратическое отклонение


Замечание:
формулы для вычисления выборочной
дисперсии и исправленной дисперсии
отличаются только знаменателями. При
достаточно больших
n
выборочная и исправленная дисперсии мало
отличаются, поэтому на практике
исправленной дисперсией пользуются, если
n<30.

 Вычислим выборочные характеристики по
выборкам, рассмотренным в 
лекции 12 пункт 3.1.(дискретный вариационный
ряд и пункт 3.2.(интервальный вариационный
ряд).

Пример
1. Для
дискретного вариационного ряда:

Среднее
выборочное

 

Выборочная
дисперсия

 

Выборочное
среднее квадратическое отклонение


Исправленная
дисперсия


Пример2.
Для интервального вариационного ряда:

За  хi примем середины частичных
интервалов:

 

Для
вычисления выборочной дисперсии
воспользуемся формулой

 



Выборочное
среднее квадратическое отклонение :

2.     
Интервальные
оценки параметров распределения.

 
Интервальной
называют оценку, которая определяется
двумя числами—концами интервала.
Интервальные оценки позволяют установить
точность и надежность оценок .

Пусть найденная по данным
выборки статистическая характеристика
Q* служит оценкой
неизвестного пара­метра Q. Будем считать Q
постоянным числом (Q может быть и случайной
величиной). Ясно, что Q* тем точнее
определяет параметр Q, чем меньше
абсолютная величина разности |
Q

Q*|. Другими словами, если
d>0
и |Q- Q*| <
d , то чем
меньше

d

, тем оценка точнее.

 
Таким
образом, положительное число
d
характеризует
точность оценки.

Однако статистические
методы не позволяют категорически
утверждать, что оценка
Q*
удовлетворяет неравенству |Q- Q*| <
d;
можно лишь говорить о
вероятности
g,
с которой это неравенство
осуществляется.

 
Надежностью
(доверительной вероятностью)

оценки
называют вероятность
g , с
которой осуществляется неравенство |
QQ*
| <
d .

Обычно
надежность оценки задается наперед, причем
в качестве
g берут
число, близкое к единице. Наиболее часто
задают
надежность,
равную 0,95; 0,99 и 0,999.

Пусть
вероятность того, что,
|Q- Q*| <
d равна g:

P(|Q-
Q*| <
d)= g.

Заменив
неравенство равносильным ему двойным
неравенством получим:

Р [Q* —d< Q < Q* +d] = g

  Это соотношение следует понимать
так: вероятность того, что интервал Q*
d<
Q
< Q* +
d заключает
в себе (покрывает) неизвестный параметр Q,
равна
g.

 
Интервал (Q* – d
Q* +
d) называется
доверительным интервалом , который
покрывает неизвестный параметр с
надежностью
g
.

2.1.Интервальные
оценки параметров нормального
распределения.

2.1.1.
Доверительный интервал для оценки
математического ожидания при известном

s.

Пусть количественный признак
генеральной совокупности распределен
нормально. Известно среднее квадратическое
отклонение  этого
распределения
s. Требуется
оценить математическое ожидание а
по выборочной средней. Найдем
доверительный интервал, покрывающий а
с надежностью
g.
Выборочную среднюю будем
рассматривать как случайную величину ( она
изменяется от выборки  к
выборке), выборочные значения признака- как
одинаково распределенные независимые СВ с
математическим ожиданием каждой а
и средним квадратическим отклонением
s. Примем
без доказательства, что если величина Х
распределена нормально, то и выборочная
средняя тоже распределена нормально с
параметрами



.

Потребуем,
чтобы выполнялось равенство



 


Заменив
Х и
s, получим

 

получим


Задача
решена.  Число
t
находят по таблице функции Лапласа Ф(х).

Пример1.
СВХ распределена нормально и
s
=3. Найти доверительный
интервал для оценки математического
ожидания по выборочным средним, если
n
= 36 и задана надежность
g
=0,95.

Из
соотношения 2Ф(
t)= 0,95 ,
откуда Ф(t) = 0,475 по таблице 
найдем
t
:
t
=1,96. Точность оценки

Доверительный
интервал

 

.

Пример2.
Найти минимальный объем выборки, который
обеспечивает заданную точность
d =0,3 и
надежность
g = 0,975, если
СВХ распределена нормально и
s =1,2.

                                           
Из равенства



 

                                          
выразим
n:



,

подставим
значения и получим минимльный объем
выборки  
n ~
81.

2.1.2.
Доверительный интервал для оценки
математического ожидания при неизвестном

s
.

Т.к.
мы не знакомы с законами распределения СВ,
которые используются при
выводе
формулы, то примем ее без доказательства.

В
качестве неизвестного параметра


s
используют
исправленную дисперсию
s2

. Заменяя
s на
s, t на величину t
g.
Значение 
этой величины зависит от надежности

g и объема
выборки
n  и определяется 
по ” Таблице значений
t
g. 
Итак :



и
доверительный интервал имеет вид


Пример1.
Найти доверительный интервал для оценки
математического ожидания с надежностью 0,95,
если объем выборки
n =16, среднее выборочное и
исправленная дисперсия соответственно
равны 20,2 и 0,8.

По
таблице приложения найдем
tg
по заданной
надежности
g =0,95 и n=
16:
tg
=2,13. Подставим
в формулу
s =0,8 и
t
g
=2,13
, вычислим границы доверительного интевала:



,

откуда
получим доверительный интервал (19,774; 20,626)

Смысл
полученного результата: если взять 100
различных выборок, то в 95 из них
математическое ожидание будет находится в
пределах данного интервала, а в 5 из них- нет.

Пример2.
Измеряют диаметры 25 корпусов
электродвигателей. Получены выборочные
характеристики

 

 

Необходимо
найти вероятность

(надежность) того, что




является доверительным интервалом оценки
математического ожидания при нормальном
распределении.

Из
условия задачи найдем точность
d,
составив и решив систему:


           
     Откуда
d =10.         
Из
равенства 


 

                                               
        
выразим
 



,

откуда
tg =3,125.
По таблице для найденного

tg  и
n=
25 находим
g
=0,99.

2.1.3.
Доверительный интервал для оценки
дисперсии и среднего квадратического
отклонения.

Требуется
оценить неизвестную генеральную дисперсию
и генеральное среднее квадратическое
отклонение по исправленной дисперсии, т.е.
найти доверительные интервалы, покрывающие
параметры
D
и s с заданной надежностью
g.

Потребуем
выполнения соотношения


.

Раскроем
модуль и получим двойное неравенство:


.

Преобразуем:



.

Обозначим
d/s
= q
(величина
q

находится по  “Таблице значений q”и зависит
от надежности и объема
выборки)
,
тогда д
оверительный
интервал для оценки генерального среднего
квадратического отклонения имеет вид:



.

Замечание
: Так как
s >0, то
если
q
>1 , левая граница интервала равна 0:
  
               

 0<
s
<
s ( 1 + q ).

Пример1. 
По выборке объема
n
= 25 найдено “исправленное” среднее
квадратическое отклонение
s
=
0,8.  Найти
доверительный интервал, покрывающий
генеральное
среднее квадратическое отклонение с
надежностью 0,95.

По
таблице приложения по данным :
g
= 0,95;
n =25 ,
находим
q
= 0,32.

Искомый
доверительный интервал 0,8(1- 0,32)<
s
< 0,8(1+ 0,32) или 
0,544
<
s
<0,056.

Пример2.
По выборке объема
n = 10
найдено
s = 0,16. Найти доверительный
интервал, покрывающий генеральное среднее
квадратическое отклонение с надежностью
0,999.

q( n=10, g
=0,999) =
1,8>0.

Искомый
доверительный интервал 
0<
s <0,16(1+1,8)  или  0<
s <0,448.

Так
как дисперсия есть квадрат среднего
квадратического отклонения, то
доверительный интервал, покрывающий
генеральную дисперсию с заданной
надежностью
g, имеет вид:


2.2.
Интервальная оценка
вероятности биноминального распределения
по относительной частоте.

Найдем
доверительный интервал для оценки
вероятности по относительной частоте,
используя формулу:

 

Если
n
достаточно велико и р не очень близка к нулю
и единице, то можно считать, что
относительная частота распределена
приближенно по нормальному закону, причем
М(
W)= р.
Заменив Х на относительную частоту ,
математическое ожидание – на вероятность,
получим равенство:



Приступим к
построению доверительного интервала (р1,
р2), который с надежностью
g
 покрывает
оцениваемый параметр р
Потребуем, чтобы с надежностью
g
выполнялось соотношение указанное выше
равенство:

                                                         
Заменив



,

                                   
получим:

Таким образом,
с надежностью
g выполняется
неравенство (чтобы получить рабочую
формулу, случайную величину
W
заменим неслучайной наблюдаемой
относительной частотой
w
и подставим 1- р
вместо
q):


Учитывая,
что вероятность р
неизвестна, решим это неравенство
относительно р.
Допустим, что w > р. Тогда


Обе
части неравенства положительны; возведя
их в квадрат, получим равносильное
квадратное неравенство относительно р:


Дискриминант
трехчлена положительный, поэтому корни
действительные и различные:

меньший
корень


больший
корень:

 

 Замечание1:
При больших значениях
n
, пренебрегая слагаемыми



                                                                    
учитывая


получим
приближенные формулы для границ
доверительного интервала :



  







Пример1.
Производят независимые испытания с
одинаковой и неизвестной вероятностью
появления события А в каждом испытании.
Найти доверительный интервал для оценки
вероятности с надежностью 0,95, если в 80
испытаниях событие А появилось 16 раз.

По
условию
n =80, m
=16,
g =0,95. Относительная
частота

 

.

Из
соотношения Ф(
t)=0,95/2
= 0,475 по таблице находим
t = 1,96. Т.к. n<100, 
то используем точные формулы, получим :
р1= 0,128, р2= 0,299.

 Замечание 2: Если n
мало, то используем для определения концов
доверительного интервала вероятности
события при биноминальном распределении
“Таблицу доверительных границ р1 и р2“. Значения р1 и р2
находят в зависимости от
n
и
m.

Пример.
В пяти независимых испытаниях событие А
произошло 3 раза. Найти с надежностью 0,95
интервальную оценку для вероятности
события А в единичном испытании.

По
условию задачи
n=5, m=3.
Имеет место схема повторных испытаний.
Используя таблицу, находим доверительный
интервал : 0,147<
p<0,947.

Контрольные
вопросы


1.     
Определение статистической оценки
неизвестного параметра.

2.     
Какая оценка называется точечной?

3.     
Каким требованиям должны удовлетворять
статистические оценки?

4.     
Сформулировать определения
генеральной средней и генеральной
дисперсии.

5.     
Записать выражения для вычисления
выборочной средней, выборочной дисперсии и
исправленной дисперсии. Какая из этих
оценок не является несмещенной?

6.     
Методики вычисления границ
доверительного интервала 
для оценки математического ожидания
нормально распределенной СВ при известном
и неизвестном

s.

7.     
Методика вычисления границ
доверительного интервала для оценки
среднего квадратического отклонения
нормально распределенной СВ.

8.     
Доверительный интервал вероятности
биноминального распределения по
относительной частоте при больших
n , при n<100.

Добавить комментарий