Пусть
из генеральной совокупности в результате
n
испытаний над количественным признаком
X
извлечена выборка объемом n:
варианты x1,
… , xr
и
их частоты n1,
… , nr.
Точечной
называют
оценку, которая определяется одним
числом. Точечные оценки обычно используют
в тех случаях, когда число наблюдений
велико.
Выборочной
средней
xв
называют среднее арифметическое значение
вариант выборки. Если значения вариант
x1,
x2,
… , xr
имеют
соответственно частоты n1,
n2,
… , nr,
то
.
(5)
Выборочной
дисперсией Dв
называют среднее арифметическое
квадратов отклонений вариант xi
от их среднего значения xв,
т.е.
.
(6)
Выборочным
средним квадратическим отклонением σв
называют
квадратный корень из выборочной дисперсии
Dв
.
(7)
Исправленную
(несмещенную оценку) дисперсию
s2
выборки получают по формуле
.
(8)
Аналогично
вводится исправленное
среднее квадратическое отклонение s
.
(9)
3. Интервальные оценки параметров распределения выборки
Интервальной
называют оценку, которая задается в
виде интервала. Интервальные оценки
удобно использовать в тех случаях, когда
число наблюдений n
относительно невелико.
Пусть
для неизвестного параметра θ количественного
признака X
генеральной совокупности статистическими
методами найдено значение θ*. Зададимся
точностью δ, т.е. | θ – θ* | < δ.
Надежностью
оценки
неизвестного параметра θ по вычисленному
статистическими методами значению θ*
называют вероятность γ, с которой
выполняется неравенство| θ – θ* | < δ,
при этом δ называется
точностью оценки.
В статистике обычно задаются надежностью
γ и определяют точность δ.
Доверительным
интервалом
для параметра θ называют интервал (θ* –
δ, θ* + δ), который покрывает неизвестный
параметр θ с вероятностью γ:
P[θ*
– δ <X
< θ* + δ] = γ.
Пусть
количественный признак X
генеральной совокупности распределен
нормально, причем среднее квадратическое
отклонение σ неизвестно. Требуется
оценить неизвестное математическое
ожидание a
по результатам выборки с заданной
надежностью γ.
Доверительный
интервал
с
уровнем надежности γ для математического
ожидания
a
признака
X,
распределенного нормально, при неизвестном
среднем квадратическом отклонении
определяется как
,
(10)
где
xв
– выборочное среднее; s
– исправленное среднее квадратическое
отклонение выборки; n
– объем выборки. Точность оценки δ в
этом случае
.
Значениеtγ
= t(γ,n)
можно найти из справочной таблицы
”Таблица значений tγ
= t(γ,n)”
для распределения Стьюдента.
Доверительный
интервал
с
уровнем надежности γ для
среднего
квадратического отклонения
σ признака X,
распределенного нормально, определяется
как
,
(11)
где
s
– исправленное среднее квадратическое
отклонение выборки; n
– объем выборки. Значение q
= q(γ,n)
можно найти из справочной таблицы
”Таблица значений q
= q(γ,n)”
для распределения χ2.
В
случае, когда q
>1 доверительный интервал имеет вид
. (11′)
4. Статистическая проверка статистических
гипотез
Статистической
называют гипотезу (предположение) о
виде неизвестного распределения или о
параметрах известного распределения.
Основной
или нулевой гипотезой H0
называют выдвинутую гипотезу о неизвестном
распределении, вместе с основной H0
выдвигается
и конкурирующая
(альтернативная) гипотеза
H1,
противоречащая
основной.
Основной
принцип проверки статистических
гипотез состоит в следующем:
в
зависимости от вида гипотезы и характера
неизвестного распределения вводится
функция K,
называемая критерием,
по значениям ее будет приниматься
решение о принятии или отклонении
основной гипотезы H0.
Вводится также уровень
значимости
α как вероятность того, что будет
отвергнута верная нулевая гипотеза и
принята неверная гипотеза H1.
Областью
принятия гипотезы
H0
называют
те значения критерия K,
при которых основная гипотеза H0
принимается, критической
областью
– отвергается. Для каждой выборки и
конкретного вида критерия K
по специальным таблицам находятся
значения kкр,
называемые критическими
точками;
критические точки отделяют область
принятия гипотезы от критической
области. Правосторонней
называют критическую область, где K
> kкр,
левосторонней
K
< kкр
и
двусторонней
(и симметричной) | K|
> kкр.
Пусть
из генеральной совокупности в результате
n
испытаний над количественным признаком
X
извлечена выборка объемом n:
равноотстоящие с шагом h
варианты x1,
… , xr
и
их частоты n1,
… , nr.
Для нее подсчитаны по формулам (5-9)
выборочное среднее xв
и выборочное среднее квадратическое
отклонение σв.
Для
проверки гипотезы
о нормальном распределении
генеральной совокупности c
уровнем значимости α используется
критерий
χ2
Пирсона:
(12)
Критическое
значение χ2кр
= χ2
(α,k)
для этого критерия находится из справочной
таблицы “Критические точки распределения
χ2”.
Здесь k
= r
– 3. Если вычисленное по результатам
наблюдений по формуле (12) значение
критерия χ2набл
больше χ2кр,
основная гипотеза отвергается, если
меньше – нет оснований отвергнуть
основную гипотезу.
Если
варианты x1,
x2,
… , xr
не
являются равноотстоящими или число их
сравнительно велико, удобно сгруппировать
варианты в отдельные интервалы ( не
обязательно равноотстоящие ) [x1*;x2*),
[x2*;x3*),
…, [xm-1*;xm*).
Каждому интервалу назначается
представительное значение, равное
середине интервала xi.ср*
= (xi*
+ xi-1*)/2
и частота ni*,
равная сумме частот, попавших на интервал.
В соответствии с критерием Пирсона,
частоты ni*,
попавшие на интервалы [xi*
; xi-1*),
сравниваются с теоретическими частотами
ni‘,
вычисленными для соответствующих
интервалов нормальной случайной величины
Z
с нулевым математическим ожиданием и
единичным средним квадратическим
отклонением (Z
принадлежит N(0,1)).
,
(13)
ni‘
= nPi,
где n
– обьем выборки;
Pi
= Ф(zi+1)
– Ф(zi),
вероятности попадания X
на интервал (xi*,xi+1*)
или
Z
на (zi,zi+1);
zi
= (xi
ср*–xв*)
/ σ*; i
= 2,3,..,m-1;
крайние интервалы открываем z1
= –∞,
zm
= ∞, а Ф(zi)
– значение функции Лапласа.
Критическое
значение χ2кр
= χ2
(α,k)
для этого критерия находится из справочной
таблицы “Критические точки распределения
χ2”.
Здесь k
= m
– 3. Если вычисленное по результатам
наблюдений по формуле (13) значение
критерия χ2набл
меньше χ2кр,
нет оснований отвергнуть основную
гипотезу, если больше – основная гипотеза
не принимается.
Для
проверки гипотез
о дисперсии σ2
генеральной совокупности
с нормальным законом распределения при
заданном уровне значимости α используется
критерий
,
(14)
где
s2
– исправленная дисперсия выборки; n
– объем выборки; σ02
– гипотетическое значение дисперсии.
А)
Пусть выдвинута нулевая гипотеза H0:
σ2
=
σ02
о
равенстве неизвестной генеральной
дисперсии σ2
предполагаемому значению σ02
при конкурирующей гипотезе H1:
σ2
≠
σ02.
Для проверки этой гипотезы по результатам
выборки вычисляется значение критерия
(14) χ2выб.
Затем по таблице «Критические точки
распределения χ2»,
по заданному уровню значимости α и числу
степеней свободы k
= n
– 1 находятся левое критическое значение
χ2лев.кр(1
– α/2;k)
и правое критическое значение
χ2прав.кр(α/2;k).
Если при этом χ2лев.кр
< χ2выб
< χ2прав.кр,
нет
оснований отвергнуть основную гипотезу,
конкурирующая – отвергается. В противном
случае принимается конкурирующая
гипотеза и отвергается основная.
Б)
Пусть теперь выдвинута нулевая гипотеза
H0:
σ2
=
σ02
о
равенстве неизвестной генеральной
дисперсии σ2
предполагаемому значению σ02
при конкурирующей гипотезе H1:
σ2
>
σ02.
Для проверки этой гипотезы по результатам
выборки вычисляется значение критерия
(14) χ2выб.
Затем по таблице «Критические точки
распределения χ2»,
по заданному уровню значимости α и числу
степеней свободы k
= n
– 1 находится критическое значение
χ2кр(
α;k).
Если при этом χ2выб
< χ2кр,
нет оснований отвергнуть основную
гипотезу, а конкурирующая – отвергается.
В)
Пусть теперь выдвинута нулевая гипотеза
H0:
σ2
=
σ02
о
равенстве неизвестной генеральной
дисперсии σ2
предполагаемому значению σ02
при конкурирующей гипотезе H1:
σ2
<
σ02.
Для проверки этой гипотезы по результатам
выборки вычисляется значение критерия
(14) χ2выб.
Затем по таблице «Критические точки
распределения χ2»,
по заданному уровню значимости α и числу
степеней свободы k
= n
– 1 находится критическое значение
χ2кр(
1- α;k).
Если при этом χ2выб
> χ2кр,
нет оснований отвергнуть основную
гипотезу, конкурирующая – отвергается.
Для
проверки гипотез
неизвестной средней a
генеральной совокупности
с
нормальным законом распределения
с неизвестной дисперсией при заданном
уровне значимости α используется
критерий Стьюдента
,
(15)
где
xвыб
– выборочное среднее;
a0
гипотетическое значение средней; n
– объем выборки; s
– исправленное среднее квадратическое
отклонение.
А)
Пусть выдвинута нулевая гипотеза H0:
a
=
a0
о
равенстве неизвестной генеральной
средней a
предполагаемому значению a0
при конкурирующей гипотезе H1:
a
≠
a0
.
Для проверки этой гипотезы по результатам
выборки вычисляется значение критерия
(15) Tвыб.
Затем по таблице «Критические точки
распределения Стьюдента», по заданному
уровню значимости α и числу степеней
свободы k
= n
– 1 находится двустороннее критическое
значение Tдвустор.кр(α;k).
Если при этом | Tвыб
| <
Tдвустор.кр,
нет оснований отвергнуть основную
гипотезу, а конкурирующая – отвергается.
Б)
Пусть теперь выдвинута нулевая гипотеза
H0:
a
=
a0
о
равенстве неизвестной генеральной
средней a
предполагаемому значению a0
при конкурирующей гипотезе H1:
a
>
a0
.
Для проверки этой гипотезы по результатам
выборки вычисляется значение критерия
(15) Tвыб.
Затем по таблице «Критические точки
распределения Стьюдента», по заданному
уровню значимости α и числу степеней
свободы k
= n
– 1 находится критическое значение
Tправостор.кр(α;k).
Если при этом Tвыб
< Tправостор.кр,
нет оснований отвергнуть основную
гипотезу
,
а конкурирующая – отвергается.
В)
Пусть теперь выдвинута нулевая гипотеза
H0:
a
=
a0
о
равенстве неизвестной генеральной
средней a
предполагаемому значению a0
при конкурирующей гипотезе H1:
a
< a0
.
Для проверки этой гипотезы по результатам
выборки вычисляется значение критерия
(15) Tвыб.
Затем по таблице «Критические точки
распределения Стьюдента», по заданному
уровню значимости α и числу степеней
свободы k
= n
– 1 находится критическое значение
Tправостор.кр(α;k)
и полагают Tлевостор.кр
= –Tправостор.кр.
Если при этом Tвыб
> Tлевостор.кр,
нет оснований отвергнуть основную
гипотезу, а конкурирующая – отвергается.
Содержание:
Точечные оценки:
Пусть случайная величина имеет неизвестную характеристику а. Такой характеристикой может быть, например, закон распределения, математическое ожидание, дисперсия, параметр закона распределения, вероятность определенного значения случайной величины и т.д. Пронаблюдаем случайную величину n раз и получим выборку из ее возможных значений
Существует два подхода к решению этой задачи. Можно по результатам наблюдений вычислить приближенное значение характеристики, а можно указать целый интервал ее значений, согласующихся с опытными данными. В первом случае говорят о точечной оценке, во втором – об интервальной.
Определение. Функция результатов наблюдений
Для одной и той же характеристики можно предложить разные точечные оценки. Необходимо иметь критерии сравнения оценок, для суждения об их качестве. Оценка как функция случайных результатов наблюдений сама является случайной величиной. Значения найденные по разным сериям наблюдений, могут отличаться от истинного значения характеристики в ту или другую сторону. Естественно потребовать, чтобы оценка систематически не завышала и не занижала оцениваемое значение, а с ростом числа наблюдений становилась более точной. Формализация названных требований приводит к следующим понятиям.
Определение. Оценка называется несмещенной, если ее математическое ожидание равно оцениваемой величине: В противном случае оценку называют смещенной.
Определение. Оценка называется состоятельной, если при увеличении числа наблюдений она сходится по вероятности к оцениваемой величине, т.е. для любого сколь угодно малого
Если известно, что оценка несмещенная, то для ее состоятельности достаточно, чтобы
Последнее условие удобно для проверки. В качестве меры разброса значений оценки относительно можно рассматривать величину Из двух оценок предпочтительней та, для которой эта величина меньше. Если оценка имеет наименьшую меру разброса среди всех оценок характеристики, построенных по наблюдениям, то оценку называют эффективной.
Следует отметить, что несмещенность и состоятельность являются желательными свойствами оценок, но не всегда разумно требовать наличия этих свойств у оценки. Например, может оказаться предпочтительней оценка хотя и обладающая небольшим смещением, но имеющая значительно меньший разброс значений, нежели несмещенная оценка. Более того, есть характеристики, для которых нет одновременно несмещенных и состоятельных оценок.
Оценки для математического ожидания и дисперсии
Пусть случайная величина имеет неизвестные математическое ожидание и дисперсию, причем Если – результаты независимых наблюдений случайной величины, то в качестве оценки для математического ожидания можно предложить среднее арифметическое наблюдаемых значений
Несмещенность такой оценки следует из равенств
В силу независимости наблюдений
При условии имеем что означает состоятельность оценки .
Доказано, что для математического ожидания нормально распределенной случайной величины оценка еще и эффективна.
Оценка математического ожидания посредством среднего арифметического наблюдаемых значений наводит на мысль предложить в качестве оценки для дисперсии величину
Преобразуем величину обозначая для краткости через
В силу (3.1.2) имеем Поэтому
Последняя запись означает, что оценка имеет смещение. Она систематически занижает истинное значение дисперсии. Для получения несмещенной оценки введем поправку в виде множителя и полученную оценку обозначим через
Величина
является несмещенной и состоятельной оценкой дисперсии.
Пример:
Оценить математическое ожидание и дисперсию случайной величины Х по результатам ее независимых наблюдений: 7, 3, 4, 8, 4, 6, 3.
Решение. По формулам (3.1.1) и (3.1.3) имеем
Ответ.
Пример:
Данные 25 независимых наблюдений случайной величины представлены в сгруппированном виде:
Требуется оценить математическое ожидание и дисперсию этой случайной величины.
Решение. Представителем каждого интервала можно считать его середину. С учетом этого формулы (3.1.1) и (3.1.3) дают следующие оценки:
Ответ.
Метод наибольшего правдоподобия для оценки параметров распределений
В теории вероятностей и ее приложениях часто приходится иметь дело с законами распределения, которые определяются некоторыми параметрами. В качестве примера можно назвать нормальный закон распределения Его параметры и имеют смысл математического ожидания и дисперсии соответственно. Их можно оценить с помощью и В общем случае параметры законов распределения не всегда напрямую связаны со значениями числовых 179 характеристик. Поэтому практический интерес представляет следующая задача.
Пусть случайная величина Х имеет функцию распределения причем тип функции распределения F известен, но неизвестно значение параметра По данным результатов наблюдений нужно оценить значение параметра. Параметр может быть и многомерным.
Продемонстрируем идею метода наибольшего правдоподобия на упрощенном примере. Пусть по результатам наблюдений, отмеченных на рис. 3.1.1 звездочками, нужно отдать предпочтение одной из двух функций плотности вероятности или
Из рисунка видно, что при значении параметра такие результаты наблюдений маловероятны и вряд ли бы реализовались. При значении же эти результаты наблюдений вполне возможны. Поэтому значение параметра более правдоподобно, чем значение . Такая аргументация позволяет сформулировать принцип наибольшего правдоподобия: в качестве оценки параметра выбирается то его значение, при котором данные результаты наблюдений наиболее вероятны.
Этот принцип приводит к следующему способу действий. Пусть закон распределения случайной величины Х зависит от неизвестного значения параметра Обозначим через для непрерывной случайной величины плотность вероятности в точке а для дискретной случайной величины – вероятность того, что Если в независимых наблюдениях реализовались значения случайной величины то выражение
называют функцией правдоподобия. Величина зависит только от параметра при фиксированных результатах наблюдений При каждом значении параметра функция равна вероятности именно тех значений дискретной случайной величины, которые получены в процессе наблюдений. Для непрерывной случайной величины равна плотности вероятности в точке выборочного пространства
Сформулированный принцип предлагает в качестве оценки значения параметра выбрать такое при котором принимает наибольшее значение. Величина будучи функцией от результатов наблюдений называется оценкой наибольшего правдоподобия.
Во многих случаях, когда дифференцируема, оценка наибольшего правдоподобия находится как решение уравнения
которое следует из необходимого условия экстремума. Поскольку достигает максимума при том же значении , что и , то можно решать относительно эквивалентное уравнение
Это уравнение называют уравнением правдоподобия. Им пользоваться удобнее, чем уравнением (3.1.5), так как функция равна произведению, а – сумме, а дифференцировать проще.
Если параметров несколько (многомерный параметр), то следует взять частные производные от функции правдоподобия по всем параметрам, приравнять частные производные нулю и решить полученную систему уравнений.
Оценку, получаемую в результате поиска максимума функции правдоподобия, называют еще оценкой максимального правдоподобия.
Известно, что оценки максимального правдоподобия состоятельны. Кроме того, если для q существует эффективная оценка, то уравнение правдоподобия имеет единственное решение, совпадающее с этой оценкой. Оценка максимального правдоподобия может оказаться смещенной.
Метод моментов
Начальным моментом го порядка случайной величины Х называется математическое ожидание й степени этой величины, т.е. Само математическое ожидание считается начальным моментом первого порядка.
Центральным моментом го порядка называется Очевидно, что дисперсия – это центральный момент второго порядка. Если закон распределения случайной величины зависит от некоторых параметров, то от этих параметров зависят и моменты случайной величины.
Для оценки параметров распределения по методу моментов находят на основе опытных данных оценки моментов в количестве, равном числу оцениваемых параметров. Эти оценки приравнивают к соответствующим теоретическим моментам, величины которых выражены через параметры. Из полученной системы уравнений можно определить искомые оценки.
Например, если Х имеет плотность распределения то
Если воспользоваться величиной как оценкой для на основе опытных данных, то оценкой по методу моментов будет решение уравнения
Пример:
Найти оценку параметра показательного закона распределения по методу моментов.
Решение. Плотность вероятности показательного закона распределения имеет вид Поэтому Откуда
Ответ.
Пример:
Пусть имеется простейший поток событий неизвестной интенсивности . Для оценки параметра проведено наблюдение потока и зарегистрированы – длительности последовательных интервалов времени между моментами наступления событий. Найти оценку для .
Решение. В простейшем потоке интервалы времени между последовательными моментами наступления событий потока имеют показательный закон распределения Так как плотность вероятности показательного закона распределения равна то функция правдоподобия (3.1.4) имеет вид
Тогда и уравнение правдоподобия имеет решение
При таком значении функция правдоподобия действительно достигает наибольшего значения, так как
Ответ.
Определение. Пусть – результаты n независимых наблюдений случайной величины X. Если расставить эти результаты в порядке возрастания, то получится последовательность значений, которую называют вариационным рядом и обозначают:
В этой записи
Величины называют порядковыми статистиками.
Пример:
Случайная величина Х имеет равномерное распределение на отрезке где и неизвестны. Пусть – результаты независимых наблюдений. Найти оценку параметра .
Решение. Функция плотности вероятности величины Х имеет вид
В этом случае функция правдоподобия от явно не зависит. Дифференцировать по такую функцию нельзя и нет возможности записать уравнение правдоподобия. Однако легко видеть, что возрастает при уменьшении . Все результаты наблюдений лежат в поэтому можно записать:
где – наименьший, а – наибольший из результатов наблюдений. При минимально возможном
откуда или
Оценкой наибольшего правдоподобия для параметра будет величина
Ответ.
Пример:
Случайная величина X имеет функцию распределения
где неизвестный параметр.
Пусть – результаты независимых наблюдений случайной величины X. Требуется найти оценку наибольшего правдоподобия для параметра и найти оценку для M(X).
Решение. Для построения функции правдоподобия найдем сначала функцию плотности вероятности
Тогда функция правдоподобия:
Логарифмическая функция правдоподобия:
Уравнение правдоподобия
не имеет решений. Критических точек нет. Наибольшее и наименьшее значения находятся на границе допустимых значений .
По виду функции можно заключить, что значение тем больше, чем меньше величина . Но не может быть меньше Поэтому наиболее правдоподобное значение
Так как , то оценкой наибольшего правдоподобия для будет величина
Ответ.
Пример:
Случайная величина Х имеет нормальный закон распределения c неизвестными параметрами и По результатам независимых наблюдений найти наиболее правдоподобные значения этих параметров.
Решение. В соответствии с (3.1.4) функция правдоподобия имеет вид
а логарифмическая функция правдоподобия:
Необходимые условия экстремума дают систему двух уравнений:
Решения этой системы имеют вид:
Отметим, что обе оценки являются состоятельными, причем оценка для несмещенная, а для смещенная (сравните с формулой (3.1.3)).
Ответ.
Пример:
По данным эксперимента построен статистический ряд:
Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения случайной величины X.
Решение. 1) Число экспериментальных данных вычисляется по формуле:
Значит, объем выборки n = 50.
2) Вычислим среднее арифметическое значение эксперимента:
Значит, найдена оценка математического ожидания = 12,3.
3) Вычислим исправленную выборочную дисперсию:
Значит, найдена оценка дисперсии: = 1,44.
5) Вычислим оценку среднего квадратического отклонения:
Ответ:
Пример:
По данным эксперимента построен статистический ряд:
Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения случайной величины X.
Решение. По формуле
перейдем к условным вариантам:
Для них произведем расчет точечных оценок параметров:
Следовательно, вычисляем искомые точечные оценки:
Ответ:
Пример:
По данным эксперимента построен интервальный статистический ряд:
Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения.
Решение. 1) От интервального ряда перейдем к статистическому ряду, заменив интервалы их серединами
2) Объем выборки вычислим по формуле:
3) Вычислим среднее арифметическое значений эксперимента:
3) Вычислим исправленную выборочную дисперсию:
Можно было воспользоваться следующей формулой:
5) Вычислим оценку среднего квадратического отклонения:
Ответ:
Пример:
Найти доверительный интервал с надежностью 0,95 для оценки математического ожидания M(X) нормально распределенной случайной величины X, если известно среднее квадратическое отклонение σ = 2, оценка математического ожидания объем выборки n = 25.
Решение. Доверительный интервал для истинного математического ожидания с доверительной вероятностью = 0,95 при известной дисперсии σ находится по формуле:
где m = M(X) – истинное математическое ожидание; 𝑥̅ − оценка M(X) по выборке; n – объем выборки; – находится по доверительной вероятности = 0,95 из равенства:
Из табл. П 2.2 приложения 2 находим: = 1,96. Следовательно, найден доверительный интервал для M(X):
Ответ: (9,216 ; 10,784).
Пример:
По данным эксперимента построен статистический ряд:
Найти доверительный интервал для математического ожидания M (X) с надежностью 0,95.
Решение. Воспользуемся формулой для доверительного интервала математического ожидания при неизвестной дисперсии:
где n – объем выборки; 𝑥̅ оценка M(X); s – оценка среднего квадратического отклонения; − находится по доверительной вероятности = 0,95.
По числам = 0,95 и n = 20 находим: = 2,093.
Теперь вычисляем оценки для M(X) и D(X):
Следовательно, s ≈ 1,685. Поэтому искомый доверительный интервал математического ожидания задается формулой:
Ответ: (– 0,76; 0,76).
Пример:
По данным десяти независимых измерений найдена оценка квадратического отклонения = 0,5. Найти доверительный интервал точности измерительного прибора с надежностью 99 %.
Решение. Задача сводится к нахождению доверительного интервала для истинного квадратического отклонения, так как точность прибора характеризуется средним квадратическим отклонением случайных ошибок измерений.
Доверительный интервал для среднего квадратического отклонения находим по формуле:
где = 0,5 − оценка среднего квадратического отклонения; – число, определяемое из табл. П 2.4 приложения 2 по заданной доверительной вероятности = 0,99 и заданному объему выборки n = 10.
Находим:
Тогда можно записать:
Ответ: (0; 1,04).
- Доверительный интервал для вероятности события
- Проверка гипотезы о равенстве вероятностей
- Доверительный интервал для математического ожидания
- Доверительный интервал для дисперсии
- Системы случайных величин
- Вероятность и риск
- Определения вероятности событий
- Предельные теоремы теории вероятностей
Реферат
на тему «Точечные оценки»
по учебной дисциплине
«ОСНОВЫ МАТЕМАТИЧЕСКОЙ ОБРАБОТКИ ИНФОРМАЦИИ»
Выполнил(а):
Савкина Юлия Камильевна
2022 г
Оглавление
Введение
Статистика есть наука о том, как,
не умея мыслить и понимать,
заставить делать это цифры.
В. О. Ключевский
Математическая статистика – это наука, изучающая методы сбора и обработки статистической информации для получения научных и практических выводов.
Одной из центральных задач математической статистики является задача оценивания теоретического распределения случайной величины на основе выборочных данных. При этом часто предполагается, что вид закона распределения генеральной совокупности известен, но неизвестны параметры этого распределения, такие как математическое ожидание, дисперсия и др. Требуется найти приближенные значения этих параметров, то есть получить статистические оценки указанных параметров.
Основным методом математической статистики является выборочный метод, его суть состоит в исследовании представительной выборочной совокупности – для достоверной характеристики совокупности генеральной. Данный метод экономит временные, трудовые и материальные затраты, поскольку исследование всей совокупности зачастую затруднено или невозможно.
Для нахождения вида функции оценивания того или иного параметра используют один из следующих методов: 1) метод максимального правдоподобия; 2) метод моментов; 3) оценивание с помощью метода наименьших квадратов
Числовые характеристики, полученные по выборкам, называют статистическими оценками параметров. Различают два вида оценок параметров точечные и интервальные.
В данной работе речь пойдет именно о точечных оценках.
Глава 1. Основная часть
Основные понятия математической статистики
Введем основные понятия, связанные с выборками. Генеральной совокупностью называется совокупность объектов, из которых производится выборка. Выборочной совокупностью (выборкой) называется совокупность случайно отобранных объектов из генеральной совокупности. Число объектов в совокупности называется ее объемом.
Числовые характеристики всей генеральной совокупности называются параметрами. Так как всю генеральную совокупность изучить достаточно часто не представляется возможным, о параметрах судят по выборочным характеристикам. На основании выборочных данных можно получить лишь приближенное значение параметра, которое является его оценкой.
Выборочная характеристика, используемая в качестве приближенного значения неизвестного параметра генеральной совокупности, называется точечной оценкой, т.к представляет собой число или точку на числовой оси.
Числовые характеристики выборки
По результатам выборочных наблюдений вычисляются такие статистические выборочные характеристики, как выборочные средняя, дисперсия, среднее квадратичное отклонение, коэффициент корреляции и т.д. Эти характеристики определяют соответствующие параметры генеральной совокупности.
Пусть x1, x2, …, xn – выборка из генеральной совокупности объёма n.
Выборочной средней (или средним значение выборки) называется среднее арифметическое значение признака выборочной совокупности.
Генеральная средняя для изучаемого количественного признака Х по генеральной совокупности
и выборочная средняя
Если все значения x1, x2, …, xn признака выборки объема n различны, то среднее значение выборки оценивается по формуле:
.
Для обозначения среднего значения выборки чаще всего используются обозначения и
Если значения признака Х1, X2, …, Хk в выборке имеют соответственно частоты n1, n2, …, nk, то последнюю формулу можно переписать в виде
Математическое ожидание характеризует среднее значение случайной величины и определяется по формулам:
(1.1) |
где mx обозначает число, полученное после вычислений по формуле (1.1); M[X] – оператор математического ожидания, ДСВ – дискретная случайная величина, НСВ – непрерывная случайная величина. Как видно из (1.1), в качестве математического ожидания используется «среднее взвешенное значение», причем каждое из значений случайной величины учитывается с «весом», пропорциональным вероятности этого значения.
Начальный момент k-го порядка случайной величины X есть математическое ожидание k-й степени этой случайной величины:
(1.2) |
При k=0 значение α0(x) = M[X0] = M [1] = 1; при k=1 — α1(x) = M[X1] = M [Х] = mx – математическое ожидание; при k=2 — α2(x) = M[X2].
Центрированной случайной величиной Х° называется случайная величина, математическое ожидание которой находится в начале координат (в центре числовой оси), т.е. M[X°] = 0. Операция центрирования (переход от нецентрированной величины Х к центрированной X°) имеет вид X° =X − mX .
Центральный момент порядка k случайной величины X есть математическое ожидание k-й степени центрированной случайной величины X:
(1.3) |
При k=0 значение 0(x)=M [X°0]=M [1]=1; при k=1 — 1(x)=M [X°1]=M [Х°] = 0; при k=2 — 2 (x)=M[X°2]= M [(X – mx)2]=M[X 2] – 2mx M [X ]+ mx2= α2 – mx2=Dx – дисперсия.
Дисперсия случайной величины характеризует степень рассеивания (разброса) значений случайной величины относительно ее математического ожидания и определяется по формулам:
(1.4) |
Дисперсия выборки или выборочная дисперсия оценивается по (слегка измененной) формуле:
, где m*– среднее значение выборки.
Дисперсия случайной величины имеет размерность квадрата случайной величины, поэтому для анализа диапазона значений величины Х дисперсия не совсем удобна. Этого недостатка лишено среднее квадратическое отклонение (СКО), размерность которого совпадает с размерностью случайной величины. Выборочным средним квадратичным отклонением (стандартом) называют квадратный корень из выборочной дисперсии:
(1.5) |
Мода случайной величины равна ее наиболее вероятному значению, т.е. то значение, для которого вероятность pi (для дискретной случайной величины) или f(x) (для непрерывных случайной величины) достигает максимума: f (Mo) = max, p(X = Mo) = max.
Медиана случайной величины X равна такому ее значению, для которого выполняется условие p { X < Me } = p { X Me }. Медиана, как правило, существует только для непрерывных случайных величин. Значение Me может быть определено как решение одного из следующих уравнений:
(1.6) |
В точке Me площадь, ограниченная кривой распределения делится пополам.Медиана вычисляется следующим образом. Изучаемая выборка упорядочивается в порядке возрастания (N – объем выборки). Получаемая последовательность ak, где k=1,…, N называется вариационным рядом или порядковыми статистиками.
Если число наблюдений N нечетно, то медиана оценивается как m = aN+1/2
Если число наблюдений N четно, то медиана оценивается как m = ( aN/2 + aN/2+1 ) / 2
Квантиль хp случайной величины X – это такое ее значение, для которого выполняется условие
p { X < xp } = F(xp)= p. (1.7) |
(1.7) |
Очевидно, что медиана – это квантиль x0,5.
Свойства точечных оценок
Статистической оценкой Qˆ неизвестного параметра Q теоретического распределения называется приближенное значение параметра, вычисленное по результатам эксперимента (по выборке). Статистические оценки делятся на точечные и интервальные. Точечной называется оценка, определяемая одним числом. Точечная оценка Qˆ параметра Q случайной величины X в общем случае равна
Qˆ= (x1, x2, …, xn), где xi – значения выборки. |
(1.8) |
Очевидно, что оценка Qˆ – это случайная величина, так как она является функцией от n-мерной случайной величины (Х1, …, Хn), где Хi, – значение величины Х в i-м опыте, и значения будут изменяться от выборки к выборке случайным образом. Чтобы точечная оценка была наилучшей с точки зрения точности, необходимо, чтобы она была состоятельной, несмещенной и эффективной.
Оценка Qˆ называется состоятельной, если при увеличении объема выборки n она сходится по вероятности к значению параметра Q:
(1.9) |
Состоятельность – это минимальное требование к оценкам.
Оценка Qˆ называется несмещенной, если ее математическое ожидание точно равно параметру Q для любого объема выборки:
Несмещенная оценка Qˆ является эффективной, если ее дисперсия минимальна по отношению к дисперсии любой другой оценки этого параметра:
(1.11) |
Первые два требования к оценке являются обязательными, выполнение последнего требования – желательно.
Точечная оценка математического ожидания. На основании теоремы Чебышева в качестве состоятельной оценки математического ожидания может быть использовано среднее арифметическое значений выборки , называемое выборочным средним:
Определим числовые характеристики оценки .
т.е. оценка несмещенная.
Оценка (1.12) является эффективной, т.е. ее дисперсия минимальна, если величина X распределена по нормальному закону.
Состоятельная оценка начального момента k-го порядка определяется по формуле
Точечная оценка дисперсии. В качестве состоятельной оценки дисперсии может быть использовано среднее арифметическое квадратов отклонений значений выборки от выборочного среднего:
Определим математическое ожидание оценки S2. Так как дисперсия не зависит от того, где выбрать начало координат, выберем его в точке mX, т.е. перейдем к центрированным величинам:
Ковариация Kij =0, так как опыты, а, следовательно, и Хi − значение величины Х в i‑м опыте − независимы. Таким образом, величина является смещенной оценкой дисперсии, а несмещенная состоятельная оценка дисперсии равна:
Дисперсия величины S02 равна:
Для нормального закона распределения величины X формула (1.17) примет вид
Для равномерного закона распределения –
Состоятельная несмещенная оценка среднеквадратического отклонения определяется по формуле: (1.20)
Состоятельная оценка центрального момента k-го порядка равна:
Точечная оценка вероятности. На основании теоремы Бернулли несмещенная состоятельная и эффективная оценка вероятности случайного события A в схеме независимых опытов равна частоте этого события:
где m – число опытов, в которых произошло событие A; n – число проведенных опытов. Числовые характеристики оценки вероятности p*(A) = p* равны:
Среднее арифметическое х, выборочная дисперсия Дх, частость р – это точечные статистические оценки соответственно математического ожидания (генерального среднего) МХ, дисперсии (генеральной дисперсии) ДХ, истиной (генеральной) вероятности р. Чтобы не заблудиться в этом многообразии, удобно пользоваться таблицей 1, представленной ниже [3].
Методы построения точечных оценок
Выше мы рассматривали точечные оценки основных генеральных характеристик: математического ожидания, дисперсии, вероятности и др. Однако осталось неясным, каким образом получены эти оценки. В математической статистике разработано большое число методов оценивания неизвестных параметров по данным случайной выборки, из которых наиболее часто используются:
метод моментов1;
метод максимального правдоподобия2;
метод наименьших квадратов;
графический метод (или метод номограмм).
Рассмотрим первые два из них.
Метод моментов. Пусть имеется выборка {x1, …, xn} независимых значений случайной величины с известным законом распределения f(x, Q1 , …, Qm) и m неизвестными параметрами Q1, …, Qm. Необходимо вычислить оценки Qˆ1, …, Qˆm параметров Q1, …, Qm. Последовательность вычислений следующая:
Вычислить значения m начальных и/или центральных теоретических моментов
Определить m соответствующих выборочных начальных αkˆ(x) и/или центральных µkˆ(x) моментов по формулам (1.14, 1.21).
Составить и решить относительно неизвестных параметров Q1, …, Qm систему из m уравнений, в которых теоретические моменты приравниваются к выборочным моментам. Каждое уравнение имеет вид αk(x) =αkˆ(x) или µ k(x) = µ kˆ(x). Найденные корни являются оценками Q1ˆ, …, Qmˆ неизвестных параметров.
Замечание. Часть уравнений может содержать начальные моменты, а оставшаяся часть – центральные.
Метод максимального правдоподобия. Согласно данному методу оценки Qˆ1, …, Qˆm получаются из условия максимума по параметрам Q1, …, Qm положительной функции правдоподобия L ( x1, …, xn, Q1, …, Qm). Если случайная величина X непрерывна, а значения xi независимы, то функция правдоподобия равна
Если случайная величина X дискретна и принимает независимые значения xi с вероятностями p (X=xi) = pi ( xi, Q1, …, Qm), то функция правдоподобия равна
Система уравнений согласно этому методу может записываться в двух видах:
или
Найденные корни выбранной системы уравнений являются оценками Q1ˆ, …, Qmˆ неизвестных параметров Q1, …, Qm.
Как правило оценка максимального правдоподобия эффективнее оценки, полученной методом моментов, и более того, если существует несмещенная эффективная оценка параметра, то она будет получена методом максимального правдоподобия.
Глава 2. Практическая часть
Примеры вычисления точечных оценок
Пример 1. Найдем оценку для вероятности P наступления события A по данному числу m появления этого события в n испытаниях.
Решение. Воспользуемся методом максимального правдоподобия: в этом случае функция правдоподобия L равна L = Cnm P m (1–P) n–m.
Тогда ln (L) = ln Cnm + m ln (P) + (n–m) ln (1 – P).
Уравнение для определения оценки:
Значит, оценкой методом максимального правдоподобия вероятности наступления события будет его относительная частота w.
Пример 2. Случайная величина X (число появлений события А в t независимых испытаниях) подчинена биномиальному закону распределения с неизвестным параметром р. Ниже приведено эмпирическое распределение числа появлений события в 10 опытах по 5 испытаний в каждом (в первой строке указано число xi появлений события А в одном опыте; во второй строке указана частота ni — количество опытов, в которых наблюдалось столько появлений события А).
Найти методом моментов точечную оценку параметра р биномиального распределения. Оценить вероятность p0=P(X=0).
Решение. Математическое ожидание биномиального распределения известно: MX = m p. Приравняв математическое ожидание к выборочному среднему, получим уравнение: , откуда . Для рассматриваемого примера имеем:
(05+12+21+31+41) / 10=1,1; |
|||
= |
= 1,1/5=0,22; |
Если распределение определяется двумя параметрами, то для построения их оценок два теоретических момента приравнивают двум соответствующим эмпирическим моментам тех же порядков (обычно первым двум).
Пример 3. Для изучения генеральной совокупности относительно некоторого количественного признака была извлечена выборка:
Найти несмещенные оценки генеральной средней и генеральной дисперсии.
Решение. Несмещенной оценкой генеральной средней является выборочная средняя:
.
Несмещенной оценкой генеральной дисперсии является исправленная выборочная дисперсия:
Ответ: 50; 2,57.
Пример 4. По выборке объема N=41 найдена смещенная оценка генеральной дисперсии DB=3. Найти несмещенную оценку дисперсии генеральной совокупности.
Решение. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия
Несмещенной оценкой генеральной дисперсии является «исправленная дисперсия»
или
Таким образом, мы получаем искомую несмещенную оценку дисперсии генеральной совокупности:
Пример 5. Для анализа лингвистических терминологических систем взято 7 фрагментов по 250 терминоупотреблений из русских лингвистических текстов. После подсчёта в каждом фрагменте числа употреблений слова «лицо» получен следующий вариационный ряд: 1,1,3,4,9,10,12.
1) Определите по выборке несмещённую и состоятельную оценку математического ожидания М(Х) и дисперсии D(X) случайной величины Х – «число употреблений слова «лицо» в русских лингвистических текстах.
2) Найдите несмещённую, состоятельную и эффективную оценку вероятности события А= «слово лицо использовано более 5 раз».
Решение
1) Несмещённая и состоятельная оценка М(Х) есть среднее выборочное.
Несмещённая и состоятельная оценка D(X) есть исправленная выборочная дисперсия:
2) Несмещённой, состоятельной и эффективной оценкой вероятности события А= «слово лицо использовано более 5 раз» является частота этого события Р(А):
Пример 6. Выборка задана таблицей распределения
Найти выборочные характеристики: среднюю, дисперсию и среднее квадратическое отклонение.
Решение. Cначала находим в:
Затем по формулам находим две другие искомые величины:
Пример 7. Из 1500 деталей отобрано 250, распределение которых по размеру Х задано в таблице:
xi |
7,8-8,0 |
8,0-8,2 |
8,2-8,4 |
8,4-8,6 |
8,6-8,8 |
8,8-9,0 |
ni |
5 |
20 |
80 |
95 |
40 |
10 |
Найти точечные оценки для среднего и дисперсии, а также дисперсию оценки среднего при повторном и бесповторном отборах.
Решение. Вычислим по формулам (используем середины интервалов сi, число интервалов r=6, объем выборки n=250):
сi |
7,9 |
8,1 |
8,3 |
8,5 |
8,7 |
8,9 |
|
ni |
5 |
20 |
80 |
95 |
40 |
10 |
n=250 |
Вычислим дисперсию оценки среднего:
для повторной выборки:
для бесповторной выборки
Пример 8. Выборочно обследовали партию кирпича. Из 100 проб в 12 случаях кирпич оказался бракованным. Найти оценку доли бракованного кирпича и дисперсию этой оценки.
Решение. По условию задачи, число бракованных изделий m=12, объем выборки n=100, тогда оценкой доли бракованных является выборочная доля
Дисперсия этой оценки для повторной выборки равна
А среднее квадратическое отклонение этой оценки равно
Задачи подобраны таким образом, чтобы показать их разнообразную тематику и способы решений. Это и доказательство свойств точечной оценки, представление выборок разными способами и вычисление точечных оценок. Чтобы облегчить свою работу, можно воспользоваться таблицей 1 (см Приложение 1).
Заключение
Точечная оценка параметра – это оценка, которая характеризуется одним конкретным числом (например, математическим ожиданием, дисперсией, средним квадратичным отклонением и т.д.). Точечные оценки параметров генеральной совокупности могут быть приняты в качестве ориентировочных, первоначальных результатов обработки выборочных данных. Их основной недостаток заключается в том, что неизвестно, с какой точностью оценивается параметр. Если для выборок большого объема точность обычно бывает достаточной (при условии несмещенности, эффективности и состоятельности оценок), то для выборок небольшого объема вопрос точности становится очень важным. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Решение задач математической статистики обусловливает существенный объем вычислений. Во избежание ошибок, можно воспользоваться инженерным калькулятором или выполнить вычисления с помощью офисного пакета MS Excel, в котором есть различные статистические функции и надстройки, в том числе и возможность решить задачи по теме «Анализ данных»
Список литературы
- Гмурман, В. Е. Теория вероятностей и математическая статистика: учебник для прикладного бакалавриата / В. Е. Гмурман. — 12-е изд. — Москва: Издательство Юрайт, 2019. — 479 с. — (Бакалавр. Прикладной курс). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://biblio-online.ru/bcode/431095.
- Гмурман, В. Е. Руководство к решению задач по теории вероятностей и математической статистике: учебное пособие для бакалавриата и специалитета / В. Е. Гмурман. — 11-е изд., перераб. и доп. — Москва: Издательство Юрайт, 2019. — 406 с. — (Бакалавр и специалист). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://biblio-online.ru/bcode/431094.
- Малугин, В. А. Теория вероятностей и математическая статистика: учебник и практикум для вузов / В. А. Малугин. — Москва: Издательство Юрайт, 2022. — 470 с. — (Высшее образование). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://urait.ru/viewer/teoriya-veroyatnostey-i-matematicheskaya-statistika-493318
- Малугин, В. А. Математическая статистика: учебное пособие для бакалавриата и магистратуры / В. А. Малугин. — Москва: Издательство Юрайт, 2019. — 218 с. — (Бакалавр и магистр. Академический курс). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://biblio-online.ru/bcode/441413.
- Энатская, Н. Ю. Математическая статистика и случайные процессы: учебное пособие для вузов / Н. Ю. Энатская. — Москва: Издательство Юрайт, 2022. — 201 с. — (Высшее образование). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://urait.ru/viewer/matematicheskaya-statistika-i-sluchaynye-processy-490096
Приложение 1
Таблица 1. Точечные оценки случайных величин
окончание таблицы 1
Таблица1. Точечные оценки случайных величин
1 Метод моментов был впервые предложен английским ученым, основателем математической статистики К. Пирсоном (1857-1936) в 1894 году.
2 Метод максимального правдоподобия разработал английский статистик Р. Фишер, который в 1921 г доказал, что ММ-оценки чаще всего не эффективны.
17 авг. 2022 г.
читать 2 мин
Точечная оценка представляет собой число, которое мы вычисляем на основе выборочных данных для оценки некоторого параметра совокупности. Это служит нашей наилучшей возможной оценкой того, каким может быть истинный параметр населения.
В следующей таблице показана точечная оценка, которую мы используем для оценки параметров совокупности:
| Измерение | Параметр населения | Балльная оценка | | — | — | — | | Иметь в виду | μ (среднее значение населения) | х (выборочное среднее) | | Доля | π (доля населения) | p (пропорция выборки) |
Хотя точечная оценка представляет собой наше лучшее предположение о параметре совокупности, не гарантируется, что она точно соответствует истинному параметру совокупности.
По этой причине мы также часто рассчитываем доверительные интервалы — интервалы, которые могут содержать параметр генеральной совокупности с определенным уровнем достоверности.
В следующих примерах показано, как рассчитать точечные оценки и доверительные интервалы в Excel.
Пример 1. Точечная оценка среднего значения генеральной совокупности
Предположим, нас интересует вычисление среднего веса популяции черепах. Для этого мы собираем случайную выборку из 20 черепах:
Наша точечная оценка среднего значения населения — это просто среднее значение выборки, которое оказывается равным 300,3 фунта:
Затем мы можем использовать следующую формулу для расчета 95% доверительного интервала для среднего значения генеральной совокупности:
Мы на 95% уверены, что истинный средний вес черепах в этой популяции находится в диапазоне [296,96, 303,64] .
Мы можем подтвердить эти результаты, используя калькулятор доверительного интервала .
Пример 2: Точечная оценка доли населения
Предположим, нам нужно рассчитать долю черепах в популяции, имеющих пятна на панцире. Для этого мы собираем случайную выборку из 20 черепах и обнаруживаем, что у 13 из них есть пятна.
Наша точечная оценка доли черепах с пятнами составляет 0,65 :
Затем мы можем использовать следующую формулу для расчета 95% доверительного интервала для доли населения:
Мы на 95% уверены, что истинная доля черепах в этой популяции с пятнами находится в диапазоне [0,44, 0,86] .
Мы можем подтвердить эти результаты, используя калькулятор доверительного интервала для пропорции .
Дополнительные ресурсы
Как рассчитать доверительные интервалы в Excel
Как рассчитать интервал прогнозирования в Excel
Как рассчитать погрешность в Excel
Точечное и интервальное оценивание числовых характеристик
Точечной оценкой числовой характеристики называют оценку, которая определяется одним числом. К точечным оценкам относятся: среднее арифметическое, дисперсия или стандартное отклонение.
Например, среднее арифметическое пробегания 100 м равно 15,38 с.
Если выборка небольшого объёма, то точечная оценка может значительно отличаться от оцениваемого параметра генеральной совокупности, в данном случае от среднего арифметического генеральной совокупности (обозначается μ) и её использование может привести к грубым ошибкам. Поэтому при небольшом объёме выборки в математической статистике используют другого типа оценки характеристик генеральной совокупности – интервальные.
Интервальной оценкой числовой характеристики называется интервал[1], который с доверительной вероятностью P (задаваемой заранее) накрывает истинное значение числовой характеристики генеральной совокупности.
Как правило, в научных исследованиях в области физической культуры и спорта считается достаточной доверительная вероятность Р=0,95. В некоторых случаях, связанных с большой ответственностью при принятии решений, принимают P равной 0,99 или 0,999. Таким образом, доверительная вероятность – это уровень гарантии суждения о значениях генеральной характеристики на основании выборочных данных.
Вероятность α=1-Р того, что построенный доверительный интервал не накроет значение генеральной характеристики, называется уровнем значимости; другими словами, α — вероятность ошибки.
В литературе часто обе вероятности α и P выражают в процентах, т.е. 100α% и 100P%.
Для определения доверительного интервала необходимо знать значение параметра t. Он зависит от объема выборки (n) и доверительной вероятности P (таблица 1).
Таблица 1 — Значения t в зависимости от объёма выборки и доверительной вероятности Р.
n |
Р | ||
0,95 | 0,99 | 0,999 | |
10 | 2,265 | 3,250 | 4,781 |
15 | 2,145 | 2,977 | 4,140 |
20 | 2,093 | 2,861 | 3,883 |
30 | 2,042 | 2,750 | 3,646 |
40 | 2,021 | 2,704 | 3,551 |
50 | 2,009 | 2,678 | 3,505 |
60 | 2,000 | 2,660 | 3,505 |
80 | 1,990 | 2,639 | 3,416 |
Покажем на примере, как определить границы 95% доверительного интервала для среднего результата в беге на 100 м (n = 50), если: среднее арифметическое равно 15,38 с, а ошибка среднего арифметического равна 0,13 с.
Из таблицы 1 для n = 50 и P= 0,95 находим значение t. Оно равно t=2,009. Следовательно, доверительный интервал будет следующим: 15,38 — 2,009·0,13<μ<15,38+2,009·0,13
или 15,12<μ<15,64 с
После округления получим итоговый результат: 15,1<μ<15,6 c
Таким образом, с доверительной вероятностью Р=0,95 можно утверждать, что генеральное среднее μ заключено в границах от 15,1 до 15,6 с.
Если мы хотим с большей вероятность (например, Р=0,99) утверждать, что генеральное среднее заключено в определенном интервале, необходимо из таблицы 1 найти значение t для n = 50 и P= 0,99. Оно равно t=2,678.
Тогда доверительный интервал для генерального среднего арифметического будет следующим:
15,38 — 2,678·0,13<μ<15,38+2,678·0,13
или 15,03<μ<15,73 с.
После округления получим итоговый результат: 15,0<μ<15,7 c.
Таким образом, с доверительной вероятностью Р=0,99 можно утверждать, что генеральное среднее μ заключено в границах от 15,0 до 15,7 с. То есть утверждение с большей вероятностью увеличивает интервал, в котором заключено генеральное среднее арифметическое.
[1] Интервал – множество всех чисел, удовлетворяющих строгому неравенству a < x < b