Как найти точечные параметры выборки

Пусть
из генеральной совокупности в результате
n
испытаний над количественным признаком
X
извлечена выборка объемом n:
варианты x1,
… , xr
и
их частоты n1,
… , nr.

Точечной
называют
оценку, которая определяется одним
числом. Точечные оценки обычно используют
в тех случаях, когда число наблюдений
велико.

Выборочной
средней

xв
называют среднее арифметическое значение
вариант выборки. Если значения вариант
x1,
x2,
… , xr
имеют
соответственно частоты n1,
n2,
… , nr,
то

.
(5)

Выборочной
дисперсией
Dв
называют среднее арифметическое
квадратов отклонений вариант xi
от их среднего значения xв,
т.е.

.
(6)

Выборочным
средним квадратическим отклонением σ
в
называют
квадратный корень из выборочной дисперсии
Dв

.
(7)

Исправленную
(несмещенную оценку) дисперсию
s2
выборки получают по формуле

.
(8)

Аналогично
вводится исправленное
среднее квадратическое отклонение
s

.
(9)

3. Интервальные оценки параметров распределения выборки

Интервальной
называют оценку, которая задается в
виде интервала. Интервальные оценки
удобно использовать в тех случаях, когда
число наблюдений n
относительно невелико.

Пусть
для неизвестного параметра θ количественного
признака X
генеральной совокупности статистическими
методами найдено значение θ*. Зададимся
точностью δ, т.е. | θ – θ* | < δ.

Надежностью
оценки
неизвестного параметра θ по вычисленному
статистическими методами значению θ*
называют вероятность γ, с которой
выполняется неравенство| θ – θ* | < δ,
при этом δ называется
точностью оценки
.
В статистике обычно задаются надежностью
γ и определяют точность δ.

Доверительным
интервалом

для параметра θ называют интервал (θ* –
δ, θ* + δ), который покрывает неизвестный
параметр θ с вероятностью γ:

P[θ*
– δ <X
< θ* + δ] = γ.

Пусть
количественный признак X
генеральной совокупности распределен
нормально, причем среднее квадратическое
отклонение σ неизвестно. Требуется
оценить неизвестное математическое
ожидание a
по результатам выборки с заданной
надежностью γ.

Доверительный
интервал

с
уровнем надежности γ для математического
ожидания

a
признака
X,
распределенного нормально, при неизвестном
среднем квадратическом отклонении
определяется как

,
(10)

где
xв
– выборочное среднее; s
– исправленное среднее квадратическое
отклонение выборки; n
– объем выборки. Точность оценки δ в
этом случае
.
Значениеtγ
= t(γ,n)
можно найти из справочной таблицы
”Таблица значений tγ
= t(γ,n)”
для распределения Стьюдента.

Доверительный
интервал

с
уровнем надежности γ для

среднего
квадратического отклонения

σ признака X,
распределенного нормально, определяется
как

,
(11)

где
s
– исправленное среднее квадратическое
отклонение выборки; n
– объем выборки. Значение q
= q(γ,n)
можно найти из справочной таблицы
”Таблица значений q
= q(γ,n)”
для распределения χ2.

В
случае, когда q
>1 доверительный интервал имеет вид

. (11′)

4. Статистическая проверка статистических
гипотез

Статистической
называют гипотезу (предположение) о
виде неизвестного распределения или о
параметрах известного распределения.
Основной
или нулевой гипотезой
H0
называют выдвинутую гипотезу о неизвестном
распределении, вместе с основной H0
выдвигается
и конкурирующая
(альтернативная) гипотеза

H1,
противоречащая
основной.

Основной
принцип проверки статистических

гипотез состоит в следующем:

в
зависимости от вида гипотезы и характера
неизвестного распределения вводится
функция K,
называемая критерием,
по значениям ее будет приниматься
решение о принятии или отклонении
основной гипотезы H0.
Вводится также уровень
значимости

α как вероятность того, что будет
отвергнута верная нулевая гипотеза и
принята неверная гипотеза H1.

Областью
принятия гипотезы

H0
называют
те значения критерия K,
при которых основная гипотеза H0
принимается, критической
областью

– отвергается. Для каждой выборки и
конкретного вида критерия K
по специальным таблицам находятся
значения kкр,
называемые критическими
точками;

критические точки отделяют область
принятия гипотезы от критической
области. Правосторонней
называют критическую область, где K
> kкр,
левосторонней
K
< kкр
и
двусторонней

(и симметричной) | K|
> kкр.

Пусть
из генеральной совокупности в результате
n
испытаний над количественным признаком
X
извлечена выборка объемом n:
равноотстоящие с шагом h
варианты x1,
… , xr
и
их частоты n1,
… , nr.
Для нее подсчитаны по формулам (5-9)
выборочное среднее xв
и выборочное среднее квадратическое
отклонение σв.

Для
проверки гипотезы
о нормальном распределении

генеральной совокупности c
уровнем значимости α используется
критерий
χ
2
Пирсона:

(12)

Критическое
значение χ2кр
= χ2
(α,k)
для этого критерия находится из справочной
таблицы “Критические точки распределения
χ2”.
Здесь k
= r
– 3. Если вычисленное по результатам
наблюдений по формуле (12) значение
критерия χ2набл
больше χ2кр,
основная гипотеза отвергается, если
меньше – нет оснований отвергнуть
основную гипотезу.

Если
варианты x1,
x2,
… , xr
не
являются равноотстоящими или число их
сравнительно велико, удобно сгруппировать
варианты в отдельные интервалы ( не
обязательно равноотстоящие ) [x1*;x2*),
[x2*;x3*),
…, [xm-1*;xm*).
Каждому интервалу назначается
представительное значение, равное
середине интервала xi.ср*
= (xi*
+ xi-1*)/2
и частота ni*,
равная сумме частот, попавших на интервал.
В соответствии с критерием Пирсона,
частоты ni*,
попавшие на интервалы [xi*
; xi-1*),
сравниваются с теоретическими частотами
ni‘,
вычисленными для соответствующих
интервалов нормальной случайной величины
Z
с нулевым математическим ожиданием и
единичным средним квадратическим
отклонением (Z
принадлежит N(0,1)).

,
(13)

ni
= nPi,
где n
– обьем выборки;

Pi
= Ф(zi+1)
– Ф(zi),
вероятности попадания X
на интервал (xi*,xi+1*)
или

Z
на (zi,zi+1);

zi
= (xi
ср
*–xв*)
/ σ*; i
= 2,3,..,m-1;
крайние интервалы открываем z1
= –∞,

zm
= ∞, а Ф(zi)
– значение функции Лапласа.

Критическое
значение χ2кр
= χ2
(α,k)
для этого критерия находится из справочной
таблицы “Критические точки распределения
χ2”.
Здесь k
= m
– 3. Если вычисленное по результатам
наблюдений по формуле (13) значение
критерия χ2набл
меньше χ2кр,
нет оснований отвергнуть основную
гипотезу, если больше – основная гипотеза
не принимается.

Для
проверки гипотез
о дисперсии σ
2
генеральной совокупности

с нормальным законом распределения при
заданном уровне значимости α используется
критерий

,
(14)

где
s2
– исправленная дисперсия выборки; n
– объем выборки; σ02
– гипотетическое значение дисперсии.

А)
Пусть выдвинута нулевая гипотеза H0:
σ2
=
σ02
о
равенстве неизвестной генеральной
дисперсии σ2
предполагаемому значению σ02
при конкурирующей гипотезе H1:
σ2

σ02.
Для проверки этой гипотезы по результатам
выборки вычисляется значение критерия
(14) χ2выб.
Затем по таблице «Критические точки
распределения χ2»,
по заданному уровню значимости α и числу
степеней свободы k
= n
– 1 находятся левое критическое значение
χ2лев.кр(1
– α/2;k)
и правое критическое значение
χ2прав.кр(α/2;k).
Если при этом χ2лев.кр
< χ2выб
< χ2прав.кр,
нет
оснований отвергнуть основную гипотезу,
конкурирующая – отвергается. В противном
случае принимается конкурирующая
гипотеза и отвергается основная.

Б)
Пусть теперь выдвинута нулевая гипотеза
H0:
σ2
=
σ02
о
равенстве неизвестной генеральной
дисперсии σ2
предполагаемому значению σ02
при конкурирующей гипотезе H1:
σ2
>
σ02.
Для проверки этой гипотезы по результатам
выборки вычисляется значение критерия
(14) χ2выб.
Затем по таблице «Критические точки
распределения χ2»,
по заданному уровню значимости α и числу
степеней свободы k
= n
– 1 находится критическое значение
χ2кр(
α;k).
Если при этом χ2выб
< χ2кр,
нет оснований отвергнуть основную
гипотезу, а конкурирующая – отвергается.

В)
Пусть теперь выдвинута нулевая гипотеза
H0:
σ2
=
σ02
о
равенстве неизвестной генеральной
дисперсии σ2
предполагаемому значению σ02
при конкурирующей гипотезе H1:
σ2
<
σ02.
Для проверки этой гипотезы по результатам
выборки вычисляется значение критерия
(14) χ2выб.
Затем по таблице «Критические точки
распределения χ2»,
по заданному уровню значимости α и числу
степеней свободы k
= n
– 1 находится критическое значение
χ2кр(
1- α;k).
Если при этом χ2выб
> χ2кр,
нет оснований отвергнуть основную
гипотезу, конкурирующая – отвергается.

Для
проверки гипотез
неизвестной средней
a
генеральной совокупности

с
нормальным законом распределения

с неизвестной дисперсией при заданном
уровне значимости α используется
критерий Стьюдента

,
(15)

где
xвыб
– выборочное среднее;
a0

гипотетическое значение средней; n
– объем выборки; s
– исправленное среднее квадратическое
отклонение.

А)
Пусть выдвинута нулевая гипотеза H0:
a

=
a0
о
равенстве неизвестной генеральной
средней a
предполагаемому значению a0
при конкурирующей гипотезе H1:
a

a0
.
Для проверки этой гипотезы по результатам
выборки вычисляется значение критерия
(15) Tвыб.
Затем по таблице «Критические точки
распределения Стьюдента», по заданному
уровню значимости α и числу степеней
свободы k
= n
– 1 находится двустороннее критическое
значение Tдвустор.кр(α;k).
Если при этом | Tвыб
| <
Tдвустор.кр,
нет оснований отвергнуть основную
гипотезу, а конкурирующая – отвергается.

Б)
Пусть теперь выдвинута нулевая гипотеза
H0:
a
=
a0
о
равенстве неизвестной генеральной
средней a
предполагаемому значению a0
при конкурирующей гипотезе H1:
a
>
a0
.
Для проверки этой гипотезы по результатам
выборки вычисляется значение критерия
(15) Tвыб.
Затем по таблице «Критические точки
распределения Стьюдента», по заданному
уровню значимости α и числу степеней
свободы k
= n
– 1 находится критическое значение
Tправостор.кр(α;k).
Если при этом Tвыб
< Tправостор.кр,
нет оснований отвергнуть основную
гипотезу
,
а конкурирующая – отвергается.

В)
Пусть теперь выдвинута нулевая гипотеза
H0:
a
=
a0
о
равенстве неизвестной генеральной
средней a
предполагаемому значению a0
при конкурирующей гипотезе H1:
a

< a0
.
Для проверки этой гипотезы по результатам
выборки вычисляется значение критерия
(15) Tвыб.
Затем по таблице «Критические точки
распределения Стьюдента», по заданному
уровню значимости α и числу степеней
свободы k
= n
– 1 находится критическое значение
Tправостор.кр(α;k)
и полагают Tлевостор.кр
= –Tправостор.кр.
Если при этом Tвыб
> Tлевостор.кр,
нет оснований отвергнуть основную
гипотезу, а конкурирующая – отвергается.

Содержание:

Точечные оценки:

Пусть случайная величина имеет неизвестную характеристику а. Такой характеристикой может быть, например, закон распределения, математическое ожидание, дисперсия, параметр закона распределения, вероятность определенного значения случайной величины и т.д. Пронаблюдаем случайную величину n раз и получим выборку из ее возможных значений Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Существует два подхода к решению этой задачи. Можно по результатам наблюдений вычислить приближенное значение характеристики, а можно указать целый интервал ее значений, согласующихся с опытными данными. В первом случае говорят о точечной оценке, во втором – об интервальной.

Определение. Функция результатов наблюдений Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Для одной и той же характеристики можно предложить разные точечные оценки. Необходимо иметь критерии сравнения оценок, для суждения об их качестве. Оценка Точечные оценки, свойства оценок - определение и вычисление с примерами решения как функция случайных результатов наблюдений Точечные оценки, свойства оценок - определение и вычисление с примерами решения сама является случайной величиной. Значения Точечные оценки, свойства оценок - определение и вычисление с примерами решения найденные по разным сериям наблюдений, могут отличаться от истинного значения характеристики Точечные оценки, свойства оценок - определение и вычисление с примерами решения в ту или другую сторону. Естественно потребовать, чтобы оценка систематически не завышала и не занижала оцениваемое значение, а с ростом числа наблюдений становилась более точной. Формализация названных требований приводит к следующим понятиям.

Определение. Оценка называется несмещенной, если ее математическое ожидание равно оцениваемой величине: Точечные оценки, свойства оценок - определение и вычисление с примерами решения В противном случае оценку называют смещенной.

Определение. Оценка называется состоятельной, если при увеличении числа наблюдений она сходится по вероятности к оцениваемой величине, т.е. для любого сколь угодно малого Точечные оценки, свойства оценок - определение и вычисление с примерами решения

 Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Если известно, что оценка Точечные оценки, свойства оценок - определение и вычисление с примерами решения несмещенная, то для ее состоятельности достаточно, чтобы

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Последнее условие удобно для проверки. В качестве меры разброса значений оценки Точечные оценки, свойства оценок - определение и вычисление с примерами решения относительно Точечные оценки, свойства оценок - определение и вычисление с примерами решения можно рассматривать величину Точечные оценки, свойства оценок - определение и вычисление с примерами решения Из двух оценок предпочтительней та, для которой эта величина меньше. Если оценка имеет наименьшую меру разброса среди всех оценок характеристики, построенных по Точечные оценки, свойства оценок - определение и вычисление с примерами решения наблюдениям, то оценку называют эффективной.

Следует отметить, что несмещенность и состоятельность являются желательными свойствами оценок, но не всегда разумно требовать наличия этих свойств у оценки. Например, может оказаться предпочтительней оценка хотя и обладающая небольшим смещением, но имеющая значительно меньший разброс значений, нежели несмещенная оценка. Более того, есть характеристики, для которых нет одновременно несмещенных и состоятельных оценок.

Оценки для математического ожидания и дисперсии

Пусть случайная величина имеет неизвестные математическое ожидание и дисперсию, причем Точечные оценки, свойства оценок - определение и вычисление с примерами решения Если Точечные оценки, свойства оценок - определение и вычисление с примерами решения– результаты Точечные оценки, свойства оценок - определение и вычисление с примерами решения независимых наблюдений случайной величины, то в качестве оценки для математического ожидания можно предложить среднее арифметическое наблюдаемых значений Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Несмещенность такой оценки следует из равенствТочечные оценки, свойства оценок - определение и вычисление с примерами решения

В силу независимости наблюдений Точечные оценки, свойства оценок - определение и вычисление с примерами решения

При условии Точечные оценки, свойства оценок - определение и вычисление с примерами решения имеем Точечные оценки, свойства оценок - определение и вычисление с примерами решения что означает состоятельность оценки Точечные оценки, свойства оценок - определение и вычисление с примерами решения.

Доказано, что для математического ожидания нормально распределенной случайной величины оценка Точечные оценки, свойства оценок - определение и вычисление с примерами решения еще и эффективна.

Оценка математического ожидания посредством среднего арифметического наблюдаемых значений наводит на мысль предложить в качестве оценки для дисперсии величину

 Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Преобразуем величину Точечные оценки, свойства оценок - определение и вычисление с примерами решения обозначая для краткости Точечные оценки, свойства оценок - определение и вычисление с примерами решения через Точечные оценки, свойства оценок - определение и вычисление с примерами решенияТочечные оценки, свойства оценок - определение и вычисление с примерами решения

В силу (3.1.2) имеем Точечные оценки, свойства оценок - определение и вычисление с примерами решения ПоэтомуТочечные оценки, свойства оценок - определение и вычисление с примерами решения 

Последняя запись означает, что оценка Точечные оценки, свойства оценок - определение и вычисление с примерами решения имеет смещение. Она систематически занижает истинное значение дисперсии. Для получения несмещенной оценки введем поправку в виде множителя Точечные оценки, свойства оценок - определение и вычисление с примерами решения и полученную оценку обозначим через Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Величина

 Точечные оценки, свойства оценок - определение и вычисление с примерами решения

является несмещенной и состоятельной оценкой дисперсии.

Пример:

Оценить математическое ожидание и дисперсию случайной величины Х по результатам ее независимых наблюдений: 7, 3, 4, 8, 4, 6, 3.

Решение. По формулам (3.1.1) и (3.1.3) имеем Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Ответ. Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Пример:

Данные 25 независимых наблюдений случайной величины представлены в сгруппированном виде: Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Требуется оценить математическое ожидание и дисперсию этой случайной величины.

Решение. Представителем каждого интервала можно считать его середину. С учетом этого формулы (3.1.1) и (3.1.3) дают следующие оценки:Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Ответ.  Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Метод наибольшего правдоподобия для оценки параметров распределений

В теории вероятностей и ее приложениях часто приходится иметь дело с законами распределения, которые определяются некоторыми параметрами. В качестве примера можно назвать нормальный закон распределения Точечные оценки, свойства оценок - определение и вычисление с примерами решения Его параметры Точечные оценки, свойства оценок - определение и вычисление с примерами решения и Точечные оценки, свойства оценок - определение и вычисление с примерами решения имеют смысл математического ожидания и дисперсии соответственно. Их можно оценить с помощью Точечные оценки, свойства оценок - определение и вычисление с примерами решения и Точечные оценки, свойства оценок - определение и вычисление с примерами решения В общем случае параметры законов распределения не всегда напрямую связаны со значениями числовых 179 характеристик. Поэтому практический интерес представляет следующая задача.

Пусть случайная величина Х имеет функцию распределения Точечные оценки, свойства оценок - определение и вычисление с примерами решения причем тип функции распределения F известен, но неизвестно значение параметра Точечные оценки, свойства оценок - определение и вычисление с примерами решения По данным результатов наблюдений нужно оценить значение параметра. Параметр может быть и многомерным.

Продемонстрируем идею метода наибольшего правдоподобия на упрощенном примере. Пусть по результатам наблюдений, отмеченных на рис. 3.1.1 звездочками, нужно отдать предпочтение одной из двух функций плотности вероятности Точечные оценки, свойства оценок - определение и вычисление с примерами решения или Точечные оценки, свойства оценок - определение и вычисление с примерами решения Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Из рисунка видно, что при значении параметра Точечные оценки, свойства оценок - определение и вычисление с примерами решения такие результаты наблюдений маловероятны и вряд ли бы реализовались. При значении же Точечные оценки, свойства оценок - определение и вычисление с примерами решения эти результаты наблюдений вполне возможны. Поэтому значение параметра Точечные оценки, свойства оценок - определение и вычисление с примерами решения более правдоподобно, чем значение Точечные оценки, свойства оценок - определение и вычисление с примерами решения. Такая аргументация позволяет сформулировать принцип наибольшего правдоподобия: в качестве оценки параметра выбирается то его значение, при котором данные результаты наблюдений наиболее вероятны.

Этот принцип приводит к следующему способу действий. Пусть закон распределения случайной величины Х зависит от неизвестного значения параметра Точечные оценки, свойства оценок - определение и вычисление с примерами решения Обозначим через Точечные оценки, свойства оценок - определение и вычисление с примерами решения для непрерывной случайной величины плотность вероятности в точке Точечные оценки, свойства оценок - определение и вычисление с примерами решения а для дискретной случайной величины – вероятность того, что Точечные оценки, свойства оценок - определение и вычисление с примерами решения Если в Точечные оценки, свойства оценок - определение и вычисление с примерами решения независимых наблюдениях реализовались значения случайной величины Точечные оценки, свойства оценок - определение и вычисление с примерами решения то выражение Точечные оценки, свойства оценок - определение и вычисление с примерами решения

называют функцией правдоподобия. Величина Точечные оценки, свойства оценок - определение и вычисление с примерами решения зависит только от параметра Точечные оценки, свойства оценок - определение и вычисление с примерами решения при фиксированных результатах наблюдений Точечные оценки, свойства оценок - определение и вычисление с примерами решения При каждом значении параметра Точечные оценки, свойства оценок - определение и вычисление с примерами решения функция Точечные оценки, свойства оценок - определение и вычисление с примерами решения равна вероятности именно тех значений дискретной случайной величины, которые получены в процессе наблюдений. Для непрерывной случайной величины Точечные оценки, свойства оценок - определение и вычисление с примерами решения равна плотности вероятности в точке выборочного пространства Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Сформулированный принцип предлагает в качестве оценки значения параметра выбрать такое Точечные оценки, свойства оценок - определение и вычисление с примерами решения при котором Точечные оценки, свойства оценок - определение и вычисление с примерами решения принимает наибольшее значение. Величина Точечные оценки, свойства оценок - определение и вычисление с примерами решения будучи функцией от результатов наблюдений Точечные оценки, свойства оценок - определение и вычисление с примерами решения называется оценкой наибольшего правдоподобия.

Во многих случаях, когда Точечные оценки, свойства оценок - определение и вычисление с примерами решения дифференцируема, оценка наибольшего правдоподобия находится как решение уравнения Точечные оценки, свойства оценок - определение и вычисление с примерами решения

которое следует из необходимого условия экстремума. Поскольку Точечные оценки, свойства оценок - определение и вычисление с примерами решения достигает максимума при том же значении Точечные оценки, свойства оценок - определение и вычисление с примерами решения, что и Точечные оценки, свойства оценок - определение и вычисление с примерами решения, то можно решать относительно Точечные оценки, свойства оценок - определение и вычисление с примерами решения эквивалентное уравнениеТочечные оценки, свойства оценок - определение и вычисление с примерами решения

Это уравнение называют уравнением правдоподобия. Им пользоваться удобнее, чем уравнением (3.1.5), так как функция Точечные оценки, свойства оценок - определение и вычисление с примерами решения равна произведению, а Точечные оценки, свойства оценок - определение и вычисление с примерами решения– сумме, а дифференцировать Точечные оценки, свойства оценок - определение и вычисление с примерами решения проще.

Если параметров несколько (многомерный параметр), то следует взять частные производные от функции правдоподобия по всем параметрам, приравнять частные производные нулю и решить полученную систему уравнений.

Оценку, получаемую в результате поиска максимума функции правдоподобия, называют еще оценкой максимального правдоподобия.

Известно, что оценки максимального правдоподобия состоятельны. Кроме того, если для q существует эффективная оценка, то уравнение правдоподобия имеет единственное решение, совпадающее с этой оценкой. Оценка максимального правдоподобия может оказаться смещенной.

Метод моментов

Начальным моментом Точечные оценки, свойства оценок - определение и вычисление с примерами решенияго порядка случайной величины Х называется математическое ожидание Точечные оценки, свойства оценок - определение и вычисление с примерами решенияй степени этой величины, т.е. Точечные оценки, свойства оценок - определение и вычисление с примерами решения Само математическое ожидание считается начальным моментом первого порядка.

Центральным моментом Точечные оценки, свойства оценок - определение и вычисление с примерами решенияго порядка называется Точечные оценки, свойства оценок - определение и вычисление с примерами решения Очевидно, что дисперсия – это центральный момент второго порядка. Если закон распределения случайной величины зависит от некоторых параметров, то от этих параметров зависят и моменты случайной величины.

Для оценки параметров распределения по методу моментов находят на основе опытных данных оценки моментов в количестве, равном числу оцениваемых параметров. Эти оценки приравнивают к соответствующим теоретическим моментам, величины которых выражены через параметры. Из полученной системы уравнений можно определить искомые оценки. 

Например, если Х имеет плотность распределения Точечные оценки, свойства оценок - определение и вычисление с примерами решения то Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Если воспользоваться величиной Точечные оценки, свойства оценок - определение и вычисление с примерами решения как оценкой для Точечные оценки, свойства оценок - определение и вычисление с примерами решения на основе опытных данных, то оценкой Точечные оценки, свойства оценок - определение и вычисление с примерами решения по методу моментов будет решение уравнения Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Пример:

Найти оценку параметра показательного закона распределения по методу моментов.

Решение. Плотность вероятности показательного закона распределения имеет вид Точечные оценки, свойства оценок - определение и вычисление с примерами решения Поэтому Точечные оценки, свойства оценок - определение и вычисление с примерами решенияТочечные оценки, свойства оценок - определение и вычисление с примерами решения Откуда Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Ответ. Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Пример:

Пусть имеется простейший поток событий неизвестной интенсивности Точечные оценки, свойства оценок - определение и вычисление с примерами решения. Для оценки параметра Точечные оценки, свойства оценок - определение и вычисление с примерами решения проведено наблюдение потока и зарегистрированы Точечные оценки, свойства оценок - определение и вычисление с примерами решения – длительности Точечные оценки, свойства оценок - определение и вычисление с примерами решенияпоследовательных интервалов времени между моментами наступления событий. Найти оценку для Точечные оценки, свойства оценок - определение и вычисление с примерами решения.

Решение. В простейшем потоке интервалы времени между последовательными моментами наступления событий потока имеют показательный закон распределения Точечные оценки, свойства оценок - определение и вычисление с примерами решения Так как плотность вероятности показательного закона распределения равна Точечные оценки, свойства оценок - определение и вычисление с примерами решения то функция правдоподобия (3.1.4) имеет видТочечные оценки, свойства оценок - определение и вычисление с примерами решения

Тогда  Точечные оценки, свойства оценок - определение и вычисление с примерами решения и уравнение правдоподобия Точечные оценки, свойства оценок - определение и вычисление с примерами решения имеет решение Точечные оценки, свойства оценок - определение и вычисление с примерами решения

При таком значении Точечные оценки, свойства оценок - определение и вычисление с примерами решения функция правдоподобия действительно достигает наибольшего значения, так как Точечные оценки, свойства оценок - определение и вычисление с примерами решения

ОтветТочечные оценки, свойства оценок - определение и вычисление с примерами решения

Определение. Пусть Точечные оценки, свойства оценок - определение и вычисление с примерами решения – результаты n независимых наблюдений случайной величины X. Если расставить эти результаты в порядке возрастания, то получится последовательность значений, которую называют вариационным рядом и обозначают: 

Точечные оценки, свойства оценок - определение и вычисление с примерами решения
В этой записи Точечные оценки, свойства оценок - определение и вычисление с примерами решения 

Величины Точечные оценки, свойства оценок - определение и вычисление с примерами решения называют порядковыми статистиками.

Пример:

Случайная величина Х имеет равномерное распределение на отрезке Точечные оценки, свойства оценок - определение и вычисление с примерами решения где Точечные оценки, свойства оценок - определение и вычисление с примерами решения и Точечные оценки, свойства оценок - определение и вычисление с примерами решения неизвестны. Пусть Точечные оценки, свойства оценок - определение и вычисление с примерами решения – результаты Точечные оценки, свойства оценок - определение и вычисление с примерами решения независимых наблюдений. Найти оценку параметра Точечные оценки, свойства оценок - определение и вычисление с примерами решения.

Решение. Функция плотности вероятности величины Х имеет видТочечные оценки, свойства оценок - определение и вычисление с примерами решения

В этом случае функция правдоподобия Точечные оценки, свойства оценок - определение и вычисление с примерами решения от Точечные оценки, свойства оценок - определение и вычисление с примерами решения явно не зависит. Дифференцировать по Точечные оценки, свойства оценок - определение и вычисление с примерами решения такую функцию нельзя и нет возможности записать уравнение правдоподобия. Однако легко видеть, что Точечные оценки, свойства оценок - определение и вычисление с примерами решения возрастает при уменьшении Точечные оценки, свойства оценок - определение и вычисление с примерами решения. Все результаты наблюдений лежат в Точечные оценки, свойства оценок - определение и вычисление с примерами решения поэтому можно записать:

 Точечные оценки, свойства оценок - определение и вычисление с примерами решения

где Точечные оценки, свойства оценок - определение и вычисление с примерами решения – наименьший, а Точечные оценки, свойства оценок - определение и вычисление с примерами решения – наибольший из результатов наблюдений. При минимально возможном Точечные оценки, свойства оценок - определение и вычисление с примерами решения 

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

откуда Точечные оценки, свойства оценок - определение и вычисление с примерами решения или Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Оценкой наибольшего правдоподобия для параметра Точечные оценки, свойства оценок - определение и вычисление с примерами решения будет величинаТочечные оценки, свойства оценок - определение и вычисление с примерами решения

ОтветТочечные оценки, свойства оценок - определение и вычисление с примерами решения

Пример:

Случайная величина X имеет функцию распределенияТочечные оценки, свойства оценок - определение и вычисление с примерами решения

где Точечные оценки, свойства оценок - определение и вычисление с примерами решения неизвестный параметр.

Пусть Точечные оценки, свойства оценок - определение и вычисление с примерами решения – результаты Точечные оценки, свойства оценок - определение и вычисление с примерами решениянезависимых наблюдений случайной величины X. Требуется найти оценку наибольшего правдоподобия для параметра Точечные оценки, свойства оценок - определение и вычисление с примерами решения и найти оценку для M(X).

Решение. Для построения функции правдоподобия найдем сначала функцию плотности вероятности

 Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Тогда функция правдоподобия: Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Логарифмическая функция правдоподобия: Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Уравнение правдоподобия

 Точечные оценки, свойства оценок - определение и вычисление с примерами решения

не имеет решений. Критических точек нет. Наибольшее и наименьшее значения Точечные оценки, свойства оценок - определение и вычисление с примерами решения находятся на границе допустимых значений Точечные оценки, свойства оценок - определение и вычисление с примерами решения.

По виду функции Точечные оценки, свойства оценок - определение и вычисление с примерами решения можно заключить, что значение Точечные оценки, свойства оценок - определение и вычисление с примерами решения тем больше, чем меньше величина Точечные оценки, свойства оценок - определение и вычисление с примерами решения. Но Точечные оценки, свойства оценок - определение и вычисление с примерами решения не может быть меньше Точечные оценки, свойства оценок - определение и вычисление с примерами решения Поэтому наиболее правдоподобное значение Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Так как Точечные оценки, свойства оценок - определение и вычисление с примерами решения, то оценкой наибольшего правдоподобия для Точечные оценки, свойства оценок - определение и вычисление с примерами решения будет величина Точечные оценки, свойства оценок - определение и вычисление с примерами решения
Ответ. Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Пример:

Случайная величина Х имеет нормальный закон распределения Точечные оценки, свойства оценок - определение и вычисление с примерами решения c неизвестными параметрами Точечные оценки, свойства оценок - определение и вычисление с примерами решения и Точечные оценки, свойства оценок - определение и вычисление с примерами решения По результатам независимых наблюдений Точечные оценки, свойства оценок - определение и вычисление с примерами решения найти наиболее правдоподобные значения этих параметров.

Решение. В соответствии с (3.1.4) функция правдоподобия имеет вид Точечные оценки, свойства оценок - определение и вычисление с примерами решения

а логарифмическая функция правдоподобия: Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Необходимые условия экстремума дают систему двух уравнений: Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Решения этой системы имеют вид: Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Отметим, что обе оценки являются состоятельными, причем оценка для Точечные оценки, свойства оценок - определение и вычисление с примерами решения несмещенная, а для Точечные оценки, свойства оценок - определение и вычисление с примерами решения смещенная (сравните с формулой (3.1.3)).

Ответ. Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Пример:

По данным эксперимента построен статистический ряд: 

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения случайной величины X.
Решение. 1) Число экспериментальных данных вычисляется по формуле:

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Значит, объем выборки n = 50.

2) Вычислим среднее арифметическое значение эксперимента:

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Значит, найдена оценка математического ожидания Точечные оценки, свойства оценок - определение и вычисление с примерами решения= 12,3.

3) Вычислим исправленную выборочную дисперсию:

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Значит, найдена оценка дисперсии: Точечные оценки, свойства оценок - определение и вычисление с примерами решения = 1,44.

5) Вычислим оценку среднего квадратического отклонения:

Точечные оценки, свойства оценок - определение и вычисление с примерами решения
Ответ: Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Пример:

По данным эксперимента построен статистический ряд: 

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения случайной величины X.
Решение. По формуле

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

перейдем к условным вариантам: 

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Для них произведем расчет точечных оценок параметров:

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Следовательно, вычисляем искомые точечные оценки: 

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

ОтветТочечные оценки, свойства оценок - определение и вычисление с примерами решения

Пример:

По данным эксперимента построен интервальный статистический ряд: 

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Найти оценки математического ожидания, дисперсии и среднего квадратического отклонения.
Решение. 1) От интервального ряда перейдем к статистическому ряду, заменив интервалы их серединами  Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

2) Объем выборки вычислим по формуле:

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

3) Вычислим среднее арифметическое значений эксперимента:

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

3) Вычислим исправленную выборочную дисперсию:

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Можно было воспользоваться следующей формулой:

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

5)  Вычислим оценку среднего квадратического отклонения: 

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

ОтветТочечные оценки, свойства оценок - определение и вычисление с примерами решения

Пример:

Найти доверительный интервал с надежностью 0,95 для оценки математического ожидания M(X) нормально распределенной случайной величины X, если известно среднее квадратическое отклонение σ = 2, оценка математического ожидания Точечные оценки, свойства оценок - определение и вычисление с примерами решения объем выборки n = 25.
 

Решение. Доверительный интервал для истинного математического ожидания с доверительной вероятностью Точечные оценки, свойства оценок - определение и вычисление с примерами решения = 0,95 при известной дисперсии σ находится по формуле:

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

где m = M(X) – истинное математическое ожидание; 𝑥̅ − оценка M(X) по выборке; n – объем выборки; Точечные оценки, свойства оценок - определение и вычисление с примерами решения – находится по доверительной вероятности Точечные оценки, свойства оценок - определение и вычисление с примерами решения = 0,95 из равенства:

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Из табл. П 2.2 приложения 2 находим: Точечные оценки, свойства оценок - определение и вычисление с примерами решения = 1,96. Следовательно, найден доверительный интервал для M(X): 

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Ответ: (9,216 ; 10,784).

Пример:

По данным эксперимента построен статистический ряд: 

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Найти доверительный интервал для математического ожидания M (X) с надежностью 0,95.
 

Решение. Воспользуемся формулой для доверительного интервала математического ожидания при неизвестной дисперсии:

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

где n – объем выборки; 𝑥̅ оценка M(X);  s – оценка среднего квадратического отклонения; Точечные оценки, свойства оценок - определение и вычисление с примерами решения  − находится по доверительной вероятности Точечные оценки, свойства оценок - определение и вычисление с примерами решения = 0,95.

По числам Точечные оценки, свойства оценок - определение и вычисление с примерами решения = 0,95 и n = 20 находим: Точечные оценки, свойства оценок - определение и вычисление с примерами решения = 2,093.
Теперь вычисляем оценки для M(X) и D(X):

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Следовательно, s ≈ 1,685. Поэтому искомый доверительный интервал математического ожидания задается формулой: 

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Ответ: (– 0,76; 0,76).

Пример:

По данным десяти независимых измерений найдена оценка квадратического отклонения Точечные оценки, свойства оценок - определение и вычисление с примерами решения = 0,5. Найти доверительный интервал точности измерительного прибора с надежностью 99 %.
 

Решение. Задача сводится к нахождению доверительного интервала для истинного квадратического отклонения, так как точность прибора характеризуется средним квадратическим отклонением случайных ошибок измерений.

Доверительный интервал для среднего квадратического отклонения находим по формуле:

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

где  Точечные оценки, свойства оценок - определение и вычисление с примерами решения = 0,5 − оценка среднего квадратического отклонения; Точечные оценки, свойства оценок - определение и вычисление с примерами решения – число, определяемое из табл. П 2.4 приложения 2 по заданной доверительной вероятности  Точечные оценки, свойства оценок - определение и вычисление с примерами решения = 0,99 и заданному объему выборки  n = 10.
Находим:   Точечные оценки, свойства оценок - определение и вычисление с примерами решения
Тогда можно записать: 

Точечные оценки, свойства оценок - определение и вычисление с примерами решения

Ответ: (0; 1,04).

  • Доверительный интервал для вероятности события
  • Проверка гипотезы о равенстве вероятностей
  • Доверительный интервал для математического ожидания
  • Доверительный интервал для дисперсии
  • Системы случайных величин
  • Вероятность и риск
  • Определения вероятности событий
  • Предельные теоремы теории вероятностей

Содержание:

  1. Точечные статистические оценки параметров генеральной совокупности 
  2. Методы определения точечных статистических оценок
  3. Законы распределения вероятностей для 
  4. Интервальные статистические оценки для параметров генеральной совокупности 
  5. Построение доверчивого интервала для  при известном значении  с заданной надежностью  
  6. Построение доверительного интервала для  при неизвестном значении  из заданной надежности 
  7. Построение доверительных интервалов с заданной надежностью  для 
  8. Построение доверительного интервала для  генеральной совокупности с заданной надежностью 
  9. Построение доверительного интервала для  с помощью неравенства Чебишова с заданной надежностью 

Информация, которую получили на основе обработки выборки про признак генеральной совокупности, всегда содержит определенные погрешности, поскольку выборка содержит только незначительную часть от нее Статистические оценки то есть объем выборки значительно меньше объема генеральной совокупности. 

Потому, следует организовать выборку так, чтобы эта информация была более полной (выборка может быть репрезентабельной) и обеспечивала с наибольшей степенью доверия о параметрах генеральной совокупности ил закон распределение ее признака. 

Параметры генеральной совокупности Статистические оценки являются величинами постоянными, но их числовые значения неизвестные. Эти параметры оцениваются параметрами выборки:  Статистические оценки которые получаются при обработке выборки. Они являются величинами непредсказуемыми, то есть случайными. Схематично это можно показать так (рис. 115). 

Статистические оценки

Тут через  Статистические оценки обозначен оценочный параметр генеральной совокупности, а через  Статистические оценки  – его статистическую оценку, Которую называют еще статистикой. При этом Статистические оценки  а Статистические оценки – случайная величина, что имеет полный закон распределения вероятностей. заметим, что для реализации выборки каждую ее варианту рассматривают как случайную величину, что имеет закон распределения вероятностей признака генеральной совокупности с соответственными числовыми характеристиками: 

Статистические оценки

Точечные статистические оценки параметров генеральной совокупности 

Статистическая оценка Статистические оценки , которая обозначается одном числом, называется точечной. Возьмем во внимание, что Статистические оценки является случайной величиной, точечная статистическая оценка может быть смещенной или несмещенной: когда математическое надежда этой оценки точно равны оценочному параметру Статистические оценки а именно: 

Статистические оценки

то Статистические оценки называется несмещенной; в противоположном случае, то есть когда 

Статистические оценки 

точечная статистическая оценка  Статистические оценки   называется смещенной относительно параметра генеральной совокупности Статистические оценки

 Разница 

Статистические оценки

называется смещением статистической оценки Статистические оценки

Оценочный параметр может иметь несколько точечных несмещенных статистических оценок, что можно изобразить так (рис. 116):

Статистические оценки

Например, пусть Статистические оценки которая имеет две несмещенные точечные статистические оценки – Статистические оценки  и Статистические оценки Тогда плотность вероятностей для Статистические оценки Статистические оценки  имеют такой вид (рис. 117): 

Статистические оценки

Из графиков плотности видим, что оценка  Статистические оценки сравнено с оценкой Статистические оценки имеет то преимущество, что около параметра Статистические оценкиСтатистические оценки  Отсюда получается,  что оценка Статистические оценки чаще получает значение в этой области, чем оценка Статистические оценки

Но на “хвостах” распределений имеет другую картину: большие отклонения от Статистические оценки будут наблюдаться для статистической оценки Статистические оценки, чаще, чем для Статистические оценки Потому, сравнивая дисперсии статистических Статистические оценки как меру рассеивания, видим, что Статистические оценки  имеет меньшую дисперсию, чем оценка Статистические оценки

Точечная статистическая оценка называется эффективной, когда при заданном объеме выборки она имеет минимальную дисперсию. Следует, оценка Статистические оценки будет несмещенной и эффективной. 

Точечная статистическая оценка называется основой, если в случае неограниченного увеличения объема выборки Статистические оценки приближается к оценке параметра Статистические оценки, а именно: 

Статистические оценки

Методы определения точечных статистических оценок

Существует три метода определения точечных статистических оценок для параметров генеральной совокупности. 

Метод аналогий. Этот метод основывается на том, что для параметров генеральной совокупности выбирают такие же параметры выборки, то есть для оценки Статистические оценки выбирают аналогичные статистики – Статистические оценки

Метод наименьших квадратов. Согласно с этим методом статистические оценки обозначаются с условием минимизации суммы квадратов отклонений вариант выборки от статистической оценки Статистические оценки

Итак, используя метод наименьших квадратов, можно, например, обозначить статистическую оценку для Статистические оценки Для этого воспользуемся функцией Статистические оценки  Используя условие экстремума, получим: 

Статистические оценки

Отсюда, для Статистические оценки точечной статистической оценкой будет Статистические оценки – выборочная средняя. 

Метод максимальной правдоподобности. Этот метод занимает центральное место в теории статистической оценки параметров Статистические оценки На него в свое время обратил внимание К. Гаусс, а  разработал его Р. Фишер. Этот метод рассмотрим подробнее. 

Пусть признак генеральной совокупности Статистические оценки  обозначается только одном параметром Статистические оценки  и имеет плотность вероятности Статистические оценки  В случае реализации выборки с вариантами Статистические оценки  плотность вероятности выборки будет такой: 

Статистические оценки

В этом варианте рассматриваются как независимые случайные величины, которые имеют один и тот же закон распределения, что ее признак генеральной совокупности Статистические оценки

Суть этого метода состоит в том, что фиксируя значение вариант Статистические оценки,  обозначают такие значение параметра  Статистические оценки, при котором функция  Статистические оценки максимизуется. Она называется функцией максимальной правдоподобности и обозначается так: Статистические оценки

Например, когда признак генеральной совокупности  Статистические оценки имеет нормальный закон распределения, то функция максимальной правдоподобности приобретет такой вид: 

Статистические оценки

При этом статистические оценки Статистические оценки  выбирают и ее значения, по которых заданная выборка будет верной, то есть функция Статистические оценки  достигает максимума. 

На практике удобно от функции Статистические оценки перейти к ее логарифму, а именно: 

Статистические оценки

согласно с необходимым условием экстремума для этой функции получим: 

Статистические оценки

Из первого уравнения системы  Статистические оценки  получим: 

Статистические оценки

из уравнение системы Статистические оценки  получим: 

Статистические оценки

Следует, для Статистические оценки точечной функции статистической оценкой будет  Статистические оценки  для  Статистические оценки

Свойства Статистические оценки Исправленная дисперсия, исправленное среднее квадратичное отклонение. Точечной несмещенной статистической оценкой для Статистические оценки  будет Статистические оценки

И на самом деле, 

Статистические оценки  учитывая то. что Статистические оценки Статистические оценки

Следует, Статистические оценки

Проверим на несмещенность статистической оценки Статистические оценки

Статистические оценки

Статистические оценки

Статистические оценки

Таким образом, получим Статистические оценки

Следует, Статистические оценки будет точечной смещенной статистической оценкой для Статистические оценки,  где  Статистические оценки – коэффициент смещения, который уменьшается с увеличением объема выборки  Статистические оценки

Когда Статистические оценки умножить на Статистические оценки  то получим Статистические оценки

Тогда 

Статистические оценки

Следует, Статистические оценки будут точеной несмещенной статистической оценкой для Статистические оценки Ее называли исправленной дисперсией и обозначили через  Статистические оценки

Отсюда точечной несмещенной статистической оценкой для Статистические оценки будет исправленная дисперсия  Статистические оценки  или 

Статистические оценки

Величину 

Статистические оценки

называют исправленным средним квадратичным отклонением.

Исправленное среднее квадратичное отклонение, следует подчеркнуть, будет смещенной точечной статистической оценкой для    Статистические оценки  поскольку 

Статистические оценки

где Статистические оценки является ступенью свободы;

Статистические оценки  – коэффициенты смещения. 

Пример. 200 однотипных деталей были отданы на шлифование. Результаты измерения приведены как дискретное статистическое распределение, подан в табличной форме: 

Статистические оценки

Найти точечные смещенные статистические оценки для Статистические оценки Статистические оценки

Решение. Поскольку точечной несмещенной оценки для Статистические оценки  будет Статистические оценки  то вычислим 

Статистические оценки

Для обозначение точечной несмещенной статистической оценки для Статистические оценки  вычислим Статистические оценки

Статистические оценки

Статистические оценки

тогда точечная несмещенная статистическая оценка для Статистические оценки равно: 

Статистические оценки

Пример. Граничная нагрузка на стальной болт Статистические оценки  что измерялась в лабораторных условий, задано как интервальное статистическое распределение: 

Статистические оценки

Обозначить точечные несмещенные статистические оценки для Статистические оценки

Решение. Для обозначения точечных несмещенных статистических распределений к дискретному, который приобретает такой вид: 

Статистические оценки

Вычислим Статистические оценки

Статистические оценки

Следует, точечная несмещенная статистическая оценка для Статистические оценки Статистические оценки

Для обозначения Статистические оценки  вычислим Статистические оценки

Статистические оценки

Отсюда точечная несмещенная статистическая оценка для Статистические оценки  будет Статистические оценки

Законы распределения вероятностей для Статистические оценки

Как уже обозначалось, числовые характеристики выборки являются случайными величинами, что имеют определенные законы распределения вероятностей. Так,  Статистические оценки (выборочная средняя) на основании центральной граничной теоремы теории вероятностей (теоремы Ляпунова) имеем нормальный закон распределения с числовыми характеристиками 

Статистические оценки

следует, случайная величина  Статистические оценки имеет закон распределения Статистические оценки

Чтобы обозначить закон распределения для Статистические оценки необходимо выявить связь между Статистические оценки и распределением Статистические оценки

Пусть признак генеральной совокупности  Статистические оценки  имеет нормальный закон распределения Статистические оценки. При реализации выборки каждую из вариант Статистические оценки  рассматривают как случайную величину. то также имеет закон распределения Статистические оценки. При этом вариант выборки является независимым, то есть Статистические оценки  а случайная величина Статистические оценки  соответственно имеет закон распределения Статистические оценки

Рассмотрим случай,  когда варианты выборки имеют частоты Статистические оценки тогда 

Статистические оценки 

Перейдем от случайных величин Статистические оценки к случайным величинам Статистические оценки которые линейно выражаются через Статистические оценки а именно:  

Статистические оценки

Поскольку случайные величины  Статистические оценки  будут линейными комбинациями случайных величин Статистические оценки то Статистические оценки тоже имеют нормальный закон распределения с числовыми характеристиками: 

Статистические оценки

Статистические оценки

Следует, случайные величины Статистические оценки имеют закон распределения Статистические оценки

Построим матрицу  Статистические оценки элементы которой будут коэффициенты при  Статистические оценки  в линейных зависимостях для Статистические оценки

Статистические оценки

Транспортируем матрицу Статистические оценки получим:

Статистические оценки

Если перемножить матрицы Статистические оценки и Статистические оценки то получим: 

Статистические оценки

где Статистические оценки  будет единичная матрица. 

Следует, случайные величины Статистические оценки обозначены ортогональными преобразованиями случайных величин Статистические оценки  В векторной – матричной форме это можно записать так: 

Из курса алгебры известно, что во время ортогональных преобразований вектора сохраняется его длина, то есть 

Статистические оценки

Тогда из формулы для Статистические оценки  получим: 

Статистические оценки

Поскольку Статистические оценки  далее вычислим: 

Статистические оценки

Следует, получим Статистические оценки

Когда поделим левую и правую часть  Статистические оценки  на Статистические оценки то получим, 

Статистические оценки

Поскольку Статистические оценки имеет закон распределения Статистические оценки  то Статистические оценки получим закон распределения Статистические оценки то есть нормированный нормальный закон. 

То случайная величина 

Статистические оценки

получим распределение Статистические оценки  из Статистические оценки  ступенями свободы. 

Отсюда получается, что случайная величина Статистические оценки  получим распределение Статистические оценки из  Статистические оценки ступенями свободы. 

Таким образом, приведена: случайная величина Статистические оценки тут символ Статистические оценки нужно читать “распределена как”; 

случайная величина Статистические оценки

случайная величина Статистические оценки

Интервальные статистические оценки для параметров генеральной совокупности 

Точечные статистические оценки Статистические оценки  являются случайными величинами, а потому приближенная замена Статистические оценки  на Статистические оценки часто приводит к существенным погрешностям, особенно когда объем выборки не большой. В этом случае используют интервальные статистические оценки.

Статистическая оценка, что обозначается двумя числами, концами интервалов, называется интервальной

Разница между статистической оценкой Статистические оценки и ее оценкой параметром Статистические оценки  взята с абсолютным значением, называется точностью оценки, а именно: 

Статистические оценки

где Статистические оценки  является точностью оценки. 

Поскольку Статистические оценки является случайной величиной, то и Статистические оценки будет случайной, потому неравенство Статистические оценки  справедливо с определенной вероятностью. 

Вероятность, с которой берется неравенство Статистические оценки, то есть 

Статистические оценки

называется надежностью

Равенство Статистические оценки можно записать так:

Статистические оценки

Интервал Статистические оценки что покрывает оценочный параметр Статистические оценки генеральной совокупности с заданной надежностью Статистические оценки называют доверчивым

Построение доверчивого интервала для Статистические оценки при известном значении Статистические оценки с заданной надежностью Статистические оценки 

Пусть признак Статистические оценки генеральной совокупностью имеет нормальный закон распределению. Построим доверительный интервал для Статистические оценки зная числовое значение среднего квадратичному отклонению генеральной совокупности  Статистические оценки   с заданной надежностью Статистические оценки Поскольку Статистические оценки как точечная несмещенная статистическая оценка для Статистические оценки  имеет нормальный закон распределения с числовыми характеристиками Статистические оценки  Статистические оценки то воспользовавшись Статистические оценки получим 

Статистические оценки

Случайная величина Статистические оценки имеет нормальный закон распределения с числовыми характеристиками 

Статистические оценки

Потому Статистические оценки  будет нормированный нормальный закон распределения Статистические оценки

Отсюда равенство Статистические оценки  можно записать, обозначив Статистические оценки так; 

Статистические оценки

или 

Статистические оценки

Согласно с формулой нормированного нормального закона 

Статистические оценки

для Статистические оценки она получает такой вид: 

Статистические оценки

Из равенства Статистические оценки  находим аргументы  Статистические оценки а именно: 

Статистические оценки

Аргумент  Статистические оценки находим значение функции Лапласа, которая равна Статистические оценки  по таблице (дополнение 2). 

Следует, доверительный интервал равен: 

Статистические оценки

что можно изобразить условно на рисунке 118. 

Статистические оценки

Величина  Статистические оценки  называется точностью оценки, или погрешностью выборки

Пример. Измеряя 40 случайно отобранных после изготовления деталей, нашли выборку средней, что равна 15 см. Из надежности  Статистические оценки построить доверительный интервал для средней величины всей партии деталей, если генеральная дисперсия равна Статистические оценки

 Решение. Для построенного доверчивого интервала необходимо найти: Статистические оценки

Из условия задачи имеем: Статистические оценки Статистические оценки Величина Статистические оценки вычисляется из уравнения

Статистические оценки

Статистические оценки {с таблицей значения функции Лапласа}. 

Найдем числовые значения концов доверчивого интервала: 

Статистические оценки

Таким образом, получим: Статистические оценки

Следует, с надежностью Статистические оценки  (99%  гарантии) оценочный параметр Статистические оценки  пребывает в середина интервала Статистические оценки

Пример. Имеем такие данные про размеры основных фондов (в млн руб.) на 30-ти случайно выбранных предприятий: 

Статистические оценки

построить интервальное статистическое распределение с длиной шага Статистические оценки млн рублей. 

С надежностью Статистические оценки найти доверительный интеграл для Статистические оценки если Статистические оценки млн рублей. 

Решение. Интервальное статистическое распределение будет таким: 

Статистические оценки

Для обозначение Статистические оценки необходимо построить дискретное статистическое распределение, что имеет такой вид: 

Статистические оценки

Тогда 

Статистические оценки

Статистические оценки  млн рублей. 

Для построения доверительного интервала с заданной надежностью Статистические оценки необходимо найти Статистические оценки

Статистические оценки

Вычислим концы интервала: 

Статистические оценки млн руб.

Статистические оценкимлн руб.

Следует, доверительный интервал для Статистические оценки будет Статистические оценки

Пример. Какое значение может получит надежность оценки Статистические оценки чтобы за объем выборки Статистические оценки погрешность ее не превышала Статистические оценки при Статистические оценки

Решение. Обозначим погрешность выборки 

Статистические оценки

Далее получим: 

Статистические оценки

как видим, надежность мала. 

Пример. Обозначить объем выборки Статистические оценки по которому погрешность Статистические оценки гарантируется с вероятностью Статистические оценки  если Статистические оценки

 Решение. По условию задачи Статистические оценки Поскольку Статистические оценки  то получим: Статистические оценки Величину Статистические оценки  находим из равенства Статистические оценки Тогда Статистические оценки

Построение доверительного интервала для Статистические оценки при неизвестном значении Статистические оценки из заданной надежности Статистические оценки

Для малых выборок, с какими сталкиваемся, исследуя разные признаки в техники или сельском хозяйстве, для оценки Статистические оценки  при неизвестном значении Статистические оценки невозможно воспользоваться нормальным законом распределения. Потому для построения доверительного интервала используется случайная величина. 

Статистические оценки

что имеет распределение Стьюдента с Статистические оценки ступенями свободы. 

Тогда Статистические оценки получает вид: 

Статистические оценки

поскольку Статистические оценки для распределения Стьюдента является функцией четной. 

Вычислив по данному статистическому распределению Статистические оценки Статистические оценки и обозначив по таблице распределения Стьюдента значения Статистические оценки построим доверительный интервал 

Статистические оценки

Тут Статистические оценки вычислим по заданной надежностью  Статистические оценки и числом степеней свободы Статистические оценки  по таблице (дополнение 3).

Пример. Случайно выбранная партия из двадцати примеров была испытана относительно срока безотказной работы каждого из них Статистические оценки Результаты испытаний приведено в виде дискретного статистического распределения: 

Статистические оценки

С надежностью Статистические оценки построить доверительный интервал для Статистические оценки (среднего времени безотказной работы прибора.)

Решение. Для построения доверительного интеграла необходимо найти среднее выборочное и исправленное среднее квадратичное отклонение. 

Вычислим Статистические оценки

Статистические оценки

следует, получили Статистические оценки часов. 

Обозначим Статистические оценки

Статистические оценки

следует, Статистические оценки

Исправленное среднее квадратичное отклонение равно: 

Статистические оценки часов.

По таблице значений Статистические оценки (дополнение 3) распределение Стьюдента по заданной надежностью Статистические оценки  и числом ступеней свободы Статистические оценки находим значение Статистические оценки

Вычислим концы доверительного интервала: 

Статистические оценки час.

Статистические оценки час. 

Следует, с надежностью Статистические оценки можно утверждать, что Статистические оценки  будет содержится в интервале 

Статистические оценки

При больших объемах выборки, а именно: Статистические оценки на основании центральной граничной теоремы теории вероятностей (теоремы Ляпунова) распределение Стьюдента приближается к нормальному закону. В этом случае Статистические оценки находиться по таблице значений функции Лапласа. 

Пример. В таблице приведены отклонения диаметров валиков, изготовленных на станке, от номинального размера: 

Статистические оценки

с надежностью Статистические оценки построить доверительный интервал для Статистические оценки

Решение. Для постройки доверительного интервала необходимо найти Статистические оценки

Для этого от интегрального статистического распределения, приведенного в условии задачи, необходимо перейти к дискретному, а именно: 

Статистические оценки

Вычислим Статистические оценки

Статистические оценки поскольку Статистические оценки

Статистические оценки

Следует, Статистические оценки

Обозначим Статистические оценки

Статистические оценки

Вычислим исправленное среднее квадратичное отклонение Статистические оценки

Статистические оценки

Учитывая  на большой Статистические оценки объем выборки можно считать, что распределение Стьюдента близкий к нормальному закону. Тогда по таблице значения функции Лапласа

Статистические оценки

Вычислим концы интервалов: 

Статистические оценки

Статистические оценки

Итак, доверчивый интервал для среднего значения отклонений будет таким: Статистические оценки

Отсюда с  надежностью Статистические оценки можно утверждать, чтоСтатистические оценки

Построение доверительных интервалов с заданной надежностью Статистические оценки для Статистические оценки

В случае, если признак Статистические оценки имеем нормальный закон распределения, для построения доверительного интервала с заданной надежностью Статистические оценки для Статистические оценки  используем случайную величину 

Статистические оценки

что имеет распределение Статистические оценки из Статистические оценки ступенями свободы. 

Поскольку случайные действия 

Статистические оценки и Статистические оценки

являются равновероятными, то есть их вероятности равны Статистические оценки получим: 

Статистические оценки

Подставляя в Статистические оценки Статистические оценки получим 

Статистические оценки

Следует, доверительный интервал для Статистические оценки получит вид: 

Статистические оценки

Тогда доверительный интервал для Статистические оценки получается из Статистические оценки и будет таким: 

Статистические оценки

Значения Статистические оценки находятся по таблице (дополнение 4) согласно с равенствами: 

Статистические оценки

где Статистические оценки

Пример. Проверена  партия однотипных телевизоров Статистические оценки на чувствительность к видео-программ  Статистические оценки данные проверки приведены как дискретное статистическое распределение: 

Статистические оценки

С надежностью Статистические оценки построить доверительные интервалы для Статистические оценки

Решение. Для построении доверительных интервалов  необходимо найти значения Статистические оценки

Вычислим значения Статистические оценки

Статистические оценки так как Статистические оценки

Статистические оценки

Вычислим Статистические оценки

Статистические оценки

Статистические оценки

Следует Статистические оценки

Исправленная дисперсия и исправленное среднее квадратичное отклонение равны:  

Статистические оценки

Поскольку Статистические оценки то согласно с Статистические оценки находим значения Статистические оценки а именно: 

Статистические оценки

По таблице (дополнение 4) находим: 

Статистические оценки

вычислим концы доверительного интервала для Статистические оценки

Статистические оценки

Статистические оценки

Следует, доверительный интеграл для Статистические оценки будет таким: 

Статистические оценки

Доверительный интервал для Статистические оценки станет

Статистические оценки

Доверительный интервал для Статистические оценки можно построить с заданной надежностью Статистические оценки взяв распределение Статистические оценки

Поскольку 

Статистические оценки

то равенство Статистические оценки можно записать так: 

Статистические оценки

или 

Статистические оценки

Обозначив Статистические оценки получим

Статистические оценки

чтобы найти Статистические оценки возьмем случайную величину 

Статистические оценки

что имеет распределение Статистические оценки

Учитывая то, что события

Статистические оценки и Статистические оценки

при Статистические оценки является равновероятными, получим: 

Статистические оценки

Если умножить все члены двойного неравенства Статистические оценкиСтатистические оценки на Статистические оценки то получим: 

Статистические оценки

Отсюда получим: 

Статистические оценки

Из уравнения Статистические оценки по заданной надежностью Статистические оценки и объемом выборки Статистические оценки находим по таблице (дополнение 5) значение величины Статистические оценки

Доверительный интервал будет таким: 

Статистические оценки

Пример. С надежностью Статистические оценки построить доверительный интервал вычислим значения Статистические оценки по таблице (дополнение 5). Статистические оценки

Обозначим концы интервала: 

Статистические оценки

Следует, доверительный интервал для Статистические оценки с надежностью Статистические оценки будет такой 

Статистические оценки

Построение доверительного интервала для Статистические оценки генеральной совокупности с заданной надежностью Статистические оценки

Как величина, полученная по результатам выборки, Статистические оценки является случайной и представляет собой точечную несмещенную статистическую оценку для Статистические оценки

Исправленное среднее квадратичное отклонение для  Статистические оценки

Статистические оценки

Для построения доверительного интервала для Статистические оценки используется случайная величина

Статистические оценки

что имеет нормированный нормальный закон распределения Статистические оценки 

Воспользовавшись Статистические оценки получим 

Статистические оценки

Следует. доверительный интервал для Статистические оценкибудет таким: 

Статистические оценки

где Статистические оценки находим из равенства 

Статистические оценки

по таблице значений функции Лапласа. 

Пример. Случайно выбранных студентов из потока университета были подвергнуты тестированию по математике и химии. Результаты этих тестирования преподнесено статистическим распределением, где Статистические оценки – оценки по математике, Статистические оценки – по химии. Ответы оценивались по десятибалльной системе: 

Статистические оценки

Необходимо: 

1) с надежностью Статистические оценки построить доверительный интервал для Статистические оценки  если Статистические оценки

2) с надежностью Статистические оценки построить доверительный интервал для Статистические оценки

Решение. Вычислим основные числовые характеристики признак Статистические оценки и Статистические оценки а также Статистические оценки Поскольку Статистические оценки получим: 

Статистические оценки

Статистические оценки

1. Построим доверительный интервал с надежностью Статистические оценки для Статистические оценки если Статистические оценки

Статистические оценки

нам известные значения Статистические оценки Значения  Статистические оценки вычисляем из уравнения  

Статистические оценки

где Статистические оценки находим по таблице значений функции Лапласа. 

Обозначим концы интервала: 

Статистические оценки

Следует, доверительный интервал для Статистические оценки будет таким: 

Статистические оценки

2. Построим доверительный интервал с надежностью Статистические оценки для Статистические оценки

Поскольку  Статистические оценки  нам не известно, то доверительный интервал в этом случае обозначается так: 

Статистические оценки

На известное значение Статистические оценки находим по таблице распределения Стьюдента (дополнение 3),

Статистические оценки

Вычислим концы доверительного интервала: 

Статистические оценки

Таким образом, доверительный интервал для Статистические оценки будет в таких границах: 

Статистические оценки

Доверительный интеграл с надежностью Статистические оценки для Статистические оценки будет таким: 

Статистические оценки

Нам известно значение Статистические оценки Учитывая, что Статистические оценки найдем по таблице (дополнение 5) значения Статистические оценки

Обозначим концы доверительного интервала: 

Статистические оценки

Следует, доверительный интервал для Статистические оценки подается таким неравенством: 

Статистические оценки

Доверительный интервал для Статистические оценки с заданной надежностью Статистические оценки будет таким: 

Статистические оценки

Нам известны значения Статистические оценки обозначаем по таблице значений функции Лапласа Статистические оценки где Статистические оценки

Обозначим концы доверительного интервала: 

Статистические оценки

таким образом, доверительный интервал для Статистические оценки будет в таких границах: 

Статистические оценки

Построение доверительного интервала для Статистические оценки с помощью неравенства Чебишова с заданной надежностью 

В случае, если отсутствует информация про закон распределения признака генеральной совокупности Статистические оценки  оценка вероятностей события Статистические оценки где Статистические оценки и построение доверительного интервала для Статистические оценки с заданной надежностью Статистические оценки выполняется с использованием неравенства Чебишова по условию, что известно значение Статистические оценки  а именно: 

Статистические оценки

Из Статистические оценки обозначаем величину Статистические оценки

Статистические оценки

Доверительный интервал дается таким неравенством: 

Статистические оценки

Когда Статистические оценки неизвестно, используем исправленную дисперсию Статистические оценки и доверительный интервал приобретает такой вид: 

Статистические оценки

Пример. Полученные данные с 100 наугад выбранных предприятий относительно возрастания выработки на одного работника Статистические оценки которые имеют такой интервальное статистическое распределение: 

Статистические оценки

Воспользовавшись неравенством Чебишова, построить доверительный интервал для Статистические оценки если известно значение Статистические оценки с надежностью Статистические оценки

Решение. Для построения доверительного интервала с помощью неравенства Чебишова необходимо вычислить Статистические оценки Чтобы обозначить Статистические оценки перейдем от интервального к дискретному статистическому распределению, а именно: 

Статистические оценки

Тогда получим: 

Статистические оценки

Воспользовавшись Статистические оценки вычислим Статистические оценки

Статистические оценки

таким образом, доверительный интервал для Статистические оценки преподноситься такими неравенствами: 

Статистические оценки

или 

Статистические оценки

Пример. Заданы размеры основных фондов Статистические оценки на 30- ти предприятий дискретным статистическим распределением: 

Статистические оценки

Воспользовавшись неравенством Чебишова с надежностью Статистические оценки построить доверительный интервал для Статистические оценки

Решение. Для постройки доверительного интервала для  Статистические оценки  с помощью неравенства Чебишова необходимо вычислить Статистические оценки

Статистические оценки

Статистические оценки млн руб. 

Следует, Статистические оценки млн рублей. 

Статистические оценки

Статистические оценки  млн рублей.

Обозначить концы доверительного интервала: 

Статистические оценки млн рублей

Статистические оценкин рублей

Итак, доверительный интервал для Статистические оценки подается неравенствами

Статистические оценки

Лекции:

  • Статистические гипотезы
  • Корреляционный и регрессионный анализ
  • Комбинаторика основные понятия и формулы с примерами
  • Число перестановок
  • Количество сочетаний
  • Действия над событиями. Теоремы сложения и умножения вероятностей примеры с решением
  • Примеры решения задач на тему: Случайные величины
  • Примеры решения задач на тему: основные законы распределения
  • Примеры решения задач на тему: совместный закон распределения двух случайных величин
  • Статистические распределения выборок и их числовые характеристики

Реферат

на тему «Точечные оценки»

по учебной дисциплине

«ОСНОВЫ МАТЕМАТИЧЕСКОЙ ОБРАБОТКИ ИНФОРМАЦИИ»

Выполнил(а):

Савкина Юлия Камильевна

2022 г

Оглавление

Введение

Статистика есть наука о том, как,

не умея мыслить и понимать,

заставить делать это цифры.

В. О. Ключевский

Математическая статистика – это наука, изучающая методы сбора и обработки статистической информации для получения научных и практических выводов.

Одной из центральных задач математической статистики является задача оценивания теоретического распределения случайной величины на основе выборочных данных. При этом часто предполагается, что вид закона распределения генеральной совокупности известен, но неизвестны параметры этого распределения, такие как математическое ожидание, дисперсия и др. Требуется найти приближенные значения этих параметров, то есть получить статистические оценки указанных параметров.

Основным методом математической статистики является выборочный метод, его суть состоит в исследовании представительной выборочной совокупности – для достоверной характеристики совокупности генеральной. Данный метод экономит временные, трудовые и материальные затраты, поскольку исследование всей совокупности зачастую затруднено или невозможно.

Для нахождения вида функции оценивания того или иного параметра используют один из следующих методов: 1) метод максимального правдоподобия; 2) метод моментов; 3) оценивание с помощью метода наименьших квадратов

Числовые характеристики, полученные по выборкам, называют статистическими оценками параметров. Различают два вида оценок параметров точечные и интервальные.

В данной работе речь пойдет именно о точечных оценках.

Глава 1. Основная часть

Основные понятия математической статистики

Введем основные понятия, связанные с выборками. Гене­ральной совокупностью называется совокупность объектов, из которых производится выборка. Выборочной совокупнос­тью (выборкой) называется совокупность случайно отобран­ных объектов из генеральной совокупности. Число объектов в совокупности называется ее объемом.

Числовые характеристики всей генеральной совокупности называются параметрами. Так как всю генеральную совокупность изучить достаточно часто не представляется возможным, о параметрах судят по выборочным характеристикам. На основании выборочных данных можно получить лишь приближенное значение параметра, которое является его оценкой.

Выборочная характеристика, используемая в качестве приближенного значения неизвестного параметра генеральной совокупности, называется точечной оценкой, т.к представляет собой число или точку на числовой оси.

Числовые характеристики выборки

По результатам выборочных наблюдений вычисляются такие статистические выборочные характеристики, как выборочные средняя, дисперсия, среднее квадратичное отклонение, коэффициент корреляции и т.д. Эти характеристики определяют соответствующие параметры генеральной совокупности.

Пусть x1, x2, …, xn – выборка из генеральной совокупности объёма n.

Выборочной средней (или средним значение выборки) называется среднее арифметическое значение признака выборочной совокупности.

Генеральная средняя для изучаемо­го количественного признака Х по генеральной совокупности

t1662868024aa.pngи выборочная средняя

t1662868024ab.png

Если все значения x1, x2, …, xn признака выборки объема n различны, то среднее значение выборки оценивается по формуле:

 t1662868024ac.gif

Для обозначения среднего значения выборки чаще всего используются обозначения t1662868024ad.gif  и t1662868024ae.gif 

Если значения признака Х1, X2, …, Хk в выборке имеют соответ­ственно частоты n1n2, …, nk, то последнюю формулу можно переписать в виде

o1662868724.png

Математическое ожидание характеризует среднее значение случайной величины и определяется по формулам:

t1662868024ag.png

(1.1)

где mx обозначает число, полученное после вычислений по формуле (1.1); M[X] – оператор математического ожидания, ДСВ – дискретная случайная величина, НСВ – непрерывная случайная величина. Как видно из (1.1), в качестве математического ожидания используется «среднее взвешенное значение», причем каждое из значений случайной величины учитывается с «весом», пропорциональным вероятности этого значения.

Начальный момент k-го порядка случайной величины X есть математическое ожидание k-й степени этой случайной величины:

t1662868024ah.png

(1.2)

При k=0 значение α0(x) = M[X0] = M [1] = 1; при k=1 — α1(x) = M[X1] = M [Х] = mx – математическое ожидание; при k=2 — α2(x) = M[X2].

Центрированной случайной величиной Х° называется случайная величина, математическое ожидание которой находится в начале координат (в центре числовой оси), т.е. M[X°] = 0. Операция центрирования (переход от нецентрированной величины Х к центрированной X°) имеет вид X° =X − mX .

Центральный момент порядка k случайной величины X есть математическое ожидание k-й степени центрированной случайной величины X:

t1662868024ai.png

(1.3)

При k=0 значение 0(x)=M [X°0]=M [1]=1; при k=1 — 1(x)=M [X°1]=M [Х°] = 0; при k=2 — 2 (x)=M[X°2]= M [(X mx)2]=M[X 2] – 2mx M [X ]+ mx2= α2 mx2=Dxдисперсия.

Дисперсия случайной величины характеризует степень рассеивания (разброса) значений случайной величины относительно ее математического ожидания и определяется по формулам:

t1662868024aj.png

(1.4)

Дисперсия выборки или выборочная дисперсия оценивается по (слегка измененной) формуле:

t1662868024ak.png, где m*– среднее значение выборки. 

Дисперсия случайной величины имеет размерность квадрата случайной величины, поэтому для анализа диапазона значений величины Х дисперсия не совсем удобна. Этого недостатка лишено среднее квадратическое отклонение (СКО), размерность которого совпадает с размерностью случайной величины. Выборочным средним квадратичным отклонением (стандартом) называют квадратный корень из выборочной дисперсии:

t1662868024al.png

(1.5)

Мода случайной величины равна ее наиболее вероятному значению, т.е. то значение, для которого вероятность pi (для дискретной случайной величины) или f(x) (для непрерывных случайной величины) достигает максимума: f (Mo) = max, p(X = Mo) = max.

Медиана случайной величины X равна такому ее значению, для которого выполняется условие { X < Me } = p { X  Me }. Медиана, как правило, существует только для непрерывных случайных величин. Значение Me может быть определено как решение одного из следующих уравнений:

y1662868949.png

(1.6)

В точке Me площадь, ограниченная кривой распределения делится пополам.Медиана вычисляется следующим образом. Изучаемая выборка упорядочивается в порядке возрастания (N – объем выборки). Получаемая последовательность ak, где k=1,…, N называется вариационным рядом или порядковыми статистиками.

Если число наблюдений N нечетно, то медиана оценивается как m = aN+1/2

Если число наблюдений N четно, то медиана оценивается как m = ( aN/2 + aN/2+1 ) / 2

Квантиль хp случайной величины X – это такое ее значение, для которого выполняется условие

{ X < xp } = F(xp)= p.       (1.7)

(1.7)

Очевидно, что медиана – это квантиль x0,5.

Свойства точечных оценок

Статистической оценкой  неизвестного параметра Q теоретического распределения называется приближенное значение параметра, вычисленное по результатам эксперимента (по выборке). Статистические оценки делятся на точечные и интервальные. Точечной называется оценка, определяемая одним числом. Точечная оценка Qˆ параметра Q случайной величины X в общем случае равна

Qˆ= (x1, x2, …, xn), где xi – значения выборки.

(1.8)

Очевидно, что оценка Qˆ – это случайная величина, так как она является функцией от n-мерной случайной величины (Х1, …, Хn), где Хi, – значение величины Х в i-м опыте, и значения будут изменяться от выборки к выборке случайным образом. Чтобы точечная оценка была наилучшей с точки зрения точности, необходимо, чтобы она была состоятельной, несмещенной и эффективной.

Оценка Qˆ называется состоятельной, если при увеличении объема выборки n она сходится по вероятности к значению параметра Q:

j1662869102.png

(1.9)

Состоятельность – это минимальное требование к оценкам.

Оценка Qˆ называется несмещенной, если ее математическое ожидание точно равно параметру Q для любого объема выборки:

Несмещенная оценка Qˆ является эффективной, если ее дисперсия минимальна по отношению к дисперсии любой другой оценки этого параметра:

t1662869721.jpg

(1.11)

Первые два требования к оценке являются обязательными, выполнение последнего требования – желательно.

Точечная оценка математического ожидания. На основании теоремы Чебышева в качестве состоятельной оценки математического ожидания может быть использовано среднее арифметическое значений выборки t1662868024aq.png, называемое выборочным средним:

Определим числовые характеристики оценки t1662868024aq.png.

t1662868024as.pngт.е. оценка несмещенная.

Оценка (1.12) является эффективной, т.е. ее дисперсия минимальна, если величина X распределена по нормальному закону.

Состоятельная оценка начального момента k-го порядка определяется по формуле

Точечная оценка дисперсии. В качестве состоятельной оценки дисперсии может быть использовано среднее арифметическое квадратов отклонений значений выборки от выборочного среднего:

Определим математическое ожидание оценки S2. Так как дисперсия не зависит от того, где выбрать начало координат, выберем его в точке mX, т.е. перейдем к центрированным величинам:

t1662868024aw.png

Ковариация Kij =0, так как опыты, а, следовательно, и Хi − значение величины Х в i‑м опыте − независимы. Таким образом, величина является смещенной оценкой дисперсии, а несмещенная состоятельная оценка дисперсии равна:

Дисперсия величины S02 равна:

Для нормального закона распределения величины X формула (1.17) примет вид

Для равномерного закона распределения –

Состоятельная несмещенная оценка среднеквадратического отклонения определяется по формуле: (1.20)

Состоятельная оценка центрального момента k-го порядка равна:

Точечная оценка вероятности. На основании теоремы Бернулли несмещенная состоятельная и эффективная оценка вероятности случайного события A в схеме независимых опытов равна частоте этого события:

где m – число опытов, в которых произошло событие A; n – число проведенных опытов. Числовые характеристики оценки вероятности p*(A) = p* равны:

Среднее арифметическое х, выборочная дисперсия Дх, частость р – это точечные статистические оценки соответственно математического ожидания (генерального среднего) МХ, дисперсии (генеральной дисперсии) ДХ, истиной (генеральной) вероятности р. Чтобы не заблудиться в этом многообразии, удобно пользоваться таблицей 1, представленной ниже [3].

Методы построения точечных оценок

Выше мы рассматривали точечные оценки основных генеральных характеристик: математического ожидания, дисперсии, вероятности и др. Однако осталось неясным, каким образом получены эти оценки. В математической статистике разработано большое число методов оценивания неизвестных параметров по данным случайной выборки, из которых наиболее часто используются:

метод моментов1;

метод максимального правдоподобия2;

метод наименьших квадратов;

графический метод (или метод номограмм).

Рассмотрим первые два из них.

Метод моментов. Пусть имеется выборка {x1, …, xn} независимых значений случайной величины с известным законом распределения f(x, Q1 , …, Qm) и m неизвестными параметрами Q1, …, Qm. Необходимо вычислить оценки Qˆ1, …, Qˆm параметров Q1, …, Qm. Последовательность вычислений следующая:

Вычислить значения m начальных и/или центральных теоретических моментов

Определить m соответствующих выборочных начальных αkˆ(x) и/или центральных µkˆ(x) моментов по формулам (1.14, 1.21).

Составить и решить относительно неизвестных параметров Q1, …, Qm систему из m уравнений, в которых теоретические моменты приравниваются к выборочным моментам. Каждое уравнение имеет вид αk(x) =αkˆ(x) или µ k(x) = µ kˆ(x). Найденные корни являются оценками Q1ˆ, …, Qmˆ неизвестных параметров.

Замечание. Часть уравнений может содержать начальные моменты, а оставшаяся часть – центральные.

Метод максимального правдоподобия. Согласно данному методу оценки Qˆ1, …, Qˆm получаются из условия максимума по параметрам Q1, …, Qm положительной функции правдоподобия L ( x1, …, xn, Q1, …, Qm). Если случайная величина X непрерывна, а значения xi независимы, то функция правдоподобия равна

t1662868024bf.png

Если случайная величина X дискретна и принимает независимые значения xi с вероятностями p (X=xi) = pi ( xi, Q1, …, Qm), то функция правдоподобия равна

t1662868024bg.png

Система уравнений согласно этому методу может записываться в двух видах:

или

Найденные корни выбранной системы уравнений являются оценками Q1ˆ, …, Qmˆ неизвестных параметров Q1, …, Qm.

Как правило оценка максимального правдоподобия эффективнее оценки, полученной методом моментов, и более того, если существует несмещенная эффективная оценка параметра, то она будет получена методом максимального правдоподобия.

Глава 2. Практическая часть

Примеры вычисления точечных оценок

Пример 1. Найдем оценку для вероятности P наступления события A по данному числу m появления этого события в n испытаниях.

Решение. Воспользуемся методом максимального правдоподобия: в этом случае функция правдоподобия L равна L = Cnm P m (1P) nm.

Тогда ln (L) = ln Cnm + m ln (P) + (nm) ln (1  P).

Уравнение для определения оценки:

t1662868024bj.png

Значит, оценкой методом максимального правдоподобия вероятности наступления события будет его относительная частота w.

t1662868024bk.png

Пример 2. Случайная величина X (число появлений события А в t независимых испытаниях) подчинена биномиальному закону распределения с неизвестным параметром р. Ниже приведено эмпирическое распределение числа появлений события в 10 опытах по 5 испытаний в каждом (в первой строке указано число xi  появлений события А в одном опыте; во второй строке указана частота ni  — количество опытов, в которых наблюдалось столько появлений события А).

Найти методом моментов точечную оценку параметра р биномиального распределения. Оценить вероятность p0=P(X=0).

Решение. Математическое ожидание биномиального распределения известно: MX = m p. Приравняв математическое ожидание к выборочному среднему, получим уравнение: t1662868024bl.png, откуда t1662868024bm.png. Для рассматриваемого примера имеем:

t1662868024bn.png

(05+12+21+31+41) / 10=1,1;

t1662868024bn.png=

= 1,1/5=0,22;

t1662868024bn.png

Если распределение определяется двумя параметрами, то для построения их оценок два теоретических момента приравнивают двум соответствующим эмпирическим моментам тех же порядков (обычно первым двум).

Пример 3. Для изучения генеральной совокупности относительно некоторого количественного признака была извлечена выборка:

Найти несмещенные оценки генеральной средней и генеральной дисперсии.

 Решение. Несмещенной оценкой генеральной средней является выборочная средняя:
t1662868024bo.gif.
Несмещенной оценкой генеральной дисперсии является исправленная выборочная дисперсия:

t1662868024bp.gifОтвет: 50; 2,57.

Пример 4. По выборке объема N=41 найдена смещенная оценка генеральной дисперсии DB=3. Найти несмещенную оценку дисперсии генеральной совокупности.

Решение. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия

t1662868024bq.gif

Несмещенной оценкой генеральной дисперсии является «исправленная дисперсия»

t1662868024br.gif  или t1662868024bs.gif

Таким образом, мы получаем искомую несмещенную оценку дисперсии генеральной совокупности:

t1662868024bt.gif

Пример 5. Для анализа лингвистических терминологических систем взято 7 фрагментов по 250 терминоупотреблений из русских лингвистических текстов. После подсчёта в каждом фрагменте числа употреблений слова «лицо» получен следующий вариационный ряд: 1,1,3,4,9,10,12.

1) Определите по выборке несмещённую и состоятельную оценку математического ожидания М(Х) и дисперсии D(X) случайной величины Х – «число употреблений слова «лицо» в русских лингвистических текстах.

2) Найдите несмещённую, состоятельную и эффективную оценку вероятности события А= «слово лицо использовано более 5 раз».

Решение 

1) Несмещённая и состоятельная оценка М(Х) есть среднее выборочное.

t1662868024bu.png

Несмещённая и состоятельная оценка D(X) есть исправленная выборочная дисперсия: t1662868024bv.png  t1662868024bw.png

2) Несмещённой, состоятельной и эффективной оценкой вероятности события А= «слово лицо использовано более 5 раз» является частота этого события Р(А): t1662868024bx.png

Пример 6. Выборка задана таблицей распределения

t1662868024by.png

Найти выборочные характеристики: среднюю, дисперсию и среднее квадратическое отклонение.

Решение. Cначала находим t1662868024bz.gifв:

t1662868024ca.png

Затем по формулам находим две другие иско­мые величины:

t1662868024cb.png

Пример 7. Из 1500 деталей отобрано 250, распределение которых по размеру Х задано в таблице:

xi

7,8-8,0

8,0-8,2

8,2-8,4

8,4-8,6

8,6-8,8

8,8-9,0

ni

5

20

80

95

40

10

Найти точечные оценки для среднего и дисперсии, а также дисперсию оценки среднего при повторном и бесповторном отборах.

Решение. Вычислим по формулам (используем середины интервалов сi, число интервалов r=6, объем выборки n=250):

сi

7,9

8,1

8,3

8,5

8,7

8,9

ni

5

20

80

95

40

10

n=250

t1662868024cc.gif

t1662868024cd.gif

t1662868024ce.gif

t1662868024cf.gif

t1662868024cg.gif

Вычислим дисперсию оценки среднего:

для повторной выборки:

t1662868024ch.gif

для бесповторной выборки

t1662868024ci.gif

Пример 8. Выборочно обследовали партию кирпича. Из 100 проб в 12 случаях кирпич оказался бракованным. Найти оценку доли бракованного кирпича и дисперсию этой оценки.

Решение. По условию задачи, число бракованных изделий m=12, объем выборки n=100, тогда оценкой доли бракованных является выборочная доля

t1662868024cj.gif

Дисперсия этой оценки для повторной выборки равна

t1662868024ck.gif

А среднее квадратическое отклонение этой оценки равно t1662868024cl.gif

Задачи подобраны таким образом, чтобы показать их разнообразную тематику и способы решений. Это и доказательство свойств точечной оценки, представление выборок разными способами и вычисление точечных оценок. Чтобы облегчить свою работу, можно воспользоваться таблицей 1 (см Приложение 1).

Заключение

Точечная оценка параметра – это оценка, которая характеризуется одним конкретным числом (например, математическим ожиданием, дисперсией, средним квадратичным отклонением и т.д.). Точечные оценки параметров генеральной совокупности могут быть приняты в качестве ориентировочных, первоначальных результатов обработки выборочных данных. Их основной недостаток заключается в том, что неизвестно, с какой точностью оценивается параметр. Если для выборок большого объема точность обычно бывает достаточной (при условии несмещенности, эффективности и состоятельности оценок), то для выборок небольшого объема вопрос точности становится очень важным. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Решение задач математической статистики обусловливает существенный объем вычислений. Во избежание ошибок, можно воспользоваться инженерным калькулятором или выполнить вычисления с помощью офисного пакета MS Excel, в котором есть различные статистические функции и надстройки, в том числе и возможность решить задачи по теме «Анализ данных»

Список литературы

  1. Гмурман, В. Е. Теория вероятностей и математическая статистика: учебник для прикладного бакалавриата / В. Е. Гмурман. — 12-е изд. — Москва: Издательство Юрайт, 2019. — 479 с. — (Бакалавр. Прикладной курс). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://biblio-online.ru/bcode/431095.
  2. Гмурман, В. Е. Руководство к решению задач по теории вероятностей и математической статистике: учебное пособие для бакалавриата и специалитета / В. Е. Гмурман. — 11-е изд., перераб. и доп. — Москва: Издательство Юрайт, 2019. — 406 с. — (Бакалавр и специалист). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://biblio-online.ru/bcode/431094.
  3. Малугин, В. А. Теория вероятностей и математическая статистика: учебник и практикум для вузов / В. А. Малугин. — Москва: Издательство Юрайт, 2022. — 470 с. — (Высшее образование). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://urait.ru/viewer/teoriya-veroyatnostey-i-matematicheskaya-statistika-493318
  4. Малугин, В. А. Математическая статистика: учебное пособие для бакалавриата и магистратуры / В. А. Малугин. — Москва: Издательство Юрайт, 2019. — 218 с. — (Бакалавр и магистр. Академический курс). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://biblio-online.ru/bcode/441413.
  5. Энатская, Н. Ю. Математическая статистика и случайные процессы: учебное пособие для вузов / Н. Ю. Энатская. — Москва: Издательство Юрайт, 2022. — 201 с. — (Высшее образование). — Текст: электронный // ЭБС Юрайт [сайт]. — URL: https://urait.ru/viewer/matematicheskaya-statistika-i-sluchaynye-processy-490096

Приложение 1

Таблица 1. Точечные оценки случайных величин

t1662868024cm.png

окончание таблицы 1

Таблица1. Точечные оценки случайных величин

t1662868024cn.png

1 Метод моментов был впервые предложен английским ученым, основателем математической статистики К. Пирсоном (1857-1936) в 1894 году.

2 Метод максимального правдоподобия разработал английский статистик Р. Фишер, который в 1921 г доказал, что ММ-оценки чаще всего не эффективны.

Добавить комментарий