Как найти оптимальную оценку

Достаточные статистики и оптимальные оценки.

Если для любой оценки
из
класса

,
для любого
,
то оценку Т* называют оценкой с
равномерно минимальной дисперсией.
Такая оценка
называется оптимальной
оценкой.

Итак, T*
– оптимальная оценка для параметрической
функции
,
если

,
,
.

Статистика
называется
достаточной
для
параметрического семейства распределений

P=(или
достаточной для параметра
),
если условный закон распределения
выборки при условии, что статистика
T(X)
приняла некоторое фиксированное значение
t,
не зависит от параметра
.

Теорема
Рао-Блекуэлла-Колмогорова:
Оптимальная
оценка, если она существует, является
функцией от достаточной статистики.

Теорема:
Если существует полная достаточная
статистика, то всякая функция от неё
является оптимальной оценкой своего
математического ожидания.

То есть оптимальная
оценка однозначно определяется уравнением
,
где Т – полная достаточная статистика,
H(T)
– произвольная функция от Т.

Функция
,
рассматриваемая при фиксированной
реализации выборки
как
функция от
,
называется функцией
правдоподобия.

Критерий
факторизации.

Для того, чтобы
статистика была достаточной для
параметрического семейства распределений
P,
необходимо и достаточно, чтобы функция
правдоподобия выборки
в
нём допускала следующее представление:

Где множитель h(x)
от

не зависит, а функция g(.)
от реализации выборки
зависит
через функцию T(x).

Если
при
возрастании θ, то в этом случае существует
одномерная достаточная статистика

Аналогично, если
при
возрастании θ, то одномерная достаточная
статистика существует и имеет вид

Этими двумя случаями
исчерпываются ситуации, когда в модели

существует одномерная достаточная
статистика.

Для модели
достаточной
статистикой является
,
а для моделей
и
минимальной
достаточной статистикой является T.

Оценка методом моменов .

Пусть неизвестный
параметр распределения наблюдаемой
случайной величины
векторный:

и у случайной величины
существует
конечный r-ый
момент:

Оценкой неизвестного
параметра
,
полученной методом моментов (ОММ),
называется вектор
,
где

есть решение системы
уравнений:

Теоретические
моменты, являющиеся функциями от
неизвестных параметров
,
приравниваются к
их статистическим аналогам – выборочным
моментам. Полученная система – это
система r
уравнений с r
переменными. Если решения системы
уравнений нет, оценки по методу моментов
не существует. Если имеется несколько
решений, то существует несколько таких
оценок. Если система уравнений имеет
единственное решение, то оценка по
методу моментов является состоятельной
оценкой параметра
.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Виктория123 писал(а):

… чтобы доказать полноту, надо поссчитать мат.ожидание от какой то функции $$phi(T)$$ ? И показать что оно равно $0$ только в случае равенства нулю этой функции $phi$ ?

Да.

Пусть оптимальной оценкой

называется несмещенная оценка с равномерно минимальной дисперсией. В зависимости от программы, возможно несколько способов построения оптимальной оценки $theta^2$:
0. Угадать и проверить по определению.
1. Воспользоваться теоремой о том, что функция от полной достаточной статистики является оптимальной оценкой своего ожидания.
2. Воспользоваться критерием Бхаттачария.

Идя первым путем, Вы доказали достаточность. Для доказательства полноты, попробуйте воспользоваться его определением (приведите свое определение; используемое мною может отличаться от принятого у Вас в курсе). После этого, попробуйте подобрать функцию этой статистики, математическое ожидание которой равно, возможно с точностью до постоянного коэффициента, $theta^2$.

Добавлено

Виктория123 писал(а):

В семействе биномиальных распределений $$Bi(1;theta)$$ найти оптимальную(с равномерно минимальной дисперсией

) оценку для параметрической функции $$tau(theta)={theta}^2$$
[Выделение цветом – GAA

]

Иногда, оптимальной

(в [1], и ряде других книг, принят термин эффективная

) называют несмещенную

оценку с равномерно минимальной дисперсией. Именно о построении такой оценки я писал выше.

[1] Боровков А.А. Математическая статистика. Оценка параметров, проверка гипотез. — М.: Наука, 1984.

14.4.1. Оптимальная оценка по критерию максимума апостериорной плотности.

Предположим теперь, что однородная независимая выборка принадлежит распределению с плотностью причем — случайный параметр с известной плотностью вероятности до . При таких априорных данных оптимальный алгоритм оценивания параметра синтезируется по критерию максимума апостериорной плотности вероятности оцениваемого параметра [см. (12.26)]. По формуле Байеса находим [см. (2.61)]

(14.70)

где

(14.70 а)

Так как логарифм — монотонная функция, то точки экстремумов функции по совпадают с точками экстремумов по функции

(14.71)

Если функция дифференцируема по , то ее максимум определяет оптимальную оценку максимальной апостериорной плотности согласно уравнению

(14.72)

при условии

Для независимой выборки из (14.72) следует

(14.73)

Оценка максимальной апостериорной плотности вероятности состоятельная и асимптотическая эффективная. Распределение ее при асимптотически нормальное с параметрами , где — информация по Фишеру [см. (14.39 а)].

Если априорное распределение случайного параметра равномерное на заданном интервале, то [см. (14.71)]

и, следовательно, при этом оценка максимальной апостериорной плотности совпадает с оценкой максимального правдоподобия.

14.4.2. Байесовские оценки.

Предположим, что наряду с априорными данными, указанными в п. 14.4.1, задана также функция потерь (см. п. 12.2.5). Тогда имеется полный комплект априорных данных, необходимый для синтеза байесовского алгоритма оценивания случайного скалярного параметра . Как показано в п. 12.4.2, байесовской оценкой, минимизирующей средний риск, является оценка минимального апостериорного риска [см. (12.20)]

(14.74)

Минимизация функционала (14.74) представляет задачу вариационного исчисления, Функционал в правой части (14.74) зависит от вида функции и необходимое условие минимума можно записать в виде

(14.75)

Выбор функции потерь в известной мере субъективен и зависит от конкретной задачи оценивания параметра. Наиболее часто используются функции потерь, которые представляют четные функции ошибки оценивания, монотонно возрастающие (неубывающие) при увеличении модуля ошибки.

Далее рассматриваются байесовские ошибки при функциях потерь указанного вида.

14.4.3. Простая функция потерь.

Рассмотрим функцию потерь, которая равна постоянной с для всех значений ошибок и дает бесконечный «выигрыш» при точном оценивании

(14.76)

Функция потерь (14.76) называется простой.

Подставляя (14.76) в (14.74), получаем

Из (14.77) следует, что байесовская оценка при простой функции потерь совпадает с оценкой максимальной апостериорной плотности вероятности оцениваемого параметра.

14.4.4. Квадратичная функция потерь.

При квадратичной функции потерь

(14.78)

апостериорный риск

(14.79)

Подставляя (14.79) в (14.75) и разрешая уравнение относительно функции , получаем

(14.80)

или

(14.80 а)

Функцию правдоподобия в (14.80 а) можно заменить статистикой отношения правдоподобия

(14.806)

где — некоторое фиксированное значение параметра [ср. также с (14.64 а)].

Из (14.80) следует, что байесовская оценка при квадратичной функции потерь представляет условное среднее значение оцениваемого параметра при заданной выборке . Нетрудно убедиться, что (14.80) соответствует минимуму апостериорного риска, так как

Условное среднее (14.80) является несмещенной оценкой параметра

(14.81)

и, следовательно, [см. (14.79)]

(14.82)

В отличие от простой функции потерь, для которой байесовская оценка определяется локальными свойствами апостериорной плотности вероятности оцениваемого параметра в окрестности ее максимума, байесовская оценка при квадратичной функции потерь зависит от изменения указанной апостериорной плотности во всем диапазоне измерения параметра . Заметим, однако, что для унимодальной и симметричной относительно моды апостериорной плотности распределения условное среднее совпадает с модой и, следовательно, байесовская оценка при квадратичной функции потерь совпадает с оценкой по критерию максимума апостериорной плотности, т. е. с байесовской оценкой при простой функции потерь.

14.4.5. Функция потерь, равная модулю ошибки.

Для функции потерь

(14.83)

апостериорный риск

откуда согласно условию (14.75)

или

(14.84)

Из (14.84) следует, что байесовская оценка при функции потерь, равной модулю ошибки, совпадает с условной медианой оцениваемого параметра при заданной выборке

Если апостериорная плотность вероятности оцениваемого параметра унимодальна и симметрична относительно моды, то медиана и среднее значение этого распределения совпадают и равны его моде. В этом случае байесовские оценки при функции потерь, равной модулю ошибки, и при квадратичной функции потерь одинаковы и совпадают с оценкой максимальной апостериорной плотности вероятности.

14.4.6. Прямоугольная функция потерь.

Для функции потерь

апостериорный риск

(14.85)

откуда из (14.75) получаем следующее трансцендентное уравнение для определения байесовской оценки при прямоугольной функции потерь:

(14.86)

Если апостериорная плотность вероятности оцениваемого параметра унимодальна и симметрична относительно моды, то единственным решением уравнения (14.86) является такая оценка , которая совпадает с модой указанной апостериорной плотности вероятности. В этом случае байесовская оценка при прямоугольной функции потерь совпадает с оценкой, соответствующей максимальной апостериорной плотности вероятности, т. е. с байесовской оценкой при простой и квадратичной функциях потерь.

14.4.7. Симметричная функция потерь.

Рассмотрим произвольную функцию потерь, четную относительно ошибки и неубывающую при увеличении модуля ошибки

(14.87)

Все указанные в п.п. 14.4.3-14.4.6 функции потерь являются функциями такого вида. Предположим, что апостериорная плотность вероятности параметра при заданной выборке унимодальна и симметрична относительно моды. Из этого предположения следует, что условное среднее является модой апостериорной плотности, т. е. – четная функция аргумента

Запишем уравнение (14.75)

(14.88)

Так как — четная функция, ее производная -нечетная функция аргумента

Поэтому величина тождественно обращается в нуль, если , т. е. если оценка

(14.89)

потому что при выполнении равенства (14.89) подынтегральная функция становится нечетной функцией относительно новой переменной интегрирования Таким образом, оценка (14.89) является решением уравнения (14.88) и, следовательно, байесовской оценкой.

Сравнивая (14.89) с (14.80), приходим к выводу, что байесовская оценка при квадратичной функции потерь является также байесовской оценкой при симметричной функции потерь для целого класса апостериорных плотностей оцениваемого параметра, удовлетворяющих условиям унимодальности и симметричности относительно моды.

14.4.8. Байесовские оценки векторного параметра.

Предположим, что однородная независимая выборка принадлежит распределению с плотностью причем случайный векторный параметр с известной плотностью вероятности . Задана также функция потерь . Оптимальной байесовский оценкой параметра является оценка, минимизирующая апостериорный риск (см. п. 12.4.2):

(14.90)

Апостериорный риск представляет многомерный функционал, зависящий от функций (статистик) Система уравнений

(14.90 а)

определяет необходимое условие экстремума этого функционала. Для простой функции потерь

(14.91)

апостериорный риск

(14.92)

При этом из (14.92) следует, что байесовская оценка векторного параметра является оценкой максимальной апостериорной плотности , компоненты коюрой определяются системой уравнений [ср. с (14.73)]

(14.93)

Для квадратичной функции потерь

(14.94)

байесовские оценки компонент векторного параметра равны апостериорному среднему

(14.95)

From Wikipedia, the free encyclopedia

In applied statistics, optimal estimation is a regularized matrix inverse method based on Bayes’ theorem.
It is used very commonly in the geosciences, particularly for atmospheric sounding.
A matrix inverse problem looks like this:


mathbf{A} vec x = vec y

The essential concept is to transform the matrix, A, into a conditional probability and the variables, {vec {x}} and vec y into probability distributions by assuming Gaussian statistics and using empirically-determined covariance matrices.

Derivation[edit]

Typically, one expects the statistics of most measurements to be Gaussian. So for example for P(vec y|vec x), we can write:


P(vec y|vec x) = frac {1} {(2 pi)^{m n/2} | boldsymbol{S_y}|}
	exp left [ -frac{1}{2} (boldsymbol{A} vec{x} - vec{y})^T
	boldsymbol {S_y}^{-1}
	(boldsymbol{A} vec{x} - vec{y}) right ]

where m and n are the numbers of elements in {vec {x}} and vec y respectively {boldsymbol {A}} is the matrix to be solved (the linear or linearised forward model) and boldsymbol{S_y} is the covariance matrix of the vector vec y. This can be similarly done for {vec {x}}:


P(vec x) = frac {1} {(2 pi)^{m/2} | boldsymbol {S_{x_a}}|}
	exp left [-frac {1}{2} (vec{x}-widehat{x_a})^T
	boldsymbol {S_{x_a}}^{-1} (vec{x}-widehat{x_a}) right ]

Here P(vec x) is taken to be the so-called “a-priori” distribution: widehat{x_a} denotes the a-priori values for {vec {x}} while boldsymbol{S_{x_a}} is its covariance matrix.

The nice thing about the Gaussian distributions is that only two parameters are needed to describe them and so the whole problem can be converted once again to matrices. Assuming that P(vec x|vec y) takes the following form:


P(vec x|vec y) = frac {1} {(2 pi)^{m n/2} | boldsymbol {S_x} |}
	exp left [ -frac{1}{2} (vec{x} - widehat{x}) ^T
	boldsymbol {S_x}^{-1} (vec{x} - widehat{x}) right ]

P(vec y) may be neglected since, for a given value of {vec {x}}, it is simply a constant scaling term. Now it is possible to solve for both the expectation value of {vec {x}}, widehat{x}, and for its covariance matrix by equating P(vec x|vec y) and P(vec y|vec x)P(vec x). This produces the following equations:


boldsymbol{S_x} = (boldsymbol{A}^T boldsymbol{S_y^{-1}} boldsymbol{A} +
	boldsymbol{S_{x_a}^{-1}})^{-1}

widehat{x} = widehat{x_a} + boldsymbol{S_x}
	boldsymbol{A}^T boldsymbol{S_y}^{-1}(vec{y}-boldsymbol{A} widehat{x_a})

Because we are using Gaussians, the expected value is equivalent to the maximum likely value, and so this is also a form of maximum likelihood estimation.

Typically with optimal estimation, in addition to the vector of retrieved quantities, one extra matrix is returned along with the covariance matrix. This is sometimes called the resolution matrix or the averaging kernel and is calculated as follows:


boldsymbol{R} = (boldsymbol{A}^T boldsymbol{S_y}^{-1} boldsymbol{A} +
	boldsymbol{S_{x_a}}^{-1})^{-1}
	boldsymbol{A}^T boldsymbol{S_y}^{-1} boldsymbol{A}

This tells us, for a given element of the retrieved vector, how much of the other elements of the vector are mixed in. In the case of a retrieval of profile information, it typical indicates the altitude resolution for a given altitude. For instance if the resolution vectors for all the altitudes contain non-zero elements (to a numerical tolerance) in their four nearest neighbours, then the altitude resolution is only one fourth that of the actual grid size.

References[edit]

  • Clive D. Rodgers (1976). “Retrieval of Atmospheric Temperature and Composition From Remote Measurements of Thermal Radiation”. Reviews of Geophysics and Space Physics. 14 (4): 609. doi:10.1029/RG014i004p00609.
  • Clive D. Rodgers (2000). Inverse Methods for Atmospheric Sounding: Theory and Practice. World Scientific.
  • Clive D. Rodgers (2002). “Atmospheric Remote Sensing: The Inverse Problem”. Proceedings of the Fourth Oxford/RAL Spring School in Quantitative Earth Observation. University of Oxford.

Содержание:

Оценки и методы их получения:

Приближенные значения параметров, входящих в законы распределения, определяемые каким-либо способом по выборкам, называются оценками или статистиками. Оценки бывают точечными и интервальными. Точечные оцен­ки представляются одним числом, интервальные – двумя числами Статистические оценки - определение и вычисление с примерами решения

Метод моментов

Пусть генеральная случайная величина X имеет плотность распределения Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения                                   (8.1)

Статистические оценки - определение и вычисление с примерами решения                              (8.2)

По выборке Статистические оценки - определение и вычисление с примерами решения определяем выборочные начальные и центральные моменты:

Статистические оценки - определение и вычисление с примерами решения                (8.3)

Статистические оценки - определение и вычисление с примерами решения           (8.4 )

Метод моментов состоит в том, что генеральные моменты (8.1, 8.2), в которые входят оцениваемые параметры, приблизительно приравниваются к со­ответствующим выборочным моментам (8.3), (8.4). Составляется система уравнений:
Статистические оценки - определение и вычисление с примерами решения                             (8.5)
Статистические оценки - определение и вычисление с примерами решения                                (8.6)

Решая систему (8.5), (8.6), находим оцениваемые параметры.
Особо важную роль играет Статистические оценки - определение и вычисление с примерами решения – выборочный начальный момент 1-го по­ рядка, он называется выборочным средним и обозначается Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения    (8.7)

Следующим по важности выборочным моментом является выборочный центральный момент 2-го порядка Статистические оценки - определение и вычисление с примерами решения который называется выборочной дисперсией и обозначается Статистические оценки - определение и вычисление с примерами решения
Статистические оценки - определение и вычисление с примерами решения                                    (8.8)

Наиболее часто используются две формулы метода моментов.
Статистические оценки - определение и вычисление с примерами решения                                        (8.9)

Статистические оценки - определение и вычисление с примерами решения         (8.10)

Сформулируем метод моментов в общем виде.
 

Пусть Статистические оценки - определение и вычисление с примерами решенияплотность распределения случайной величины Статистические оценки - определение и вычисление с примерами решения где Статистические оценки - определение и вычисление с примерами решения – неизвестные параметры. Чтобы найти оценки Статистические оценки - определение и вычисление с примерами решения выражаем первые Статистические оценки - определение и вычисление с примерами решения начальных или центральных моментов случайной величины X через параметры Статистические оценки - определение и вычисление с примерами решения затем генеральные моменты аппроксимируем соответствующими выборочными. В результате имеем систему из Статистические оценки - определение и вычисление с примерами решения уравнений с Статистические оценки - определение и вычисление с примерами решениянеизвестными, откуда и получаем Статистические оценки - определение и вычисление с примерами решения
 

Пример:

Пусть генеральная случайная величина X имеет показательный закон распределения с плотностью Статистические оценки - определение и вычисление с примерами решения По выборке Статистические оценки - определение и вычисление с примерами решения методом моментов найти оценку параметра Статистические оценки - определение и вычисление с примерами решения

 1. Определяем Статистические оценки - определение и вычисление с примерами решения используя (8.1): 

Статистические оценки - определение и вычисление с примерами решения

2. По (8.3) или (8.7) находим выборочный начальный момент 1-го поряд­ка или Статистические оценки - определение и вычисление с примерами решения и составляем выражение вида (8.5) или (8.9):

Статистические оценки - определение и вычисление с примерами решения
3. Заменяя в п. 2 Статистические оценки - определение и вычисление с примерами решения на оценку Статистические оценки - определение и вычисление с примерами решения составим уравнение: Статистические оценки - определение и вычисление с примерами решения

4. Откуда определим оценку параметра Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения
 

Метод наибольшего правдоподобия

Этот метод предложен математиком Фишером в 1912 г.
 

Пусть Статистические оценки - определение и вычисление с примерами решения – плотность распределения генеральной случайной величины X, где Статистические оценки - определение и вычисление с примерами решения – неизвестные параметры. Согласно методу, наилучшими оценками Статистические оценки - определение и вычисление с примерами решения параметров Статистические оценки - определение и вычисление с примерами решения являются такие, для которых функция правдоподобия L принимает наибольшее значение.

Для непрерывной случайной величины

Статистические оценки - определение и вычисление с примерами решения   (8.11)

Для дискретной случайной величины

Статистические оценки - определение и вычисление с примерами решения                  (8.12)
Здесь Статистические оценки - определение и вычисление с примерами решения– выборка из генеральной случайной величины X.
Априорные выборочные значения Статистические оценки - определение и вычисление с примерами решения – являются независимыми случайными величинами, закон распределения которых совпадает с законом распределения генеральной случайной величины X. Тогда правую часть (8.11) на основании теоремы умножения законов распределений (см. раздел 3.5) можно рассматривать как плотность распределения вероятности Статистические оценки - определение и вычисление с примерами решениямерного вектора Статистические оценки - определение и вычисление с примерами решения Согласно методу, для наилучших оценок Статистические оценки - определение и вычисление с примерами решения случайный вектор Статистические оценки - определение и вычисление с примерами решения будет иметь наибольшую плотность распределения. То есть надо найти такие оценки Статистические оценки - определение и вычисление с примерами решения для которых функция правдоподобия L – максимальна. Для этого составляют и решают такую систему уравнений:
Статистические оценки - определение и вычисление с примерами решения                                   (8.13)

Так как функция и ее логарифм достигают экстремума в одной точке, то часто для упрощения решения задачи используют логарифмическую функцию правдоподобия. В случае логарифмической функции правдоподобия составляется система следующих уравнений:
Статистические оценки - определение и вычисление с примерами решения                            (8.14)
 

Пример:

Пусть генеральная случайная величина X имеет показательный закон распределения с плотностью Статистические оценки - определение и вычисление с примерами решения По выборке Статистические оценки - определение и вычисление с примерами решенияметодом наибольшего правдоподобия найти оценку параметра Статистические оценки - определение и вычисление с примерами решения

 1. Так как нам необходимо оценить один параметр Статистические оценки - определение и вычисление с примерами решения то надо составить и решить одно уравнение. Найдем функцию правдоподобия, используя (8.11):

Статистические оценки - определение и вычисление с примерами решения

2. Составим логарифмическую функцию правдоподобия:

Статистические оценки - определение и вычисление с примерами решения

3. Для определения максимума логарифмической функции правдоподо­бия составляем и решаем следующее уравнение:

Статистические оценки - определение и вычисление с примерами решения

Откуда оценка 0 параметра 0 определяется так:
Статистические оценки - определение и вычисление с примерами решения
При сравнение это выражение с оценкой Статистические оценки - определение и вычисление с примерами решения полученной по методу моментов (см. раздел 8.1), мы понимаем, что они одинаковы. Методы, рассмотренные нами, как видим, абсолютно разные. Это свидетельствует о их достоверности.

Свойства оценок

Пусть Статистические оценки - определение и вычисление с примерами решения – выборка из генеральной совокупности. Обозначим оценку параметра Статистические оценки - определение и вычисление с примерами решения через Статистические оценки - определение и вычисление с примерами решения Ранее мы показали, что эта оценка определяется с помощью различных методов по полученной выборке , т. е. являляется функцией от Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения

Так как любая выборка типа Статистические оценки - определение и вычисление с примерами решения– случайна, то и выборочные функции Статистические оценки - определение и вычисление с примерами решения – тоже являются случайными. Следовательно, она тоже имеет свои характеристики.
 

1. Оценка Статистические оценки - определение и вычисление с примерами решения называется несмещенной, если ее математическое ожида­ние совпадает с самим оцениваемым параметром:
Статистические оценки - определение и вычисление с примерами решения

В противном случае оценка называется смещенной.
Статистические оценки - определение и вычисление с примерами решения
 

Полную погрешность Статистические оценки - определение и вычисление с примерами решения возникшую от замены 0 на 0, можно пред­ставить так:

Статистические оценки - определение и вычисление с примерами решения

Таким образом, если оценка несмещенная, то систематическая погреш­ность равна нулю, т. е. Статистические оценки - определение и вычисление с примерами решения

Наиболее опасна систематическая ошибка, если она заранее неизвестна или среднее квадратичное отклонение не очень большое. Среднее значение случайной ошибки Статистические оценки - определение и вычисление с примерами решения

Мы уже отмечали, что Статистические оценки - определение и вычисление с примерами решения– независимые случайные величины, имеющие тот же закон распределения, что и Статистические оценки - определение и вычисление с примерами решения генеральная случайная величина, в частности, выборочное математическое ожидание и дисперсия имеет те же числовые характеристики, т. е. справедливы тождества:

Статистические оценки - определение и вычисление с примерами решения                                   (*)

Проверим смещенность оценки математического ожидания выборочной средней Статистические оценки - определение и вычисление с примерами решения Используя обычные свойства математического ожидания, найдем Статистические оценки - определение и вычисление с примерами решения
Статистические оценки - определение и вычисление с примерами решения
 

Обозначим Статистические оценки - определение и вычисление с примерами решения видим, чтоСтатистические оценки - определение и вычисление с примерами решения значит, выборочное среднее Статистические оценки - определение и вычисление с примерами решения является несмещенной оценкой математического ожидания.

Проверим смещенность оценки дисперсии выборочной дисперсией Статистические оценки - определение и вычисление с примерами решения Найдем математическое ожидание от выборочной дисперсии:

Статистические оценки - определение и вычисление с примерами решения

То есть дисперсия выборочной средней в Статистические оценки - определение и вычисление с примерами решения раз меньше дисперсии генеральной случайной величины. Тогда

Статистические оценки - определение и вычисление с примерами решения

Обозначим Статистические оценки - определение и вычисление с примерами решения значит, выборочная дисперсия Статистические оценки - определение и вычисление с примерами решения является смещенной оценкой дисперсии. Можно отметить, что выборочная дисперсия Статистические оценки - определение и вычисление с примерами решения является асимптотически несмещенной оценкой, т. к. при Статистические оценки - определение и вычисление с примерами решения стремящемся к бесконечности, смещение стремится к нулю.

При решении практических задач часто используется несмещенная оцен­ка дисперсии – это модифицированная выборочная дисперсия:

Статистические оценки - определение и вычисление с примерами решения

Найдем математическое ожидание от Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения

Обозначим Статистические оценки - определение и вычисление с примерами решения как видим, Статистические оценки - определение и вычисление с примерами решения значит, оценка Статистические оценки - определение и вычисление с примерами решения уже несмещенная. При малых Статистические оценки - определение и вычисление с примерами решения этой формулой пользоваться лучше (при и > 30 оценки совпадают). На практике используют еще одну несмещенную оценку дисперсии – когда известно математическое ожидание:

Статистические оценки - определение и вычисление с примерами решения

Найдем Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения

Обозначим Статистические оценки - определение и вычисление с примерами решения значит, оценка Статистические оценки - определение и вычисление с примерами решения несмещенная.
 

2. Оценка Статистические оценки - определение и вычисление с примерами решения параметра Статистические оценки - определение и вычисление с примерами решения называется состоятельной, если она сходит­ся по вероятности к параметру Статистические оценки - определение и вычисление с примерами решения, т. е. если Статистические оценки - определение и вычисление с примерами решения выполняется:

Статистические оценки - определение и вычисление с примерами решения                            Статистические оценки - определение и вычисление с примерами решения

Условие Статистические оценки - определение и вычисление с примерами решенияна практике проверить трудно. Поэтому для проверки состоятельности оценок применяют более простые условия:

а) Статистические оценки - определение и вычисление с примерами решения

б) Статистические оценки - определение и вычисление с примерами решения

Как видим, оценка Статистические оценки - определение и вычисление с примерами решения будет состоятельной, если при Статистические оценки - определение и вычисление с примерами решения смещение устраняется и дисперсия оценки стремится к нулю.
 

Пример:

Проверим состоятельность оценки математического ожидания выборочной средней Статистические оценки - определение и вычисление с примерами решения. Ранее мы показали, что Статистические оценки - определение и вычисление с примерами решения является несмещенной оценкой математического ожидания, т. е. условие а) выполняется и без вычисления предела. Проверим условие б), найдем  Статистические оценки - определение и вычисление с примерами решения

Статистические оценки - определение и вычисление с примерами решения

Видим, что при Статистические оценки - определение и вычисление с примерами решения предел Статистические оценки - определение и вычисление с примерами решения будет стремиться к нулю, значит условие б) выполняется. Следовательно, Статистические оценки - определение и вычисление с примерами решения является состоятельной оценкой математического ожидания.

3. Несмещенная оценка Статистические оценки - определение и вычисление с примерами решения параметра Статистические оценки - определение и вычисление с примерами решения называется эффективной, если она имеет наименьшую дисперсию среди всех оценок при одном и том же объеме выборки Статистические оценки - определение и вычисление с примерами решения
Для определения наименьшей дисперсии эффективной оценки Статистические оценки - определение и вычисление с примерами решения параметра Статистические оценки - определение и вычисление с примерами решения применяется формула Рао-Крамера:

Статистические оценки - определение и вычисление с примерами решения                   (8.15)

где Статистические оценки - определение и вычисление с примерами решения – плотность распределения генеральной случайной величины X.
Отметим, если оценка Статистические оценки - определение и вычисление с примерами решения смещенная, то малость ее дисперсии еще не говорит о ее эффективности. Например, если в качестве оценки Статистические оценки - определение и вычисление с примерами решения взять любую постоянную величину с, то ее дисперсия будет равна нулю, а ошибка может быть какой угодно большой.
 

Пример:

Задана нормальная случайная величина Статистические оценки - определение и вычисление с примерами решения с плотностью распределения

Статистические оценки - определение и вычисление с примерами решения

Проверим эффективность оценки математического ожидания выборочной средней Статистические оценки - определение и вычисление с примерами решения.

Найдем дисперсию эффективной оценки параметра Статистические оценки - определение и вычисление с примерами решения Обозначим эффективную оценкуСтатистические оценки - определение и вычисление с примерами решения Чтобы воспользоваться формулой Рао-Крамера (8.15), вычислим

Статистические оценки - определение и вычисление с примерами решения

Найдем производную:

Статистические оценки - определение и вычисление с примерами решения

Подставим полученное выражение в (8.15): 

Статистические оценки - определение и вычисление с примерами решения

Ранее мы показали, что такую же дисперсию имеет Статистические оценки - определение и вычисление с примерами решения (см. формулу Статистические оценки - определение и вычисление с примерами решения
Видим, что правые части формул (8.16) и Статистические оценки - определение и вычисление с примерами решения совпадают, следовательно, выборочное среднее Статистические оценки - определение и вычисление с примерами решения является эффективной оценкой параметра Статистические оценки - определение и вычисление с примерами решения

Отметим, что оценки, полученные методом наибольшего правдоподобия, являются состоятельными. Если существуют эффективная оценка, то метод наибольшего правдоподобия позволяет найти ее, но не всегда оценки, полученные этим методом, являются несмещенными.

  • Теория статистической проверки гипотез
  • Линейный регрессионный анализ
  • Вариационный ряд
  • Законы распределения случайных величин
  • Статистические решающие функции
  • Случайные процессы
  • Выборочный метод
  • Статистическая проверка гипотез

Добавить комментарий