Как найти распределение порядковой статистики

Макеты страниц

ограничена, то не могут появиться значения (принадлежащие выборкам из X), выходящие за ее границы, и, наоборот, если X не ограничена, ничто не удержит каких-либо точных пределах.

Обратимся к рис. 2, на котором изображены функции и искомая плотность распределения порядковой статистики Индекс указывает объем выборки. На ось х нанесены значения принадлежащие некоторой конкретной выборке. Запишем элемент вероятности равный вероятности для порядковой статистики оказаться вблизи точки

Выразим эту же вероятность через исходный закон распределения, связав таким образом Будем считать, что процесс образования выборки процесс независимых испытаний, в которых «успехом» считается появление значения а «неуспехом» Очевидно, что вероятность успеха а неуспеха (рис. 2). Количество «успехов» равно «неуспехов» поскольку значение в выборке объема таково, что значений меньше и значений больше его.

Нетрудно видеть, что речь идет о процедуре подсчета вероятностей, сходной с той, которая приводит к биномиальному закону распределения.

Вероятность для исходной случайной величины принять значение, близкое к есть элемент вероятности

Вероятность расположения выборки вокруг значения так, что элементов ее окажутся слева, справа, а сама случайная величина X вблизи него и будет равной

Но именно эта вероятность и определяется выражением Поэтому, приравняв (1) и (2), получим

Если при переходе от плотности сохранить масштаб по оси х, то

Последнее выражение показывает, что плотность распределения порядковой статистики зависит от исходного распределения и ранга и изменяется с изменением объема выборки Формула (3) позволяет определить, в частности, как распределены значения крайних членов выборки, имеющих ранги

Крайний справа максимальный член имеет функцию распределения а минимальный Для примера продемонстрируем плотности порядковых статистик с рангами при объеме выборки из равномерно распределенной на отрезке [0, 11 совокупности (рис. 3). В соответствии с (3) при исходной плотности (и значит получаем распределение наименьшего члена

среднего члена

и максимального

Рис. 3

Эти плотности изображены на рис. 3. В полном согласии с интуитивными представлениями плотность центрального члена выборки симметрична относительно медианы исходного распределения, а плотности крайних ограничены тем же интервалом, что и и возрастают к соответствующей границе.

Продемонстрируем на этом же примере еще одно любопытное свойство распределений порядковых статистик. Сложим плотности и разделим результат на их число:

на отрезке [0, 1].

Сумма (нормированная) плотностей порядковых статистик оказалась равной исходной плотности Это значит, что генеральная совокупность X является смесью порядковых статистик Этого результата следовало ожидать. Выше мы уже упоминали, что, рассортировав исходную совокупность по рангам, мы могли бы, вновь смешав объекты с различными рангами, восстановить ее. Теперь мы убедились в этом на примере, но можно было бы привести и строгое доказательство этого свойства.

1

Оглавление

  • ВВЕДЕНИЕ
  • 1. ОБРАЗОВАНИЕ И УПОРЯДОЧЕНИЕ ВЫБОРКИ
  • Как упорядочить выборку?
  • Ранжированная выборка — объект с новыми свойствами
  • 2. ВЕРОЯТНОСТНЫЕ СВОЙСТВА ПОРЯДКОВОЙ СТАТИСТИКИ
  • Закон распределения порядковой статистики
  • Числовые характеристики порядковой статистики
  • Распределения при неограниченном увеличении выборки. Распределения центральных значений
  • Распределения крайних значений
  • Совместные распределения порядковых статистик
  • 3. ВЫБОРОЧНЫЕ ЗНАЧЕНИЯ И РАНГИ
  • Связь между значениями и их рангами
  • Ранговая корреляция
  • 4. УЛУЧШЕНИЕ ОЦЕНОК ПУТЕМ ЦЕНЗУРИРОВАНИЯ ВЫБОРОК
  • Цензурирование выборок — общая идея
  • Оценки параметров нормального распределения по усеченным выборкам
  • Оценки параметров равномерного распределения
  • Выборка из трех наблюдений
  • 5. БЕЗЭТАЛОННЫЕ ПРОЦЕДУРЫ ИЗМЕРЕНИЯ, ИДЕНТИФИКАЦИИ И КЛАССИФИКАЦИИ
  • Идентификация объекта с ненаблюдаемым входом
  • Безэталонная классификация
  • ЛИТЕРАТУРА

Утверждение 4.8.

Пусть

– выборка из распределения
,
тогда функция распределения
-ой
порядковой статистики
:

Доказательство:

Выберем произвольным образом и зафиксируем
значение
,
определим на основе выборки

вектор бинарных случайных величин
:

.

Случайные величины

независимы в совокупности (поскольку
случайные величины

независимы в совокупности) и имеют
одинаковое распределение

(поскольку случайные величины

имеют одинаковую функцию распределения)
:

,

.

Пусть


-ая
порядковая статистика, по определению
функция распределения
:

.

Порядковая статистика

меньше величины

тогда и только тогда, когда среди величин
выборки


()
величин меньше

и

величин не меньше
,
то есть тогда и только тогда, когда в
векторе бинарных случайных величин


величин равны 1 и

величин равны 0, что эквивалентно тому,
что случайная величина

больше или равна
.
Поскольку все

независимы и одинаково распределены,
то случайная величина

имеет распределение Бернулли с параметрами

и
,
тогда:

(4.13)

Заметим, что полученное равенство
справедливо для любого
,
поскольку величина

была выбрана произвольным образом.

При

из (4.13) получим:

.

При

из (4.13) получим:

.

Утверждение доказано.

Утверждение 4.9

Пусть выполнены условия утверждения
4.8 и функция распределения

дифференцируема при всех

и
,
тогда плотность вероятности
-ой
порядковой статистики
:

,

где

– плотность вероятности.

Доказательство:

Действительно, для того, чтобы получить
выражение для плотности вероятности

достаточно продифференцировать функцию
распределения
:

При

получим:

.

При

получим:

.

При

получим (для краткости опускаем аргумент
функций):

.

Утверждение доказано.

Порядковые статистики используются
для построения оценок квантилей
распределений и параметров.

Определение 4.10.

Пусть

– функция распределения,
квантиль
(квантиль уровня
)
функции распределения

есть число

такое, что:

.

(если существует несколько значений
,
удовлетворяющих условию
,
то в качестве
-квантили
принимают наименьшее из этих значений).

Если распределение, соответствующее

имеет название, то обычно говорят,
например, «квантиль уровня

нормального распределения с параметрами
0 и 1» или «квантиль уровня

распределения хи-квадрат с

степенями свободы».

Предположим, что функция распределения

зависит от неизвестного параметра
,
тогда
-квантиль
является функцией параметра

и является неизвестной величиной. Для
построения оценки
-квантили

функцию распределения

заменяют эмпирической функцией
распределения
.

Определение 4.11.

Пусть

– эмпирическая функция распределения
выборки

и

– реализация выборки
,
число

называется выборочной
-квантилью
,
если:

.

Поскольку реализации эмпирической
функции распределения являются
кусочно-постоянными функциями, то для

(где

– целое число,
)
существует бесконечно много значений
,
удовлетворяющих условию
,
а для
,
вообще говоря, нет ни одного значения
,
удовлетворяющего условию
.
В таком случае в качестве оценки
-квантили

используют порядковую статистику

«наиболее близкую» к выборочной
-квантили
,
для этого, как нетрудно убедиться,
достаточно положить

(где

– целая часть числа). Таким образом, в
качестве оценки

-квантили
следует взять величину:

.

Теорема 4.12. (Крамер)

Пусть

– выборка из распределения
,


-квантиль
распределения

и в некоторой окрестности точки

плотность вероятности

непрерывно дифференцируема и положительна,
,
тогда статистика

имеет асимптотически нормальное
распределение:

,
при
.

Следствие

При выполнении условий теоремы 4.12
статистика

является состоятельной оценкой
-квантиля
,
поскольку математическое ожидание

и дисперсия

при
.

Пусть функция распределения

зависит от неизвестного параметра
,
для построения оценки величины

с помощью порядковых статистик достаточно
выразить величину

через квантили функции распределения
:

.

Использование вместо квантилей
,
…,

их оценок, полученных с помощью порядковых
статистик,
,
…,
,
приводит к статистике:

,

которая используется в качестве оценки
.

При некоторых условиях статистики

являются состоятельными оценками
квантилей
,
то есть имеет место сходимость по
вероятности

при
,
если функция

непрерывна в точке
,
тогда по свойству сходимости по
вероятности статистика

сходится по вероятности к величине
:

,
при
,

тогда по определению статистика

является состоятельной оценкой
.

Оценки, полученные методом порядковых
статистик, как правило, имеют дисперсию
больше, чем дисперсии оценок, полученные
другими методами. Тем не менее, оценки,
полученные методом порядковых статистик,
могут обладать дополнительными
положительными свойствами, например,
устойчивостью к «засорению» выборки
(«засорение» выборки означает наличие
в выборке ошибочных значений, полученных
в результате неверного измерения и
т.п.)

54

Соседние файлы в папке Лекции_2

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Поря́дковые стати́стики в математической статистике — это упорядоченная по неубыванию выборка одинаково распределённых независимых случайных величин и её элементы, занимающие строго определенное место в ранжированной совокупности.

Содержание

  • 1 Определение
  • 2 Замечания
  • 3 Порядковые статистики абсолютно непрерывного распределения
  • 4 Пример
  • 5 См. также
  • 6 Примечания

Определение[править | править код]

Пусть X_{1},ldots ,X_{n} — конечная выборка из распределения mathbb {P} ^{X}, определённая на некотором вероятностном пространстве (Omega ,{mathcal {F}},mathbb {P} ). Пусть omega in Omega и {displaystyle x_{i}=X_{i}(omega ),;i=1,ldots ,n}. Перенумеруем последовательность {displaystyle {x_{i}}_{i=1}^{n}} в порядке неубывания, так что

{displaystyle x_{(1)}leq x_{(2)}leq cdots leq x_{(n-1)}leq x_{(n)}}.

Эта последовательность называется вариационным рядом. Вариационный ряд и его члены являются порядковыми статистиками. Случайная величина {displaystyle X_{(k)}(omega )=x_{(k)}} называется k-ой порядковой статистикой исходной выборки[1]. Порядковые статистики являются основой непараметрических методов.

Замечания[править | править код]

Очевидно из определения:

  • {displaystyle X_{(1)}=min(X_{1},ldots ,X_{n})};
  • {displaystyle X_{(n)}=max(X_{1},ldots ,X_{n})}.

Порядковые статистики абсолютно непрерывного распределения[править | править код]

{displaystyle f_{X_{(k)}}(x)={frac {n!}{(n-k)!(k-1)!}}[F_{X}(x)]^{k-1}[1-F_{X}(x)]^{n-k}f_{X}(x)}.
{displaystyle f_{X_{(j)},X_{(k)}}(x_{j},x_{k})=left{{begin{matrix}{frac {n!}{(j-1)!(k-j-1)!(n-k)!}}[F_{X}(x_{j})]^{j-1}[F_{X}(x_{k})-F_{X}(x_{j})]^{k-j-1}[1-F_{X}(x_{k})]^{n-k}f_{X}(x_{j})f_{X}(x_{k}),&x_{j}leq x_{k}\0,&x_{j}>x_{k}end{matrix}}right.}.

Пример[править | править код]

Плотности стандартного непрерывного равномерного распределения и его порядковых статистик для случая n=5.

Пусть {displaystyle U_{1},ldots ,U_{n}sim mathrm {U} [0,1]} – выборка из стандартного непрерывного равномерного распределения. Тогда

  • {displaystyle f_{U_{(k)}}(u)={frac {n!}{(n-k)!(k-1)!}}u^{k-1}[1-u]^{n-k},quad uin [0,1]},

то есть {displaystyle U_{(k)}sim mathrm {B} (k,n-k+1)}, где {displaystyle mathrm {B} } – бета-распределение;

  • {displaystyle f_{U_{(j)},U_{(k)}}(u_{j},u_{k})={frac {n!}{(j-1)!(k-j-1)!(n-k)!}}u_{j}^{j-1}[u_{k}-u_{j}]^{k-j-1}[1-u_{k}]^{n-k},quad j<k,quad 0leq u_{j}leq u_{k}leq 1};
  • {displaystyle f_{U_{(1)},ldots ,U_{(n)}}(u_{1},ldots ,u_{n})=n!,quad 0leq u_{1}leq cdots leq u_{n}leq 1}.

См. также[править | править код]

  • Статистика (функция выборки)
  • Алгоритм выбора

Примечания[править | править код]

  1. Математический энциклопедический словарь. — М.: «Сов. энциклопедия », 1988. — С. 847.
  2. Доказательство Архивная копия от 27 февраля 2012 на Wayback Machine, с. 12, з. 1.18

Улучшение статьи

Для улучшения этой статьи по математике желательно:

  • Проставить сноски, внести более точные указания на источники.

После исправления проблемы исключите её из списка. Удалите шаблон, если устранены все недостатки.

Добавить комментарий