Как найти эмпирическую функцию распределения для выборки

Skip to content

Эмпирической (опытной) функцией распределения или функцией распределения выборки называют такую функцию, которая определяет для каждого значения x частоту событий X<x и предназначена для оценке теоретической функции распределения генеральной совокупности в математической статистике.

Эмпирическая функция распределения находится по формуле:

Эмпирическая функция распределения формула

n — объем выборки;

nx — количество наблюдений (вариантов) меньше x.


Пример

Дана таблица функции распределения выборки. Требуется построить эмпирическую функцию распределения

xi 1 2 3 4 5 6
ni 4 10 6 8 7 5

Решение

Из таблицы n=40, т.е.
n=4+10+6+8+7+5=40
Вычислим функцию распределения выборки
Эмпирическая функция распределения решение

Эмпирическая функция распределения имеет вид

Эмпирическая функция распределения

Построим график кусочно-постоянной эмпирической функции распределения

Эмпирическая функция распределения график

таким образом, по данным выборки можно приближенно построить функцию для неизвестной функции выборки.

72685


Автор статьи

Эксперт по предмету «Математика»

Задать вопрос автору статьи

Определение эмпирической функции распределения

Пусть $X$ — случайная величина. $F(x)$ – функция распределения данной случайной величины. Будем проводить в одних и тех же независимых друг от друга условий $n$ опытов над данной случайной величиной. При этом получим последовательность значений $x_1, x_2 $, … ,$ x_n$, которая и называется выборкой.

Определение 1

Каждое значение $x_i$ ($i=1,2 $, … ,$ n$) называется вариантой.

Определение 2

Функция распределения $F(x)$ генеральной совокупности называется теоретической функцией распределения.

Одной из оценок теоретической функции распределения является эмпирическая функция распределения.

Определение 3

Эмпирической функцией распределения $F_n(x)$ называется функция, которая определяет для каждого значения $x$ относительную частоту события $X
[F_nleft(xright)=frac{n_x}{n}]

где $n_x$ – число вариант, меньших $x$, $n$ — объем выборки.

Отличие эмпирической функции от теоретической состоит том, что теоретическая функция определяет вероятность события $X

Свойства эмпирической функции распределения

Рассмотрим теперь несколько основных свойств функции распределения.

  1. Область значений функции $F_nleft(xright)$ — отрезок $[0,1]$.

  2. $F_nleft(xright)$ неубывающая функция.

  3. $F_nleft(xright)$ непрерывная слева функция.

  4. $F_nleft(xright)$ кусочно-постоянная функция и возрастает только в точках значений случайной величины $X$

  5. Пусть $X_1$ — наименьшая, а $X_n$ — наибольшая варианта. Тогда $F_nleft(xright)=0$ при ${xle X}_1$и $F_nleft(xright)=1$ при $xge X_n$.

«Эмпирическая функция распределения» 👇

Введем теорему, которая связывает между собой теоретическую и эмпирическую функции.

Пусть $F_nleft(xright)$ — эмпирическая функция распределения, а $Fleft(xright)$ — теоретическая функция распределения генеральной выборки. Тогда выполняется равенство:

[{mathop{lim}_{nto infty } {|F}_nleft(xright)-Fleft(xright)|=0 }]

Примеры задач на нахождение эмпирической функции распределения

Пример 1

Пусть распределение выборки имеет следующие данные, записанные с помощью таблицы:

Рисунок 1.

Найти объем выборки, составить эмпирическую функцию распределения и построить её график.

Решение:

Объем выборки: $n=5+10+15+20=50$.

По свойству 5, имеем, что при $xle 1$ $F_nleft(xright)=0$, а при $x>4$ $F_nleft(xright)=1$.

Значение $x

Значение $x

Значение $x

Таким образом, получаем:

Рисунок 2.

Построим график эмпирического распределения:

Рисунок 3.

Пример 2

Из городов центральной части России случайным образом выбрано 20 городов, для которых получены следующие данные по стоимости проезда в общественном транспорте: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14, 15, 13, 13, 12, 12, 15, 14, 14.

Составить эмпирическую функцию распределения данной выборки и построить её график.

Решение:

Запишем значения выборки в порядке возрастания и посчитаем частоту каждого значения. Получаем следующую таблицу:

Рисунок 4.

Объем выборки: $n=20$.

По свойству 5, имеем, что при $xle 12$ $F_nleft(xright)=0$, а при $x>15$ $F_nleft(xright)=1$.

Значение $x

Значение $x

Значение $x

Таким образом, получаем:

Рисунок 5.

Построим график эмпирического распределения:

Рисунок 6.

Оригинальность: $92,12%$.

Находи статьи и создавай свой список литературы по ГОСТу

Поиск по теме

Как известно, закон
распределения случайной величины можно
задавать различными способами. Дискретную
случайную величину можно задать с
помощью ряда распределения или
интегральной функции, а непрерывную
случайную величину – с помощью или
интегральной, или дифференциальной
функции. Рассмотрим выборочные аналоги
этих двух функций.

Пусть имеется
выборочная совокупность значений
некоторой случайной величины
объемаи каждому варианту из этой совокупности
поставлена в соответствие его частость.
Пусть далее,– некоторое действительное число, а– число выборочных значений случайной
величины,
меньших.Тогда
числоявляется частостью наблюдаемых в выборке
значений величиныX,
меньших
,
т.е. частостью появления события
.
При измененииx
в общем случае будет изменяться и
величина
.
Это означает, что относительная частотаявляется функцией аргумента.
А так как эта функция находится по
выборочным данным, полученным в результате
опытов, то ее называют выборочной илиэмпирической.

Определение
10.15.
Эмпирической
функцией распределения

(функцией распределения выборки) называют
функцию
,
определяющую для каждого значенияx
относительную частоту события
.

(10.19)

В отличие от
эмпирической функции распределения
выборки функцию распределения F(x)
генеральной совокупности называют
теоретической
функцией распределения
.
Различие между ними состоит в том, что
теоретическая функция F(x)
определяет вероятность события
,
а эмпирическая – относительную частоту
этого же события. Из теоремы Бернулли
следует

,
(10.20)

т.е. при больших
вероятностьи относительная частота события,
т.е.мало отличаются одно от другого. Уже
отсюда следует целесообразность
использования эмпирической функции
распределения выборки для приближенного
представления теоретической (интегральной)
функции распределения генеральной
совокупности.

Функция
иобладают одинаковыми свойствами. Это
вытекает из определения функции.

Свойства
:

  1. ;

  2. –неубывающая
    функция;

  3. ;

  4. .

Пример 10.4.
Построить эмпирическую функцию по
данному распределению выборки:

Варианты

2

6

10

Частоты

12

18

30

Решение:
Найдем объем выборки n=12+18+30=60.
Наименьшая варианта
,
следовательно,при.
Значение,
а именнонаблюдалось 12 раз, следовательно:

=при.

Значение x<10,
а именно
инаблюдались 12+18=30 раз, следовательно,=при.
При.

Искомая эмпирическая
функция распределения:

=

График
представлен на рис. 10.2

Рис.
10.2

Контрольные вопросы

1. Какие основные
задачи решает математическая статистика?
2. Генеральная и выборочная совокупность?
3. Дайте определение объема выборки. 4.
Какие выборки называются репрезентативными?
5. Ошибки репрезентативности. 6. Основные
способы образования выборки. 7. Понятия
частоты, относительной частоты. 8. Понятие
статистического ряда. 9. Запишите формулу
Стэрджеса. 10. Сформулируйте понятия
размаха выборки, медианы и моды. 11.
Полигон частот, гистограмма. 12. Понятие
точечной оценки выборочной совокупности.
13. Смещенная и несмещенная точечная
оценка. 14. Сформулируйте понятие
выборочной средней. 15. Сформулируйте
понятие выборочной дисперсии. 16.
Сформулируйте понятие выборочного
среднеквадратического отклонения. 17.
Сформулируйте понятие выборочного
коэффициента вариации. 18. Сформулируйте
понятие выборочной средней геометрической.

8

Соседние файлы в папке Лекции

  • #
  • #
  • #
  • #
  • #
  • #
  • #

Эмпирическая функция распределения

Содержание:

  • Что называют эмпирической функции распределения
  • Свойства функции
  • Как найти
  • Как построить график
  • Примеры задач

Что называют эмпирической функции распределения

Допустим, известно статистическое распределение частот количественного признака Х. Обозначим nх – количество наблюдений со значением меньше x1, n – всего наблюдений. Очевидно, что относительная частота события Х<x будет равна nх/n.

Определение

Эмпирическая функция распределения – это функция F*(x), которая определяет для каждого значения x относительную частоту события X

Данное понятие можно записать в виде формулы:

Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.

(Fast(x)=frac{n_x}n)

В этой записи nx – количество вариантов, меньших x– объем выборочной совокупности.

Существует также теоретическая функция распределения (функция распределения генеральной совокупности). Ее отличие от выборочной функции распределения состоит в определении объективной возможности или вероятности события X<x.

Свойства функции

Функция распределения выборки обладает рядом свойств, которые следуют из определения понятия.

  1. Значения рассматриваемой функции F*(x) располагаются на отрезке [0; 1].
  2. Функция имеет неубывающий характер.
  3. При минимальной варианте x1 верно равенство F*(x)=0 при условии, что х<х1. При максимальной варианте хверно равенство F*(x)=1 при условии х>xk.

Таким образом, функция распределения выборки помогает оценить теоретическую функцию распределения.

Как найти

Выборочная функция распределения для случайной величины рассчитывается по формуле:

(F(x)=P(xi<x))

Данное равенство читается так: функция распределения равна вероятности события, при котором случайная величина будем меньше x.

Поскольку при условии, что x меньше или равно 1, событие ξ20<1 невозможно (ξ20 не принимает значение менее 1, вероятность невозможного события равна 0), верно следующее выражение:

(F(x)=P(xi20<1)=0)

При принадлежности x отрезку (1; 2] событие ξ20<2 представляет собой равенство ξ20=1, значит, вероятность этого события равно 0,1. В записи это выглядит так:

(F(x)=P(xi20<2)=0,1)

Когда x принадлежит отрезку (2; 4], событие ξ20<4 состоит в равенстве ξ20 значению 1 или 2, то есть вероятность рассматриваемого события равна 0,1+0,2=0,3 или:

(F(x)=P(xi20<4)=0,3)

Если 4 < ≤ 5, то событие ξ20<5 означает, что ξ20 принимает значение либо 1, либо 2, либо 4. Следовательно, вероятность данного события вычисляется так: 0,1+0,2+0,35=0,65, то есть:

(F(x)=P(xi20<5)=0,65)

При 5 < ≤ 6 событие ξ20<6 заключается в том, что ξ20 принимает значение 1, 2, 4 или 5. Значит его вероятность равно 0,1+0,2+0,35+0,1=0,75 или:

(F(x)=P(xi20<6)=0,75)

И так далее.

Итак, эмпирическая функция распределения имеет следующий вид:

Функция

 

Как построить график

Построение графика эмпирической функции распределения возможно после вычисления ее значений на всей числовой оси. Для рассмотренного примера схематическое изображение будет выглядеть так:

График

 

График ступенчатого вида, построенный на отрезках. Совпадение графика с горизонтальной осью означает, что левее минимального значения x=1 функция приобретает значение нуля. Увеличение в каждой следующей точке xi происходит на величину вероятности νi. Правее максимального значения х8=13 функция равна 1. Стрелки и точки на концах отрезков указывают на определение функции на полуинтервалах.

Примеры задач

Задача

В таблице даны значения эмпирического распределения:

Задача

 

Необходимо найти объем выборочной совокупности, составить выборочную функцию распределения, построить ее график.

Решение

  1. Вычислим объем выборки: n=5+10+15+20=50.
  2. Из свойства эмпирической функции распределения: Fn(x)=0 при x≤1, Fn(x)=1 при x>4.

Выходит, что:

Задача 2

 

По полученным значениям построим график:

Задача 3

 

Пусть Nх — число наблюдений, при которых значение при­знака Х меньше Х. При объеме выборки, равном П, относитель­ная частота события Х < х равна Nx/N.

Определение 8. Функция

Определяющая для каждого значения Х относительную частоту события Х < х, называется Эмпирической функцией распреде­ления, или функцией распределения выборки.

В отличие от эмпирической функции распределения F*(X) Выборки функция распределения F(X) генеральной совокупнос­ти называется Теоретической функцией распределения. Раз­личие между ними состоит в том, что функция F(X) опреде­ляет вероятность события Х < х, a F*(X) — относительную частоту этого события. Из теоретических результатов общей теории вероятностей (закон больших чисел) следует, что при больших П вероятность отличия этих функций друг от друга близка к единице:

Нетрудно видеть, что F*(X) обладает всеми свойствами F(X), что вытекает из ее определения (18.49):

1) значения F*(X) принадлежат отрезку [0, 1];

2) F*(X) является неубывающей функцией;

3) если Х1 наименьшая варианта, то F*(X) = 0 при ХХ1; если Xk — максимальная варианта, то F*(X) = 1 при X > XK.

Сама же функция F*(X) служит для оценки теоретической функции распределения F(X) генеральной совокупности.

Пример 3. Построить эмпирическую функцию по заданному распределению выборки:

Решение. Находим объем выборки: П = 10 + 15 + 25 = 50. Наименьшая варианта равна 2, поэтому F*(X) = 0 при Х ≤ 2. Значение Х < 4 (или X1 = 2) наблюдалось 10 раз, значит, F*(X) = 10/50 = 0,2 при 2 < Х < 4. Значения X < 6 (а именно X1 = 2 и X2 = 4) наблюдались 10 + 15 = 25 раз, значит, при 4 < Х < 6 функция F*(X) = 25/50 = 0,5. Поскольку X = 6 — максимальная варианта, то F*(X) = 1 при Х > 6. Напишем формулу искомой эмпирической функции:

График этой функции показан на рис. 18.8.

< Предыдущая   Следующая >

Добавить комментарий