Как найти абсолютную плотность распределения

Вопрос 11. Плотность
распределения (абсолютная и относительная).

Группировка – это расчленение
изучаемой статистической совокупности
на части по одному или нескольким
группировочным признакам. Правильно
проведенная группировка в значительной
мере обеспечивает достоверность всего
статистического исследования.

Вариация
– различие значений
признака у разных единиц одновременно
существующей совокупности.

Частотыf – это
численности отдельных вариаций или
каждой группы вариационного ряда. Сумма
всех частот называется объемом
совокупности и определяет число элементов
всей совокупности.

Показатель численности групп представлен
либо частотой (абсолютные числа), либо
частостью (удельным весом каждой группы
– относительные), либо как те и другие
совместно (в двух параллельных столбцах).

Частость – относительное выражение
частоты, представляет собой отношение
частоты к сумме частот.

Вариационные ряды – ряды
распределения, построенные по
количественному признаку,
определение интервала группировки
должно соответствовать переходу от
одного качества к другому.

Если приходится иметь дело с вариационным
рядом с неравными интервалами, то для
сопоставимости нужно частоты или
частости привести к единице интервала.
Полученное отношение называется
плотностью распределения:

Отношения частот или частостей к
величинам интервала называются плотностью
распределения.

Абсолютной плотностью распределения


называется число, показывающее, сколько
единиц совокупности приходится на
единицу размера интервала в отдельных
группах ряда

Относительная плотность распределения

определяется как частное от деления
частности W отдельной группы ряда на
единицу размера интервала

Абсолютная
плотность распределения

Относительная
плотность распределение

Плотность распределения используется
как для расчета обобщающих показателей,
так и для графического изображения
вариационных рядов с неравными
интервалами.


Огива и кумулята
распределения по урожайности

Известно распределение 20 однотипных торговых точек по величине  ежедневной прибыли (тыс. руб.):

11,3;  10,2;  13,9; 10,7;  11,8;  8,2;  12,4;  9,6;  13,1;  10,6;  6,3;  11,3;  10,2;  15,1;  10,5;  11,0;  15,1; 11,6;  10,4;  11,7.

  1. Составить интервальный ряд распределения.
  2. Построить гистограмму распределения плотности относительных частот.

Запишем исходные данные в виде ранжированного ряда:

6,3;  8,2;  9,6;  10,2;  10,2;  10,4;  10,5;  10,6;  10,7;  11,0;  11,3;  11,3;  11,6;  11,7; 11,8;  12,4;  13,1;  13,9;  15,1;  15,1.

Диапазон изменения вариант в выборке составляет 6–16. Этот диапазон разобьем на несколько интервалов. Ширину (шаг) интервала рассчитаем по формуле: 

    [h = frac{{Xmax - Xmin}}{n} = frac{{15.1 - 6.3}}{5} = 1.76 approx 2]

Следует иметь в виду, что чем меньше интервал, тем точнее результаты. В нашем случае принимаем размер интервала равным 2 единицам, то есть h=2. Зависимость между количеством групп (n) и численностью единиц совокупности (N) выражается формулой Стерджесса при условии, что данное распределение подчиняется закону нормального распределения (ЗНР) и применяются равные интервалы: 

    [n = 1 + 3,322lg N = 1 + 3.322 cdot 1.301 = 5.32 approx 5]

В практической работе можно использовать данные таблицы:

N 15-24 25-44 45-89 90-179 180-359 360-719 720-1439
n 5 6 7 8 9 10 11

Получаем пять интервалов: первый  6–8, второй  8–10, третий  10–12, четвертый  12–14, пятый 14–16.

Определим частоту попадания вариант выборки в каждый интервал.

В первый интервал попадает одно значение ряда: 6,3, поэтому f1=1. Во второй интервал попадают два значения: 8,2 и 9,6, поэтому  f2=2. Аналогично находим f3=12, f4=3, f5=2.  Определим относительные частоты попадания вариант выборки в каждый интервал:

в 1 интервал

    [{omega _1} = frac{{{f_1}}}{n} = frac{1}{{20}} = 0,05]

во 2 интервал

    [{omega _2} = frac{{{f_2}}}{n} = frac{2}{{20}} = 0,10]

в 3 интервал

    [{omega _3} = frac{{{f_3}}}{n} = frac{{12}}{{20}} = 0,60]

в 4 интервал

    [{omega _4} = frac{{{f_4}}}{n} = frac{3}{{20}} = 0,15]

в 5 интервал

    [{omega _5} = frac{{{f_5}}}{n} = frac{2}{{20}} = 0,10]

Сумма относительных частот

    [sumlimits_{i = 1}^5 {{omega _i}}  = 1]

Следовательно, вычисления выполнены верно.

Определим плотность относительных частот вариант как отношение относительной частоты (ωi) к ширине интервала (h):

для первого интервала

    [{varphi _1} = frac{{{omega _1}}}{h} = frac{{0,05}}{2} = 0,025]

для второго интервала

    [{varphi _2} = frac{{{omega _2}}}{h} = frac{{0,10}}{2} = 0,050]

для третьего интервала

    [{varphi _3} = frac{{{omega _3}}}{h} = frac{{0,60}}{2} = 0,300]

для четвертого интервала

    [{varphi _4} = frac{{{omega _4}}}{h} = frac{{0,15}}{2} = 0,075]

для пятого интервала

    [{varphi _5} = frac{{{omega _5}}}{h} = frac{{0,10}}{2} = 0,050]

Результаты выполненных расчетов сводим в таблицу. 

Интервальный ряд распределения прибыли предприятий

Интервал значений прибыли (h)  6 — 8  8 – 10  10 — 12  12 — 14  14 — 16
Частоты вариант (fi) 1 2 12 3 2
Относительные частоты (ωi)  0,05  0,10  0,60  0,15  0,10
Плотность относительных частот (φi)  0,025  0,050  0,300  0,075  0,050

Построим гистограмму, показывающую зависимость плотности относительных частот от значения вариант. По горизонтальной оси наносим шкалу возможных значений вариант, по вертикальной оси – плотность относительных частот; величину относительной плотности считаем постоянной внутри соответствующего интервала. Получаем столбчатую диаграмму, называемую гистограммой распределения плотности относительных частот.

Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 24 августа 2021 года; проверки требуют 7 правок.

Пло́тность вероя́тности — один из способов задания распределения случайной величины. Во многих практических приложениях понятия «плотность вероятности» и «плотность (распределения) случайной величины» или «функция распределения вероятностей» фактически синонимизируются[источник не указан 1058 дней] и под ними подразумевается вещественная функция, характеризующая сравнительную вероятность реализации тех или иных значений случайной переменной (переменных).

Прикладное описание понятия[править | править код]

Плотность распределения одномерной непрерывной случайной величины xi — это числовая функция f(x), отношение {displaystyle f(x_{1})/f(x_{2})} значений которой в точках x_{1} и x_{2} задаёт отношение вероятностей попаданий величины xi в узкие интервалы равной ширины {displaystyle [x_{1},x_{1}+Delta x]} и {displaystyle [x_{2},x_{2}+Delta x]} вблизи данных точек.

Плотность распределения неотрицательна при любом x и нормирована, то есть

{displaystyle int _{-infty }^{+infty }f(x),{mbox{d}}x=1}

При стремлении x к {displaystyle ,pm infty } функция f(x) стремится к нулю. Размерность плотности распределения всегда обратная к размерности случайной величины — если xi исчисляется в метрах, то размерностью f будет м-1.

Если в конкретной ситуации известно выражение для f(x), с его помощью можно вычислить вероятность попадания величины xi в интервал [a,b] как

{displaystyle P(xi in [a,b])=int _{a}^{b}f(x),{mbox{d}}x}.

Зная плотность вероятности, можно также определить наиболее вероятное значение (моду) случайной величины как максимум f(x).
Также с помощью плотности вероятности находится среднее значение случайной величины:

{displaystyle Exi =int _{-infty }^{+infty }xf(x),{mbox{d}}x}

и среднее значение измеримой функции {displaystyle g(xi )} случайной величины:

{displaystyle langle g(xi )rangle =int _{-infty }^{+infty }g(x)f(x),{mbox{d}}x}.

Чтобы перейти к плотности распределения {displaystyle {f}_{chi }(y)} другой случайной величины {displaystyle chi =z(xi )}, нужно взять

{displaystyle {f}_{chi }(y)=f(z^{-1}(y))cdot left|{frac {{mbox{d}}z^{-1}(y)}{{mbox{d}}y}}right|},

где {displaystyle z^{-1}(y)} — обратная функция по отношению к {displaystyle y=z(x)} (предполагается, что z — взаимно однозначное отображение).

Значение плотности распределения f(x_{1}) не является вероятностью принять случайной величиной значение x_{1}. Так, вероятность принятия непрерывной случайной величиной xi значения x_{1} равна нулю. При непрерывном распределении случайной величины xi вопрос может ставиться о вероятности её попадания в некий диапазон, а не о вероятности реализации её конкретного значения.

Интеграл

{displaystyle int _{-infty }^{x}f(t),{mbox{d}}t=F(x)}

называют функцией распределения (соответственно, плотность распределения вероятности — это производная функции распределения). Функция F является неубывающей и изменяется от 0 при {displaystyle xto -infty } до 1 при xto +infty .

Самым простым распределением является равномерное распределение на отрезке [a,b]. Для него плотность вероятности равна:

{displaystyle f(x)=left{{begin{matrix}{1 over b-a},&xin [a,b]\0,&xnot in [a,b]end{matrix}}right..}

Широко известным распределением является «нормальное», оно же гауссово, плотность которого записывается как

{displaystyle f(x)={frac {1}{{sqrt {2pi }}sigma }}exp left[-{frac {(x-mu )^{2}}{2sigma ^{2}}}right]},

где mu и sigma — параметры: математическое ожидание и среднеквадратичное отклонение. Другие примеры плотностей распределения — одностороннее лапласовское (lambda >0):

{displaystyle f(x)=Aexp left[-lambda ,xright],,(xgeq 0)} и {displaystyle f(x)=0,,(x<0)},

и максвелловское ({displaystyle alpha >0}):

{displaystyle f(x)=Ax^{2}exp left[-alpha x^{2}right],,(xgeq 0)} и {displaystyle f(x)=0,,(x<0)}.

В двух последних примерах множитель A подбирается в зависимости от параметра lambda или alpha так, чтобы обеспечить нормировку интеграла от плотности вероятности. В случае распределения Лапласа оказывается, что {displaystyle A=lambda }.

Как названные, так и другие распределения широко применяются в физике. Например, в случае распределения Максвелла роль случайной величины обычно играет абсолютная величина скорости молекулы в идеальном газе. При этом для аргумента функции f нередко используют тот же символ, что и для рассматриваемой в физической задаче случайной величины (как если бы выше на месте xi всюду стояло x). Так, в выражении максвелловской плотности распределения пишут не формальную переменную x, а символ скорости v. В простейших ситуациях такая вольность с обозначениями не приводит к недоразумениям.

Спадающий при стремлении аргумента к +infty или -infty участок графика плотности вероятности f(x) в областях, где {displaystyle fll f_{max}}, называется хвостом. Из упомянутых распределений, нормальное и лапласовское имеют по два хвоста (слева и справа), а максвелловское в выписанном виде — один (справа).

Выше была изложена суть понятия «плотность вероятности». Однако, такое изложение не является строгим — плотность f нередко является функцией нескольких величин, в рассуждениях неявно предполагались не всегда гарантируемые непрерывность и дифференцируемость функций и так далее.

Определение плотности вероятности в теории меры[править | править код]

Плотность вероятности можно рассматривать как один из способов задания вероятностной меры на евклидовом пространстве mathbb {R} ^{n}.
Пусть mathbb {P} является вероятностной мерой на mathbb {R} ^{n}, то есть определено вероятностное пространство left(mathbb{R}^n,mathcal{B}(mathbb{R}^n),mathbb{P}right), где mathcal{B}(mathbb{R}^n) обозначает борелевскую σ-алгебру на mathbb {R} ^{n}. Пусть m обозначает меру Лебега на mathbb {R} ^{n}.
Вероятность mathbb {P} называется абсолютно непрерывной (относительно меры Лебега) (mathbb{P} ll m), если любое борелевское множество нулевой меры Лебега также имеет вероятность ноль:

forall B in mathcal{B}(mathbb{R}^n),; ( m(B) = 0 ) Rightarrow ( mathbb{P}(B) = 0 ) .

Если вероятность mathbb {P} абсолютно непрерывна, то согласно теореме Радона-Никодима существует неотрицательная борелевская функция fcolonmathbb{R}^n to [0,infty) такая, что

mathbb{P}(B) = intlimits_{B} f(x), dx,

где использовано общепринятое сокращение m(dx) equiv dx, и интеграл понимается в смысле Лебега.

В более общем виде, пусть (X, mathcal F) — произвольное измеримое пространство, а mu и nu  — две меры на этом пространстве. Если найдется неотрицательная f, позволяющая выразить меру nu через меру mu в виде

nu(A) = int_A f dmu,

то такую функцию называют плотностью меры nu по мере mu , или производной Радона-Никодима меры nu относительно меры mu , и обозначают

f=frac{dnu}{dmu}.

Плотность случайной величины[править | править код]

Пусть определено произвольное вероятностное пространство (Omega ,{mathcal {F}},mathbb {P} ), и Xcolon Omega to mathbb {R} ^{n} случайная величина (или случайный вектор). X индуцирует вероятностную меру mathbb {P} ^{X} на left(mathbb{R}^n,mathcal{B}(mathbb{R}^n)right), называемую распределением случайной величины X.

Если распределение mathbb {P} ^{X} абсолютно непрерывно относительно меры Лебега, то его плотность f_X = frac{dmathbb{P}^X}{dx} называется плотностью случайной величины X. Сама случайная величина X называется абсолютно непрерывной.

Таким образом для абсолютно непрерывной случайной величины имеем:

mathbb{P}(X in B) = intlimits_{B} f_X(x), dx.

Замечания[править | править код]

  • Не всякая случайная величина абсолютно непрерывна. Любое дискретное распределение, например, не является абсолютно непрерывным относительно меры Лебега, а потому дискретные случайные величины не имеют плотности.
  • Функция распределения абсолютно непрерывной случайной величины X непрерывна и может быть выражена через плотность следующим образом:
F_X(x_1,ldots, x_n) = mathbb{P}left(X in prodlimits_{i=1}^n (-infty,x_i]right) = intlimits_{-infty}^{x_n} !! ldots !! intlimits_{-infty}^{x_1} f_X(x'_1,ldots, x'_n), dx'_1ldots dx'_n.

В одномерном случае:

F_X(x) = intlimits_{-infty}^x f_X(x'), dx'.

Если f_X in C(mathbb{R}^n), то F_X in mathcal{D}(mathbb{R}^n), и

frac{partial^n}{partial x_1 ldots partial x_n} F_X(x_1,ldots, x_n) = f_X(x_1,ldots, x_n).

В одномерном случае:

frac{d}{dx} F_X(x) = f_X(x).
  • Математическое ожидание функции от абсолютно непрерывной случайной величины может быть записано в виде:
mathbb{E}[g(X)] = intlimits_{mathbb{R}^n} g(x) , mathbb{P}^X(dx) = intlimits_{mathbb{R}^n} g(x), f_X(x), dx,

где gcolon mathbb{R}^n to mathbb{R} — борелевская функция, так что mathbb{E}[g(X)] определено и конечно.

Плотность преобразования случайной величины[править | править код]

Пусть Xcolon Omega to mathbb {R} ^{n} — абсолютно непрерывная случайная величина, и gcolonmathbb{R}^n to mathbb{R}^n — инъективная непрерывно дифференцируемая функция такая, что J_g(x) not=0,; forall xin mathbb{R}^n, где J_g(x) — якобиан функции g в точке x. Тогда случайная величина Y = g(X) также абсолютно непрерывна, и её плотность имеет вид:

f_Y(y) = f_Xleft(g^{-1}(y)right) vert J_{g^{-1}}(y) vert.

В одномерном случае:

f_Y(y) = f_Xleft(g^{-1}(y)right) leftvert frac{dg^{-1}}{dy}(y)rightvert.

Свойства плотности вероятности[править | править код]

  • Интеграл от плотности по всему пространству равен единице:
mathbb{P}left(mathbb{R}^nright) = intlimits_{mathbb{R}^n} f(x), dx = 1.

Обратно, если f(x) — неотрицательная почти всюду функция, такая что intlimits_{mathbb{R}^n}f(x), dx = 1, то существует абсолютно непрерывная вероятностная мера mathbb {P} на mathbb {R} ^{n} такая, что f(x) является её плотностью.

  • Замена меры в интеграле Лебега:
intlimits_{mathbb{R}^n} varphi(x), mathbb{P}(dx) = intlimits_{mathbb{R}^n}varphi(x), f(x), dx,

где {displaystyle varphi ::mathbb {R} ^{n}to mathbb {R} } любая борелевская функция, интегрируемая относительно вероятностной меры {displaystyle {}mathbb {P} }.

Примеры абсолютно непрерывных распределений[править | править код]

  • Бета-распределение
  • Гамма-распределение
  • Гиперэкспоненциальное распределение
  • Двумерное нормальное распределение
  • Логнормальное распределение
  • Многомерное нормальное распределение
  • Непрерывное равномерное распределение
  • Нормальное распределение
  • Обобщённое гиперболическое распределение
  • Полукруговой закон Вигнера
  • Распределение variance-gamma
  • Распределение Вейбулла
  • Распределение Гомпертца
  • Распределение Колмогорова
  • Распределение копулы
  • Распределение Коши
  • Распределение Лапласа
  • Распределение Накагами
  • Распределение Парето
  • Распределение Пирсона
  • Распределение Райса
  • Распределение Рэлея
  • Распределение Стьюдента
  • Распределение Трейси — Видома
  • Распределение Фишера
  • Распределение хи-квадрат
  • Частотное распределение
  • Экспоненциальное распределение

См. также[править | править код]

  • Распределение вероятностей
  • Сингулярное распределение
  • Функция вероятности

Литература[править | править код]

  • Плотность вероятности // Большая российская энциклопедия : [в 35 т.] / гл. ред. Ю. С. Осипов. — М. : Большая российская энциклопедия, 2004—2017.

Что такое плотность вероятности

Плотность вероятности — это производная от функции F(x), описывающей распределение случайной величины.

Двумерная, трехмерная, N-мерная плотность, иначе называемая совместной, определяет одновременное выполнение двух и более условий. Чтобы проанализировать взаимосвязь между характеристиками одного процесса, сдвинутыми на определенный интервал времени, или результаты одновременного броска двух игральных костей, нужно рассматривать двумерную плотность вероятности. Функция в таком случае должна определять одновременное выполнение двух условий: случайные величины (X) и (Y) одновременно принимают значения из интервалов (x_{1;}leq Xleq x_2\) и (y_{1;}leq Yleq y_2\).

Практические задачи, где требуется вычислить случайные величины, часто приходится решать в квантовой механике, например, рассчитывая коэффициенты отражения и прохождения квантовых частиц, движущихся в потенциальном поле. Также непрерывные случайные величины широко используют в генетике, ядерной физике.

Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.

Плотность (f(x)) аналогична таким понятиям, как плотность тока в теории электричества или плотность распределения масс на оси абсцисс.

Свойства плотности распределения

Плотность распределения обладает следующими свойствами:

  1. Интеграл от плотности равен единице по всему пространству: (int_{-infty}^infty f(x)dx=1). Выражение (f(x)dx) называют элементом вероятности.
  2. Плотность распределения выполняется почти всюду, множество, на котором функция не будет выполнена, имеет меру ноль. Отрицательной плотность быть не может.
  3. Вероятность попадания непрерывной случайной величины в промежуток ([a,b]) равна определенному интегралу от ее плотности в пределах этого промежутка.

Функция распределения непрерывной случайной величины

Функцию распределения непрерывной случайной величины можно представить в виде формулы (F(x);=;P(X)).

Любое дискретное распределение не является абсолютно непрерывным относительно меры Лебега, поэтому дискретные случайные величины не имеют плотности.

Согласно центральной предельной теореме теории вероятностей, чаще всего сумма множества случайных и слабо связанных друг с другом величин стремится к нормальному распределению. Если распределить группу людей на подгруппы по росту, большинство окажется среднего роста, то же самое будет с весом, коэффициентом интеллекта и многими другими параметрами.

Также встречаются следующие абсолютно непрерывные распределения:

  • равномерное на отрезке ([a,b]);
  • хи-квадрат;
  • логнормальное;
  • многомерное нормальное;
  • экспоненциальное;
  • Вейбулла;
  • Коши;
  • Парето;
  • Стьюдента;
  • Фишера.

График плотности распределения

График плотности распределения

 

Площадь, заштрихованная на иллюстрации, соответствует вероятности события ({aleq Xleq b}.)

Графики

 

Нормальное распределение задается функцией плотности вероятности, совпадающей с функцией Гаусса.

(mu) — математическое ожидание, (sigma) — среднеквадратическое отклонение, (а sigma^2) — дисперсия распределения.

Примеры задач

Задача 1

Распределение непрерывной случайной величины (X) задано функцией

(F(x);=;left{begin{array}{lc}0,&x<-1\frac15(x+1),&cleq xleq d\1,&x>4end{array}right.)

Нужно найти значения (с) и (d), плотность распределения вероятностей (f(x)), построить графики функций (F(x)) и (f(x)).

Решение:

функция распределения непрерывна, следовательно:

(F(c);=;frac15(c+1);=;0;Rightarrow;c;=;-1)

(F(d);=;frac15(d+1);=;1;Rightarrow;d;=;4)

Таким образом:

(F(x);=;left{begin{array}{lc}0,&x<-1\frac15(x+1),&-1leq xleq4\1,&x>4end{array}right.)

(f(x);=;F'(x);=;left{begin{array}{lc}0,&x<-1\frac15,&-1leq xleq4\1,&x>4end{array}right.)

Задача 1

 

Задача 2

Написать функцию плотности нормального распределения случайной величины (X), если известно, что (M(X) = 2) и (D(x) = 5.)

Решение:

при распределении по нормальному закону функция имеет вид: (f(x);=;frac1{sigmasqrt{2pi}}e^frac{{(x-a)}^2}{10}), где (a) — математическое ожидание, (sigma) — среднее квадратическое отклонение.

Подставим значения из условий задачи:

(а = М(Х) = 2, sigma;=;sqrt{D(X)};=;sqrt5)

Таким образом:

(f(x);=;frac1{sqrt{10pi}}e^frac{{(x-2)}^2}{10})

Добавить комментарий