Вопрос 11. Плотность
распределения (абсолютная и относительная).
Группировка – это расчленение
изучаемой статистической совокупности
на части по одному или нескольким
группировочным признакам. Правильно
проведенная группировка в значительной
мере обеспечивает достоверность всего
статистического исследования.
Вариация
– различие значений
признака у разных единиц одновременно
существующей совокупности.
Частоты – f – это
численности отдельных вариаций или
каждой группы вариационного ряда. Сумма
всех частот называется объемом
совокупности и определяет число элементов
всей совокупности.
Показатель численности групп представлен
либо частотой (абсолютные числа), либо
частостью (удельным весом каждой группы
– относительные), либо как те и другие
совместно (в двух параллельных столбцах).
Частость – относительное выражение
частоты, представляет собой отношение
частоты к сумме частот.
Вариационные ряды – ряды
распределения, построенные по
количественному признаку,
определение интервала группировки
должно соответствовать переходу от
одного качества к другому.
Если приходится иметь дело с вариационным
рядом с неравными интервалами, то для
сопоставимости нужно частоты или
частости привести к единице интервала.
Полученное отношение называется
плотностью распределения:
Отношения частот или частостей к
величинам интервала называются плотностью
распределения.
Абсолютной плотностью распределения
называется число, показывающее, сколько
единиц совокупности приходится на
единицу размера интервала в отдельных
группах ряда
Относительная плотность распределения
определяется как частное от деления
частности W отдельной группы ряда на
единицу размера интервала
Абсолютная |
Относительная |
Плотность распределения используется
как для расчета обобщающих показателей,
так и для графического изображения
вариационных рядов с неравными
интервалами.
Огива и кумулята
распределения по урожайности
Известно распределение 20 однотипных торговых точек по величине ежедневной прибыли (тыс. руб.):
11,3; 10,2; 13,9; 10,7; 11,8; 8,2; 12,4; 9,6; 13,1; 10,6; 6,3; 11,3; 10,2; 15,1; 10,5; 11,0; 15,1; 11,6; 10,4; 11,7.
- Составить интервальный ряд распределения.
- Построить гистограмму распределения плотности относительных частот.
Запишем исходные данные в виде ранжированного ряда:
6,3; 8,2; 9,6; 10,2; 10,2; 10,4; 10,5; 10,6; 10,7; 11,0; 11,3; 11,3; 11,6; 11,7; 11,8; 12,4; 13,1; 13,9; 15,1; 15,1.
Диапазон изменения вариант в выборке составляет 6–16. Этот диапазон разобьем на несколько интервалов. Ширину (шаг) интервала рассчитаем по формуле:
Следует иметь в виду, что чем меньше интервал, тем точнее результаты. В нашем случае принимаем размер интервала равным 2 единицам, то есть h=2. Зависимость между количеством групп (n) и численностью единиц совокупности (N) выражается формулой Стерджесса при условии, что данное распределение подчиняется закону нормального распределения (ЗНР) и применяются равные интервалы:
В практической работе можно использовать данные таблицы:
N | 15-24 | 25-44 | 45-89 | 90-179 | 180-359 | 360-719 | 720-1439 |
n | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
Получаем пять интервалов: первый 6–8, второй 8–10, третий 10–12, четвертый 12–14, пятый 14–16.
Определим частоту попадания вариант выборки в каждый интервал.
В первый интервал попадает одно значение ряда: 6,3, поэтому f1=1. Во второй интервал попадают два значения: 8,2 и 9,6, поэтому f2=2. Аналогично находим f3=12, f4=3, f5=2. Определим относительные частоты попадания вариант выборки в каждый интервал:
в 1 интервал
во 2 интервал
в 3 интервал
в 4 интервал
в 5 интервал
Сумма относительных частот
Следовательно, вычисления выполнены верно.
Определим плотность относительных частот вариант как отношение относительной частоты (ωi) к ширине интервала (h):
для первого интервала
для второго интервала
для третьего интервала
для четвертого интервала
для пятого интервала
Результаты выполненных расчетов сводим в таблицу.
Интервальный ряд распределения прибыли предприятий
Интервал значений прибыли (h) | 6 — 8 | 8 – 10 | 10 — 12 | 12 — 14 | 14 — 16 |
Частоты вариант (fi) | 1 | 2 | 12 | 3 | 2 |
Относительные частоты (ωi) | 0,05 | 0,10 | 0,60 | 0,15 | 0,10 |
Плотность относительных частот (φi) | 0,025 | 0,050 | 0,300 | 0,075 | 0,050 |
Построим гистограмму, показывающую зависимость плотности относительных частот от значения вариант. По горизонтальной оси наносим шкалу возможных значений вариант, по вертикальной оси – плотность относительных частот; величину относительной плотности считаем постоянной внутри соответствующего интервала. Получаем столбчатую диаграмму, называемую гистограммой распределения плотности относительных частот.
Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 24 августа 2021 года; проверки требуют 7 правок.
Пло́тность вероя́тности — один из способов задания распределения случайной величины. Во многих практических приложениях понятия «плотность вероятности» и «плотность (распределения) случайной величины» или «функция распределения вероятностей» фактически синонимизируются[источник не указан 1058 дней] и под ними подразумевается вещественная функция, характеризующая сравнительную вероятность реализации тех или иных значений случайной переменной (переменных).
Прикладное описание понятия[править | править код]
Плотность распределения одномерной непрерывной случайной величины — это числовая функция , отношение значений которой в точках и задаёт отношение вероятностей попаданий величины в узкие интервалы равной ширины и вблизи данных точек.
Плотность распределения неотрицательна при любом и нормирована, то есть
При стремлении к функция стремится к нулю. Размерность плотности распределения всегда обратная к размерности случайной величины — если исчисляется в метрах, то размерностью будет м-1.
Если в конкретной ситуации известно выражение для , с его помощью можно вычислить вероятность попадания величины в интервал как
-
- .
Зная плотность вероятности, можно также определить наиболее вероятное значение (моду) случайной величины как максимум .
Также с помощью плотности вероятности находится среднее значение случайной величины:
и среднее значение измеримой функции случайной величины:
-
- .
Чтобы перейти к плотности распределения другой случайной величины , нужно взять
-
- ,
где — обратная функция по отношению к (предполагается, что z — взаимно однозначное отображение).
Значение плотности распределения не является вероятностью принять случайной величиной значение . Так, вероятность принятия непрерывной случайной величиной значения равна нулю. При непрерывном распределении случайной величины вопрос может ставиться о вероятности её попадания в некий диапазон, а не о вероятности реализации её конкретного значения.
Интеграл
называют функцией распределения (соответственно, плотность распределения вероятности — это производная функции распределения). Функция является неубывающей и изменяется от 0 при до 1 при .
Самым простым распределением является равномерное распределение на отрезке . Для него плотность вероятности равна:
Широко известным распределением является «нормальное», оно же гауссово, плотность которого записывается как
-
- ,
где и — параметры: математическое ожидание и среднеквадратичное отклонение. Другие примеры плотностей распределения — одностороннее лапласовское ():
-
- и ,
и максвелловское ():
-
- и .
В двух последних примерах множитель подбирается в зависимости от параметра или так, чтобы обеспечить нормировку интеграла от плотности вероятности. В случае распределения Лапласа оказывается, что .
Как названные, так и другие распределения широко применяются в физике. Например, в случае распределения Максвелла роль случайной величины обычно играет абсолютная величина скорости молекулы в идеальном газе. При этом для аргумента функции нередко используют тот же символ, что и для рассматриваемой в физической задаче случайной величины (как если бы выше на месте всюду стояло ). Так, в выражении максвелловской плотности распределения пишут не формальную переменную , а символ скорости . В простейших ситуациях такая вольность с обозначениями не приводит к недоразумениям.
Спадающий при стремлении аргумента к или участок графика плотности вероятности в областях, где , называется хвостом. Из упомянутых распределений, нормальное и лапласовское имеют по два хвоста (слева и справа), а максвелловское в выписанном виде — один (справа).
Выше была изложена суть понятия «плотность вероятности». Однако, такое изложение не является строгим — плотность нередко является функцией нескольких величин, в рассуждениях неявно предполагались не всегда гарантируемые непрерывность и дифференцируемость функций и так далее.
Определение плотности вероятности в теории меры[править | править код]
Плотность вероятности можно рассматривать как один из способов задания вероятностной меры на евклидовом пространстве .
Пусть является вероятностной мерой на , то есть определено вероятностное пространство , где обозначает борелевскую σ-алгебру на . Пусть обозначает меру Лебега на .
Вероятность называется абсолютно непрерывной (относительно меры Лебега) (), если любое борелевское множество нулевой меры Лебега также имеет вероятность ноль:
Если вероятность абсолютно непрерывна, то согласно теореме Радона-Никодима существует неотрицательная борелевская функция такая, что
- ,
где использовано общепринятое сокращение , и интеграл понимается в смысле Лебега.
В более общем виде, пусть — произвольное измеримое пространство, а и — две меры на этом пространстве. Если найдется неотрицательная , позволяющая выразить меру через меру в виде
то такую функцию называют плотностью меры по мере , или производной Радона-Никодима меры относительно меры , и обозначают
- .
Плотность случайной величины[править | править код]
Пусть определено произвольное вероятностное пространство , и случайная величина (или случайный вектор). индуцирует вероятностную меру на , называемую распределением случайной величины .
Если распределение абсолютно непрерывно относительно меры Лебега, то его плотность называется плотностью случайной величины . Сама случайная величина называется абсолютно непрерывной.
Таким образом для абсолютно непрерывной случайной величины имеем:
- .
Замечания[править | править код]
- Не всякая случайная величина абсолютно непрерывна. Любое дискретное распределение, например, не является абсолютно непрерывным относительно меры Лебега, а потому дискретные случайные величины не имеют плотности.
- Функция распределения абсолютно непрерывной случайной величины непрерывна и может быть выражена через плотность следующим образом:
- .
В одномерном случае:
- .
Если , то , и
- .
В одномерном случае:
- .
- Математическое ожидание функции от абсолютно непрерывной случайной величины может быть записано в виде:
- ,
где — борелевская функция, так что определено и конечно.
Плотность преобразования случайной величины[править | править код]
Пусть — абсолютно непрерывная случайная величина, и — инъективная непрерывно дифференцируемая функция такая, что , где — якобиан функции в точке . Тогда случайная величина также абсолютно непрерывна, и её плотность имеет вид:
- .
В одномерном случае:
- .
Свойства плотности вероятности[править | править код]
- Интеграл от плотности по всему пространству равен единице:
- .
Обратно, если — неотрицательная почти всюду функция, такая что , то существует абсолютно непрерывная вероятностная мера на такая, что является её плотностью.
- Замена меры в интеграле Лебега:
- ,
где любая борелевская функция, интегрируемая относительно вероятностной меры .
Примеры абсолютно непрерывных распределений[править | править код]
- Бета-распределение
- Гамма-распределение
- Гиперэкспоненциальное распределение
- Двумерное нормальное распределение
- Логнормальное распределение
- Многомерное нормальное распределение
- Непрерывное равномерное распределение
- Нормальное распределение
- Обобщённое гиперболическое распределение
- Полукруговой закон Вигнера
- Распределение variance-gamma
- Распределение Вейбулла
- Распределение Гомпертца
- Распределение Колмогорова
- Распределение копулы
- Распределение Коши
- Распределение Лапласа
- Распределение Накагами
- Распределение Парето
- Распределение Пирсона
- Распределение Райса
- Распределение Рэлея
- Распределение Стьюдента
- Распределение Трейси — Видома
- Распределение Фишера
- Распределение хи-квадрат
- Частотное распределение
- Экспоненциальное распределение
См. также[править | править код]
- Распределение вероятностей
- Сингулярное распределение
- Функция вероятности
Литература[править | править код]
- Плотность вероятности // Большая российская энциклопедия : [в 35 т.] / гл. ред. Ю. С. Осипов. — М. : Большая российская энциклопедия, 2004—2017.
Что такое плотность вероятности
Плотность вероятности — это производная от функции F(x), описывающей распределение случайной величины.
Двумерная, трехмерная, N-мерная плотность, иначе называемая совместной, определяет одновременное выполнение двух и более условий. Чтобы проанализировать взаимосвязь между характеристиками одного процесса, сдвинутыми на определенный интервал времени, или результаты одновременного броска двух игральных костей, нужно рассматривать двумерную плотность вероятности. Функция в таком случае должна определять одновременное выполнение двух условий: случайные величины (X) и (Y) одновременно принимают значения из интервалов (x_{1;}leq Xleq x_2\) и (y_{1;}leq Yleq y_2\).
Практические задачи, где требуется вычислить случайные величины, часто приходится решать в квантовой механике, например, рассчитывая коэффициенты отражения и прохождения квантовых частиц, движущихся в потенциальном поле. Также непрерывные случайные величины широко используют в генетике, ядерной физике.
Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.
Плотность (f(x)) аналогична таким понятиям, как плотность тока в теории электричества или плотность распределения масс на оси абсцисс.
Свойства плотности распределения
Плотность распределения обладает следующими свойствами:
- Интеграл от плотности равен единице по всему пространству: (int_{-infty}^infty f(x)dx=1). Выражение (f(x)dx) называют элементом вероятности.
- Плотность распределения выполняется почти всюду, множество, на котором функция не будет выполнена, имеет меру ноль. Отрицательной плотность быть не может.
- Вероятность попадания непрерывной случайной величины в промежуток ([a,b]) равна определенному интегралу от ее плотности в пределах этого промежутка.
Функция распределения непрерывной случайной величины
Функцию распределения непрерывной случайной величины можно представить в виде формулы (F(x);=;P(X)).
Любое дискретное распределение не является абсолютно непрерывным относительно меры Лебега, поэтому дискретные случайные величины не имеют плотности.
Согласно центральной предельной теореме теории вероятностей, чаще всего сумма множества случайных и слабо связанных друг с другом величин стремится к нормальному распределению. Если распределить группу людей на подгруппы по росту, большинство окажется среднего роста, то же самое будет с весом, коэффициентом интеллекта и многими другими параметрами.
Также встречаются следующие абсолютно непрерывные распределения:
- равномерное на отрезке ([a,b]);
- хи-квадрат;
- логнормальное;
- многомерное нормальное;
- экспоненциальное;
- Вейбулла;
- Коши;
- Парето;
- Стьюдента;
- Фишера.
График плотности распределения
Площадь, заштрихованная на иллюстрации, соответствует вероятности события ({aleq Xleq b}.)
Нормальное распределение задается функцией плотности вероятности, совпадающей с функцией Гаусса.
(mu) — математическое ожидание, (sigma) — среднеквадратическое отклонение, (а sigma^2) — дисперсия распределения.
Примеры задач
Задача 1
Распределение непрерывной случайной величины (X) задано функцией
(F(x);=;left{begin{array}{lc}0,&x<-1\frac15(x+1),&cleq xleq d\1,&x>4end{array}right.)
Нужно найти значения (с) и (d), плотность распределения вероятностей (f(x)), построить графики функций (F(x)) и (f(x)).
Решение:
функция распределения непрерывна, следовательно:
(F(c);=;frac15(c+1);=;0;Rightarrow;c;=;-1)
(F(d);=;frac15(d+1);=;1;Rightarrow;d;=;4)
Таким образом:
(F(x);=;left{begin{array}{lc}0,&x<-1\frac15(x+1),&-1leq xleq4\1,&x>4end{array}right.)
(f(x);=;F'(x);=;left{begin{array}{lc}0,&x<-1\frac15,&-1leq xleq4\1,&x>4end{array}right.)
Задача 2
Написать функцию плотности нормального распределения случайной величины (X), если известно, что (M(X) = 2) и (D(x) = 5.)
Решение:
при распределении по нормальному закону функция имеет вид: (f(x);=;frac1{sigmasqrt{2pi}}e^frac{{(x-a)}^2}{10}), где (a) — математическое ожидание, (sigma) — среднее квадратическое отклонение.
Подставим значения из условий задачи:
(а = М(Х) = 2, sigma;=;sqrt{D(X)};=;sqrt5)
Таким образом:
(f(x);=;frac1{sqrt{10pi}}e^frac{{(x-2)}^2}{10})