Как найти параметры нормально распределенной совокупности

Нормальное распределение
Плотность нормального распределения
Зеленая линия соответствует стандартному нормальному распределениюПлотность вероятности
Функция распределения нормального распределения
Цвета на этом графике соответствуют графику наверхуФункция распределения
Обозначение {displaystyle Nleft(mu ,sigma ^{2}right)}
Параметры μ — коэффициент сдвига (вещественный)
σ > 0 — коэффициент масштаба (вещественный, строго положительный)
Носитель {displaystyle xin left(-infty ;+infty right)}
Плотность вероятности {displaystyle {frac {1}{sigma {sqrt {2pi }}}};exp left(-{frac {left(x-mu right)^{2}}{2sigma ^{2}}}right)}
Функция распределения {frac {1}{2}}left[1+operatorname {erf} left({frac {x-mu }{sqrt {2sigma ^{2}}}}right)right]
Математическое ожидание mu
Медиана mu
Мода mu
Дисперсия sigma ^{2}
Коэффициент асимметрии {displaystyle 0}
Коэффициент эксцесса {displaystyle 0}
Дифференциальная энтропия {displaystyle ln left(sigma {sqrt {2,pi ,e}}right)}
Производящая функция моментов M_{X}left(tright)=exp left(mu ,t+{frac {sigma ^{2}t^{2}}{2}}right)
Характеристическая функция phi _{X}left(tright)=exp left(mu ,i,t-{frac {sigma ^{2}t^{2}}{2}}right)

Норма́льное распределе́ние[1][2], также называемое распределением Гаусса или Гаусса — Лапласа[3], или колоколообразная кривая — непрерывное распределение вероятностей с пиком в центре и симметричными боковыми сторонами, которое в одномерном случае задаётся функцией плотности вероятности, совпадающей с функцией Гаусса:

{displaystyle f(x)={frac {1}{sigma {sqrt {2pi }}}}e^{-{frac {1}{2}}left({frac {x-mu }{sigma }}right)^{2}}},
где параметр mu  — математическое ожидание (среднее значение), медиана и мода распределения, а параметр sigma  — среднеквадратическое отклонение, sigma ^{2} — дисперсия распределения.

Таким образом, одномерное нормальное распределение является двухпараметрическим семейством распределений, которое принадлежит экспоненциальному классу распределений[4]. Многомерный случай описан в статье «Многомерное нормальное распределение».

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием mu =0 и стандартным отклонением {displaystyle sigma =1.}

Общие сведения[править | править код]

Если величина является суммой многих случайных слабо взаимозависимых величин, каждая из которых вносит малый вклад относительно общей суммы, то центрированное и нормированное распределение такой величины при достаточно большом числе слагаемых стремится к нормальному распределению.

Это следует из центральной предельной теоремы теории вероятностей. В окружающем нас мире часто встречаются величины, значение которых определяется совокупностью многих независимых факторов. Этот факт, а также то, что распределение считалось типичным, обычным, привели к тому, что в конце XIX века стал использоваться термин «нормальное распределение». Нормальное распределение играет заметную роль во многих областях науки, например в математической статистике и статистической физике.

Случайная величина, имеющая нормальное распределение, называется нормальной, или гауссовской, случайной величиной.

Определения[править | править код]

Стандартное нормальное распределение[править | править код]

Наиболее простой случай нормального распределения — стандартное нормальное распределение — частный случай, когда mu =0 и {displaystyle sigma =1.} Его плотность вероятности равна:

{displaystyle varphi (x)={frac {1}{sqrt {2pi }}}e^{-{frac {1}{2}}x^{2}}.}

Множитель {displaystyle {frac {1}{sqrt {2pi }}}} в выражении обеспечивает условие нормировки интеграла {displaystyle int limits _{-infty }^{+infty }varphi (x),dx=1}[5]. Поскольку множитель {displaystyle {frac {1}{2}}} в экспоненте обеспечивает дисперсию равную единице, то и стандартное отклонение равно 1. Функция симметрична в точке x=0, её значение в ней максимально и равно {displaystyle {frac {1}{sqrt {2pi }}}.} Точки перегиба функции: {displaystyle x=+1} и {displaystyle x=-1.}

Гаусс называл стандартным нормальным распределение с {displaystyle sigma ^{2}=1/2,} то есть:

{displaystyle varphi (x)={frac {e^{-x^{2}}}{sqrt {pi }}}.}

Нормальное распределение с параметрами μ, σ[править | править код]

Каждое нормальное распределение — это вариант стандартного нормального распределения, область значений которого растягивается множителем sigma (стандартное отклонение) и переносится на mu (математическое ожидание):

{displaystyle f(xmid mu ,sigma ^{2})={frac {1}{sigma }}varphi left({frac {x-mu }{sigma }}right).}

{displaystyle mu ,sigma } являются параметрами нормального распределения. Плотность вероятности должна нормироваться {displaystyle {frac {1}{sigma }},} так что интеграл равен 1.

Если Z — стандартная нормальная случайная величина, то величина {displaystyle X=sigma Z+mu } будет иметь нормальное распределение с математическим ожиданием mu и стандартным отклонением sigma. Наоборот, если X — нормальная величина с параметрами mu и {displaystyle sigma ^{2},} то {displaystyle Z={frac {X-mu }{sigma }}} будет иметь стандартное нормальное распределение.

Если в экспоненте плотности вероятности раскрыть скобки и учитывать, что {displaystyle 1=ln e}, то:

{displaystyle f(x)={frac {1}{sigma {sqrt {2pi }}}}e^{-{frac {1}{2}}left({frac {x-mu }{sigma }}right)^{2}}=e^{-{frac {1}{2}}left(2ln sigma +ln 2pi +left({frac {x-mu }{sigma }}right)^{2}right)}=e^{-{frac {1}{2}}left({frac {x^{2}}{sigma ^{2}}}-2{frac {mu x}{sigma ^{2}}}+2ln sigma +ln 2pi +{frac {mu ^{2}}{sigma ^{2}}}right)}.}

Таким образом, плотность вероятности каждого нормального распределения представляет собой экспоненту квадратичной функции:

{displaystyle f(x)=e^{ax^{2}+bx+c},}
где {displaystyle a=-{frac {1}{2sigma ^{2}}}, b={frac {mu }{sigma ^{2}}}, c=-left(ln sigma +{frac {1}{2}}ln 2pi +{frac {1}{2}}{frac {mu ^{2}}{sigma ^{2}}}right).}

Отсюда можно выразить среднее значение как {displaystyle mu =-{frac {b}{2a}},} а дисперсию как {displaystyle sigma ^{2}=-{frac {1}{2a}}.} Для стандартного нормального распределения {displaystyle a=-1/2,} b=0 и {displaystyle c=-{frac {1}{2}}ln 2pi .}

Обозначение[править | править код]

Плотность вероятности стандартного нормального распределения (с нулевым средним и единичной дисперсией) часто обозначается греческой буквой phi (фи)[6]. Также достаточно часто используется альтернативная формы греческой буквы фи varphi .

Нормальное распределение часто обозначается {displaystyle N(mu ,sigma ^{2}),} или {displaystyle {mathcal {N}}(mu ,sigma ^{2})}[7]. Если случайная величина X распределена по нормальному закону со средним mu и вариацией {displaystyle sigma ^{2},} то пишут:

{displaystyle Xsim {mathcal {N}}(mu ,sigma ^{2}).}

Функция распределения[править | править код]


Функция распределения стандартного нормального распределения (нормальное интегральное распределение) обычно обозначается заглавной греческой буквой Phi (фи) и представляет собой интеграл:

{displaystyle Phi (x)={frac {1}{sqrt {2pi }}}int limits _{-infty }^{x}e^{-x^{2}/2},dx.}

С ней связана функция ошибок (интеграл вероятности) {displaystyle operatorname {erf} (x),} дающий вероятность того, что нормальная случайная величина со средним 0 и вариацией 1/2 попадёт в отрезок {displaystyle [-x,x]}:

{displaystyle operatorname {erf} (x)={frac {2}{sqrt {pi }}}int limits _{0}^{x}e^{-x^{2}},dx.}

Эти интегралы не выражаются в элементарных функциях и называются специальными функциями. Многие их численные приближения известны. См. ниже.

Функции связаны, в частности, соотношением:

{displaystyle Phi (x)={frac {1}{2}}left[1+operatorname {erf} left({frac {x}{sqrt {2}}}right)right]}.

Нормальное распределение с плотностью f, средним mu и отклонением sigma имеет следующую функцию распределения:

{displaystyle F(x)=Phi left({frac {x-mu }{sigma }}right)={frac {1}{2}}left[1+operatorname {erf} left({frac {x-mu }{sigma {sqrt {2}}}}right)right].}

Можно использовать функцию {displaystyle Q(x)=1-Phi (x)} — она даст вероятность того, что значение стандартной нормальной случайной величины X превысит x:

{displaystyle P(X>x)}.

График стандартной нормальной функции распределения Phi имеет 2-кратную вращательную симметрию относительно точки (0;1/2), то есть {displaystyle Phi (-x)=1-Phi (x).} Её неопределенный интеграл равен:

{displaystyle int Phi (x),dx=xPhi (x)+varphi (x)+C.}

Функция распределения стандартной нормальной случайной величины может быть разложена с помощью метода интегрирования по частям в ряд:

{displaystyle Phi (x)={frac {1}{2}}+{frac {1}{sqrt {2pi }}}cdot e^{-x^{2}/2}left[x+{frac {x^{3}}{3}}+{frac {x^{5}}{3cdot 5}}+cdots +{frac {x^{2n+1}}{(2n+1)!!}}+cdots right],}

где знак {displaystyle !!} означает двойной факториал.

Асимптотическое разложение функции распределения для больших x может быть также произведено интегрированием по частям.

Стандартное отклонение[править | править код]

Правило 68-95-99,7.
Для нормального распределения количество значений, отличающихся от среднего на число, меньшее чем одно стандартное отклонение, составляют 68,27 % выборок. В то же время количество значений, отличающиеся от среднего на два стандартных отклонения, составляют 95,45 %, а на три стандартных отклонения — 99,73 %.

Около 68 % значений из нормального распределения находятся на расстоянии не более одного стандартного отклонения σ от среднего; около 95 % значений лежат расстоянии не более двух стандартных отклонений; и 99,7 % не более трёх. Этот факт является частным случаем правила 3 сигм для нормальной выборки.

Более точно, вероятность получить нормальное число в интервале между {displaystyle mu -nsigma } и {displaystyle mu +nsigma } равна:

{displaystyle F(mu +nsigma )-F(mu -nsigma )=}

{displaystyle Phi (n)-Phi (-n)=operatorname {erf} left({frac {n}{sqrt {2}}}right).}

С точностью до 12 значащих цифр значения для {displaystyle n=1,2,ldots ,6} приведены в таблице[8]:

n {displaystyle p=F(mu +nsigma )-F(mu -nsigma )} 1-p {displaystyle {frac {1}{1-p}}} OEIS
1 0,682689492137 0,317310507863

3,15148718753

A178647
2 0,954499736104 0,045500263896

21,9778945080

A110894
3 0,997300203937 0,002699796063

370,398347345

A270712
4 0,999936657516 0,000063342484

15787.1927673

5 0,999999426697 0,000000573303

1744277,89362

6 0,999999998027 0,000000001973

506797345,897

Свойства[править | править код]

Моменты[править | править код]

Моментами и абсолютными моментами случайной величины X называются математические ожидания случайных величин {displaystyle X^{p}} и {displaystyle left|Xright|^{p},} соответственно. Если математическое ожидание случайной величины {displaystyle mu =0,} то эти параметры называются центральными моментами. В большинстве случаев представляют интерес моменты для целых p.

Если X имеет нормальное распределение, то для неё существуют (конечные) моменты при всех p с действительной частью больше −1. Для неотрицательных целых p центральные моменты таковы:

{displaystyle mathbb {E} left[X^{p}right]={begin{cases}0&p=2n+1,\sigma ^{p},left(p-1right)!!&p=2n.end{cases}}}

Здесь n — натуральное число, а запись {displaystyle (p-1)!!} означает двойной факториал числа {displaystyle p-1,} то есть (поскольку p-1 в данном случае нечётно) произведение всех нечётных чисел от 1 до {displaystyle p-1.}

Центральные абсолютные моменты для неотрицательных целых p таковы:

{displaystyle mathbb {E} left[left|Xright|^{p}right]=sigma ^{p},left(p-1right)!!cdot left.{begin{cases}{sqrt {frac {2}{pi }}}&p=2n+1,\1&p=2n.end{cases}}right}=sigma ^{p}cdot {frac {2^{frac {p}{2}}Gamma left({frac {p+1}{2}}right)}{sqrt {pi }}}.}

Последняя формула справедлива также для произвольных {displaystyle p>-1}.

Преобразование Фурье и характеристическая функция[править | править код]

Преобразование Фурье нормальной плотности вероятности f с математическим ожиданием mu стандартным отклонением sigma равно[9]:

{displaystyle {hat {f}}(t)=int limits _{-infty }^{infty }f(x)e^{-itx},dx=e^{imu t-{frac {1}{2}}sigma ^{2}t^{2}},}
где i есть мнимая единица.

Если математическое ожидание {displaystyle mu =0,} то первый множитель равен 1, и преобразование Фурье, с точностью до константы есть нормальная плотность вероятности на частотных интервалах, с математическим ожиданием равным 0 и стандартным отклонением {displaystyle 1/sigma .} В частности, стандартное нормальное распределение varphi есть собственная функция от преобразования Фурье.

В теории вероятности, преобразование Фурье плотности распределения действительной случайной величины X близко связано с характеристической функцией {displaystyle varphi _{X}(t)} этой величины, которая определена как математическое ожидание от {displaystyle e^{itX}} и является функцией вещественной переменной t (частотный параметр преобразования Фурье). Определение может быть распространено и на комплексную переменную t[10]. Соотношение записывается так:

{displaystyle varphi _{X}(t)={hat {f}}(-t).}

Бесконечная делимость[править | править код]

Нормальное распределение является бесконечно делимым.

Если случайные величины X_{1} и X_{2} независимы и имеют нормальное распределение с математическими ожиданиями mu _{1} и mu _{2} и дисперсиями sigma _{1}^{2} и sigma _{2}^{2} соответственно, то X_{1}+X_{2} также имеет нормальное распределение с математическим ожиданием mu _{1}+mu _{2} и дисперсией sigma _{1}^{2}+sigma _{2}^{2}.

Отсюда вытекает, что нормальная случайная величина представима как сумма произвольного числа независимых нормальных случайных величин.

Максимальная энтропия[править | править код]

Нормальное распределение имеет максимальную дифференциальную энтропию среди всех непрерывных распределений, дисперсия которых не превышает заданную величину[11][12].

Правило трёх сигм для гауссовской случайной величины[править | править код]

График плотности вероятности нормального распределения и процент попадания случайной величины на отрезки, равные среднеквадратическому отклонению.

Правило трёх сигм ({displaystyle 3sigma }) — практически все значения нормально распределённой случайной величины лежат в интервале:

{displaystyle left(mu -3sigma ;mu +3sigma right),}
где {displaystyle mu =mathbb {E} xi } — математическое ожидание и параметр нормальной случайной величины.

Более точно — приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале.

Моделирование нормальных псевдослучайных величин[править | править код]

При компьютерном моделировании, особенно при применении метода Монте-Карло, желательно использовать величины, распределенные по нормальному закону. Многие алгоритмы дают стандартные нормальные величины, так как нормальную величину {displaystyle Xsim N(mu ,sigma ^{2})} можно получить как:

{displaystyle X=mu +sigma Z,}
где Z — стандартная нормальная величина.

Алгоритмы также используют различные преобразования равномерных величин.
Простейшие приближённые методы моделирования основываются на центральной предельной теореме. Если сложить достаточно большое количество независимых одинаково распределённых величин с конечной дисперсией, то сумма будет иметь распределение, близкое к нормальному. Например, если сложить 100 независимых стандартно равномерно распределённых случайных величин, то распределение суммы будет приближённо нормальным.

Для программного генерирования нормально распределённых псевдослучайных величин предпочтительнее использовать преобразование Бокса — Мюллера. Оно позволяет генерировать одну нормально распределённую величину на базе одной равномерно распределённой.

Также существует алгоритм Зиккурат, который работает даже быстрее преобразования Бокса — Мюллера. Тем не менее, сложнее в реализации, но его применение оправдано в случаях, когда требуется генерирование очень большого числа неравномерно распределённых случайных чисел.

Нормальное распределение в природе и приложениях[править | править код]

Нормальное распределение часто встречается в природе. Например, следующие случайные величины хорошо моделируются нормальным распределением:

  • отклонение при стрельбе;
  • погрешности измерений (однако погрешности некоторых измерительных приборов имеют иное распределение);
  • некоторые характеристики живых организмов в популяции.

Такое широкое распространение этого распределения связано с тем, что оно является бесконечно делимым непрерывным распределением с конечной дисперсией. Поэтому к нему в пределе приближаются некоторые другие, например биномиальное и пуассоновское. Этим распределением моделируются многие недетерминированные физические процессы[13].

Многомерное нормальное распределение используется при исследовании многомерных случайных величин (случайных векторов). Одним из многочисленных примеров таких приложений является исследование параметров личности человека в психологии и психиатрии.

Связь с другими распределениями[править | править код]

{displaystyle t={frac {{overline {X}}-mu }{S/{sqrt {n}}}}={frac {{frac {1}{n}}(X_{1}+cdots +X_{n})-mu }{sqrt {{frac {1}{n(n-1)}}left[(X_{1}-{overline {X}})^{2}+cdots +(X_{n}-{overline {X}})^{2}right]}}}sim t_{n-1}.}
{displaystyle F={frac {left(X_{1}^{2}+X_{2}^{2}+cdots +X_{n}^{2}right)/n}{left(Y_{1}^{2}+Y_{2}^{2}+cdots +Y_{m}^{2}right)/m}}sim F_{n,m}.}
  • Отношение квадратов двух стандартных нормальных случайных величин имеет распределение Фишера со степенями свободы {displaystyle left(1,1right).}

История[править | править код]

Впервые нормальное распределение как предел биномиального распределения при {displaystyle p={tfrac {1}{2}}} появилось в 1738 году во втором издании работы Муавра «Доктрина случайностей»[en][18]. Это было первое доказательство частного случая центральной предельной теоремы. В 1809 году Гаусс в сочинении «Теория движения небесных тел» ввёл это распределение как возникающее в результате многократных измерений движения небесных тел. Однако Гаусс вывел формулу для действительных случайных величин из принципа достижения максимума совместной плотности всех измерений в точке с координатами, равными среднему всех измерений. Этот принцип впоследствии подвергался критике. В 1812 году Лаплас в теореме Муавра — Лапласа обобщил результат Муавра для произвольного биномиального распределения, то есть для сумм одинаково распределённых независимых бинарных величин[3].

См. также[править | править код]

  • Аддитивный белый гауссовский шум
  • Логнормальное распределение
  • Равномерное распределение
  • Центральная предельная теорема
  • Двумерное нормальное распределение
  • Многомерное нормальное распределение
  • Распределение хи-квадрат
  • Статистический критерий
  • Частотное распределение

Примечания[править | править код]

  1. Вентцель Е. С. Теория вероятностей. — 10-е изд., стереотипное.. — М.: Academia, 2005. — 576 с. — ISBN 5-7695-2311-5.
  2. Ширяев А. Н. Вероятность. — М.: Наука, 1980.
  3. 1 2 Математический энциклопедический словарь. — М.: Советская энциклопедия, 1988. — С. 139—140.
  4. Wasserman L. All of Statistics. — New York, NY: Springer, 2004. — С. 142. — 433 с. — ISBN 978-1-4419-2322-6.
  5. Доказательство см. Гауссов интеграл
  6. Halperin, Hartley & Hoel, 1965, item 7.
  7. McPherson (1990)
  8. Wolfram|Alpha: Computational Knowledge Engine. Wolframalpha.com. Дата обращения: 3 марта 2017.
  9. Bryc (1995, p. 23)
  10. Bryc (1995, p. 24)
  11. Cover, Thomas M.; Thomas, Joy A. Elements of Information Theory. — John Wiley and Sons, 2006. — С. 254.
  12. Park, Sung Y.; Bera, Anil K. Maximum Entropy Autoregressive Conditional Heteroskedasticity Model (англ.) // Journal of Econometrics  (англ.) (рус. : journal. — Elsevier, 2009. — P. 219—230. Архивировано 7 марта 2016 года.
  13. Талеб Н. Н. Чёрный лебедь. Под знаком непредсказуемости = The Black Swan: The Impact of the Highly Improbable. — КоЛибри, 2012. — 525 с. — ISBN 978-5-389-00573-0.
  14. Королюк, 1985, с. 135.
  15. Галкин В. М., Ерофеева Л. Н., Лещева С. В. Оценки параметра распределения Коши // Труды Нижегородского государственного технического университета им. Р. Е. Алексеева. — 2014. — № 2(104). — С. 314—319. — УДК 513.015.2(G).
  16. Lukacs, Eugene. A Characterization of the Normal Distribution (англ.) // The Annals of Mathematical Statistics  (англ.) (рус. : journal. — 1942. — Vol. 13, no. 1. — P. 91—3. — ISSN 0003-4851. — doi:10.1214/aoms/1177731647. — JSTOR 2236166.
  17. Lehmann, E. L.ruen. Testing Statistical Hypotheses. — 2nd. — Springer  (англ.) (рус., 1997. — С. 199. — ISBN 978-0-387-94919-2.
  18. The doctrine of chances; or, a method of calculating the probability of events in play, L., 1718, 1738, 1756; L., 1967 (репродуцир. изд.); Miscellanea analytica de scriebus et quadraturis, L., 1730.

Литература[править | править код]

  • Королюк В. С., Портенко Н. И., Скороход А. В., Турбин А. Ф. Справочник по теории вероятностей и математической статистике. — М.: Наука, 1985. — 640 с.
  • Halperin, Max; Hartley, Herman O.; Hoel, Paul G. Recommended Standards for Statistical Symbols and Notation. COPSS Committee on Symbols and Notation (англ.) // The American Statistician  (англ.) (рус. : journal. — 1965. — Vol. 19, no. 3. — P. 12—14. — doi:10.2307/2681417. — JSTOR 2681417.
  • McPherson, Glen. Statistics in Scientific Investigation: Its Basis, Application and Interpretation (англ.). — Springer-Verlag, 1990. — ISBN 978-0-387-97137-7.
  • Bryc, Wlodzimierz. The Normal Distribution: Characterizations with Applications (англ.). — Springer-Verlag, 1995. — ISBN 978-0-387-97990-8.

Ссылки[править | править код]

  • Таблица значений функции стандартного нормального распределения
  • Онлайн расчёт вероятности нормального распределения

Нормальное распределение

Время на прочтение
7 мин

Количество просмотров 35K

Автор статьи: Виктория Ляликова

Нормальный закон распределения или закон Гаусса играет важную роль в статистике и занимает особое положение среди других законов. Вспомним как выглядит нормальное распределение

frac{1}{sigmasqrt{2pi}}e^left(-frac{(x-a)^2)}{2sigma^2}right)

где a -математическое ожидание, sigma – среднее квадратическое отклонение.

Тестирование данных на нормальность является достаточно частым этапом первичного анализа данных, так как большое количество статистических методов использует тот факт, что данные распределены нормально. Если выборка не подчиняется нормальному закону, тогда предположении о параметрических статистических тестах нарушаются, и должны использоваться непараметрические методы статистики

Нормальное распределение естественным образом возникает практически везде, где речь идет об измерении с ошибками. Например, координаты точки попадания снаряда, рост, вес человека имеют нормальный закон распределения. Более того, центральная предельная теорема вообще утверждает, что сумма большого числа слагаемых сходится к нормальной случайной величине, не зависимо от того, какое было исходное распределение у выборки. Таким образом, данная теорема устанавливает условия, при которых возникает нормальное распределение и нарушение которых ведет к распределению, отличному от нормального.

Можно выделить следующие этапы проверки выборочных значений на нормальность

  • Подсчет основных характеристик выборки. Выборочное среднее, медиана, коэффициенты асимметрии и эксцесса.

  • Графический. К этому методу относится построение гистограммы и график квантиль-квантиль или кратко QQ

  • Статистические методы. Данные методы вычисляют статистику по данным и определяют, какая вероятность того, что данные получены из нормального распределения

При нормальном распределении, которое симметрично, значения медианы и выборочного среднего будут одинаковы, значения эксцесса равно 3, а асимметрии равно нулю. Однако ситуация, когда все указанные выборочные характеристики равны именно таким значениям, практически не встречается. Поэтому после этапа подсчета выборочных характеристик можно переходить к графическому представлению выборочных данных.

Гистограмма позволяет представить выборочные данные в графическом виде – в виде столбчатой диаграммы, где данные делятся на заранее определенное количество групп. Вид гистограммы дает наглядное представление функции плотности вероятности некоторой случайной величины, построенной по выборке.

 График QQ (квантиль-квантиль) является графиком вероятностей, который представляет собой графический метод сравнения двух распределений путем построения их квантилей. QQ график сравнивает наборы данных теоретических и выборочных (эмпирических) распределений. Если два сравниваемых распределения подобны, тогда точки на графике QQ будут приблизительно лежать на линии y=x. Основным шагом в построении графика QQ является расчет или оценка квантилей.

Существует множество статистических тестов, которые можно использовать для проверки выборочных значений на нормальность. Каждый тест использует разные предположения и рассматривает разные аспекты данных.

Чтобы применять статистические критерии сформулируем задачу. Выдвигаются две гипотезы H0 и H1, которые утверждают 

H0 – Выборка подчиняется нормальному закону распределения

H1 – Выборка не подчиняется нормальному распределению

Установи уровень значимости alpha=0,05.

Теперь задача состоит в том, чтобы на основании какого-то критерия отвергнуть или принять основную нулевую гипотезу при уровне значимости

Критерий Шапиро-Уилка

Критерий Шапиро-Уилка основан на отношении оптимальной линейной несмещенной оценки дисперсии к ее обычной оценке методом максимального правдоподобия. Статистика критерия имеет вид

W=frac{1}{s^2}{sumlimits_{i=1}^n{a_{n-i+1}(x_{n-i+1}-x_{i})}} s^2=sumlimits_{i=1}^n(x_i-overline x^2) overline x=frac{1}{n}sumlimits_{i=1}^n{x}

Числитель является квадратом оценки среднеквадратического отклонения Ллойда. Коэффициенты  {a_{n-i+1}} и критические {W(alpha)} значения статистики являются табулированными значениями.  Если W<{W({alpha})}, то нулевая гипотеза нормальности распределения отклоняется на уровне значимости alpha.

В Python функция shapiro() содержится в библиотеке scipy.stats и возвращает как статистику, рассчитанную тестом, так и значение p. В Python можно использовать выборку до 5000 элементов. Интерпретация вывода осуществляется следующим образом

Если значение p-value>alpha, тогда принимается гипотеза H0, в противном случае, т.е. если, p-value<alpha, тогда принимается гипотеза H1, т.е. что выборка не подчиняется нормальному закону.

Критерий Д’Агостино

В данном критерии в качестве статистики для проверки нормальности распределения используется отношение оценки Даутона для стандартного отклонения к выборочному стандартному отклонению, оцененному методом максимального правдоподобия 

D=frac{T}{n^2s}  T=sumlimits_{i=1}^nbigg(i-frac{n+1}{2}bigg)x_i  s^2=sumlimits_{i=1}^n(x_i-overline x^2),   {x_1}leq...leq{x_n}

В качестве статистики критерия Д’Агостино используется величина

Y=sqrt{n}frac{(D-0,28209479)}{0,02998598}

значение которой рассчитывается на основе центральной предельной теоремы, которая утверждает, что при nlongrightarrow{infty}

limlimits_{x to infty}Pbigg(frac{D-M[D]}{sqrt{D[D]}}{<x}bigg)=Phi(x)

где Phi(x)стандартная нормальная случайная величина.

Критические значения являются табулированными значениями. Гипотеза нормальности принимается, если значение статистики лежит в интервале критических значений. Данный критерий показывает хорошую мощность против большого спектра альтернатив, по мощности немного уступая критерию Шапиро-Уилка.

В Python функция normaltest() также содержится в библиотеке scipy.stats и возвращает статистику теста и значение p. Интерпретация результата аналогична результатам в критерии Шапиро-Уилка.

Критерий согласия chi^2– Пирсона

Данный критерий является одним из наиболее распространенных критериев проверки гипотез о виде закона распределения и позволяет проверить значимость расхождения эмпирических (наблюдаемых) и теоретических (ожидаемых) частот. Таким образом, данный критерий позволяет проверить гипотезу о принадлежности наблюдаемой выборки некоторому теоретическому закону. Можно сказать, что критерий является универсальным, так как позволяет проверить принадлежность выборочных значений практическому любому закону распределения.

Для решения задачи используется статистика chi^2 – Пирсона

          G=sumlimits_{k=1}^mfrac{(v_k-np_k)^2}{np_k}

где nu_k – эмпирические частоты (подсчитывается число элементов выборки, попавших в интервал), {np_k} – теоретические частоты. Подсчитывается критическое значение chi^2_{кр}. Если Ggeq chi^2_{кр}, отклоняется гипотеза  о принадлежности выборки нормальному распределению и принимается, если G< chi^2_{кр}.

Теперь перейдем к практической части. Для демонстрации функций будем использовать Dataset, взятый с сайта kaggle.com по прогнозированию инсульта по 11 клиническим характеристикам.

Загружаем необходимые библиотеки

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

 Загружаем датасет

data_healthcares = pd.read_csv('E:/vika/healthcare-dataset-stroke-data.csv')

Набор состоит из 5110 строк и 12 столбцов.

Посмотрим на основные характеристики, каждого признака.
data_healthcares.describe()

Из данных характеристик можно увидеть, что есть пропущенные значения в показателях индекс массы тела. Посчитаем количество пропущенных значений.

Если бы нам необходимо было делать модель для прогноза, то пропущенные значения bmi являются достаточно большой проблемой, в которой возникает вопрос как их восстановить. Поэтому будем предполагать, что значения столбца bmi (индекс массы тела) подчиняются нормальному закону распределения (предварительно был построен график распределения, поэтому сделано такое предположение). Но так как, на данный момент, у нас нет необходимости в построении модели для прогноза, то удалим все пропущенные значения

new_data=data_healthcares.dropna()

Теперь можем приступать к проверке выборочных значений показателя bmi на нормальность. Вычислим основные выборочные характеристики

Выборочная характеристика

Код в python

Значение характеристики

Выборочное среднее

new_data.bmi.mean()

28,89

Выборочная медиана

new_data.bmi.median()

28,1

Выборочная мода

new_data.bmi.mode()

28,7

Выборочное среднеквадратическое отклонение

new_data.bmi.std()

7.854066729680458

Выборочный коэффициент асиметрии

new_data.bmi.skew()

1.0553402052962928

Выборочный эксцесс

new_data.bmi.kurtosis()

3.362659165623678

После вычислений основных характеристик мы видим, что выборочное среднее и медиана можно сказать принимают одинаковые значения и коэффициент эксцесса равен 3. Но, к сожалению коэффициент асимметрии равен 1, что вводить нас в некоторое замешательство, т.е. мы уже можем предположить, что значения bmi не подчиняются нормальному закону. Продолжим исследования, перейдем к построению графиков.

Строим гистограмму

fig = plt.figure
fig,ax= plt.subplots(figsize=(7,7))
sns.distplot(new_data.bmi,color='red',label='bmi',ax=ax)
plt.show()

Гистограмма достаточно хорошо напоминает нормальное распределение, кроме конечно, небольшого выброса справа, но смотрим дальше. Тут скорее, можно предположить, что значения bmi подчиняются распределению  chi^2.

Строим QQ график. В python есть отличная функция qqplot(), содержащаяся в библиотеке statsmodel, которая позволяет строить как раз такие графики.

from statsmodels.graphics.gofplots import qqplot
from matplotlib import pyplot
qqplot(new_data.bmi, line=’s’)
Pyplot.show

Что имеем из графика QQ? Наши выборочные значений имеют хвосты слева и справа, и также в правом верхнем углу значения становятся разреженными. 

 На основе данных графика можно сделать вывод, что значения bmi не подчиняются нормальному закону распределения. Рядом приведен пример QQ графика распределения хи-квадрат с 8 степенями свободы из выборки в 1000 значений.

Для примера построим график QQ для выборки из нормального распределения с такими же показателями стандартного отклонения и среднего, как у bmi.

std=new_data.bmi.std() # вычисляем отклонение
mean=new_data.bmi.mean() #вычисляем среднее
Z=np.random.randn(4909)*std+mean # моделируем нормальное распределение
qqplot(Z,line='s') # строим график
pyplot.show()

Продолжим исследования. Перейдем к статистическим критериям. Будем использовать критерий Шапиро-Уилка и Д’Агостино, чтобы окончательно принять или опровергнуть предположение о нормальном распределении. Для использования критериев подключим библиотеки

from scipy.stats import shapiro
from scipy.stats import normaltest
shapiro(new_data.bmi)
ShapiroResult(statistic=0.9535483717918396, pvalue=6.623218133972133e-37)
Normaltest(new_data.bmi)
NormaltestResult(statistic=1021.1795052962864, pvalue=1.793444363882936e-222)

После применения двух тестов мы имеем, что значение p-value намного меньше заданного критического значения alpha , значит выборочные значения не принадлежат нормальному закону.

Конечно, мы рассмотрели не все тесты на нормальности, которые существуют. Какие можно дать рекомендации по проверке выборочных значений на нормальность. Лучше использовать все возможные варианты, если они уместны.

На этом все. Еще хочу порекомендовать бесплатный вебинар, который 15 июня пройдет на платформе OTUS в рамках запуска курса Математика для Data Science. На вебинаре расскажут про несколько часто используемых подходов в анализе данных, а также разберут, какие математические идеи работают у них под капотом и почему эти подходы вообще работают так, как нам нужно. Регистрация на вебинар доступна по этой ссылке.

Нормальный закон распределения и его параметры:

Нормальный закон распределения (часто называемый законом Гаусса) играет исключительно важную роль в теории вероятностей и занимает среди других законов распределения особое положение. Это — наиболее часто встречающийся на практике закон распределения. Главная особенность, выделяющая нормальный закон среди других законов, состоит в том, что он является предельным законом, к которому приближаются другие законы распределения при весьма часто встречающихся типичных условиях.

Можно доказать, что сумма достаточно большого числа независимых (или слабо зависимых) случайных величин, подчиненных каким угодно законам распределения (при соблюдении некоторых весьма нежестких ограничений), приближенно подчиняется нормальному закону, и это выполняется тем точнее, чем большее количество случайных величин суммируется. Большинство встречающихся на практике случайных величин, таких, например, как ошибки измерений, ошибки стрельбы и т. д., могут быть представлены как суммы весьма большого числа сравнительно малых слагаемых — элементарных ошибок, каждая из которых вызвана действием отдельной причины, не зависящей от остальных. Каким бы законам распределения ни были подчинены отдельные элементарные ошибки, особенности этих распределений в сумме большого числа слагаемых нивелируются, и сумма оказывается подчиненной закону, близкому к нормальному. Основное ограничение, налагаемое на суммируемые ошибки, состоит в том, чтобы они все равномерно играли в общей сумме относительно малую роль. Если это условие не выполняется и, например, одна из случайных ошибок окажется по своему влиянию на сумму резко превалирующей над всеми другими, то закон распределения этой превалирующей ошибки наложит свое влияние на сумму и определит в основных чертах ее закон распределения.

Теоремы, устанавливающие нормальный закон как предельный для суммы независимых равномерно малых случайных слагаемых, будут подробнее рассмотрены в главе 13.

Нормальный закон распределения характеризуется плотностью вероятности вида:

Нормальный закон распределения(6.1.1)

Кривая распределения по нормальному закону имеет симметричный холмообразный вид (рис. 6.1.1). Максимальная ордината кривой, равная Нормальный закон распределения, соответствует точке х = m по мере удаления от точки m плотность распределения падает, и при Нормальный закон распределения кривая асимптотически приближается к оси абсцисс.

Нормальный закон распределения

Выясним смысл численных параметров т и о, входящих в выражение нормального закона (5.1.1); докажем, что величина m есть не что иное, как математическое ожидание, а величина Нормальный закон распределения среднее квадратическое отклонение величины X. Для этого вычислим основные числовые характеристики величины X — математическое ожидание и дисперсию.

Нормальный закон распределения

Применяя замену переменной

Нормальный закон распределения

имеем:

Нормальный закон распределения(6.1.2)

Нетрудно убедиться, что первый из двух интервалов в формуле (5.1.2) равен нулю; второй представляет собой известный интеграл Эйлера — Пуассона:

Нормальный закон распределения(6.1.3)

Следовательно, М[Х] = m

т. е. параметр m представляет собой математическое ожидание вели- величины X. Этот параметр, особенно в задачах стрельбы, часто называют центром рассеивания (сокращенно — ц. р.). Вычислим дисперсию величины X:

Нормальный закон распределения

Применив снова замену переменной

Нормальный закон распределения

имеем:

Нормальный закон распределения

Интегрируя по частям, получим:

Нормальный закон распределения

Первое слагаемое в фигурных скобках равно нулю (так как Нормальный закон распределения При Нормальный закон распределения убывает быстрее, чем возрастает любая степень f), второе слагаемое по формуле 5.1.3) равно Нормальный закон распределения откуда Нормальный закон распределения

Следовательно, параметр о в формуле 5.1.1) есть не что иное, как среднее квадратическое отклонение величины X.

Выясним смысл параметров m и Нормальный закон распределения нормального распределения. Непосредственно из формулы 5.1.1) видно, что центром симметрии распределения является центр рассеивания m. Это ясно из того, что при изменении знака разности (хm) на обратный выражение 5.1.1) не меняется. Если изменять центр рассеивания т. кривая распределения будет смещаться вдоль оси абсцисс, не изменяя своей формы (рис. 6.1.2). Центр рассеивания характеризует положение распределения на оси абсцисс.

Размерность центра рассеивания—та же, что размерность случайной величины X.

Параметр о характеризует не положение, а самую форму кривой распределения. Это есть характеристика рассеивания. Наибольшая ордината кривой распределения обратно пропорциональна Нормальный закон распределения; при увеличении Нормальный закон распределения максимальная ордината уменьшается. Так как площадь

Нормальный закон распределения

кривой распределения всегда должна оставаться равной единице, то при увеличении о кривая распределения становится более плоской, растягиваясь вдоль оси абсцисс; напротив, при уменьшении Нормальный закон распределения кривая распределения вытягивается вверх, одновременно сжимаясь с боков, и становится более иглообразной. На рис. 6.1.3 показаны три нормальные кривые (/, //, ///) при m=0; из них кривая l соответствует Нормальный закон распределения

самому большому, а кривая /// — самому малому значению Нормальный закон распределения. Изменение параметра Нормальный закон распределения равносильно изменению масштаба кривой распределения— увеличению масштаба по одной оси и такому же уменьшению по другой.

Размерность параметра Нормальный закон распределения, естественно, совпадает с раpмерноcтью случайной величины X.

В некоторых курсах теории вероятностей в качестве характеристики рассеивания для нормального закона вместо среднего квадратического отклонения применяется так называемая мера точности. Мерой точности называется величина, обратно пропорциональная среднему квадратическому отклонению Нормальный закон распределения: Нормальный закон распределения

Размерность меры точности обратна размерности случайной величины.

Термин «мера точности» заимствован из теории ошибок измерений: чем точнее измерение, тем больше мера точности. Пользуясь мерой точности h, можно записать нормальный закон в виде: Нормальный закон распределения

Моменты нормального распределения

Выше мы доказали, что математическое ожидание случайной вели- величины, подчиненной нормальному закону 6.1.1), равно m, а среднее квадратическое отклонение равно Нормальный закон распределения.

Выведем общие формулы для центральных моментов любого порядка.

По определению:

Нормальный закон распределения

Делая замену переменной

Нормальный закон распределения

получим:

Нормальный закон распределения(6.2.1)

Применим к выражению (6.2.1) формулу интегрирования по частям: Нормальный закон распределения

Имея в виду, что первый член внутри скобок равен нулю, получим: Нормальный закон распределения(6.2.2)

Из формулы (6.2.1) имеем следующее выражение для Нормальный закон распределения Нормальный закон распределения(6.2.3)

Сравнивая правые части формул (6.2.2) и (6.2.3), видим, что они отличаются между собой только множителемНормальный закон распределения следовательно,

Нормальный закон распределения(6.2.4)

Формула (6.2.4) представляет собой простое рекуррентное соотношение, позволяющее выражать моменты высших порядков через моменты низших порядков. Пользуясь этой формулой и имея в виду, что Нормальный закон распределения и Нормальный закон распределения можно вычислить центральные моменты всех порядков. Так как Нормальный закон распределениято из формулы (6.2.4) следует, что все нечетные моменты нормального распределения равны нулю. Это, впрочем, непосредственно следует из симметричности нормального закона.

Для четных s из формулы (6.2.4) вытекают следующие выражения для последовательных моментов:

Нормальный закон распределения

и т. д. Общая формула для момента s-гo порядка при любом четном s имеет вид:

Нормальный закон распределения

где под символам (s—1)!! понимается произведение всех нечетных чисел от 1 до s— 1. Так как для нормального закона Нормальный закон распределения то асимметрия его также равна нулю:

Нормальный закон распределения

Из выражения четвертого момента

Нормальный закон распределения

имеем:

Нормальный закон распределения

‘) Нулевой момент любой случайной величины равен единице как математическое ожидание нулевой степени этой величины.

т. е. эксцесс нормального распределения равен нулю. Это и естественно, так как назначение эксцесса — характеризовать сравнительную крутость данного закона по сравнению с нормальным.

Вероятность попадания случайной величины, подчиненной нормальному закону, на заданный участок. Нормальная функция распределения

Во многих задачах, связанных с нормально распределенными случайными величинами, приходится определять вероятность попадания случайной величины X, подчиненной нормальному закону с параметрами m, Нормальный закон распределения, на участок от а до Нормальный закон распределения Для вычисления этой вероятности воспользуемся общей формулой

Нормальный закон распределения(6.3.1)

где F (х)— функция распределения величины X.

Найдем функцию распределения F(x) случайной величины X, распределенной по нормальному закону с параметрами m, Нормальный закон распределения. Плот- Плотность распределения величины X равна:

Нормальный закон распределения(6.3.2)

Отсюда находим функцию распределения

Нормальный закон распределения(6.3.3)

Сделаем в интеграле (6.3.3) замену переменной

Нормальный закон распределения(6.3.4)

и приведем его к виду:

Нормальный закон распределения(6.3.4)

Интеграл (6.3.4) не выражается через элементарные функции, но его можно вычислить через специальную функцию, выражающую определенный интеграл от выражения Нормальный закон распределения илиНормальный закон распределения (так называемый интеграл вероятностей), для которого составлены таблицы. Существует много разновидностей таких функций, например:

Нормальный закон распределения

и т. д. Какой из этих функций пользоваться — вопрос вкуса. Мы выберем в качестве такой функции

Нормальный закон распределения(6.3.5)

Нетрудно видеть, что эта функция представляет собой не что иное, как функцию распределения для нормально распределенной случайной величины с параметрами от m = 0, Нормальный закон распределения=1.

Условимся называть функцию Ф*(х) нормальной функцией распределения. В приложении (табл. 1) приведены таблицы значений функции Ф*(х)Нормальный закон распределения

Выразим функцию распределения (6.3.3) величины X с пара- параметрами m и Нормальный закон распределения через нормальную функцию распределения Ф*(х). Очевидно,

Нормальный закон распределения(6.3.6)

Теперь найдем вероятность попадания случайной величины X на участок от а до Нормальный закон распределения Согласно формуле (6.3.1)

Нормальный закон распределения(6.3.7)

Таким образом, мы выразили вероятность попадания на участок случайной величины X, распределенной по нормальному закону с любыми параметрами, через стандартную функцию распределения Ф* (х), соответствующую простейшему нормальному . закону с параметрами 0,1. Заметим, что аргументы функции Ф* в фор- формуле (6.3.7) имеют очень простой смысл: Нормальный закон распределения есть расстояние от правого конца участка Нормальный закон распределения до центра рассеивания, выраженное в средних квадратических отклонениях; Нормальный закон распределения— такое же расстояние для левого конца участка, причем это расстояние считается положительным, если конец расположен справа от центра рассеивания , и отрицательным, если слева.

Как и всякая функция распределения,, функция Ф*(х) обладает свойствами:

Нормальный закон распределения-неубывающая функция

Кроме того, из симметричности нормального распределения с параметрами m = 0, Нормальный закон распределения=1 относительно начала координат следует, что

ф* (— х)=1— Ф* (х). (6.3.8)

Нормальный закон распределения Для облегчения интерполяции в таблицах рядом со значениями функции приведены ее приращения за один шаг таблиц Нормальный закон распределения

Пользуясь этим свойством, собственно говоря, можно было бы ограничить таблицы функции Ф(х) только положительными значениями аргумента, но, чтобы избежать лишней операции (вычитание из единицы), в таблице 1 приложения приводятся значения Ф(х) как для положительных, так и для отрицательных аргументов.

Нормальный закон распределения

На практике часто встречается задача вычисления вероятности попадания нормально распределенной случайной величины на участок, симметричный относительно центра рассеивания m. Рассмотрим такой участок длины 2l (рис. 6.3.1). Вычислим вероятность попадания на этот участок по формуле (6.3.7): Нормальный закон распределения

Учитывая свойство (6.3.8) функции Ф*(х) и придавая левой части формулы (6.3.9) более компактный вид, получим формулу для вероятности попадания случайной величины, распределенной по нормальному закону, на участок, симметричный относительно центра рассеивания:

Нормальный закон распределения

Решим следующую задачу. Отложим от центра рассеивания m последовательные отрезки длиной Нормальный закон распределения (рис. 6.3.2) и вычислим вероятность попадания случайной величины X в каждый из них. Так как кривая нормального закона симметрична, достаточно отложить такие отрезки только в одну сторону.

Нормальный закон распределения

По формуле (6.3.7) находим:

Нормальный закон распределения

Как видно из этих данных, вероятности попадания на каждый из следующих отрезков (пятый, шестой и т. д.) с точностью до 0,001 равны нулю.

Округляя вероятности попадания в отрезки до 0,01 (до 1%). получим три числа, которые легко запомнить: 0,34; 0,14; 0,02.

Сумма этих трех значений равна 0,5. Это значит, что для нормально распределенной случайной величины все рассеивание (с точностью до долей процента) укладывается на участке m± ЗНормальный закон распределения.

Это позволяет, зная среднее квадратическое отклонение и математическое ожидание случайной величины, ориентировочно указать интервал ее практически возможных значений. Такой способ оценки диапазона возможных значений случайной величины известен в математической статистике под названием «правило трех сигма«. Из правила трех сигма вытекает также ориентировочный способ определения среднего квадратического отклонения случайной величины: берут максимальное практически возможное отклонение от среднего и делят его на три. Разумеется, этот грубый прием может быть рекомендован, только если нет других, более точных способов определения Нормальный закон распределения.

Пример:

Случайная величина X, распределенная по нормальному закону, представляет собой ошибку измерения некоторого расстояния. При измерении допускается систематическая ошибка в сторону завышения на 1,2 (м) среднее квадратическое отклонение ошибки измерения равно 0,8 (м). Найти вероятность того, что отклонение измеренного значения от истинного не превзойдет по абсолютной величине 1,6 (м).

Решение:

Ошибка измерения есть случайная величина X, подчинен- подчиненная нормальному закону с параметрами m= 1,2 и Нормальный закон распределения = 0,8. Нужно найти вероятность попадания этой величины на участок от а =—1,6 до Нормальный закон распределения = + 1,6. По формуле (6.3.7) имеем:

Нормальный закон распределения

Пользуясь таблицами функции Ф* (х) (приложение, табл. 1), найдем:

Ф* (0,5) = 0,6915; Ф* (—3,5) = 0,0002,

откуда Р (—1,6 < X < 1,6) = 0,6915 — 0,0002 = 0,6913 Нормальный закон распределения 0,691.

Пример:

Найти ту же вероятность, что в предыдущем примере, но при условии, что систематической ошибки нет.

Решение:

По формуле (6.3.10), полагая l=1.6, найдем:

Нормальный закон распределения

Пример:

По цели, имеющей вид полосы (автострада), ширина которой равна 20 м, ведется стрельба в направлении, перпендикулярном автостраде, прицеливание ведется по средней линии автострады. Среднее квадратическое отклонение в направлении стрельбы равно Нормальный закон распределения = 8 м. Имеется систематическая ошибка в направлении стрельбы: недолет 3 м. Найти вероятность попадания в автостраду при одном выстреле.

Решение:

Выберем начало координат в любой точке на средней линии автострады (рис. 6.3.3) и направим ось абсцисс перпендикулярно автостраде. Попадание или непопадание снаряда в автостраду определяется значением только одной координаты точки падения X (другая координата Y нам безразлична). Случайная величина X распределена по нормальному закону

Нормальный закон распределения

с параметрами m = —3, Нормальный закон распределения = 8. Попадание снаряда в автостраду соответствует попаданию величины X на участок от а = — 10 до Нормальный закон распределения = 4-10. Применяя формулу (6.3.7), имеем:

Нормальный закон распределения

Пример:

Имеется случайная величина Х, нормально распределенная, с центром рассеивания m (рис. 6.3.4) и некоторый участок Нормальный закон распределения оси абсцисс. Каково должно быть среднее квадратическое отклонение о случайной величины X для того, чтобы вероятность попадания р на участок Нормальный закон распределения достигала максимума?

Решение:

Имеем:

Нормальный закон распределения

Продифференцируем эту функцию величины Нормальный закон распределения:

Нормальный закон распределения

Применяя правило дифференцирования интеграла по переменной, входящей в его предел, получим:

Нормальный закон распределения

Аналогично

Нормальный закон распределения

Для нахождения экстремума положим:

Нормальный закон распределения

При Нормальный закон распределения это выражение обращается в нуль и вероятность р достигает минимума. Максимум р получим из условия Нормальный закон распределения(6.3.13)

Уравнение (6.3.13) можно решить численно или графически.

6.4. Вероятное (срединное) отклонение

В ряде областей практических применений теории вероятностей (в частности, в теории стрельбы) часто, наряду со средним квадратическим отклонением, пользуются еще одной характеристикой рассеивания, так называемым вероятным, или срединным, отклонением. Вероятное отклонение обычно обозначается буквой Е (иногда В).

Вероятным (срединным) отклонением случайной величины X, распределенной по нормальному закону, называется половина длины участка, симметричного относительно центра рассеивания, вероятность попадания в который равна половине.

Геометрическая интерпретация вероятного отклонения показана на рис. 6.4.1. Вероятное отклонение Е — это половина длины участка оси абсцисс, симметричного относительно точки m, на кото- который опирается половина площади кривой распределения.

Поясним смысл термина «срединное отклонение» или «срединная ошибка», которым часто пользуются в артиллерийской практике вместо «вероятного отклонения».

Рассмотрим случайную величину X, распределенную по нормальному закону. Вероятность того, что она отклонится от центра рассеивания m меньше чем на Е, по определению вероятного отклонения Е, равна Нормальный закон распределения

Нормальный закон распределения(6.4.1)

Вероятность того, что она отклонится от m больше чем на Е, тоже равна Нормальный закон распределения

Нормальный закон распределения

Таким образом, при большом числе опытов в среднем половина значений случайной величины X отклонится от m больше чем на Е, а половина — меньше. Отсюда и термины «срединная ошибка», «срединное отклонение».

Очевидно, вероятное отклонение, как характеристика рассеивания, должно находиться в прямой зависимости от среднего rвадратического отклонения Нормальный закон распределения. Установим эту зависимость. Вычислим вероятность события | X — m | < Е в уравнении (6.4.1) по формуле (6.3.10). Имеем:

Нормальный закон распределения

Отсюда

Нормальный закон распределения

Нормальный закон распределения

По таблицам функции Ф* (х) можно найти такое значение аргумента х, при котором она равна 0,75. Это значение аргумента приближенно равно 0,674; отсюда

Нормальный закон распределения(6.4.3)

Таким образом, зная значение Нормальный закон распределения, можно сразу найти пропорциональное ему значение Е. Часто пользуются еще такой формой записи этой зависимости:

Нормальный закон распределения(6.4.4)

где р — такое значение аргумента, при котором одна из форм интеграла вероятностей — так называемая функция Лапласа Нормальный закон распределения

— равна половине. Численное значение величины р приближенно равно 0,477.

В настоящее время вероятное отклонение, как характеристика рассеивания, все больше вытесняется более универсальной характеристикой Нормальный закон распределения. В ряде областей приложений теории вероятностей она сохраняется лишь по традиции.

Если в качестве характеристики рассеивания принято вероятное отклонение Е, то плотность нормального распределения записывается в виде:

Нормальный закон распределения(6.4.5)

а вероятность попадания на участок от а до Нормальный закон распределения чаще всего записывается в виде:

Нормальный закон распределения

где

Нормальный закон распределения— так называемая приведенная функция Лапласа. Нормальный закон распределения

Сделаем подсчет, аналогичный выполненному в предыдущем п° для среднего квадратического отклонения Нормальный закон распределения: отложим от центра рассеивания т. последовательные отрезки длиной в одно вероятное отклонение Е (рис. 6.4.2) и подсчитаем вероятности попа- попадания в эти отрезки с точностью до 0,01. Получим: Нормальный закон распределения

Отсюда видно, что с точностью до 0,01 все значения нормально распределенной случайной величины укладываются на участке Нормальный закон распределения

Пример:

Самолет-штурмовик производит обстрел колонны войск противника, ширина которой’ равна 8 м. Полет — вдоль колонны, прицеливание— по средней линии колонны; вследствие скольжения имеется систематическая ошибка: 2 м вправо но направлению полета. Главные вероятные отклонения: по направлению полета Нормальный закон распределения = 15 м, в боковом направлении Нормальный закон распределения = 5 М. Не имея в своем распоряжении никаких таблиц интеграла вероятностей, а зная только числа:

25%, 16%, 7%, 2%,

оценить грубо-приближенно вероятность попадания в колонну при одном выстреле и вероятность хотя бы одного попадания при трех независимых выстрелах.

Решение:

Для решения задачи достаточно рассмотреть одну координату точки попадания — абсциссу X в направлении, перпендикулярном колонне. Эта абсцисса распределена по нормальному закону с центром рассеивания m = 2 и вероятным отклонением Нормальный закон распределения =Е = 5 (м). Отложим мысленно от центра рассеивания в ту и другую сторону отрезки длиной в 5 м. Вправо от центра рассеивания цель занимает участок 2 м, который составляет 0,4 вероятного отклонения. Вероятность попадания на этот участок приближенно равна:

0,4-25% =0,1.

Влево от центра рассеивания цель занимает участок б м. Это — целое вероятное отклонение E м), вероятность попадания в которое равна 25% плюс часть длиной 1 м следующего (второго от центра) вероятного отклонения, вероятность попадания в которое равна 16%. Вероятность попадания в часть длиной 1 м приближенно равна: Нормальный закон распределения

Таким образом, вероятность попадания в колонну приближенно равна:

0,1+0,25 + 0,03 = 0,38.

Вероятность хотя бы одного попадания при трех выстрелах равна: Нормальный закон распределения

Закон нормального распределения случайных величин

Закон нормального распределения случайных величин

Закон нормального распределения случайных величин

Закон нормального распределения случайных величин

Закон нормального распределения случайных величин

Закон нормального распределения случайных величин

Закон нормального распределения случайных величин

Смотрите также:

Решение заданий и задач по предметам:

  • Теория вероятностей
  • Математическая статистика

Дополнительные лекции по теории вероятностей:

  1. Случайные события и их вероятности
  2. Случайные величины
  3. Функции случайных величин
  4. Числовые характеристики случайных величин
  5. Законы больших чисел
  6. Статистические оценки
  7. Статистическая проверка гипотез
  8. Статистическое исследование зависимостей
  9. Теории игр
  10. Вероятность события
  11. Теорема умножения вероятностей
  12. Формула полной вероятности
  13. Теорема о повторении опытов
  14. Определение законов распределения случайных величин на основе опытных данных
  15. Системы случайных величин
  16. Нормальный закон распределения для системы случайных величин
  17. Вероятностное пространство
  18. Классическое определение вероятности
  19. Геометрическая вероятность
  20. Условная вероятность
  21. Схема Бернулли
  22. Многомерные случайные величины
  23. Предельные теоремы теории вероятностей
  24. Оценки неизвестных параметров
  25. Генеральная совокупность

Содержание:

Нормальный закон распределения:

Нормальный закон распределения имеет плотность вероятности

Нормальный закон распределения - определение и вычисление с примерами решения

где Нормальный закон распределения - определение и вычисление с примерами решения

График функции плотности вероятности (2.9.1) имеет максимум в точке Нормальный закон распределения - определение и вычисление с примерами решения а точки перегиба отстоят от точки Нормальный закон распределения - определение и вычисление с примерами решения на расстояние Нормальный закон распределения - определение и вычисление с примерами решения При Нормальный закон распределения - определение и вычисление с примерами решения функция (2.9.1) асимптотически приближается к нулю (ее график изображен на рис. 2.9.1).

Нормальный закон распределения - определение и вычисление с примерами решения

Помимо геометрического смысла, параметры нормального закона распределения имеют и вероятностный смысл. Параметр Нормальный закон распределения - определение и вычисление с примерами решения равен математическому ожиданию нормально распределенной случайной величины, а дисперсия Нормальный закон распределения - определение и вычисление с примерами решения Если Нормальный закон распределения - определение и вычисление с примерами решения т.е. X имеет нормальный закон распределения с параметрами Нормальный закон распределения - определение и вычисление с примерами решения и Нормальный закон распределения - определение и вычисление с примерами решения то Нормальный закон распределения - определение и вычисление с примерами решения

где Нормальный закон распределения - определение и вычисление с примерами решения– функция Лапласа

Значения функции Нормальный закон распределения - определение и вычисление с примерами решения можно найти по таблице (см. прил., табл. П2). Функция Лапласа нечетна, т.е. Нормальный закон распределения - определение и вычисление с примерами решения Поэтому ее таблица дана только для неотрицательныхНормальный закон распределения - определение и вычисление с примерами решения График функции Лапласа изображен на рис. 2.9.2. При значениях Нормальный закон распределения - определение и вычисление с примерами решения она практически остается постоянной. Поэтому в таблице даны значения функции только для Нормальный закон распределения - определение и вычисление с примерами решения При значениях Нормальный закон распределения - определение и вычисление с примерами решения можно считать, что Нормальный закон распределения - определение и вычисление с примерами решения

Нормальный закон распределения - определение и вычисление с примерами решения

Если Нормальный закон распределения - определение и вычисление с примерами решения то

Нормальный закон распределения - определение и вычисление с примерами решения

Пример:

Случайная величина X имеет нормальный закон распределения Нормальный закон распределения - определение и вычисление с примерами решения Известно, что Нормальный закон распределения - определение и вычисление с примерами решения а Нормальный закон распределения - определение и вычисление с примерами решенияНормальный закон распределения - определение и вычисление с примерами решения Найти значения параметров Нормальный закон распределения - определение и вычисление с примерами решения и Нормальный закон распределения - определение и вычисление с примерами решения

Решение. Воспользуемся формулой (2.9.2): Нормальный закон распределения - определение и вычисление с примерами решения

Так как Нормальный закон распределения - определение и вычисление с примерами решения По таблице функции Лапласа (см. прил., табл. П2) находим, что Нормальный закон распределения - определение и вычисление с примерами решения Нормальный закон распределения - определение и вычисление с примерами решения Поэтому Нормальный закон распределения - определение и вычисление с примерами решения или Нормальный закон распределения - определение и вычисление с примерами решения

Аналогично Нормальный закон распределения - определение и вычисление с примерами решения Так как Нормальный закон распределения - определение и вычисление с примерами решения то Нормальный закон распределения - определение и вычисление с примерами решения По таблице функции Лапласа (см. прил., табл. П2) находим, что Нормальный закон распределения - определение и вычисление с примерами решения Поэтому Нормальный закон распределения - определение и вычисление с примерами решения или Нормальный закон распределения - определение и вычисление с примерами решения Из системы двух уравнений Нормальный закон распределения - определение и вычисление с примерами решения и Нормальный закон распределения - определение и вычисление с примерами решения находим, что Нормальный закон распределения - определение и вычисление с примерами решения а  Нормальный закон распределения - определение и вычисление с примерами решения т.е. Нормальный закон распределения - определение и вычисление с примерами решения Итак, случайная величина X имеет нормальный закон распределения N(3;4).

График функции плотности вероятности этого закона распределения изображен на рис. 2.9.3.

Нормальный закон распределения - определение и вычисление с примерами решения

Ответ. Нормальный закон распределения - определение и вычисление с примерами решения

Пример:

Ошибка измерения X имеет нормальный закон распределения, причем систематическая ошибка равна 1 мк, а дисперсия ошибки равна 4 мк2. Какова вероятность того, что в трех независимых измерениях ошибка ни разу не превзойдет по модулю 2 мк?

Решение. По условиям задачи Нормальный закон распределения - определение и вычисление с примерами решения Вычислим сначала вероятность того, что в одном измерении ошибка не превзойдет 2 мк. По формуле (2.9.2)Нормальный закон распределения - определение и вычисление с примерами решения

Вычисленная вероятность численно равна заштрихованной площади на рис. 2.9.4.

Нормальный закон распределения - определение и вычисление с примерами решения

Каждое измерение можно рассматривать как независимый опыт. Поэтому по формуле Бернулли (2.6.1) вероятность того, что в трех независимых измерениях ошибка ни разу не превзойдет 2 мк, равна Нормальный закон распределения - определение и вычисление с примерами решенияНормальный закон распределения - определение и вычисление с примерами решения

Ответ. Нормальный закон распределения - определение и вычисление с примерами решения

Пример:

Функция плотности вероятности случайной величины X имеет вид Нормальный закон распределения - определение и вычисление с примерами решения

Требуется определить коэффициент Нормальный закон распределения - определение и вычисление с примерами решения найти Нормальный закон распределения - определение и вычисление с примерами решения и Нормальный закон распределения - определение и вычисление с примерами решения определить тип закона распределения, нарисовать график функции Нормальный закон распределения - определение и вычисление с примерами решения вычислить вероятность Нормальный закон распределения - определение и вычисление с примерами решения

Замечание. Если каждый закон распределения из некоторого семейства законов распределения имеет функцию распределения , Нормальный закон распределения - определение и вычисление с примерами решения где Нормальный закон распределения - определение и вычисление с примерами решения– фиксированная функция распределения, a Нормальный закон распределения - определение и вычисление с примерами решения Нормальный закон распределения - определение и вычисление с примерами решения то говорят, что эти законы распределения принадлежат к одному виду или типу распределений. Параметр Нормальный закон распределения - определение и вычисление с примерами решения называют параметром сдвига, Нормальный закон распределения - определение и вычисление с примерами решения – параметром масштаба.

Решение. Так как (2.9.4) функция плотности вероятности, то интеграл от нее по всей числовой оси должен быть равен единице: Нормальный закон распределения - определение и вычисление с примерами решения

Преобразуем выражение в показателе степени, выделяя полный квадрат: Нормальный закон распределения - определение и вычисление с примерами решения

Тогда (2.9.5) можно записать в виде Нормальный закон распределения - определение и вычисление с примерами решения

Сделаем замену переменных так, чтобы Нормальный закон распределения - определение и вычисление с примерами решения т.е. Нормальный закон распределения - определение и вычисление с примерами решения Пределы интегрирования при этом останутся прежними. Тогда (2.9.6) преобразуется к виду

Нормальный закон распределения - определение и вычисление с примерами решения

Умножим и разделим левую часть равенства на Нормальный закон распределения - определение и вычисление с примерами решения Получим равенство Нормальный закон распределения - определение и вычисление с примерами решения

Так как Нормальный закон распределения - определение и вычисление с примерами решения  как интеграл по всей числовой оси от функции плотности вероятности стандартного нормального закона распределения N(0,1), то приходим к выводу, что

Нормальный закон распределения - определение и вычисление с примерами решения

Поэтому

Нормальный закон распределения - определение и вычисление с примерами решения

Последняя запись означает, что случайная величина имеет нормальный закон распределения с параметрами Нормальный закон распределения - определение и вычисление с примерами решения и Нормальный закон распределения - определение и вычисление с примерами решения График функции плотности вероятности этого закона изображен на рис. 2.9.5. Распределение случайной величины X принадлежит к семейству нормальных законов распределения. По формуле (2.9.2)

Нормальный закон распределения - определение и вычисление с примерами решения

Ответ. Нормальный закон распределения - определение и вычисление с примерами решения

Пример:

Цех на заводе выпускает транзисторы с емкостью коллекторного перехода Нормальный закон распределения - определение и вычисление с примерами решения Сколько транзисторов попадет в группу Нормальный закон распределения - определение и вычисление с примерами решения если в нее попадают транзисторы с емкостью коллекторного перехода от 1,80 до 2,00 пФ. Цех выпустил партию в 1000 штук.

Решение.

Статистическими исследованиями в цеху установлено, что Нормальный закон распределения - определение и вычисление с примерами решения можно трактовать как случайную величину, подчиняющуюся нормальному закону.

Чтобы вычислить количество транзисторов, попадающих в группу Нормальный закон распределения - определение и вычисление с примерами решения необходимо учитывать, что вся партия транзисторов имеет разброс параметров, накрывающий всю (условно говоря) числовую ось. То есть кривая Гаусса охватывает всю числовую ось, центр ее совпадает с Нормальный закон распределения - определение и вычисление с примерами решения (т. к. все установки в цеху настроены на выпуск транзисторов именно с этой емкостью). Вероятность попадания отклонений параметров всех транзисторов на всю числовую ось равна 1. Поэтому нам необходимо фактически определить вероятность попадания случайной величины Нормальный закон распределения - определение и вычисление с примерами решения в интервал Нормальный закон распределения - определение и вычисление с примерами решения а затем пересчитать количество пропорциональной вероятности.

Для расчета этой вероятности надо построить математическую модель. Экспериментальные данные говорят о том, что нормальное распределение можно принять в качестве математической модели. Эмпирическая оценка (установлена статистическими исследованиями в цеху) среднего значения Нормальный закон распределения - определение и вычисление с примерами решения

дает Нормальный закон распределения - определение и вычисление с примерами решения оценка среднего квадратического отклонения Нормальный закон распределения - определение и вычисление с примерами решения

Обозначая Нормальный закон распределения - определение и вычисление с примерами решения подставим приведенные значения в (6.3):
Нормальный закон распределения - определение и вычисление с примерами решения

Тогда количество транзисторов Нормальный закон распределения - определение и вычисление с примерами решения попавших в интервал [1,8; 2,0] пФ, можно найти так: Нормальный закон распределения - определение и вычисление с примерами решения Таким образом можно планировать и рассчитывать количество транзисторов, попадающих в ту или иную группу.

Нормальное распределение и его свойства

Если выйти на улицу любого города и случайным образом выбранных прохожих спросить о том, какой у них рост, вес, возраст, доход, и т.п., а потом построить график любой из этих величин, например, роста… Но не будем спешить, сначала посмотрим, как можно построить такой график.

Сначала, мы просто запишем результаты своего исследования. Потом, мы отсортируем всех людей по группам, так чтобы каждый попал в свой диапазон роста, например, “от 180 до 181 включительно”.

После этого мы должны посчитать количество людей в каждой подгруппе-диапазоне, это будет частота попадания роста жителей города в данный диапазон. Обычно эту часть удобно оформить в виде таблички. Если затем эти частоты построить по оси у, а диапазоны отложить по оси х, можно получить так называемую гистограмму, упорядоченный набор столбиков, ширина которых равна, в данном случае, одному сантиметру, а длина будет равна той частоте, которая соответствует каждому диапазону роста. Если

Вам попалось достаточно много жителей, то Ваша схема будет выглядеть примерно так:

Нормальный закон распределения - определение и вычисление с примерами решения

Дальше можно уточнить задачу. Каждый диапазон разбить на десять, жителей рассортировать по росту с точностью до миллиметра. Диаграмма станет глаже, но уменьшится по высоте, “оплывет” вниз, т.к. в каждом маленьком диапазоне количество жителей уменьшается. Чтобы избежать этого, просто увеличим масштаб по вертикальной оси в 10 раз. Если гипотетически повторить эту процедуру несколько раз, будет вырисовываться та знаменитая колоколообразная фигура, которая характерна для нормального (или Гауссова) распределения. В результате, относительная частота встречаемости каждого конкретного диапазона роста может быть посчитана как отношение площади “ломтика” кривой, приходящегося на этот диапазон к площади подо всей кривой. Стандартизированные кривые нормального распределения, значения функций которых приводятся в таблицах книг по статистике, всегда имеют суммарную площадь под кривой равную единице. Это связано с тем, что, как Вы помните из курса теории вероятности, вероятность достоверного события всегда равна 100% (или единице), а для любого человека иметь хоть какое-то значение роста – достоверное событие. А вот вероятность того, что рост произвольного человека попадет в определенный выбранный нами диапазон, будет зависеть от трех факторов.

Во-первых, от величины такого диапазона – чем точнее наши требования, тем меньше вероятности, что нам повезет.

Во-вторых, от того, насколько “популярен” выбранный нами рост. Напомним, что мода – самое часто встречающееся значение роста. Кстати для нормального распределения мода, медиана и среднее значение совпадают. Кривая нормального распределения симметрична относительно среднего значения.

И, в-третьих, вероятность попадания роста в определенный диапазон зависит от характеристики рассеивания случайной величины. Отчасти это связано с единицами измерения (представьте, что мы бы измеряли людей в дюймах, а не в миллиметрах, но сами люди и их рост были бы теми же). Но дело не только в этом. Просто некоторые процессы кучнее группируются возле среднего значения, в то время как другие более разбросаны.

Например, рост собак и рост домашних кошек имеют разный разброс значений, их кривые нормального распределения будут выглядеть по-разному (напомним еще раз, что площадь под обеими кривыми будет единичной).

Так, кривая для роста кошек будет более узкой и высокой, а для роста собак кривая будет ниже и шире. Для характеристики разброса конечного ряда данных в прошлом разделе мы использовали величину среднего квадратического отклонения. Аналогичная величина используется для характеристики кривой нормального распределения. Она обозначается буквой s и называется в этом случае стандартным отклонением. Это очень важная величина для кривой нормального распределения. Кривая нормального распределения полностью задана, если известно среднее значение Нормальный закон распределения - определение и вычисление с примерами решения и отклонение s. Кроме того, любой житель города с вероятностью 68% попадет в диапазон роста Нормальный закон распределения - определение и вычисление с примерами решения с вероятностью 95% – в диапазон Нормальный закон распределения - определение и вычисление с примерами решенияНормальный закон распределения - определение и вычисление с примерами решения и с вероятностью 99,7% – в диапазон Нормальный закон распределения - определение и вычисление с примерами решения

Нормальный закон распределения - определение и вычисление с примерами решения

Для вычисления других значений вероятности, которые могут Вам понадобиться, можно воспользоваться приведенной таблицей:

Таблица вероятности попадания случайной величины в отмеченный (заштрихованный) диапазон

Нормальный закон распределения - определение и вычисление с примерами решения

Нормальный закон распределения

Нормальный закон распределения случайных величин, который иногда называют законом Гаусса или законом ошибок, занимает особое положение в теории вероятностей, так как 95 % изученных случайных величин подчиняются этому закону. Природа этих случайных величин такова, что их значение в проводимом эксперименте связано с проявлением огромного числа взаимно независимых случайных факторов, действие каждого из которых составляет малую долю их совокупного действия. Например, длина детали, изготавливаемой на станке с программным управлением, зависит от случайных колебаний резца в момент отрезания, от веса и толщины детали, ее формы и температуры, а также от других случайных факторов. По нормальному закону распределения изменяются рост и вес мужчин и женщин, дальность выстрела из орудия, ошибки различных измерений и другие случайные величины.

Определение: Случайная величина X называется нормальной, если она подчиняется нормальному закону распределения, т.е. ее плотность распределения задается формулойНормальный закон распределения - определение и вычисление с примерами решения – средне-квадратичное отклонение, a m = М[Х] – математическое ожидание.

Приведенная дифференциальная функция распределения удовлетворяет всем свойствам плотности вероятности, проверим, например, свойство 4.:

Нормальный закон распределения - определение и вычисление с примерами решения

Выясним геометрический смысл параметров Нормальный закон распределения - определение и вычисление с примерами решения Зафиксируем параметр Нормальный закон распределения - определение и вычисление с примерами решения и будем изменять параметр m. Построим графики соответствующих кривых (Рис. 8). Нормальный закон распределения - определение и вычисление с примерами решения

Рис. 8. Изменение графика плотности вероятности в зависимости от изменения математического ожидания при фиксированном значении средне-квадратичного отклонения. Из рисунка видно, кривая Нормальный закон распределения - определение и вычисление с примерами решения получается путем смещения кривой Нормальный закон распределения - определение и вычисление с примерами решения вдоль оси абсцисс на величину m, поэтому параметр m определяет центр тяжести данного распределения. Кроме того, из рисунка видно, что функция Нормальный закон распределения - определение и вычисление с примерами решения достигает своего максимального значения в точке Нормальный закон распределения - определение и вычисление с примерами решения Из этой формулы видно, что при уменьшении параметра Нормальный закон распределения - определение и вычисление с примерами решения значение максимума возрастает. Так как площадь под кривой плотности распределения всегда равна 1, то с уменьшением параметра Нормальный закон распределения - определение и вычисление с примерами решения кривая вытягивается вдоль оси ординат, а с увеличением параметра Нормальный закон распределения - определение и вычисление с примерами решения кривая прижимается к оси абсцисс. Построим график нормальной плотности распределения при m = 0 и разных значениях параметра Нормальный закон распределения - определение и вычисление с примерами решения (Рис. 9): Нормальный закон распределения - определение и вычисление с примерами решения

Рис. 9. Изменение графика плотности вероятности в зависимости от изменения средне-квадратичного отклонения при фиксированном значении математического ожидания.

Интегральная функция нормального распределения имеет вид: Нормальный закон распределения - определение и вычисление с примерами решения

График функции распределения имеет вид (Рис. 10): Нормальный закон распределения - определение и вычисление с примерами решения

Рис. 10. Графика интегральной функции распределения нормальной случайной величины.

Вероятность попадания нормальной случайной величины в заданный интервал

Пусть требуется определить вероятность того, что нормальная случайная величина попадает в интервал Нормальный закон распределения - определение и вычисление с примерами решения Согласно определениюНормальный закон распределения - определение и вычисление с примерами решения пересчитаем пределы интегрирования Нормальный закон распределения - определение и вычисление с примерами решения Нормальный закон распределения - определение и вычисление с примерами решения Следовательно,Нормальный закон распределения - определение и вычисление с примерами решения

Рассмотрим основные свойства функции Лапласа Ф(х):

  1. Ф(0) = 0 – график функции Лапласа проходит через начало координат.
  2. Ф (-х) = – Ф(х) – функция Лапласа является нечетной функцией, поэтому
  3. таблицы для функции Лапласа приведены только для неотрицательных значений аргумента.
  4. Нормальный закон распределения - определение и вычисление с примерами решения – график функции Лапласа имеет горизонтальные асимптотыНормальный закон распределения - определение и вычисление с примерами решения

Следовательно, график функции Лапласа имеет вид (Рис. 11): Нормальный закон распределения - определение и вычисление с примерами решения

Рис. 11. График функции Лапласа.

Пример №1

Закон распределения нормальной случайной величины X имеет вид: Нормальный закон распределения - определение и вычисление с примерами решения Определить вероятность попадания случайной величины X в интервал (-1;8).

Решение:

Согласно условиям задачи Нормальный закон распределения - определение и вычисление с примерами решения Поэтому искомая вероятность равна: Нормальный закон распределения - определение и вычисление с примерами решения 0,4772 + 0,3413 = 0,8185.

Вычисление вероятности заданного отклонения

Вычисление вероятности заданного отклонения. Правило Нормальный закон распределения - определение и вычисление с примерами решения.

Если интервал, в который попадает нормальная случайная величина X, симметричен относительно математического ожидания Нормальный закон распределения - определение и вычисление с примерами решения то, используя свойство нечетности функции Лапласа, получим

Нормальный закон распределения - определение и вычисление с примерами решения

Данная формула показывает, что отклонение случайной величины Х от ее математического ожидания на заданную величину l равна удвоенному значению функции Лапласа от отношения / к среднему квадратичному отклонению. Если положить Нормальный закон распределения - определение и вычисление с примерами решенияслучаях нормальная случайная величина X отличается от своего математического ожидания на величину равную среднему квадратичному отклонению. Если Нормальный закон распределения - определение и вычисление с примерами решения то вероятность отклонения равна Нормальный закон распределения - определение и вычисление с примерами решения Наконец, в случае Нормальный закон распределения - определение и вычисление с примерами решения то вероятность отклонения равна Нормальный закон распределения - определение и вычисление с примерами решения

Нормальный закон распределения - определение и вычисление с примерами решения Из последнего равенства видно, что только приблизительно в 0.3 % случаях отклонение нормальной случайной величины X от своего математического ожидания превышает Нормальный закон распределения - определение и вычисление с примерами решения Это свойство нормальной случайной величины X называется правилом “трех сигм”. На практике это правило применяется следующим образом: если отклонение случайной величины X от своего математического ожидания не превышает Нормальный закон распределения - определение и вычисление с примерами решения то эта случайная величина распределена по нормальному закону.

Показательный закон распределения

Определение: Закон распределения, определяемый фу нкцией распределения:

Нормальный закон распределения - определение и вычисление с примерами решения называется экспоненциальным или показательным.

График экспоненциального закона распределения имеет вид (Рис. 12): Нормальный закон распределения - определение и вычисление с примерами решения

Рис. 12. График функции распределения для случая экспоненциального закона.

Дифференциальная функция распределения (плотность вероятности) имеет вид: Нормальный закон распределения - определение и вычисление с примерами решения а ее график показан на (Рис. 13): Нормальный закон распределения - определение и вычисление с примерами решения

Рис. 13. График плотности вероятности для случая экспоненциального закона.

Пример №2

Случайная величина X подчиняется дифференциальной функции распределения Нормальный закон распределения - определение и вычисление с примерами решения Найти вероятность того, что случайная величина X попадет в интервал (2; 4), математическое ожидание M[Х], дисперсию D[X] и среднее квадратичное отклонение Нормальный закон распределения - определение и вычисление с примерами решения Проверить выполнение правила “трех сигм” для показательного распределения.

Решение:

Интегральная функция распределения Нормальный закон распределения - определение и вычисление с примерами решения следовательно, вероятность того, что случайная величина X попадет в интервал (2; 4), равна: Нормальный закон распределения - определение и вычисление с примерами решения Математическое ожидание Нормальный закон распределения - определение и вычисление с примерами решения Вычислим значение величины МНормальный закон распределения - определение и вычисление с примерами решения тогда дисперсия случайной величины X равна Нормальный закон распределения - определение и вычисление с примерами решения а средне-квадратичное

отклонение Нормальный закон распределения - определение и вычисление с примерами решения Для проверки правила “трех сигм” вычислим вероятность заданного отклонения:

Нормальный закон распределения - определение и вычисление с примерами решения

  • Основные законы распределения вероятностей
  • Асимптотика схемы независимых испытаний
  • Функции случайных величин
  • Центральная предельная теорема
  • Повторные независимые испытания
  • Простейший (пуассоновский) поток событий
  • Случайные величины
  • Числовые характеристики случайных величин

Содержание:

  1. Примеры с решением
  2. Нормальное распределение и его числовые характеристики
  3. Логарифмически-нормальное распределение

Нормальное распределение является наиболее распространенным типом распределения, предполагаемым в техническом анализе фондового рынка и в других видах статистического анализа. Стандартное нормальное распределение имеет два параметра: среднее значение и стандартное отклонение . Для нормального распределения 68% наблюдений находятся в пределах +/- одно стандартное отклонение от среднего значения, 95% находятся в пределах +/- два стандартных отклонения, а 99,7% находятся в пределах + – три стандартных отклонения.

Нормальное распределение

Определение:

Общим нормальным распределением вероя тностей непрерывной случайной величины Нормальное распределение называется распределение с плотностью Нормальное распределение

Нормальное распределение задается двумя параметрами: Нормальное распределение и Нормальное распределение.

Нормальное распределение

По определениям математического ожидания и дисперсии после выполнения соответствующих интегрирований можно вывести, что для нормального распределения справедливы формулы: Нормальное распределение

По этой ссылке вы найдёте полный курс лекций по высшей математике:

Определение:

Нормальное распределение с параметрами Нормальное распределение и Нормальное распределение называется нормированным; его плотность Нормальное распределение

Поскольку функция является четной, неопределенный интеграл от нее — нечетная функция, и потому вместо функции распределения используется функция Лапласа Нормальное распределение Функции табулированы Графики плотности нормального распределения для разных значений Нормальное распределение показаны на рис. 2.6. Нормальное распределение

Пусть случайная величина X задана плотностью нормального распределения ; тогда вероятность того, что Нормальное распределение примет значение на интервале Нормальное распределение согласно формулам равна: Нормальное распределение Преобразование этой формулы путем введения новой переменной интегрирования Нормальное распределение приводит к удобной вычислительной формуле Нормальное распределение где Нормальное распределение — функция Лапласа, определенная по формуле.

Возможно вам будут полезны данные страницы:

Модель нормального распределения мотивирована центральной предельной теоремой.

Теория утверждает, что средние значения, рассчитанные из независимых идентично распределенных случайных величин, имеют приблизительно нормальные распределения, независимо от типа распределения, из которого выбираются переменные (при условии, что они имеют конечную дисперсию). Нормальное распределение иногда путают с симметричным распределением. Симметричное распределение – это то, где разделительная линия создает два зеркальных изображения, но фактические данные могут быть двумя горбами или серией холмов в дополнение к кривой колокола, которая указывает на нормальное распределение.

Нормальное распределение

Примеры с решением

Пример 1.

Случайная величина распределена по нормальному закону с математическим ожиданием и средним квадратическим отклонением, соответственно равными 10 и 5. Найти вероятность того, что Нормальное распределение примет значение на интервале (20, 30).

Решение:

Воспользуемся формулой . По условию Нормальное распределение Нормальное распределение Следовательно, Нормальное распределение По табл. 2 приложения находим соответствующие значения функции Лапласа и окончательно получаем: Нормальное распределение

Пример 2.

Магазин продает мужские костюмы. По данным статистики, распределение по размерам является нормальным с математическим ожиданием и средним квадратическим отклонением, соответственно равным 48 и 2. Определить процент спроса на костюмы 50-го размера при условии разброса значений этого размера в интервале (49, 51).

Решение:

По условию задачи Нормальное распределение Используя формулу (2.66), получаем, что вероятность спроса на костюмы 50-го размера в заданном интервале равна: Нормальное распределение

Следовательно, спрос на костюмы 50-го размера составит около 24%, и магазину нужно предусмотреть это в общем объеме закупки.

Нормальное распределение и его числовые характеристики

ДСВ — дискретная случайная величина

НСВ — непрерывная случайная величина.

В этом подразделе мы создадим функцию распределения для каждого типа НСВ и создадим график, выясним числовые свойства этого типа НСВ и узнаем тип НСВ в реальных ситуациях из содержания задачи. вы будете учиться. Наиболее распространенным в природе, экономике, социологии и других науках является нормальное распределение непрерывных случайных величин.

Используя нормальное распределение, вы можете описать плотность вероятности НСВ, когда появляются отклонения от среднего случайного значения из-за различных явлений, действующих независимо друг от друга, но в одинаковой степени.

Чем больше случайных случайных величин добавлено, тем точнее результат. Все эти явления не зависят друг от друга, но, воздействуя на процесс изготовления примерно с одинаковой силой, обусловливают то, что закон, по которому изменяется НСВ (например, размер конкретной детали), описывается нормальным распределением.

Самое точное изготовление детали с заданными размерами — «эталон» — будет соответствовать математическому ожиданию т, разброс фактических значений случайной величины размера детали — понятию дисперсии (точнее — среднеквадратическому отклонению Нормальное распределение). Случайная величина с нормальным распределением существует в интервале Нормальное распределение и описывается законами: плотности вероятности Нормальное распределение называемой «кривой Гаусса» (рис. 2.9, а) Нормальное распределение где Нормальное распределение и Нормальное распределение — параметры нормального распределения, причем Нормальное распределение функции распределения Нормальное распределение (рис. 2.9, б):

Нормальное распределение

Рис. 2.9

Нормальное распределение

Подстановкой Нормальное распределение интеграл приводится к виду Нормальное распределение

Поэтому для удобства вводится нечетная функция Нормальное распределение Нормальное распределение называемая функцией Лапласа. Функцию Лапласа называют также «интегралом вероятности», или «функцией ошибок». Очевидно, что Нормальное распределение

Математическое ожидание Нормальное распределение случайной величины Нормальное распределение распределенной нормааьно, равно Нормальное распределение дисперсия равна Нормальное распределение поэтому параметр Нормальное распределение — среднеквадратическое отклонение.

Случайную величинуНормальное распределение распределенную нормально с параметрами Нормальное распределение и Нормальное распределение обозначают Нормальное распределение На практике для вычисления значений функции Лапласа используются таблицы, которые приводятся в справочной литературе (табл. П. 3). Вероятность попадания в интервал Нормальное распределение НСВ, распределенной по нормальному закону, можно найти с помощью функции Лапласа Нормальное распределение по формуле Нормальное распределение

Величины параметров нормального распределения СВ Нормальное распределение непосредственно влияют на форму кривой Нормальное распределение при Нормальное распределение она принимает максимальное значение, равное Нормальное распределение Поэтому с увесил личением (уменьшением) Нормальное распределение максимальная ордината убывает (возрастает) и кривая становится более пологой, приближаясь к оси Нормальное распределение

Величина математического ожидания Нормальное распределение влияет на расположение кривойНормальное распределение относительно оси ординат: при возрастании (убывании) Нормальное распределение кривая смещается вправо (влево). Поэтому с помощью подстановки Нормальное распределение можно получить функцию Нормальное распределение плотности вероятности, график которой симметричен относительно оси Нормальное распределение Такая кривая соответствует нормированному закону нормального распределения с параметрами Нормальное распределение и Нормальное распределение Величину Нормальное распределение называют стандартно нормальной. Ее функция распределения имеет вид Нормальное распределение

Логарифмически-нормальное распределение

Определение. Непрерывная случайная величина Нормальное распределение имеет логарифмически-нормальное (сокращенно логнормальное распределение), если ее логарифм подчинен нормальному закону. Так как при Нормальное распределение неравенства Нормальное распределение равносильны, то функция распределения логнормального распределения совпадает с функцией нормального распределения для случайной величины Нормальное распределение т.е. в соответствии с Нормальное распределение

Дифференцируя по Нормальное распределение получим выражение плотности вероятности для логнормального распределения Нормальное распределение

Нормальное распределение

(рис. 4.14).

Можно доказать, что числовые характеристики случайной величины Нормальное распределение распределенной по логнормальному закону, имеют вид: математическое ожидание Нормальное распределение дисперсия Нормальное распределение мода Нормальное распределение медиана Нормальное распределение Очевидно, чем меньше Нормальное распределение тем ближе друг к другу значения моды, медианы и математического ожидания, а кривая распределения — ближе к симметрии.

Если в нормальном законе параметр а выступает в качестве среднего значения случайной величины, то в логнормальном — в качестве медианы. Логнормальное распределение используется для описания распределения доходов, банковских вкладов, цен активов, месячной заработной платы, посевных площадей под разные культуры, долговечности изделий в режиме износа и старения и др.

Нормальное распределение, также известное как распределение Гаусса, является распределением вероятностей , симметричным относительно среднего значения, показывающим, что данные около среднего значения встречаются чаще, чем данные, далекие от среднего значения.

Нормальное распределение

Пример 3.

Проведенное исследование показало, что вклады населения в данном банке могут быть описаны случайной величиной Нормальное распределение распределенной по логнормальному закону с параметрами Нормальное распределение Найти: а) средний размер вклада; б) долю вкладчиков, размер вклада которых составляет не менее 1000 ден. ед.; в) моду и медиану случайной величины Нормальное распределение и пояснить их смысл.

Решение:

а) Найдем средний размер вклада, т.е. Нормальное распределение

б) Доля вкладчиков, размер вклада которых составляет не менее 1000 ден. ед., есть Нормальное распределение

При определении Нормальное распределение воспользуемся тем, что функция логнормального распределения случайной величины Нормальное распределение совпадает с функцией нормального распределения случайной величины Нормальное распределение т.е. с учетом имеем:

Нормальное распределение

Теперь Нормальное распределение

(рис. 4.15). Нормальное распределение

в) Вычислим моду случайной величины Нормальное распределение Нормальное распределение т.е. наиболее часто встречающийся банковский вклад равен 280 ден. ед. (точнее, наиболее часто встречающийся элементарный интервал с центром 280 ден. ед., т.е. интервал (Нормальное распределение Если исходить из вероятностного смысла параметра Нормальное распределение логнормального распределения, то медиана Нормальное распределение т.е. половина вкладчиков имеют вклады до 530 ден. ед., а другая половина — сверх 530 ден. ед.

Нормальное распределениеНормальное распределение

Лекции:

  • Площадь поверхности цилиндра
  • Найти определитель матрицы
  • Как привести к общему знаменателю
  • Геометрическое распределение
  • Замечательные пределы примеры решения
  • Формула Муавра
  • Интерполяция кусочно-полиномиальными функциями
  • Дисперсия случайной величины
  • Уравнение прямой
  • Найдите координаты точки пересечения прямых

Добавить комментарий