Как найти среднее квадратичное отклонение дискретной величины

Числовые характеристики дискретной случайной величины

В этом разделе:

  • Основная информация
  • Онлайн калькулятор
  • Полезные ссылки

Лучшее спасибо – порекомендовать эту страницу

Основная информация

Числовые характеристики дискретной случайной величины $X$, которые обычно требуется находить в учебных задачах по теории вероятностей, это математическое ожидание $M(X)$, дисперсия $D(X)$ и среднее квадратическое отклонение $sigma(X)$.

$$
M(X)=sum_{i=1}^{n}{x_i cdot p_i}.
$$
$$
D(X)=sum_{i=1}^{n}{x_i^2 cdot p_i}-left(sum_{i=1}^{n}{x_i cdot p_i} right)^2.
$$
$$
sigma(X) = sqrt{D(X)}.
$$

Подробные формулы и примеры расчета вы найдете по ссылкам в предыдущем абзаце, в этом же разделе вы сможете автоматически и бесплатно рассчитать эти значения с помощью онлайн-калькулятора, который даст не только ответ, но и продемонстрирует процесс вычисления.

Подробно решим ваши задачи по теории вероятностей

Калькулятор: числовые характеристики случайной величины

  • Введите число значений случайной величины К.
  • Появится форма ввода для значений $x_i$ и соответствующих вероятностей $p_i$ (десятичные дроби вводятся с разделителем точкой, например: -1.5 или 10.558). Введите нужные значения (убедитесь, что сумма вероятностей равна единице, то есть закон распределения задан верно).
  • Нажмите на кнопку “Вычислить”.
  • Калькулятор покажет процесс вычисления математического ожидания $M(X)$, дисперсии $D(X)$ и СКО $sigma(X)$.
  • Нужны еще расчеты? Вводите новые числа и нажимайте на кнопку.

Видео. Полезные ссылки

Видеоролики об СКО

На закуску для продвинутых – какие формулы вычисления СКО для выборок бывают и для чего подходят.

Полезная страница? Сохрани или расскажи друзьям

Полезные ссылки

  • Калькуляторы по теории вероятнстей
  • Онлайн учебник по ТВ
  • Примеры решений по теории вероятностей
  • Контрольные по теории вероятностей на заказ

А если у вас есть задачи, которые надо срочно сделать, а времени нет? Можете поискать готовые решения в решебнике или заказать в МатБюро:

Числовые характеристики распределения вероятностей. Математическое ожидание, дисперсия и стандартное отклонение

  1. Закон распределения дискретной случайной величины
  2. Математическое ожидание
  3. Дисперсия
  4. Среднее квадратичное отклонение
  5. Правило трёх сигм
  6. Примеры

п.1. Закон распределения дискретной случайной величины

Законом распределения дискретной случайной величины называют соответствие между полученными на опыте значениями этой величины X= {xi} и их вероятностями pi = P(xi).
При этом сумма всех вероятностей равна 1: (mathrm{sum_{i=1}^n p_i=1})
Закон распределения можно задать таблицей, графиком или аналитически (в виде формулы).

Например:
Закон распределения случайной величины X = {0;1;2;3}, равной числу выпадения орлов при 3 бросках монеты, аналитически задаётся формулой: $$ mathrm{ p_i=P(x_i)=P_3(i)=frac{C_3^{i}}{2^3}, i={0;1;2;3} } $$

В табличном виде:

xi

pi

0

1/8

1

3/8

2

3/8

3

1/8

В виде графика:

Закон распределения дискретной случайной величины

п.2. Математическое ожидание

Математическое ожидание дискретной случайной величины X = {xi} равно сумме произведений всех возможных значений xi на соответствующие вероятности pi: $$ mathrm{ M(X)=x_1p_1+x_2p_2+…+x_{n}p_{n}=sum_{i=1}^n x_{i}p_{i} } $$ Математическое ожидание является средним значением величины X.

Свойства математического ожидания
1) Размерность математического ожидания равна размерности случайной величины.
2) Математическое ожидание может быть любым действительным числом: положительным, равным 0, отрицательным.
3) Математическое ожидание постоянной величины равно этой постоянной:

M(C) = C

4) Математическое ожидание суммы независимых случайных величин равно сумме математических ожиданий:

M(X + Y) = M(X) + M(Y)

5) Математическое ожидание произведения двух независимых случайных величин равно произведению математических ожиданий:

M(XY) = M(X) · M(Y)

6) Постоянный множитель можно вынести за знак математического ожидания:

M(CX) = C · M(X)

Например:
Пусть в результате экспериментов получено следующее распределение случайной величины X – числа появления белых шаров (см. пример 1, §40 данного справочника):

Число белых шаров, xi 0 1 2 3 4 5
pi (mathrm{C_5^0q^5}) (mathrm{C_5^1pq^4}) (mathrm{C_5^2p^2q^3}) (mathrm{C_5^3p^3q^2}) (mathrm{C_5^4p^4q}) (mathrm{C_5^5p^5})
0,0074 0,0618 0,2060 0,3433 0,2861 0,0954

Найдём математическое ожидание для данного распределения:

M(X) = 0 · 0,0074 + 1 · 0,0618 + … + 5 · 0,0954 = 3,125

п.3. Дисперсия

Дисперсия дискретной случайной величины X = {xi} – это математическое ожидание квадрата отклонения случайной величины от её математического ожидания: $$ mathrm{ D(X)=M(X-M(X))^2 } $$ На практике дисперсия рассчитывается по формуле: $$ mathrm{ D(X)=M(X)^2-M^2(X)=sum_{i=1}^n x_i^2p_i-M^2(X) } $$

Свойства дисперсии
1) Размерность дисперсии равна квадрату размерности случайной величины.
2) Дисперсия может быть любым неотрицательным действительным числом.
3) Дисперсия постоянной величины равна нулю:

D(C) = 0

4) Дисперсия суммы независимых случайных величин равна сумме дисперсий:

D(X + Y) = D(X) + D(Y)

5) Постоянный множитель можно вынести за знак дисперсии:

D(CX) = C2 · D(X)

Например:
Продолжим исследование и найдём дисперсию для распределения случайной величины X – числа появления белых шаров. Составим расчётную таблицу:

pi

0,0074

0,0618

0,2060

0,3433

0,2861

0,0954

1

xip1

0

0,0618

0,4120

1,0300

1,1444

0,4768

3,125

(mathrm{x_i^2})

0

1

4

9

16

25

(mathrm{x_i^2p_i})

0

0,0618

0,8240

3,0899

4,5776

2,3842

10,9375

Получаем: D(X) = 10,9375 – 3,1252 ≈ 1,1719.

п.4. Среднее квадратичное отклонение

Среднее квадратичное отклонение (СКО) дискретной случайной величины X = {xi} – это корень квадратный от дисперсии: $$ mathrm{ sigma(X)=sqrt{D(X)} } $$ СКО характеризует степень отклонения случайной величины от среднего значения.

Свойства СКО
1) Размерность СКО равна размерности случайной величины.
2) СКО может быть любым неотрицательным действительным числом.
3) СКО постоянной величины равно нулю:

σ(C) = 0

4) Постоянный множитель можно вынести за знак СКО:

σ(CX) = C · σ(X)

п.5. Правило трёх сигм

Большое количество случайных величин, измеряемых в экспериментах (например, в школьных лабораторных работах), имеет так называемое нормальное распределение.
В частности, при больших n, биномиальное распределение можно с хорошей точностью описывать как нормальное с M(X) = np и (mathrm{sigma(X)=sqrt{npq}}).
График плотности нормального распределения p(x) похож на колокол, с максимумом, соответствующим M(X) = Xcp – среднему значению измеряемой величины.
Правило трёх сигм
Величина СКО σ(X) характеризует степень отклонения X от среднего значения M(X).

Если величина X имеет нормальное распределение, то в пределах
±σ лежит 68,26% значений, принимаемых этой величиной
±2σ лежит 95,44% значений, принимаемых этой величиной
±3σ лежит 99,72% значений, принимаемых этой величиной
Вероятность того, что нормально распределённая величина примет значение, отклоняющееся от среднего больше, чем на «три сигмы», равна 0,28%, т.е. пренебрежимо мала.

п.6. Примеры

Пример 1. Найдите математическое ожидание, дисперсию и СКО при бросании кубика.

Закон распределения величины X – очки на верхней грани при бросании кубика и расчётная таблица:

pi

1/6

1/6

1/6

1/6

1/6

1/6

1

xip1

1/6

1/3

1/2

2/3

5/6

1

3,5

(mathrm{x_i^2})

1

4

9

16

25

36

(mathrm{x_i^2p_i})

(mathrm{frac16})

(mathrm{frac23})

(mathrm{1frac12})

(mathrm{2frac23})

(mathrm{4frac16})

6

(mathrm{15frac16})

Получаем: begin{gather*} mathrm{ M(X)=sum_{i=1}^6 x_ip_i=3,5 }\ mathrm{ D(X)=sum_{i=1}^6 x_i^2p_i-M^2(X)=15frac16-3,5^3=2frac{11}{12} }\ mathrm{ sigma(X)=sqrt{D(X)}=sqrt{2frac{11}{12}}approx 1,7 } end{gather*} Ответ: (mathrm{M(X)=3,5; D(X)=2frac{11}{12}; sigma(X)approx 1,7}).

Пример 2*. Найти математическое ожидание, дисперсию и СКО суммы очков при бросании двух кубиков.

Используем свойства мат.ожиданий и дисперсий.
Пусть X – очки на первом кубике, Y – на втором.
Параметры распределения для каждого из кубиков рассчитаны в примере 1.
(mathrm{M(X)=M(Y)=3,5, D(X)=D(Y)=2frac{11}{12}}).
Для суммы очков получаем:
(mathrm{M(X+Y)=M(X)+M(Y)=3,5+3,5=7})
(mathrm{D(X+Y)=D(X)+D(Y)=2frac{11}{12}+2frac{11}{12}=5frac56})
(mathrm{sigma(X+Y)=sqrt{D(X+Y)}=sqrt{5frac56}approx 2,4})
Ответ: (mathrm{M(X+Y)=7; D(X+Y)=5frac56; sigma(X+Y)approx 2,4}).

Пример 3*. Докажите, что в опытах по схеме Бернулли математическое ожидание M(X)=np, а дисперсия D(X)=npq.

Проведем один опыт. В нём может быть только два исхода: «успех» и «неудача».
Составим расчётную таблицу:

(mathrm{x_i^2p_i})

0

p

p

Мат.ожидание первого опыта (mathrm{M(X)=sum x_ip_i=p}).
Общее число успехов при n опытах складывается из числа успехов при каждом опыте, т.е. (mathrm{X=X_1+X_2+…+X_n}). Все опыты между собой независимы.
По свойству мат.ожидания суммы независимых событий: begin{gather*} mathrm{ M(X)=M(X_1+X_2+…+X_n)=M(X_1)+M(X_2)+…+M(X_n)= }\ mathrm{=underbrace{p+p+…+p}_{n text{раз}}=np } end{gather*} Дисперсия первого опыта (mathrm{D(X)=sum x_i^2p_i-M(X)=p-p^2=p(1-p)=pq})
По свойству дисперсии суммы независимых событий: begin{gather*} mathrm{ D(X)=D(X_1+X_2+…+X_n)=D(X_1)+D(X_2)+…+D(X_n)= }\ mathrm{=underbrace{pq+pq+…+pq}_{n text{раз}}=npq } end{gather*} Что и требовалось доказать.

Пример 4. 100 канцелярских кнопок высыпали на стул. Вероятность, что кнопка упала острием вверх, равна 0,4. Найдите среднее количество, дисперсию и СКО для числа кнопок, упавших острием вверх. Найдите интервал оценки для количества этих кнопок по правилу «трёх сигм».

По условию n = 100, p = 0,4.
Для каждой кнопки может быть два исхода: упасть острием вверх или вниз.
Таким образом, это испытание Бернулли с биномиальным распределением случайной величины. begin{gather*} mathrm{ M(X)=np=100cdot 0,4=40 }\ mathrm{D(X)=npq=100cdot 0,4cdot 0,6=24 }\ mathrm{sigma(X)=sqrt{D(X)}=sqrt{24}approx 4,9} end{gather*} Интервал оценки «три сигмы»: begin{gather*} mathrm{ M(X)-3sigma(X)lt Xlt M(X)+3sigma(X) }\ mathrm{40-3cdot 4,9lt Xlt 40+3cdot 4,9 }\ mathrm{25,3lt Xlt 54,7}\ mathrm{26leq Xleq 54} end{gather*} Скорее всего (99,7%), от 26 до 54 кнопок будут острием вверх.
Ответ: (mathrm{M(X)=40; D(X)=24; sigma(X)approx 4,9; 26leq Xleq 54})

Пример 5*. В тесте 10 задач с 4 вариантами ответов. Ответы выбираются наугад. Постройте распределение величины X = «количество угаданных ответов», найдите числовые характеристики этого распределения.
Найдите интервал оценки для количества угаданных ответов по правилу «трёх сигм».
Какова вероятность угадать хотя бы 1 ответ? Хотя бы 5 ответов? Угадать все 10 ответов?

По условию: (mathrm{n=10, p=frac14, q=frac34}).
Для каждого ответа может быть два исхода: «угадал»/ «не угадал».
Таким образом, это испытание Бернулли с биномиальным распределением случайной величины. $$ mathrm{ P_{10}(k)=C_{10}^kp^kq^{10-k}=C_{10}^kfrac{3^{10-k}}{4^{10}}=left(frac34right)^{10}frac{C_{10}^k}{3^k} } $$ Строим расчётную таблицу. Для (mathrm{C_{10}^k}) используем рекуррентную формулу (см. §36 данного справочника): $$ mathrm{ C_{n}^k=frac{n-k+1}{k}C_n^{k-1} } $$

(mathrm{x_i=k}) (mathrm{C_k}) (mathrm{3^k}) (mathrm{p_i(x_i)}) (mathrm{x_icdot p_i}) (mathrm{x_i^2}) (mathrm{x_i^2cdot p_i})
0 1 1 0,0563135 0,0000000 0 0,0000000
1 10 3 0,1877117 0,1877117 1 0,1877117
2 45 9 0,2815676 0,5631351 4 1,1262703
3 120 27 0,2502823 0,7508469 9 2,2525406
4 210 81 0,1459980 0,5839920 16 2,3359680
5 252 243 0,0583992 0,2919960 25 1,4599800
6 210 729 0,0162220 0,0973320 36 0,5839920
7 120 2187 0,0030899 0,0216293 49 0,1514053
8 45 6561 0,0003862 0,0030899 64 0,0247192
9 10 19683 0,0000286 0,0002575 81 0,0023174
10 1 59049 0,0000010 0,0000095 100 0,0000954
Σ 1 2,5 8,125

Получаем: begin{gather*} mathrm{ M(X)=sum_{i=0}^{10} x_ip_i=2,5 }\ mathrm{ D(X)=sum_{i=0}^{10} x_i^2p_i-M^2(X)=8,125=2,5^2=1,875 }\ mathrm{ sigma(X)=sqrt{D(X)}=sqrt{1,875}approx 1,37 } end{gather*} Пример 5
Интервал оценки «три сигмы»: begin{gather*} mathrm{ M(X)-3sigma(X) lt Xlt M(X)+3sigma(X) }\ mathrm{ 2,5-3cdot 1,37lt X lt 2,5+3cdot 1,37 }\ mathrm{ -1,61lt Xlt 6,61 }\ mathrm{ 0leq Xleq 6 } end{gather*} Скорее всего (по расчетам – 99,65%), вы угадаете от 0 до 6 ответов.

Вероятность угадать хотя бы один ответ: begin{gather*} mathrm{ P(Xgeq 1)=1-p_0approx 1-0,0563=0,9437 }end{gather*} Очень хорошие шансы – 94,37%.
Вероятность угадать хотя бы 5 ответов: begin{gather*} mathrm{ P(Xgeq 5)=1-left(sum_{i=0}^{4}{p_i} right)approx 1-(0,0563+0,1877+…+0,1460)=0,0781 }end{gather*} Шансов мало – 7,81%. Т.е. «средний балл» при сдаче тестов мало достижим методом научного тыка.
Вероятность угадать все 10 ответов: p10≈ 0,000001. Шанс – один из миллиона.

Среднеквадрати́ческое отклонение (среднеквадрати́чное отклонение, стандартное отклонение[1]) — наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания (аналога среднего арифметического с бесконечным числом исходов). Обычно означает квадратный корень из дисперсии случайной величины, но иногда может означать тот или иной вариант оценки этого значения.

В литературе обычно обозначают греческой буквой sigma (сигма). В статистике принято два обозначения: sigma  — для генеральной совокупности и {displaystyle sd} (с англ. standard deviation — стандартное отклонение) — для выборки.

Варианты определения[править | править код]

Обычно определяется как квадратный корень из дисперсии случайной величины: {displaystyle sigma ={sqrt {D[X]}}}. Измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.

На практике, когда вместо точного распределения случайной величины в распоряжении имеется лишь выборка, стандартное отклонение, как и математическое ожидание, оценивают (выборочная дисперсия), и делать это можно разными способами. Термины «стандартное отклонение» и «среднеквадратическое отклонение» обычно применяют к квадратному корню из дисперсии случайной величины (определённому через её истинное распределение), но иногда и к различным вариантам оценки этой величины на основании выборки.

В частности, если x_{i} — i-й элемент выборки, n — объём выборки, {bar {x}} — среднее арифметическое выборки (выборочное среднее — оценка математического ожидания величины):

{displaystyle {bar {x}}={frac {1}{n}}sum _{i=1}^{n}x_{i}={frac {1}{n}}(x_{1}+ldots +x_{n})},

то два основных способа оценки стандартного отклонения записываются нижеследующим образом.

Оценка стандартного отклонения на основании смещённой оценки дисперсии (иногда называемой просто выборочной дисперсией[2]):

{displaystyle S={sqrt {{frac {1}{n}}sum _{i=1}^{n}left(x_{i}-{bar {x}}right)^{2}}}}.

Это в буквальном смысле среднее квадратическое разностей измеренных значений и среднего.

Оценка стандартного отклонения на основании несмещённой оценки дисперсии (подправленной выборочной дисперсии[2], в ГОСТ Р 8.736-2011 — «среднее квадратическое отклонение»):

{displaystyle S_{0}={sqrt {{frac {n}{n-1}}S^{2}}}={sqrt {{frac {1}{n-1}}sum _{i=1}^{n}left(x_{i}-{bar {x}}right)^{2}}}.}

Само по себе, однако, S_{0} не является несмещённой оценкой квадратного корня из дисперсии, то есть извлечение квадратного корня «портит» несмещённость.

Обе оценки являются состоятельными[2].

Кроме того, среднеквадратическим отклонением называют математическое ожидание квадрата разности истинного значения случайной величины и её оценки для некоторого метода оценки[3]. Если оценка несмещённая (выборочное среднее — как раз несмещённая оценка для случайной величины), то эта величина равна дисперсии этой оценки.

Среднее значение выборки также является случайной величиной с оценкой среднеквадратичного отклонения[3][нет в источнике]:

{displaystyle S_{bar {x}}=S_{0}/{sqrt {n}}={sqrt {{frac {1}{n(n-1)}}sum _{i=1}^{n}left(x_{i}-{bar {x}}right)^{2}}}.}

Правило трёх сигм[править | править код]

Правило трёх сигм ({displaystyle 3sigma }) гласит: вероятность того, что любая случайная величина отклонится от своего среднего значения менее чем на {displaystyle 3sigma }:

{displaystyle P(|xi -Exi mid <3sigma )geqslant {frac {8}{9}}}.

Практически все значения нормально распределённой случайной величины лежат в интервале {displaystyle left(mu -3sigma ;mu +3sigma right)}, где {displaystyle mu =Exi } — математическое ожидание случайной величины. Более строго — приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале.

Интерпретация[править | править код]

Большее значение среднеквадратического отклонения показывает больший разброс значений в представленном множестве со средней величиной множества; меньшее значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.

Например, для у всех трёх числовых множеств: {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8} средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения — значения внутри множества сильно расходятся со средним значением.

В общем смысле среднеквадратическое отклонение можно считать мерой неопределённости. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить.

Практическое применение[править | править код]

На практике среднеквадратическое отклонение позволяет оценить, насколько значения из множества могут отличаться от среднего значения.

Экономика и финансы[править | править код]

Среднее квадратическое отклонение доходности портфеля sigma ={sqrt {D[X]}} отождествляется с риском портфеля.

В техническом анализе среднеквадратическое отклонение используется для построения линий Боллинджера, расчёта волатильности.

Оценка рисков и критика[править | править код]

Среднеквадратическое отклонение широко распространено в финансовой сфере в качестве критерия оценки инвестиционного риска. По мнению американского экономиста Нассима Талеба, этого делать не следует. Так, по теории около двух третей изменений должны укладываться в определённые рамки (среднеквадратические отклонения −1 и +1) и что колебания свыше семи стандартных отклонений практически невозможны. Однако в реальной жизни, по мнению Талеба, всё иначе — скачки отдельных показателей могут превышать 10, 20, а иногда и 30 стандартных отклонений. Талеб считает, что риск-менеджерам следует избегать использования средств и методов, связанных со стандартными отклонениями, таких как регрессионные модели, коэффициент детерминации (R-квадрат) и бета-факторы. Кроме того, по мнению Талеба, среднеквадратическое отклонение — слишком сложный для понимания метод. Он считает, что тот, кто пытается оценить риск с помощью единственного показателя, обречён на неудачу[4].

Климат[править | править код]

Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой внутри континента. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.

Спорт[править | править код]

Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.

Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.

Пример[править | править код]

Предположим, что интересующая нас группа (генеральная совокупность) это класс из восьми учеников, которым выставляются оценки по 10-бальной системе. Так как мы оцениваем всю группу, а не её выборку, можно использовать стандартное отклонение на основании смещённой оценки дисперсии. Для этого берём квадратный корень из среднего арифметического квадратов отклонений величин от их среднего значения.

Пусть оценки учеников класса следующие:

{displaystyle 2, 4, 4, 4, 5, 5, 7, 9}.

Тогда средняя оценка равна:

{displaystyle mu ={frac {2+4+4+4+5+5+7+9}{8}}=5}.

Вычислим квадраты отклонений оценок учеников от их средней оценки:

{displaystyle {begin{array}{lll}(2-5)^{2}=(-3)^{2}=9&&(5-5)^{2}=0^{2}=0\(4-5)^{2}=(-1)^{2}=1&&(5-5)^{2}=0^{2}=0\(4-5)^{2}=(-1)^{2}=1&&(7-5)^{2}=2^{2}=4\(4-5)^{2}=(-1)^{2}=1&&(9-5)^{2}=4^{2}=16\end{array}}}

Среднее арифметическое этих значений называется дисперсией:

{displaystyle sigma ^{2}={frac {9+1+1+1+0+0+4+16}{8}}=4}

Стандартное отклонение равно квадратному корню дисперсии:

{displaystyle sigma ={sqrt {4}}=2}

Эта формула справедлива только если эти восемь значений и являются генеральной совокупностью. Если бы эти данные были случайной выборкой из какой-то большой совокупности (например, оценки восьми случайно выбранных учеников большого города), то в знаменателе формулы для вычисления дисперсии вместо n = 8 нужно было бы поставить n − 1 = 7:

{displaystyle sigma ^{2}={frac {9+1+1+1+0+0+4+16}{7}}approx 4{,}57}

и стандартное отклонение равнялось бы:

{displaystyle sigma ={sqrt {4{,}57}}approx 2{,}14}

Этот результат называется стандартным отклонением на основании несмещённой оценки дисперсии. Деление на n − 1 вместо n даёт неискажённую оценку дисперсии для больших генеральных совокупностей.

Примечания[править | править код]

  1. Встречаются также различные синонимы: среднее квадратическое отклонение, стандартный разброс, стандартная неопределённость; термин «среднее квадратическое» означает «среднее степени 2»
  2. 1 2 3 Ивченко Г. И., Медведев Ю. И. Введение в математическую статистику. — М. : Издательство ЛКИ, 2010. — §2.2. Выборочные моменты: точная и асимптотическая теория. — ISBN 978-5-382-01013-7.
  3. 1 2 C. Patrignani et al. (Particle Data Group). 39. STATISTICS. — В: Review of Particle Physics // Chin. Phys. C. — 2016. — Vol. 40. — P. 100001. — doi:10.1088/1674-1137/40/10/100001.
  4. Талеб, Гольдштейн, Шпицнагель, 2022, с. 46.

Литература[править | править код]

  • Боровиков В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов / В. Боровиков. — СПб.: Питер, 2003. — 688 с. — ISBN 5-272-00078-1..
  • Нассим Талеб, Дениэл Гольдштейн, Марк Шпицнагель. Шесть ошибок руководителей компаний при управлении рисками // Управление рисками (Серия «Harvard Business Review: 10 лучших статей») = On Managing Risk / Коллектив авторов. — М.: Альпина Паблишер, 2022. — С. 41—50. — 206 с. — ISBN 978-5-9614-8186-0.

Среднеквадратическое отклонение случайной величины (или СКО случайной величины показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения. 

Обозначение: σ(X), σ

В регрессионном анализе СКО характеризует достоверность линии тренда для прогнозирования.

Среднеквадратическое отклонение связано с дисперсией случайной величины X и эта связь выражается в виде формулы для определения среднего квадратического отклонения:

Среднеквадратическое отклонение случайной величины формула

Ряд распределения задан в виде таблицы 1

Найти дисперсию и среднее квадратическое отклонение:

Решение

D(X) = M(X2) — M2(X) 

  Вычисляем математическое ожидание

  М(Х)=3·0,2+4·0,5+5·0,3=

=0,6+2,0+1,5=4,1

  Представим закон распределения дискретной случайной величины для X2 в виде таблицы 2:

Найдем М(Х2) исходя из таблицы 2:

М(Х2)=9·0,2+16·0,5 +25·0,3=

=1,8+8+7,5=17,3

Дисперсия СВ равна:

   D(X) = M(X2)-M2(X)=

=17,3-(4,1)2 =0,49

Извлекая корень квадратный из дисперсии, найдём среднеквадратическое отклонение случайной величины:

Среднеквадратическое отклонение случайной величины формула пример с решением

17102


Добавить комментарий