Как найти ско погрешности методики

Добрый день!

По результатам проверки нашего подразделения одним из замечаний стало то, что результаты анализов выдаются в протоколе без ошибки. То есть не указывается «плюс/минус некая погрешность». Метод, по которому проводится анализ, гостированный (ГОСТ 7847-73 анализ пека), там указаны только параметры сходимости и воспроизводимости.

Наш оператор проводит два измерения подряд (n=2), смотрит, чтобы полученные цифры меж собой не расходились более заданной планки, и выдает среднее арифметическое как результат (собственно строго по ГОСТ). Условий воспроизводимости, как таковой, у нас нет: оператор один и оборудование одно.

Однако, аудитор, когда объясняла, в чем суть замечания привела пример расчета для нашего случая :

Ошибка (Δ)=Ϭсходимостивоспроизводимости =2* Ϭсходимости

D (норматив, который как я понимаю, и указан в ГОСТ)=2,77* Ϭсходимости или же Ϭсходимости= D/2,77 отсюда следует:

Δ=2* Ϭсходимости=2* D/2,77 (и вот этот результат мол и пойдет как «плюс/ минус» к среднему арифметическому в протокол)

Я же не могу понять, почему в нашем случае ошибка это:

(Δ)=Ϭсходимостивоспроизводимости =2* Ϭсходимости,

т.е. почему воспроизводимость приравняли к сходимости. Аналитики, сказали, что стоит брать просто цифру из госта и не проводить никаких расчетов. Я же думаю, что норматив сходимости и ошибка(погрешность) – это все же разные понятия.

Скажите, пожалуйста, сталкивались ли вы с расчетами погрешностей по гостированным методам? Если бы вас попросили указать ошибку «плюс/минус» в протокол по ГОСТ 7847-73, то каким образом от понятий сходимости и воспроизводимости, вы бы перешли непосредственно к погрешности измерения?

Заранее большое спасибо.

10.1 Основы теории суммирования погрешностей

Определение расчетным путем
оценки результирующей погреш­ности
по известным оценкам ее составляющих
называется суммированием
погрешностей
.

Главной проблемой,
возникающей при суммировании, являет­ся
то, что все составляющие погрешности
должны рассматриваться как случайные
величины.
С точки
зрения теории вероятностей они наиболее
полно могут быть описаны своими законами
распределе­ния, а их совместное
действие – соответствующим многомерным
распределением. Однако в такой постановке
задача суммирования погрешностей
практически не разрешима уже для
нескольких со­ставляющих, не говоря
о нескольких десятках.

Практически приемлемый
путь решения данной задачи сумми­рования
погрешностей состоит в отказе от
определения и использо­вания многомерных
функций распределения составляющих
погреш­ности. Необходимо подобрать
для характеристик составляющих такие
числовые оценки (СКО, эксцесс и др.),
оперируя с которыми можно было бы
получить соответствующие числовые
оценки ре­зультирующей погрешности.
При этом следует
учитывать, что:

• отдельные составляющие
погрешности могут быть коррелированны
между собой;

• при суммировании случайных величин
их законы распределе­ния существенно
деформируются, т.е. форма закона суммы
может резко отличаться от формы закона
распределения составляющих.

Правила суммирования
погрешностей основываются на том, что
погрешность по абсолютному значению
всегда много меньше са­мой измеряемой
величины. Поэтому изменение погрешности
в зави­симости от изменения измеряемой
величины может быть учтено, если все
суммируемые случайные и систематические
составляющие пог­решности разделить
на аддитивные и
мультипликативные
.
Сумма аддитивных составляющих даст
значение аддитивной части результи­рующей
погрешности, а сумма мультипликативных
составляющих – значение мультипликативной
части результирующей погрешности.

В пределах некоторого
диапазона изменения, как правило,
де­сятикратного, измеряемой величины
изменение результирующей погрешности
может быть с достаточной степенью
точности пред­ставлено прямой линией
или простейшей кривой (парабола,
гипер­бола). Это дает возможность
описать результирующую погрешность
линейной или нелинейной двухзвенной
формулой. При большем из­менении
измеряемой величины весь диапазон
разбивается на учас­тки, для которых
и определяются крайние погрешности.

Пример 10.1
Основная допускаемая погрешность
измерения сопротивле­ния цифрового
микропроцессорного измерителя иммитанса
марки Е7-14 при различных диапазонах
измерения и добротностях
Q
приведена в таблице.

Диапазон измерения

Конечное значение диапазона Rk,
Ом

Предел допустимого значения основной
погрешности, Ом.

0,1…1000мОм

1

10–3(1+Q)R+3·10–4Rk

0,001…10 Ом

10

10–3(1+Q)R+2·10–4Rk

0,01…100 Ом

100

10–3(1+Q)R+2·10–4Rk

100…1000 Ом

1000

[10–3(1+Q)R+2·10–3
R/Rk]R

1…10кОм

10000

[10–3(1+Q)R+2·10–3
R/Rk]R

Для устранения влияния
деформации формы законов распреде­ления
все суммируемые составляющие исходно
представляются сво­ими СКО и все
операции расчетного суммирования
проводятся только над ними. Учет взаимных
корреляционных связей между сумми­руемыми
составляющими производится путем
использования раз­личных правил
суммирования для жестко и слабо
коррелирован­ных составляющих. Эти
правила рассмотрены далее.

В результате суммирования
СКО составляющих получаются сред­ние
квадратические отклонения соответственно
аддитивной, муль­типликативной или
нелинейной составляющих результирующей
погрешности. СКО аддитивной составляющей
результирующей пог­решности будет
характеризовать результирующую
погрешность в начале диапазона. Сумма
СКО аддитивной и мультипликативной
составляющих в конце диапазона описывает
результирующую пог­решность в конце
диапазона. Если участков несколько, то
сумми­рование проводится на всех
участках, а затем принимается реше­ние
о методе описания результирующей
погрешности.

Результирующую погрешность
необходимо выразить в виде до­верительного
интервала. Его расчет по полученному
СКО является с точки зрения теории самой
трудной операцией при суммирова­нии
погрешностей. Это связано с тем, что
доверительный интервал равен произведению
рассчитанного СКО и множителя, зависящего
от закона распределения результирующей
погрешности. В то же время вся излагаемая
методика с самого начала была нацелена
на то, чтобы обойтись без точного
определения результирующего за­кона
распределения суммы всех составляющих.

Практические правила
расчетного суммирования результирую­щей
погрешности состоят в следующем:

1. Для определения суммарного
значения СКО должны учиты­ваться
корреляционные связи различных
составляющих погреш­ности. В связи с
этим исходными данными для более точного
рас­чета должны служить оценки именно
всех отдельных составляющих погрешности,
а не оценки некоторых суммарных
погрешностей.

2. Для каждой составляющей должно быть
найдено ее СКО. В большинстве случаев
для этого необходимо знание или
предпол­ожение о виде закона ее
распределения.

3. Все суммируемые составляющие
разделяются на аддитивные и мультипликативные
составляющие, которые суммируются
отдель­но.

4. Так как в большинстве
случаев точное значение коэффициен­та
корреляции ρ
найти невозможно, то все погрешности
должны быть условно разделены на:

• сильно коррелированные
при 0,7
<1,

для которых счита­ют ρ
= ±1
в зависимости от
знака коэффициента корреляции;

• слабо коррелированные
при 0
0,7
,
для которых ρ
= 0.

5. Из суммируемых составляющих
выделяются группы сильно коррелированных
между собой погрешностей, и внутри этих
групп производится алгебраическое
суммирование их оценок.

6. После алгебраического
суммирования групп сильно коррели­рованных
погрешностей суммарные по группам и
оставшиеся вне групп погрешности можно
считать некоррелированными и склады­вать
по правилу геометрического суммирования.

Для определения СКО
суммарной погрешности при начальном
значении измеряемой величины складывают
лишь аддитивные со­ставляющие, а для
определения СКО погрешности в конце
диапа­зона изменения измеряемой
величины – все просуммированные выше
составляющие.

7. Для перехода от СКО
погрешности к доверительному значе­нию
должно быть вынесено суждение о форме
закона распределения результирующей
погрешности и тем самым выбрано значение
квантильного множителя.

Изложенная методика может
быть несколько упрощена. Самым сложным
в ней являются нахождение СКО всех
составляющих по известным их интервальным
оценкам и определение интервальной
оценки результирующей погрешности по
полученному СКО.

В обоих случаях необходимо
знание закона распределения пог­решностей.
Упрощение методики суммирования состоит
в том, что­бы сделать эти переходы по
возможности более простыми. Один из
вариантов состоит в следующем. Согласно
центральной предельной теореме, если
число суммируемых независимых составляющих
до­статочно велико (практически при
m
5)
и если среди этих состав­ляющих нет
существенно преобладающих над остальными,
то ре­зультирующий закон распределения
близок к нормальному. Однако предположение
о близости закона распределения к
нормальному без соответствующего
анализа достаточно рискованно даже и
при боль­шом числе суммируемых
составляющих. Тем не менее, при недо­статке
времени и невысоких требованиях к
точности получаемого результата
предположение о нормальности закона
распределения результирующей погрешности
вполне возможно. В этом случае
до­верительный интервал

,
где zр
– квантильный множитель, определяемый
через функцию Лапласа; SΣ
– суммарное СКО или его оценка.

Такой прием существенно
снижает трудоемкость расчетов, но может
вносить весьма значительные ошибки,
если реальное рас­пределение сильно
отличается от нормального закона.
Например, при фактическом арксинусоидальном
распределении ошибка мо­жет достигать
180 %. Поэтому использовать его надо весьма
ос­мотрительно.

В качестве другого пути
упрощения перехода от СКО результи­рующей
погрешности к ее интервальной оценке
следует указать воз­можность
использования доверительной вероятности
Рд
= 0,9
, при которой для
большой группы различных распределений
имеет мес­то соотношение

(10.1)

Действительно, для широкого
класса симмет­ричных, высокоэнтропийных
(k
>
1,7)
распределений, а именно для равномерного,
треугольного, трапецеидальных,
нормального, экспоненциальных с
показателем степени α
2/3,
двухмодальных с глубиной антимодальности
менее 1,5, интегральные кривые F(х)
в области 0,05 и 0,95 квантилей пересекаются
между собой в очень узком интервале
значений Х/S=
1,6 ± 0,05.
Поэтому с
погрешностью 0,05S
можно считать, что квантили 0,05 и 0,95 для
любых из этих распределений могут быть
найдены как

Х0,05
= Х
ц
– 1,6
S
и Х
0,95
= Х
ц
+ 1,6
S,

где Хц
– координата центра
распределения; SТ
– его СКО. Отсюда следу­ет, что значение
доверительного интервала, найденное
по формуле (10.1), для любого из названных
распределений является интервалом с
90%-ной доверительной вероятностью.

При Рд
> 0,9
интегральные
кривые для разных законов рас­пределения
резко расходятся между собой. В этом
случае для нахождения доверительного
интервала

вместо большого числа таблиц квантилей
разнообразных распре­делений нужно
найти для близких классов распределений
аппроксими­рующие выражения

,
где ε
– эксцесс распределения.

Для входящих в классы
экспоненциальных и трапецеидальных
распределений, а именно: распределения
Лапласа (ε
= 6
); нормаль­ного
распределения (ε
= 3
); трапецеидального
распределения с соот­ношением верхнего
и нижнего оснований 1:2 (ε
= 2) и равномерного распределения (ε
= 1,8
), зависимость
квантильного множителя от эксцесса и
доверительной вероятности аппроксимируется
уравнением

(10.2)

Погрешность аппроксимации
не превышает 4% при
изменении Р
от 0,9 до 0,99 и 8% – от 0,9 до 0,999.

Для кругловершинных
двухмодальных распределений,
представ­ляющих собой композицию
нормального и дискретного двузначного
распределений, в диапазоне изменения
ε
от 3 до 1,3 для Р
от 0,9 до 0,999 с погрешностью 10% зависимость

аппроксимирует­ся выражением

(10.3)

Для островершинных
двухмодальных распределений, образую­щихся
как композиция распределения Лапласа
и дискретного двуз­начного распределения,
рассматриваемая зависимость в интервале
значений ε
от 1,8 до 6 при Р
от 0,9 до 0,999 с погрешностью 5% аппроксимируется
формулой

(10.4)

Для уплощенных распределений,
образующихся как компози­ция
экспоненциального распределения с α
= 1/2
и равномерного
рас­пределения в интервале значений
ε
от 6 до 1,8 с погрешностью 8%, рассматриваемая
зависимость аппроксимируется формулой

(10.5)

Использование приведенных
уравнений позволяет, не прибегая к
таблицам, с достаточной для практики
степенью точности вычис­лять
доверительные интервалы для всех
встречающихся распреде­лений
погрешностей. Однако для выбора формулы
нужно вынести суждение о классе
распределения суммарной погрешности.

Дальнейшие упрощения
методики, выражающиеся в пренебре­жении
разделением погрешностей на аддитивные
и мультиплика­тивные, коррелированные
и некоррелированные, недопустимы,
пос­кольку при суммировании погрешностей
получены неверные результаты.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #


Загрузить PDF


Загрузить PDF

После сбора данных их нужно проанализировать. Обычно нужно найти среднее значение, квадратичное отклонение и погрешность. Мы расскажем вам, как это сделать.

  1. Изображение с названием Calculate Mean, Standard Deviation, and Standard Error Step 1

    1

    Запишите числовые значения, которые вы собираетесь анализировать. Мы проанализируем случайно подобранные числовые значения в качестве примера.

    • Например, 5 школьникам был предложен письменный тест. Их результаты (в баллах по 100 бальной системе): 12, 55, 74, 79 и 90 баллов.

    Реклама

  1. Изображение с названием Calculate Mean, Standard Deviation, and Standard Error Step 2

    1

    Для того чтобы посчитать среднее значение, нужно сложить все имеющиеся числовые значения и разделить получившееся число на их количество.

    • Среднее значение (μ) = Σ/N, где Σ сумма всех числовых значений, а N количество значений.
    • То есть, в нашем случае μ равно (12+55+74+79+90)/5 = 62.
  1. Изображение с названием Calculate Mean, Standard Deviation, and Standard Error Step 3

    1

    Мы будем считать среднее отклонение. Среднее отклонение = σ = квадратный корень из [(Σ((X-μ)^2))/(N)].

    • Для вышеуказанного примера это квадратный корень из [((12-62)^2 + (55-62)^2 + (74-62)^2 + (79-62)^2 + (90-62)^2)/(5)] = 27,4. (Обратите внимание, что если это выборочное среднеквадратическое отклонение, то делить нужно на N-1, где N количество значений.)

    Реклама

  1. Изображение с названием Calculate Mean, Standard Deviation, and Standard Error Step 4

    1

    Считаем среднюю погрешность (среднего значения). Это оценка того, насколько сильно округляется общее среднее значение. Чем больше числовых значений, тем меньше средняя погрешность, тем точнее среднее значение. Для расчета погрешности надо разделить среднее отклонение на корень квадратный от N. Стандартная погрешность = σ/кв.корень(n).

    • Если в нашем примере 5 школьников, а всего в классе 50 школьников, и среднее отклонение, посчитанное для 50 школьников равно 17 (σ = 21), средняя погрешность = 17/кв. корень(5) = 7.6.

Советы

  • Расчеты среднего значения, среднего отклонения и погрешности годятся для анализа равномерно распределенных данных. Среднее отклонение математического среднего значения распределения относится приблизительно к 68% данных, 2 средних отклонения – к 95% данных, а 3 – к 99.7% данных. Стандартная погрешность же уменьшается при увеличении количества значений.
  • Простой в использовании калькулятор для расчета среднего отклонения.

Реклама

Предупреждения

  • Считайте дважды. Все делают ошибки.

Реклама

Об этой статье

Эту страницу просматривали 66 238 раз.

Была ли эта статья полезной?

Среднеквадрати́ческое отклонение (среднеквадрати́чное отклонение, стандартное отклонение[1]) — наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания (аналога среднего арифметического с бесконечным числом исходов). Обычно означает квадратный корень из дисперсии случайной величины, но иногда может означать тот или иной вариант оценки этого значения.

В литературе обычно обозначают греческой буквой sigma (сигма). В статистике принято два обозначения: sigma  — для генеральной совокупности и {displaystyle sd} (с англ. standard deviation — стандартное отклонение) — для выборки.

Варианты определения[править | править код]

Обычно определяется как квадратный корень из дисперсии случайной величины: {displaystyle sigma ={sqrt {D[X]}}}. Измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.

На практике, когда вместо точного распределения случайной величины в распоряжении имеется лишь выборка, стандартное отклонение, как и математическое ожидание, оценивают (выборочная дисперсия), и делать это можно разными способами. Термины «стандартное отклонение» и «среднеквадратическое отклонение» обычно применяют к квадратному корню из дисперсии случайной величины (определённому через её истинное распределение), но иногда и к различным вариантам оценки этой величины на основании выборки.

В частности, если x_{i} — i-й элемент выборки, n — объём выборки, {bar {x}} — среднее арифметическое выборки (выборочное среднее — оценка математического ожидания величины):

{displaystyle {bar {x}}={frac {1}{n}}sum _{i=1}^{n}x_{i}={frac {1}{n}}(x_{1}+ldots +x_{n})},

то два основных способа оценки стандартного отклонения записываются нижеследующим образом.

Оценка стандартного отклонения на основании смещённой оценки дисперсии (иногда называемой просто выборочной дисперсией[2]):

{displaystyle S={sqrt {{frac {1}{n}}sum _{i=1}^{n}left(x_{i}-{bar {x}}right)^{2}}}}.

Это в буквальном смысле среднее квадратическое разностей измеренных значений и среднего.

Оценка стандартного отклонения на основании несмещённой оценки дисперсии (подправленной выборочной дисперсии[2], в ГОСТ Р 8.736-2011 — «среднее квадратическое отклонение»):

{displaystyle S_{0}={sqrt {{frac {n}{n-1}}S^{2}}}={sqrt {{frac {1}{n-1}}sum _{i=1}^{n}left(x_{i}-{bar {x}}right)^{2}}}.}

Само по себе, однако, S_{0} не является несмещённой оценкой квадратного корня из дисперсии, то есть извлечение квадратного корня «портит» несмещённость.

Обе оценки являются состоятельными[2].

Кроме того, среднеквадратическим отклонением называют математическое ожидание квадрата разности истинного значения случайной величины и её оценки для некоторого метода оценки[3]. Если оценка несмещённая (выборочное среднее — как раз несмещённая оценка для случайной величины), то эта величина равна дисперсии этой оценки.

Среднее значение выборки также является случайной величиной с оценкой среднеквадратичного отклонения[3][нет в источнике]:

{displaystyle S_{bar {x}}=S_{0}/{sqrt {n}}={sqrt {{frac {1}{n(n-1)}}sum _{i=1}^{n}left(x_{i}-{bar {x}}right)^{2}}}.}

Правило трёх сигм[править | править код]

Правило трёх сигм ({displaystyle 3sigma }) гласит: вероятность того, что любая случайная величина отклонится от своего среднего значения менее чем на {displaystyle 3sigma }:

{displaystyle P(|xi -Exi mid <3sigma )geqslant {frac {8}{9}}}.

Практически все значения нормально распределённой случайной величины лежат в интервале {displaystyle left(mu -3sigma ;mu +3sigma right)}, где {displaystyle mu =Exi } — математическое ожидание случайной величины. Более строго — приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале.

Интерпретация[править | править код]

Большее значение среднеквадратического отклонения показывает больший разброс значений в представленном множестве со средней величиной множества; меньшее значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.

Например, для у всех трёх числовых множеств: {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8} средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения — значения внутри множества сильно расходятся со средним значением.

В общем смысле среднеквадратическое отклонение можно считать мерой неопределённости. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить.

Практическое применение[править | править код]

На практике среднеквадратическое отклонение позволяет оценить, насколько значения из множества могут отличаться от среднего значения.

Экономика и финансы[править | править код]

Среднее квадратическое отклонение доходности портфеля sigma ={sqrt {D[X]}} отождествляется с риском портфеля.

В техническом анализе среднеквадратическое отклонение используется для построения линий Боллинджера, расчёта волатильности.

Оценка рисков и критика[править | править код]

Среднеквадратическое отклонение широко распространено в финансовой сфере в качестве критерия оценки инвестиционного риска. По мнению американского экономиста Нассима Талеба, этого делать не следует. Так, по теории около двух третей изменений должны укладываться в определённые рамки (среднеквадратические отклонения −1 и +1) и что колебания свыше семи стандартных отклонений практически невозможны. Однако в реальной жизни, по мнению Талеба, всё иначе — скачки отдельных показателей могут превышать 10, 20, а иногда и 30 стандартных отклонений. Талеб считает, что риск-менеджерам следует избегать использования средств и методов, связанных со стандартными отклонениями, таких как регрессионные модели, коэффициент детерминации (R-квадрат) и бета-факторы. Кроме того, по мнению Талеба, среднеквадратическое отклонение — слишком сложный для понимания метод. Он считает, что тот, кто пытается оценить риск с помощью единственного показателя, обречён на неудачу[4].

Климат[править | править код]

Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой внутри континента. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.

Спорт[править | править код]

Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.

Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.

Пример[править | править код]

Предположим, что интересующая нас группа (генеральная совокупность) это класс из восьми учеников, которым выставляются оценки по 10-бальной системе. Так как мы оцениваем всю группу, а не её выборку, можно использовать стандартное отклонение на основании смещённой оценки дисперсии. Для этого берём квадратный корень из среднего арифметического квадратов отклонений величин от их среднего значения.

Пусть оценки учеников класса следующие:

{displaystyle 2, 4, 4, 4, 5, 5, 7, 9}.

Тогда средняя оценка равна:

{displaystyle mu ={frac {2+4+4+4+5+5+7+9}{8}}=5}.

Вычислим квадраты отклонений оценок учеников от их средней оценки:

{displaystyle {begin{array}{lll}(2-5)^{2}=(-3)^{2}=9&&(5-5)^{2}=0^{2}=0\(4-5)^{2}=(-1)^{2}=1&&(5-5)^{2}=0^{2}=0\(4-5)^{2}=(-1)^{2}=1&&(7-5)^{2}=2^{2}=4\(4-5)^{2}=(-1)^{2}=1&&(9-5)^{2}=4^{2}=16\end{array}}}

Среднее арифметическое этих значений называется дисперсией:

{displaystyle sigma ^{2}={frac {9+1+1+1+0+0+4+16}{8}}=4}

Стандартное отклонение равно квадратному корню дисперсии:

{displaystyle sigma ={sqrt {4}}=2}

Эта формула справедлива только если эти восемь значений и являются генеральной совокупностью. Если бы эти данные были случайной выборкой из какой-то большой совокупности (например, оценки восьми случайно выбранных учеников большого города), то в знаменателе формулы для вычисления дисперсии вместо n = 8 нужно было бы поставить n − 1 = 7:

{displaystyle sigma ^{2}={frac {9+1+1+1+0+0+4+16}{7}}approx 4{,}57}

и стандартное отклонение равнялось бы:

{displaystyle sigma ={sqrt {4{,}57}}approx 2{,}14}

Этот результат называется стандартным отклонением на основании несмещённой оценки дисперсии. Деление на n − 1 вместо n даёт неискажённую оценку дисперсии для больших генеральных совокупностей.

Примечания[править | править код]

  1. Встречаются также различные синонимы: среднее квадратическое отклонение, стандартный разброс, стандартная неопределённость; термин «среднее квадратическое» означает «среднее степени 2»
  2. 1 2 3 Ивченко Г. И., Медведев Ю. И. Введение в математическую статистику. — М. : Издательство ЛКИ, 2010. — §2.2. Выборочные моменты: точная и асимптотическая теория. — ISBN 978-5-382-01013-7.
  3. 1 2 C. Patrignani et al. (Particle Data Group). 39. STATISTICS. — В: Review of Particle Physics // Chin. Phys. C. — 2016. — Vol. 40. — P. 100001. — doi:10.1088/1674-1137/40/10/100001.
  4. Талеб, Гольдштейн, Шпицнагель, 2022, с. 46.

Литература[править | править код]

  • Боровиков В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов / В. Боровиков. — СПб.: Питер, 2003. — 688 с. — ISBN 5-272-00078-1..
  • Нассим Талеб, Дениэл Гольдштейн, Марк Шпицнагель. Шесть ошибок руководителей компаний при управлении рисками // Управление рисками (Серия «Harvard Business Review: 10 лучших статей») = On Managing Risk / Коллектив авторов. — М.: Альпина Паблишер, 2022. — С. 41—50. — 206 с. — ISBN 978-5-9614-8186-0.

Добавить комментарий