Добрый день!
По результатам проверки нашего подразделения одним из замечаний стало то, что результаты анализов выдаются в протоколе без ошибки. То есть не указывается «плюс/минус некая погрешность». Метод, по которому проводится анализ, гостированный (ГОСТ 7847-73 анализ пека), там указаны только параметры сходимости и воспроизводимости.
Наш оператор проводит два измерения подряд (n=2), смотрит, чтобы полученные цифры меж собой не расходились более заданной планки, и выдает среднее арифметическое как результат (собственно строго по ГОСТ). Условий воспроизводимости, как таковой, у нас нет: оператор один и оборудование одно.
Однако, аудитор, когда объясняла, в чем суть замечания привела пример расчета для нашего случая :
Ошибка (Δ)=Ϭсходимости+Ϭвоспроизводимости =2* Ϭсходимости
D (норматив, который как я понимаю, и указан в ГОСТ)=2,77* Ϭсходимости или же Ϭсходимости= D/2,77 отсюда следует:
Δ=2* Ϭсходимости=2* D/2,77 (и вот этот результат мол и пойдет как «плюс/ минус» к среднему арифметическому в протокол)
Я же не могу понять, почему в нашем случае ошибка это:
(Δ)=Ϭсходимости+Ϭвоспроизводимости =2* Ϭсходимости,
т.е. почему воспроизводимость приравняли к сходимости. Аналитики, сказали, что стоит брать просто цифру из госта и не проводить никаких расчетов. Я же думаю, что норматив сходимости и ошибка(погрешность) – это все же разные понятия.
Скажите, пожалуйста, сталкивались ли вы с расчетами погрешностей по гостированным методам? Если бы вас попросили указать ошибку «плюс/минус» в протокол по ГОСТ 7847-73, то каким образом от понятий сходимости и воспроизводимости, вы бы перешли непосредственно к погрешности измерения?
Заранее большое спасибо.
10.1 Основы теории суммирования погрешностей
Определение расчетным путем
оценки результирующей погрешности
по известным оценкам ее составляющих
называется суммированием
погрешностей.
Главной проблемой,
возникающей при суммировании, является
то, что все составляющие погрешности
должны рассматриваться как случайные
величины. С точки
зрения теории вероятностей они наиболее
полно могут быть описаны своими законами
распределения, а их совместное
действие – соответствующим многомерным
распределением. Однако в такой постановке
задача суммирования погрешностей
практически не разрешима уже для
нескольких составляющих, не говоря
о нескольких десятках.
Практически приемлемый
путь решения данной задачи суммирования
погрешностей состоит в отказе от
определения и использования многомерных
функций распределения составляющих
погрешности. Необходимо подобрать
для характеристик составляющих такие
числовые оценки (СКО, эксцесс и др.),
оперируя с которыми можно было бы
получить соответствующие числовые
оценки результирующей погрешности.
При этом следует
учитывать, что:
• отдельные составляющие
погрешности могут быть коррелированны
между собой;
• при суммировании случайных величин
их законы распределения существенно
деформируются, т.е. форма закона суммы
может резко отличаться от формы закона
распределения составляющих.
Правила суммирования
погрешностей основываются на том, что
погрешность по абсолютному значению
всегда много меньше самой измеряемой
величины. Поэтому изменение погрешности
в зависимости от изменения измеряемой
величины может быть учтено, если все
суммируемые случайные и систематические
составляющие погрешности разделить
на аддитивные и
мультипликативные.
Сумма аддитивных составляющих даст
значение аддитивной части результирующей
погрешности, а сумма мультипликативных
составляющих – значение мультипликативной
части результирующей погрешности.
В пределах некоторого
диапазона изменения, как правило,
десятикратного, измеряемой величины
изменение результирующей погрешности
может быть с достаточной степенью
точности представлено прямой линией
или простейшей кривой (парабола,
гипербола). Это дает возможность
описать результирующую погрешность
линейной или нелинейной двухзвенной
формулой. При большем изменении
измеряемой величины весь диапазон
разбивается на участки, для которых
и определяются крайние погрешности.
Пример 10.1
Основная допускаемая погрешность
измерения сопротивления цифрового
микропроцессорного измерителя иммитанса
марки Е7-14 при различных диапазонах
измерения и добротностях Q
приведена в таблице.
Диапазон измерения |
Конечное значение диапазона Rk, |
Предел допустимого значения основной |
0,1…1000мОм |
1 |
10–3(1+Q)R+3·10–4Rk |
0,001…10 Ом |
10 |
10–3(1+Q)R+2·10–4Rk |
0,01…100 Ом |
100 |
10–3(1+Q)R+2·10–4Rk |
100…1000 Ом |
1000 |
[10–3(1+Q)R+2·10–3 |
1…10кОм |
10000 |
[10–3(1+Q)R+2·10–3 |
Для устранения влияния
деформации формы законов распределения
все суммируемые составляющие исходно
представляются своими СКО и все
операции расчетного суммирования
проводятся только над ними. Учет взаимных
корреляционных связей между суммируемыми
составляющими производится путем
использования различных правил
суммирования для жестко и слабо
коррелированных составляющих. Эти
правила рассмотрены далее.
В результате суммирования
СКО составляющих получаются средние
квадратические отклонения соответственно
аддитивной, мультипликативной или
нелинейной составляющих результирующей
погрешности. СКО аддитивной составляющей
результирующей погрешности будет
характеризовать результирующую
погрешность в начале диапазона. Сумма
СКО аддитивной и мультипликативной
составляющих в конце диапазона описывает
результирующую погрешность в конце
диапазона. Если участков несколько, то
суммирование проводится на всех
участках, а затем принимается решение
о методе описания результирующей
погрешности.
Результирующую погрешность
необходимо выразить в виде доверительного
интервала. Его расчет по полученному
СКО является с точки зрения теории самой
трудной операцией при суммировании
погрешностей. Это связано с тем, что
доверительный интервал равен произведению
рассчитанного СКО и множителя, зависящего
от закона распределения результирующей
погрешности. В то же время вся излагаемая
методика с самого начала была нацелена
на то, чтобы обойтись без точного
определения результирующего закона
распределения суммы всех составляющих.
Практические правила
расчетного суммирования результирующей
погрешности состоят в следующем:
1. Для определения суммарного
значения СКО должны учитываться
корреляционные связи различных
составляющих погрешности. В связи с
этим исходными данными для более точного
расчета должны служить оценки именно
всех отдельных составляющих погрешности,
а не оценки некоторых суммарных
погрешностей.
2. Для каждой составляющей должно быть
найдено ее СКО. В большинстве случаев
для этого необходимо знание или
предположение о виде закона ее
распределения.
3. Все суммируемые составляющие
разделяются на аддитивные и мультипликативные
составляющие, которые суммируются
отдельно.
4. Так как в большинстве
случаев точное значение коэффициента
корреляции ρ
найти невозможно, то все погрешности
должны быть условно разделены на:
• сильно коррелированные
при 0,7
<1,
для которых считают ρ
= ±1 в зависимости от
знака коэффициента корреляции;
• слабо коррелированные
при 0
0,7,
для которых ρ
= 0.
5. Из суммируемых составляющих
выделяются группы сильно коррелированных
между собой погрешностей, и внутри этих
групп производится алгебраическое
суммирование их оценок.
6. После алгебраического
суммирования групп сильно коррелированных
погрешностей суммарные по группам и
оставшиеся вне групп погрешности можно
считать некоррелированными и складывать
по правилу геометрического суммирования.
Для определения СКО
суммарной погрешности при начальном
значении измеряемой величины складывают
лишь аддитивные составляющие, а для
определения СКО погрешности в конце
диапазона изменения измеряемой
величины – все просуммированные выше
составляющие.
7. Для перехода от СКО
погрешности к доверительному значению
должно быть вынесено суждение о форме
закона распределения результирующей
погрешности и тем самым выбрано значение
квантильного множителя.
Изложенная методика может
быть несколько упрощена. Самым сложным
в ней являются нахождение СКО всех
составляющих по известным их интервальным
оценкам и определение интервальной
оценки результирующей погрешности по
полученному СКО.
В обоих случаях необходимо
знание закона распределения погрешностей.
Упрощение методики суммирования состоит
в том, чтобы сделать эти переходы по
возможности более простыми. Один из
вариантов состоит в следующем. Согласно
центральной предельной теореме, если
число суммируемых независимых составляющих
достаточно велико (практически при
m
5)
и если среди этих составляющих нет
существенно преобладающих над остальными,
то результирующий закон распределения
близок к нормальному. Однако предположение
о близости закона распределения к
нормальному без соответствующего
анализа достаточно рискованно даже и
при большом числе суммируемых
составляющих. Тем не менее, при недостатке
времени и невысоких требованиях к
точности получаемого результата
предположение о нормальности закона
распределения результирующей погрешности
вполне возможно. В этом случае
доверительный интервал
,
где zр
– квантильный множитель, определяемый
через функцию Лапласа; SΣ
– суммарное СКО или его оценка.
Такой прием существенно
снижает трудоемкость расчетов, но может
вносить весьма значительные ошибки,
если реальное распределение сильно
отличается от нормального закона.
Например, при фактическом арксинусоидальном
распределении ошибка может достигать
180 %. Поэтому использовать его надо весьма
осмотрительно.
В качестве другого пути
упрощения перехода от СКО результирующей
погрешности к ее интервальной оценке
следует указать возможность
использования доверительной вероятности
Рд
= 0,9, при которой для
большой группы различных распределений
имеет место соотношение
(10.1)
Действительно, для широкого
класса симметричных, высокоэнтропийных
(k
>1,7)
распределений, а именно для равномерного,
треугольного, трапецеидальных,
нормального, экспоненциальных с
показателем степени α
2/3,
двухмодальных с глубиной антимодальности
менее 1,5, интегральные кривые F(х)
в области 0,05 и 0,95 квантилей пересекаются
между собой в очень узком интервале
значений Х/S=
1,6 ± 0,05. Поэтому с
погрешностью 0,05S
можно считать, что квантили 0,05 и 0,95 для
любых из этих распределений могут быть
найдены как
Х0,05
= Хц
– 1,6S
и Х0,95
= Хц
+ 1,6S,
где Хц
– координата центра
распределения; SТ
– его СКО. Отсюда следует, что значение
доверительного интервала, найденное
по формуле (10.1), для любого из названных
распределений является интервалом с
90%-ной доверительной вероятностью.
При Рд
> 0,9 интегральные
кривые для разных законов распределения
резко расходятся между собой. В этом
случае для нахождения доверительного
интервала
вместо большого числа таблиц квантилей
разнообразных распределений нужно
найти для близких классов распределений
аппроксимирующие выражения
,
где ε
– эксцесс распределения.
Для входящих в классы
экспоненциальных и трапецеидальных
распределений, а именно: распределения
Лапласа (ε
= 6); нормального
распределения (ε
= 3); трапецеидального
распределения с соотношением верхнего
и нижнего оснований 1:2 (ε
= 2) и равномерного распределения (ε
= 1,8), зависимость
квантильного множителя от эксцесса и
доверительной вероятности аппроксимируется
уравнением
(10.2)
Погрешность аппроксимации
не превышает 4% при
изменении Р
от 0,9 до 0,99 и 8% – от 0,9 до 0,999.
Для кругловершинных
двухмодальных распределений,
представляющих собой композицию
нормального и дискретного двузначного
распределений, в диапазоне изменения
ε
от 3 до 1,3 для Р
от 0,9 до 0,999 с погрешностью 10% зависимость
аппроксимируется выражением
(10.3)
Для островершинных
двухмодальных распределений, образующихся
как композиция распределения Лапласа
и дискретного двузначного распределения,
рассматриваемая зависимость в интервале
значений ε
от 1,8 до 6 при Р
от 0,9 до 0,999 с погрешностью 5% аппроксимируется
формулой
(10.4)
Для уплощенных распределений,
образующихся как композиция
экспоненциального распределения с α
= 1/2 и равномерного
распределения в интервале значений
ε
от 6 до 1,8 с погрешностью 8%, рассматриваемая
зависимость аппроксимируется формулой
(10.5)
Использование приведенных
уравнений позволяет, не прибегая к
таблицам, с достаточной для практики
степенью точности вычислять
доверительные интервалы для всех
встречающихся распределений
погрешностей. Однако для выбора формулы
нужно вынести суждение о классе
распределения суммарной погрешности.
Дальнейшие упрощения
методики, выражающиеся в пренебрежении
разделением погрешностей на аддитивные
и мультипликативные, коррелированные
и некоррелированные, недопустимы,
поскольку при суммировании погрешностей
получены неверные результаты.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Загрузить PDF
Загрузить PDF
После сбора данных их нужно проанализировать. Обычно нужно найти среднее значение, квадратичное отклонение и погрешность. Мы расскажем вам, как это сделать.
-
1
Запишите числовые значения, которые вы собираетесь анализировать. Мы проанализируем случайно подобранные числовые значения в качестве примера.
- Например, 5 школьникам был предложен письменный тест. Их результаты (в баллах по 100 бальной системе): 12, 55, 74, 79 и 90 баллов.
Реклама
-
1
Для того чтобы посчитать среднее значение, нужно сложить все имеющиеся числовые значения и разделить получившееся число на их количество.
- Среднее значение (μ) = Σ/N, где Σ сумма всех числовых значений, а N количество значений.
- То есть, в нашем случае μ равно (12+55+74+79+90)/5 = 62.
-
1
Мы будем считать среднее отклонение. Среднее отклонение = σ = квадратный корень из [(Σ((X-μ)^2))/(N)].
- Для вышеуказанного примера это квадратный корень из [((12-62)^2 + (55-62)^2 + (74-62)^2 + (79-62)^2 + (90-62)^2)/(5)] = 27,4. (Обратите внимание, что если это выборочное среднеквадратическое отклонение, то делить нужно на N-1, где N количество значений.)
Реклама
-
1
Считаем среднюю погрешность (среднего значения). Это оценка того, насколько сильно округляется общее среднее значение. Чем больше числовых значений, тем меньше средняя погрешность, тем точнее среднее значение. Для расчета погрешности надо разделить среднее отклонение на корень квадратный от N. Стандартная погрешность = σ/кв.корень(n).
- Если в нашем примере 5 школьников, а всего в классе 50 школьников, и среднее отклонение, посчитанное для 50 школьников равно 17 (σ = 21), средняя погрешность = 17/кв. корень(5) = 7.6.
Советы
- Расчеты среднего значения, среднего отклонения и погрешности годятся для анализа равномерно распределенных данных. Среднее отклонение математического среднего значения распределения относится приблизительно к 68% данных, 2 средних отклонения – к 95% данных, а 3 – к 99.7% данных. Стандартная погрешность же уменьшается при увеличении количества значений.
- Простой в использовании калькулятор для расчета среднего отклонения.
Реклама
Предупреждения
- Считайте дважды. Все делают ошибки.
Реклама
Об этой статье
Эту страницу просматривали 66 238 раз.
Была ли эта статья полезной?
Среднеквадрати́ческое отклонение (среднеквадрати́чное отклонение, стандартное отклонение[1]) — наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания (аналога среднего арифметического с бесконечным числом исходов). Обычно означает квадратный корень из дисперсии случайной величины, но иногда может означать тот или иной вариант оценки этого значения.
В литературе обычно обозначают греческой буквой (сигма). В статистике принято два обозначения: — для генеральной совокупности и (с англ. standard deviation — стандартное отклонение) — для выборки.
Варианты определения[править | править код]
Обычно определяется как квадратный корень из дисперсии случайной величины: . Измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.
На практике, когда вместо точного распределения случайной величины в распоряжении имеется лишь выборка, стандартное отклонение, как и математическое ожидание, оценивают (выборочная дисперсия), и делать это можно разными способами. Термины «стандартное отклонение» и «среднеквадратическое отклонение» обычно применяют к квадратному корню из дисперсии случайной величины (определённому через её истинное распределение), но иногда и к различным вариантам оценки этой величины на основании выборки.
В частности, если — -й элемент выборки, — объём выборки, — среднее арифметическое выборки (выборочное среднее — оценка математического ожидания величины):
- ,
то два основных способа оценки стандартного отклонения записываются нижеследующим образом.
Оценка стандартного отклонения на основании смещённой оценки дисперсии (иногда называемой просто выборочной дисперсией[2]):
- .
Это в буквальном смысле среднее квадратическое разностей измеренных значений и среднего.
Оценка стандартного отклонения на основании несмещённой оценки дисперсии (подправленной выборочной дисперсии[2], в ГОСТ Р 8.736-2011 — «среднее квадратическое отклонение»):
Само по себе, однако, не является несмещённой оценкой квадратного корня из дисперсии, то есть извлечение квадратного корня «портит» несмещённость.
Обе оценки являются состоятельными[2].
Кроме того, среднеквадратическим отклонением называют математическое ожидание квадрата разности истинного значения случайной величины и её оценки для некоторого метода оценки[3]. Если оценка несмещённая (выборочное среднее — как раз несмещённая оценка для случайной величины), то эта величина равна дисперсии этой оценки.
Среднее значение выборки также является случайной величиной с оценкой среднеквадратичного отклонения[3][нет в источнике]:
Правило трёх сигм[править | править код]
Правило трёх сигм () гласит: вероятность того, что любая случайная величина отклонится от своего среднего значения менее чем на :
- .
Практически все значения нормально распределённой случайной величины лежат в интервале , где — математическое ожидание случайной величины. Более строго — приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале.
Интерпретация[править | править код]
Большее значение среднеквадратического отклонения показывает больший разброс значений в представленном множестве со средней величиной множества; меньшее значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.
Например, для у всех трёх числовых множеств: {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8} средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения — значения внутри множества сильно расходятся со средним значением.
В общем смысле среднеквадратическое отклонение можно считать мерой неопределённости. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить.
Практическое применение[править | править код]
На практике среднеквадратическое отклонение позволяет оценить, насколько значения из множества могут отличаться от среднего значения.
Экономика и финансы[править | править код]
Среднее квадратическое отклонение доходности портфеля отождествляется с риском портфеля.
В техническом анализе среднеквадратическое отклонение используется для построения линий Боллинджера, расчёта волатильности.
Оценка рисков и критика[править | править код]
Среднеквадратическое отклонение широко распространено в финансовой сфере в качестве критерия оценки инвестиционного риска. По мнению американского экономиста Нассима Талеба, этого делать не следует. Так, по теории около двух третей изменений должны укладываться в определённые рамки (среднеквадратические отклонения −1 и +1) и что колебания свыше семи стандартных отклонений практически невозможны. Однако в реальной жизни, по мнению Талеба, всё иначе — скачки отдельных показателей могут превышать 10, 20, а иногда и 30 стандартных отклонений. Талеб считает, что риск-менеджерам следует избегать использования средств и методов, связанных со стандартными отклонениями, таких как регрессионные модели, коэффициент детерминации (R-квадрат) и бета-факторы. Кроме того, по мнению Талеба, среднеквадратическое отклонение — слишком сложный для понимания метод. Он считает, что тот, кто пытается оценить риск с помощью единственного показателя, обречён на неудачу[4].
Климат[править | править код]
Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой внутри континента. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.
Спорт[править | править код]
Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.
Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.
Пример[править | править код]
Предположим, что интересующая нас группа (генеральная совокупность) это класс из восьми учеников, которым выставляются оценки по 10-бальной системе. Так как мы оцениваем всю группу, а не её выборку, можно использовать стандартное отклонение на основании смещённой оценки дисперсии. Для этого берём квадратный корень из среднего арифметического квадратов отклонений величин от их среднего значения.
Пусть оценки учеников класса следующие:
- .
Тогда средняя оценка равна:
- .
Вычислим квадраты отклонений оценок учеников от их средней оценки:
Среднее арифметическое этих значений называется дисперсией:
Стандартное отклонение равно квадратному корню дисперсии:
Эта формула справедлива только если эти восемь значений и являются генеральной совокупностью. Если бы эти данные были случайной выборкой из какой-то большой совокупности (например, оценки восьми случайно выбранных учеников большого города), то в знаменателе формулы для вычисления дисперсии вместо n = 8 нужно было бы поставить n − 1 = 7:
и стандартное отклонение равнялось бы:
Этот результат называется стандартным отклонением на основании несмещённой оценки дисперсии. Деление на n − 1 вместо n даёт неискажённую оценку дисперсии для больших генеральных совокупностей.
Примечания[править | править код]
- ↑ Встречаются также различные синонимы: среднее квадратическое отклонение, стандартный разброс, стандартная неопределённость; термин «среднее квадратическое» означает «среднее степени 2»
- ↑ 1 2 3 Ивченко Г. И., Медведев Ю. И. Введение в математическую статистику. — М. : Издательство ЛКИ, 2010. — §2.2. Выборочные моменты: точная и асимптотическая теория. — ISBN 978-5-382-01013-7.
- ↑ 1 2 C. Patrignani et al. (Particle Data Group). 39. STATISTICS. — В: Review of Particle Physics // Chin. Phys. C. — 2016. — Vol. 40. — P. 100001. — doi:10.1088/1674-1137/40/10/100001.
- ↑ Талеб, Гольдштейн, Шпицнагель, 2022, с. 46.
Литература[править | править код]
- Боровиков В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов / В. Боровиков. — СПб.: Питер, 2003. — 688 с. — ISBN 5-272-00078-1..
- Нассим Талеб, Дениэл Гольдштейн, Марк Шпицнагель. Шесть ошибок руководителей компаний при управлении рисками // Управление рисками (Серия «Harvard Business Review: 10 лучших статей») = On Managing Risk / Коллектив авторов. — М.: Альпина Паблишер, 2022. — С. 41—50. — 206 с. — ISBN 978-5-9614-8186-0.