Как найти доверительный интервал аналитическая химия

В соответствии с
законом эквивалентов

Сн(HCl)∙V(HCl)
= Сн(KOH)∙V(KOH)

рассчитайте
Сн(KOH),
Т(КОН), m(КОН)
для трех повторностей. Массу
КОН в исследуемом растворе рассчитывают
по формуле:

m
(КОН) = Т(КОН) ∙ V (КОН), где V = 50 мл

Результаты
вычислений занесите в таблицу 2.

5. Выполните статистическую обработку результатов анализа.

Статистическая
обработка
результатов анализа позволяет существенно
уменьшить влияние случайных ошибок на
результат измерения. Она позволяет
представить результаты многих определений
в компактной форме и оценить надежность
полученных результатов, т.е. степень их
соответствия истинному содержанию
элемента в образе.

Общепринятой
является ниже приведенная методика
статистической обработки результатов
анализа:

1)
расчет среднего арифметического значения
определяемой величины (Хi
ср.
):

Х
i
ср.
=
Σ Хi
/ n,

где
n
– число измерений;

2)
расчет отклонения отдельных измерений
от среднего значения (di):

di
= Xi
– Xi
ср.

3)
расчет стандартного отклонения или
средней квадратической ошибки (s):

,

где
f
= n
– 1 – число степеней свободы;

4)
расчет доверительного интервала
результата среднего отклонения (εα),
являющегося максимальной случайной
ошибкой определения. Сущность этого
понятия состоит в том, что при некоторой
заданной вероятности и заданном числе
степеней свободы f
результат отдельного измерения Х
попадает в интервал

Хср.
± ts.

Доверительный
интервал рассчитывается по формуле
,
гдеt
– критерий Стьюдента, значения которого
при различных p
и f
приведены в таблице 3:

Таблица
3

f
= n – 1

p

0,9

0,95

0,99

1

6,31

12,71

63,66

2

2,92

4,30

9,92

3

2,35

3,18

5,84

4

2,13

2,78

4,60

5

2,01

2,57

4,03

Границы,
внутри которых может заключаться каждая
определяемая величина Х (границы
доверительного интервала), определяются
формулой:

ПРИМЕР:
по результатам трех параллельных
титрований рассчитать массу вещества
в растворе: m1
= 0,0583 г;
m2
= 0,0590 г;
m3
= 0,0578 г.

  1. найдем
    среднее арифметическое значение искомой
    величины:

  1. рассчитаем
    отклонения отдельных измерений от
    среднего значения:

  1. вычислим
    среднюю квадратичную ошибку:

4)
найдем доверительный интервал, принимая
заданную вероятность равной 0,95; в этом
случае при трех параллельных измерениях
коэффициент Стьюдента равен 4,30.

Ответ
аналитической задачи должен быть
представлен так:

m(в-ва)
= 0,0584 ± 0,0013 (г)

ФОРМА
ОТЧЕТА:

1.
Изложить теоретические основы метода.

2.
Привести уравнения реакций, лежащих в
основе выполненных определений в
молекулярной и молекулярно-ионной
формах.

3.
Заполнить таблицы, приведенные в
методических указаниях.

4.
Привести расчет титра и нормальности
рабочего раствора HCl.

5.
Привести расчет массы вещества,
содержащегося в исследуемом растворе.

6.
Выполнить статистическую обработку
полученных результатов.

5.
вопросы
ДЛЯ САМОконтроля знаний:

5.1
Методы количественного анализа: весовой
(гравиметрический); объемный
(титриметрический).

5.2
Основные понятия объемного анализа:
титрование, титрант, точка эквивалентности.
Закон эквивалентов.

5.3
Требование к реакциям, применяемым в
титриметрическом анализе.

5.4
Классификация методов титриметрического
анализа.

5.5
Метод кислотно-основного титрования.

5.6
Какие факторы определяют выбор индикатора
при кислотно-основном титровании?

5.7
Какие стандартные растворы применяются
при кислотно-основном титровании?

Статистическая обработка результатов химического эксперимента (ОФС.1.1.0013.15)

Государственная фармакопея 13 издание (ГФ XIII)

ОБЩАЯ ФАРМАКОПЕЙНАЯ СТАТЬЯ

Взамен ст. ГФ XI, вып.1

Требования данной общей фармакопейной статьи распространяются на методы, используемые при статистической обработке результатов химического эксперимента.

Обозначения:

А — измеряемая величина;

a — свободный член линейной зависимости;

b — угловой коэффициент линейной зависимости;

F — критерий Фишера;

f — число степеней свободы;

i — порядковый номер варианты;

L — фактор, используемый при оценке сходимости результатов параллельных определений;

т, п — объемы выборки;

P, P̅ — доверительная вероятность соответственно при дву- и односторонней постановке задачи;

Q 1, Qn — контрольные критерии идентификации грубых ошибок;

R — размах варьирования;

r — коэффициент корреляции;

s — стандартное отклонение;

s2 — дисперсия;

s — стандартное отклонение среднего результата;

s ,% — относительное стандартное отклонение среднего результата (коэффициент вариации);

s lg — логарифмическое стандартное отклонение;

s 2lg — логарифмическая дисперсия;

Slgo̅g — логарифмическое стандартное отклонение среднего геометрического результата;

S20 , S2b , S2a — общая дисперсия и дисперсия коэффициентов линейной зависимости;

t — критерий Стьюдента;

U — коэффициент для расчета границ среднего результата гарантии качества анализируемого продукта;

х, у — текущие координаты в уравнении линейной зависимости;

Хi, Yi — вычисленные, исходя из уравнения линейной зависимости, значения переменных х и у;

x, у — средние выборки (координаты центра линейной зависимости);

Xi, yi — i-тая варианта (i-тая пара экспериментальных значений х и у);

x ± Δx — граничные значения доверительного интервала среднего результата;

Xi ± Δх — граничные значения доверительного интервала результата отдельного определения;

d, А — разность некоторых величин;

α — уровень значимости, степень надежности;

Δх- полуширина доверительного интервала величины;

δ — относительная величина систематической ошибки;

ε, ε̅ — относительные ошибки соответственно результата отдельного

определения и среднего результата;

μ — истинное значение измеряемой величины;

Σ — знак суммирования (сумма);

X2 — критерий хи-квадрат.

Примечание. Термины доверительная вероятность P и уровень значимости (степень надежности) α взаимозаменяемы, поскольку их сумма равна либо 1, либо 100 %.

Метрологические характеристики методов и результатов, получаемых при статистической обработке данных эксперимента, позволяют проводить оценку и сравнение, как методик аналитического эксперимента, так и исследуемых при таком эксперименте объектов, и на этой основе решать ряд прикладных задач.

1. Основные статистические характеристики однородной выборки и их вычисление

Проверка однородности выборки. Исключение выпадающих значений вариант. Термином «выборка» обозначают совокупность статистически эквивалентных найденных в эксперименте величин (вариант). В качестве такой совокупности можно, например, рассматривать ряд результатов, полученных при параллельных определениях содержания какого-либо вещества в однородной по составу пробе.

Допустим, что отдельные значения вариант выборки объема п обозначены через xi (1 ≤ i ≤ n) и расположены в порядке возрастания:

Х1; х2; … xi; …хn-1; хn. (1.1)

Результаты, полученные при статистической обработке выборки, будут достоверны лишь в том случае, если эта выборка однородна, т. е. если варианты, входящие в нее, не отягощены грубыми ошибками, допущенными при измерении или расчете. Такие варианты должны быть исключены из выборки перед окончательным вычислением ее статистических характеристик. Для выборки небольшого объема (n < 10) идентификация вариант, отягощенных грубыми ошибками, может быть выполнена, исходя из величины размаха варьирования R, см. уравнения (1.12), (1.13). Для идентификации таких вариант в выборке большого объема (n ≥ 10) целесообразно проводить предварительную статистическую обработку всей выборки, полагая ее однородной, и уже затем на основании найденных статистических характеристик решать вопрос о справедливости сделанного предположения об однородности, см. выражение (1.14).

В большинстве случаев среднее выборки х̅ является наилучшей оценкой истинного значения измеряемой величины μ, если его вычисляют как среднее арифметическое всех вариант:

  (1.2)

При этом разброс вариант хi вокруг среднего х̅ характеризуется величиной стандартного отклонения s. В количественном химическом анализе величина s часто рассматривается как оценка случайной ошибки, свойственной данному методу анализа. Квадрат этой величины s2 называют дисперсией. Величина дисперсии может рассматриваться как мера воспроизводимости результатов, представленных в данной выборке. Вычисление величин (оценок) s и s2 проводят по уравнениям (1.5) и (1.6). Иногда для этого предварительно определяют значения отклонений di и число степеней свободы (число независимых вариант) f:

Стандартное отклонение среднего результата S  рассчитывают по уравнению:

Отношение S  к x , выраженное в процентах, называют относительным стандартным отклонением среднего результата или коэффициентом вариации S %.

Примечание 1.1. При наличии ряда из g выборок с порядковыми номерами k (1 ≤ k ≤ g) расчет дисперсии s целесообразно проводить по формуле:

При этом число степеней свободы равно:

где xk — среднее k-той выборки;

nk — число вариант в k-той выборке;

xik — i-тая варианта к-той выборки;

s2k — дисперсия к-той выборки;

dik — отклонение i-той варианты к-той выборки.

Необходимым условием применения уравнений (1.8) и (1.9) является отсутствие статистически достоверной разницы между отдельными значениями S2k. В простейшем случае сравнение крайних значений S2k проводят, исходя из величины критерия F, которую вычисляют по уравнению (3.4) и интерпретируют, как указано в разделе 3.

Примечание 1.2. Если при измерениях получают логарифмы искомых вариант, среднее выборки вычисляют как среднее геометрическое, используя логарифм вариант:

Откуда

Значения s2, s и Sx в этом случае также рассчитывают, исходя из логарифмов вариант, и обозначают соответственно через S2lg , Slg и Slgo̅

Пример 1.1. При определении содержания стрептоцида в образце линимента были получены следующие данные:

Как было указано выше, значения x̅, s2, s и s могут быть признаны достоверными, если ни одна из вариант выборки не отягощена грубой ошибкой, т. е. если выборка однородна.

Проверка однородности выборок малого объема (n < 10) осуществляется без предварительного вычисления статистических характеристик, с этой целью после представления выборки в виде (1.1) для крайних вариант x1 и xn рассчитывают значения контрольного критерия Q, исходя из величины размаха варьирования R:

Выборка признается неоднородной, если хотя бы одно из вычисленных значений Q превышает табличное значение Q (P, n), найденное для доверительной вероятности P̅ (см. табл. I приложения). Варианты х1 или xn, для которых соответствующее значение Q > Q (P, n), отбрасываются и для полученной выборки уменьшенного объема выполняют новый цикл вычислений по уравнениям (1.12) и (1.13) с целью проверки ее однородности. Полученная в конечном счете однородная выборка используется для вычисления x̅, s2, s и s.

Примечание 1.3.

При |x1 – x2| < |x2 – x3| и xn – xn-1 < |xn-1 – xn-2| уравнения (1.13 а) и (1.13 б) принимают соответственно вид:

Пример 1.2. При проведении девяти (n = 9) определений содержания общего азота в плазме крови крыс были получены следующие данные (в порядке возрастания):

По уравнениям (1.12) и (1.13 а) находим:

По табл. I приложения находим:

Q(9; 95%) = 0,46 < Q1 = 0,51;

Q(9; 99%) = 0,55 < Q1 = 0,51;

Следовательно, гипотеза о том, что значение x1 = 0,62 должно быть исключено из рассматриваемой совокупности результатов измерений как отягощенное грубой ошибкой, может быть принята с доверительной вероятностью 95 %, но должна быть отвергнута, если выбранное значение доверительной вероятности равно 99 %.

Для выборок большого объема (n ≥ 10) проверку однородности проводят после предварительного вычисления статистических характеристик x̅, s2, s и s. При этом выборка признается однородной, если для всех вариант выполняется условие:

| di | ≤ 3s. (1.14)

Если выборка признана неоднородной, то варианты, для которых | di | > 3s, отбрасываются как отягощенные грубыми ошибками с доверительной вероятностью Р > 99,0 %. В этом случае для полученной выборки сокращенного объема повторяют цикл вычислений статистических характеристик по уравнениям (1.2), (1.5), (1.6), (1.9) и снова проводят проверку однородности. Вычисление статистических характеристик считают законченным, когда выборка сокращенного объема оказывается однородной.

Примечание 1.4. При решении вопроса об однородности конкретной выборки небольшого объема также можно воспользоваться выражением (1.14), если известна оценка величины s, ранее найденная для данного метода измерения (расчета) вариант.

2. Доверительные интервалы и оценка их величины

Если случайная однородная выборка конечного объема n получена в результате последовательных измерений некоторой величины А, имеющей истинное значение μ, то среднее этой выборки x следует рассматривать лишь как приближенную оценку величины А. Достоверность этой оценки характеризуется величиной доверительного интервала x̅ ± ∆x̅, для которой с заданной доверительной вероятностью Р выполняется условие:

(x̅ — ∆x̅) ≤ μ ≤ (x̅ — ∆x̅) (2.1)

Следует отметить, что данный доверительный интервал не характеризует погрешность определения величины μ, поскольку найденная величина x̅ может быть в действительности очень близка к истинному значению μ. Полученный доверительный интервал характеризует степень неопределенности истинного значения μ величины А по результатам последовательных измерений выборки конечного объема п. Поэтому правильно говорить о «неопределенности результатов анализа» (которая характеризуется доверительным интервалом) вместо выражения «погрешность результатов анализа», которое нередко не совсем корректно используется.

Расчет граничных значений доверительного интервала проводят по критерию Стьюдента, предполагая, что варианты, входящие в выборку, распределены нормально:

Здесь t (P, f) — табличное значение критерия Стьюдента (см. табл. II приложения).

Если при измерении одним и тем же методом двух близких значений А были получены две случайные однородные выборки с объемами п и m, то при m < п для выборки объема m справедливо выражение:

где индекс указывает принадлежность величин к выборке объема m или n.

Выражение (2.3) позволяет оценить величину доверительного интервала среднего x̅(m), найденного, исходя из выборки объема m. Иными словами, доверительный интервал среднего x̅(m) для выборки относительно малого объема m может быть сужен благодаря использованию известных величин, S(n) и t (P, f(n)) найденных ранее для выборки большего объема n (в дальнейшем индекс n будет опущен).

Примечание 2.1. Если n ≤ 15, а ((m + n) / n) > 1,5 , величины s и f целесообразно вычислять, как указано в примечании 1.1.

Подставляя n = 1 в выражение (2.2), или m = 1 в выражение (2.3), получаем:

xi ± ∆x = xi ± t (P, f) * s (2.4)

Этот интервал является доверительным интервалом результата единичного определения. Для него с доверительной вероятностью Р выполняются взаимосвязанные условия:

xi — ∆x μxi + ∆x (2.5)

μ∆x xi μ + ∆x (2.6)

Значения ∆x̅ и ∆x из выражений (2.2) и (2.4) используют при вычислении относительных погрешностей отдельной варианты (ε) и среднего результата ( ε̅ ), выражая эти величины в %:

Пример 2.1. В результате определения содержания хинона в стандартном образце хингидрона были получены следующие данные (n = 10):

Расчеты по формулам (1.2), (1.4), (1.5), (1.6), (1.9) дали следующие результаты:

Доверительные интервалы результата отдельного определения и среднего результата при Р = 90 % получаем согласно (2.4) и (2.2):

Тогда относительные погрешности ε и ε‾ согласно (2.7) и (2.8), равны:

Обозначая истинное содержание хинона в хингидроне через μ, можно считать, что с 90 % доверительной вероятностью справедливы неравенства:

Примечание 2.2. Вычисление доверительных интервалов для случая, описанного в примечании 1.2, проводят, исходя из логарифмов вариант. Тогда выражения (2.2) и (2.4) принимают вид:

Потенцирование выражений (2.9) и (2.10) приводит к несимметричным доверительным интервалам для значений х и xi.

При этом для нижних и верхних границ доверительных интервалов и x имеем:

3. Метрологическая характеристика метода анализа. Сравнение двух методов анализа по воспроизводимости.

С целью получения метрологической характеристики метода проводят совместную статистическую обработку одной или нескольких выборок, полученных при анализе образцов с известным содержанием определяемого компонента μ. Результаты статистической обработки представляют в виде табл. 1.

*- Графа 10 заполняется в том случае, если реализуется неравенство (3.2).

Примечание 3.1. При проведении совместной статистической обработки нескольких выборок, полученных при анализе образцов с разным содержанием определяемого компонента μ, данные в графах 1, 2, 3, 4, 9 и 10 табл. 1 приводят отдельно для каждой выборки. При этом в графах 2, 4, 5, 7, 8 в последней строке под чертой приводят обобщенные значения f, s2, s, t, ∆x, вычисленные с учетом примечания 1.1.

Если для выборки объема m величина |μ – x̅| > 0, следует решить вопрос о наличии или отсутствии систематической ошибки. Для этого вычисляют критерий Стьюдента t:

Если, например, при Р = 95 % и f = m — 1, реализуется неравенство

t > t (P, f) (3.2)

то полученные данным методом результаты отягощены систематической ошибкой, относительная величина которой δ вычисляется по формуле:

Следует помнить, что если величина А определена как среднее некоей выборки, полученной эталонным методом, критерий Стьюдента t может рассчитываться по уравнению (4.5).

При сравнении воспроизводимости двух методов анализа с оценками дисперсий s21 и s22 (s21 > s22) вычисляют критерий Фишера F:

F = s21 / s22 (3.4)

Критерий F характеризует при s21 > s22 достоверность различия между s21 и s22. Вычисленное значение F сравнивают с табличным значением F (P, f1, f2) найденным при P = 99 % (см. табл. III приложения).

Если для вычисленного значения F выполняется неравенство:

F > F (P, f1, f2) (3.5)

различие дисперсий s21 и s22 признается статистически значимым с вероятностью Р, что позволяет сделать заключение о более высокой воспроизводимости второго метода. Если выполняется неравенство:

F ≤ F (P, f1, f2) (3.5a)

различие значений s21 и s22 не может быть признано значимым и заключение о различии воспроизводимости методов сделать нельзя ввиду недостаточного объема информации.

Примечание 3.2. Для случая, описанного в примечании 1.2, в табл. 1 вместо величин μ, x̅, s2 и s приводят величины lgμ, lg x̅ g, s2lg и slg. При этом в графу 8, согласно примечанию 2.2, вносят величину ∆lg x, а в графу 9 — максимальное по абсолютной величине значение ε. Аналогичные замены проводят при вычислении t по уравнению (3.1) и F — по уравнению (3.4).

Для сравнения двух методов анализа результаты статистической обработки сводят в табл.2.

Таблица 2 — Данные для сравнительной метрологической оценки двух методов анализа

Метрологическое сравнение методов анализа желательно проводить при μ1 = μ2, f1 > 10 и f2 > 10. Если точные значения μ1 и μ2 неизвестны, величины δ и tвыч не определяют.

Пример 3.1. Пусть для двух выборок аналитических данных (1 и 2), характеризующих, например, различные методы анализа, получены метрологические характеристики, приведенные в графах 1 — 10 табл. 3

Для заполнения графы 11 вычислим значения tвыч(1) и tвыч(2):

Поскольку tвыч(1) = 1,28 < t1 (95 %, 20) = 2,09, гипотеза |μ1 – x̅2| ≠ 0 может быть отвергнута, что позволяет считать результаты выборки 1 свободными от систематической ошибки. Напротив, поскольку tвыч(2) = 72,36 » t2 (95 %, 15) = 2,13, гипотезу |μ2 – x̅2| ≠ 0 приходится признать статистически достоверной, что свидетельствует о наличии систематической ошибки в результатах выборки 2.

В графу 14 вносим вычисленное значение δ2:

Заполним графы 12 и 13:

Следовательно, при Р = 99 % гипотезу о различии дисперсий s21 и s22 следует признать статистически достоверной.

Выводы:

  1. результаты, полученные первым методом, являются правильными, т. е. они не отягощены систематической ошибкой;
  2. результаты, полученные вторым методом, отягощены систематической ошибкой;
  3. по воспроизводимости второй метод существенно превосходит первый метод.

4. Метрологическая характеристика среднего результата. Сравнение средних результатов двух выборок.

Если с помощью данного метода анализа (измерения) следует определить значение некоторой величины А, то для полученной экспериментально однородной выборки объема m рассчитывают значения величин, необходимые для заполнения табл. 4. Так поступают в том случае, если применяемый метод анализа (измерения) не был ранее аттестован метрологически. Если же этот метод уже имеет метрологическую аттестацию, графы 2, 4, 5, 7, 8 и 9 табл. 4 заполняются на основании данных табл. 1, полученных при его аттестации. При заполнении табл. 4 следует при необходимости учитывать примечания 2.1 и 3.1.

Таблица 4 — Метрологические характеристики среднего результата

Таблица 4 - Метрологические характеристики среднего результата

Таким образом, на основании выражения (2.1) для измеряемой величины А в предположении отсутствия систематической ошибки с вероятностью Р выполняется условие:

x — ∆x ≤ A ≤ x + ∆x , (4.1)

то есть величина А при отсутствии систематической ошибки лежит в пределах:

A = x ± ∆x . (4.2)

Примечание 4.1. В случае, предусмотренном в примечании 1.2, в графе 9 табл. 4 приводят величину ∆lg x̅, а каждую из граф 3, 10 и 11 разбивают на две (а, б). В графе 3а приводят значение x̅g, в графе 3б – значение lg x̅ g, в графах 10а и 10б — соответственно значения нижней и верхней границ доверительного интервала для xg (см. уравнения (2.11), (2.12)). Наконец, в графе 11 приводят максимальное по абсолютной величине значение ε̅ (см. уравнение (2.12 а)).

Если в результате измерений одной и той же величины А получены две выборки объема n 1 и n2, причем x1 ≠ x2, может возникнуть необходимость проверки статистической достоверности гипотезы:

x̅1 = x̅2, (4.3)

то есть значимости величины разности ( x̅1 — x̅2)

Такая проверка необходима, если величина А определялась двумя разными методами с целью их сравнения или если величина А определялась одним и тем же методом для двух разных объектов, идентичность которых требуется доказать. Для проверки гипотезы (4.3) следует установить, существует ли статистически значимое различие между дисперсиями s21 и s22 . Эта проверка проводится так, как указано в разделе 3 (см. выражения (3.4), (3.5), (3.5 а)).

Рассмотрим три случая.

1. Различие дисперсий s21 и s22 статистически недостоверно (справедливо неравенство (3.5 а)). В этом случае средневзвешенное значение s2 вычисляют по уравнению (1.7), а дисперсию s2p разности |x̅1 – x̅2| — по уравнению:

Далее вычисляют критерий Стьюдента:

Если при выбранном значении Р (например, при Р = 95 %):

t > t (P, f), (4.6)

то результат проверки положителен — значение (xi — x2) является значимым и
гипотезу xi = x2 отбрасывают. В противном случае надо признать, что эта гипотеза не противоречит экспериментальным данным.

2. Различие значений s21 и s22 статистически достоверно (справедливо неравенство (3.5)). Если s21 > s22, дисперсию s21 разности (x̅1 – x̅2) находят по уравнению (4.7), а число степеней свободы по f ’ по уравнению (4.8):

Следовательно, в данном случае:

Вычисленное по уравнению (4.9) значение t сравнивают с табличным значением t (Р, f ‘ ), как это описано выше для случая 1.

Рассмотрение проблемы упрощается, когда n1 ≈ n2 и s21 >> s22. Тогда в отсутствие систематической ошибки среднее x̅2 выборки объема n2 принимают за достаточно точную оценку величины А, т. е. принимают x2 = μ. Справедливость гипотезы x1 = μ, эквивалентной гипотезе (4.3), проверяют с помощью выражений (3.1), (3.2), принимая f1 = n 1 — 1. Гипотеза (4.3) отклоняется как статистически недостоверная, если выполнятся неравенство (3.2).

3. Известно точное значение величины А. Если A = μ, проверяют две гипотезы:

1 = μ (4.3 a) и x̅2 = μ (4.3 б).

Проверку выполняют так, как описано в разделе 3 с помощью выражений (3.1) и (3.2) отдельно для каждой из гипотез. Если гипотезы (4.3 а) и (4.3 б) статистически достоверны, то следует признать достоверной и гипотезу (4.3). В противном случае гипотеза (4.3) должна быть отброшена.

Примечание 4.2. В случае, предусмотренном примечанием 1.2, при сравнении средних используют величины lgx̅g , s2lg и slg.

Когда разность (x 1 — x 2) оказывается значимой, определяют доверительный интервал для разности соответствующих генеральных средних :

Пример 4.1. При определении содержания основного вещества в двух образцах препарата, изготовленных по разной технологии, получены метрологические характеристики средних результатов, приведенные в табл. 5.

Таблица 5 -Полученные данные метрологических характеристик средних результатов

Требуется решить, является ли первый образец по данному показателю лучшим в сравнении со вторым образцом. Поскольку

то согласно неравенству (3.5 а) статистически достоверное различие величин s21 и s22 отсутствует. Следовательно, гипотеза x̅1 = x̅2 (4.3) проверяется с помощью уравнений (1.7), (1.8), (4.4) и (4.5).

Следовательно, с доверительной вероятностью Р = 95 % гипотеза x̅1 ≠ x̅2 может быть принята. Однако с доверительной вероятностью Р = 99 % принять эту гипотезу нельзя из-за недостатка информации.

Если гипотеза x̅1 ≠ x̅2 принята, то определяют доверительный интервал разности генеральных средних (уравнение (4.10)):

5. Интерпретация результатов анализа

Оценка сходимости результатов параллельных определений. При рядовых исследованиях аналитик обычно проводит 2 — 3, реже 4 параллельных определения. Варианты полученной при этом упорядоченной выборки объема m, как правило, довольно значительно отличаются друг от друга. Если метод анализа метрологически аттестован, то максимальная разность результатов двух параллельных определений должна удовлетворять неравенству:

|x1 — xn| < L(P, m)*s, (5.1)

где L (P, m) — фактор, вычисленный по Пирсону при Р = 95 %.

Если неравенство (5.1) не выполняется, необходимо провести дополнительное определение и снова проверить, удовлетворяет ли величина |x1 — xn| неравенству (5.1).

Если для результатов 4 параллельных определений неравенство (5.1) не выполняется, одна из вариант (х1 или xn) должна быть отброшена и заменена новой. При невозможности добиться выполнения неравенства (5.1) следует считать, что конкретные условия анализа привели к снижению воспроизводимости метода и принятая оценка величины s применительно к данному случаю является заниженной. В этом случае поступают, как указано в разделе 1.

Определение необходимого числа параллельных определений. Если необходимо получить средний результат x̅ с относительной погрешностью ε̅ ≤ φ, причем метод анализа метрологически аттестован, необходимое число параллельных определений m находят учетом с уравнений (2.3) и (2.4):

Гарантия качества продукции. Предположим, что качество продукции регламентируется предельными значениями amin и amax величины А, которую определяют на основании результатов анализа. Примем, что вероятность соответствия качества продукта условию:

amin < A < amax, (5.3)

должна составлять P̅ %.

Пусть величину А находят экспериментально, как среднее выборки объема т, а метод ее определения метрологически аттестован. Тогда условие (5.3) будет выполняться с вероятностью P̅, если значение x̅ = A будет лежать в пределах:

Значения коэффициента U для вероятности P̅ = 95 % и P̅ = 99 % соответственно равны 1,65 и 2,33. Иными словами, для гарантии качества наблюдаемые пределы изменения величины А на практике следует ограничить значениями:

Наоборот, если заданы значения Amin и Amax, значения amin и amax, входящие в неравенство (5.3), могут быть найдены путем решения уравнений (5.6) и (5.7). Наконец, если заданы пары значений A min, amin и A max, amax, то уравнения (5.6) и (5.7) могут быть решены относительно т. Это может быть использовано для оценки необходимого числа параллельных определений величины А.

Примечание 5.1. В уравнениях (5.5), (5.6) и (5.7) величина коэффициента U(P) должна быть заменена величиной t (P, f), если значение f, определенное по уравнениям (1.4) или (1.8), меньше 15.

Примечание 5.2. Для случая, предусмотренного примечанием 1.2, описанные в разделе 5 вычисления проводят с использованием величин и т. п.

Пример 5.1. Рассмотрим данные табл. 3, относящиеся к выборке 1, как метрологическую характеристику используемого метода анализа.

a) Пусть amin = 98 %, amax = 100,50 %. Тогда для испытуемого образца продукта средний результат анализа A̅ при проведении трех параллельных определений (m = 3) должен находиться в пределах:

б) Реальный средний результат анализа образца испытуемого продукта А = 99 % (при т = 3). Тогда определение пределов amin и amax, гарантированно характеризующих качество данного образца с заданной доверительной вероятностью P, проводим, исходя из уравнения (5.6) или (5.7), полагая

Полученные оценки amin и amax близки к границам доверительного интервала
что соответствует примечанию 5.1.

6. Расчет и статистическая оценка параметров линейной зависимости (линейной регрессии)

При использовании ряда химических и физико-химических методов количественного анализа непосредственному измерению подвергается некоторая величина у, которая рассматривается как линейная функция искомой концентрации (количества) х определяемого вещества или элемента. Иными словами, в основе таких методов анализа лежит экспериментально подтвержденная линейная зависимость:

y = bx + a, (6.1)

где у — измеряемая величина;

х — концентрация (количество) определяемого вещества или элемента;

b — угловой коэффициент линейной зависимости;

а — свободный член линейной зависимости.

(Здесь b и а рассматриваются как коэффициенты (параметры) линейной регрессии y на x).

Для использования зависимости (6.1) в аналитических целях, т. е. для определения конкретной величины х по измеренному значению у, необходимо заранее найти числовые значения констант b и а, иными словами провести калибровку. Если константы зависимости (6.1) рассматриваются с учетом их физического смысла, то, при необходимости, их значения могут оцениваться с учетом доверительных интервалов.

Если калибровка проведена и значения констант а и b определены, величину Xi находят по измеренному значению yi:

При калибровке величину х рассматривают как аргумент, а величину у — как функцию.

Наличие линейной зависимости между х и у целесообразно подтверждать расчетным путем. Для этого по экспериментальным данным, полученным при калибровке, оценивают достоверность линейной связи между х и у с использованием корреляционного анализа и лишь затем рассчитывают значения констант а и b зависимости (6.1) и их доверительные интервалы. В первом приближении судить о достоверности линейной связи между переменными х и у можно по эмпирической величине коэффициента корреляции r, который вычисляют по уравнению:

исходя из экспериментальных данных, представленных в табл. 6. Чем ближе значение |r| к единице, тем менее наблюдаемая линейная зависимость между переменными х и у может рассматриваться как случайная. В аналитической химии в большинстве случаев используют линейные зависимости, отвечающие условию |r| > 0,98, и только при анализе следовых количеств рассматривают линейные зависимости, для которых |r| > 0,90. При столь близких к 1 значениях величины |r| формальное подтверждение наличия линейной связи между переменными x и у проводить не следует.

Коэффициенты а и b и метрологические характеристики зависимости (6.1) рассчитывают с использованием регрессионного анализа, т. е. методом наименьших квадратов по экспериментально измеренным значениям переменной у для заданных значений аргумента х. Пусть в результате эксперимента найдены представленные в табл. 6 пары значений аргумента х и функции у.

Таблица 6. Значения аргумента х и функции у.

Если полученные значения коэффициентов а и b использовать для вычисления значений у по заданным в табл. 6 значениям аргумента х согласно зависимости (6.1), то вычисленные значения у обозначают через Y 1, Y2, … , Yi, … Yn. Разброс значений Yi относительно значений yi характеризуется величиной дисперсии s20, которую вычисляют по уравнению:

В свою очередь, дисперсии констант b и а находят по уравнениям:

Стандартные отклонения sb и sa и величины ∆b и ∆a, необходимые для оценки доверительных интервалов констант уравнения регрессии, рассчитывают по уравнениям:

Уравнению (6.1) с константами а и b обязательно удовлетворяет точка с координатами x и у, называемая центром калибровочного графика:

Наименьшие отклонения значений yi от значений Yi наблюдаются в окрестностях центра графика. Стандартные отклонения sy и sx величин Y и X, рассчитанных соответственно по уравнениям (6.1) и (6.2), исходя соответственно из известных значений х и у, определяются с учетом удаления последних от центра графика:

где y̅j — среднее значение для nj— вариант y, по которым вычислено искомое значение X.

При x = x̅ и y̅j = y̅ выражения (6.16) и (6.17) принимают вид:

С учетом значений sy и sx могут быть найдены значения величин ∆Y и ∆X:

∆Y = sy*t(P, f); (6.18)

∆X = sx*t(P, f). (6.19)

Значения sx и ∆X, найденные при nj = 1, являются характеристиками воспроизводимости аналитического метода, если х — концентрация (количество), а у есть функция х.

Обычно результаты статистической обработки по методу наименьших квадратов сводят в таблицу (табл. 7).

Таблица 7. Результаты статистической обработки экспериментальных данных, полученных при изучении линейной зависимости у = bx + a

Примечание 6.1. Если целью экспериментальной работы являлось определение констант b и a, графы 11, 12 и 13 табл. 7 не заполняются.

Примечание 6.2. Если y = b lg x + a, вычисления, описанные в разделе 6, выполняют с учетом примечаний 1.2 и 2.2.

Примечание 6.3. Сравнение дисперсий s20, полученных в разных условиях для двух линейных зависимостей, может быть проведено, как указано в разделе 3 (см. выражения (3.4), (3.5) и (3.5 а)).

7. Расчет неопределенности функции нескольких случайных переменных

Описанные в разделах 1 — 6 настоящей общей фармакопейной статьи расчеты доверительных интервалов результатов методик анализа применимы лишь в том случае, если измеряемая величина (концентрация, содержание и т.д.) является функцией только одной случайной переменной. Такая ситуация обычно возникает при использовании прямых методов анализа (титрование, определение сульфатной золы, тяжелых металлов и т.д.). Однако большинство методик количественного определения в фармакопейном анализе являются косвенными, то есть используют стандартные образцы. Следовательно, измеряемая величина является функцией, как минимум, двух случайных переменных — аналитических сигналов (оптическая плотность, высота или площадь пика и т.д.) испытуемого и стандартного образцов. Кроме того, нередко возникает проблема прогнозирования неопределенности аналитической методики, состоящей из нескольких стадий (взвешивание, разбавление, конечная аналитическая операция), каждая из которых является по отношению к другой случайной величиной.

Таким образом, возникает общая проблема оценки неопределенности косвенно измеряемой величины, зависящей от нескольких измеряемых величин, в частности, как рассчитывать неопределенность всей аналитической методики, если известны неопределенности отдельных ее составляющих (стадий)?

Если измеряемая на опыте величина у является функцией п независимых случайных величин xi, то есть:

y = f(x1, x2, … xn), (7.1)

и число степеней свободы величин xi одинаково или достаточно велико (> 30, чтобы можно было применять статистику Гаусса, а не Стьюдента), то диспер­сия величины у связана с дисперсиями величин xi соотношением (правило рас­пространения неопределенностей):

Однако на практике степени свободы величин xt обычно невелики и не равны друг другу. Кроме того, обычно интерес представляют не сами дисперсии (стандартные отклонения), а доверительные интервалы, рассчитать которые, используя уравнение (7.2), при небольших и неодинаковых степенях свободы невозможно. Поэтому для расчета неопределенности величины у (∆у) предложены различные подходы, среди которых можно выделить два основных: линейная модель и подход Уэлча-Сатертуэйта.

7.1. Линейная модель

Если случайные переменные xi статистически независимы, то доверительный интервал функции ∆у связан с доверительными интервалами переменных ∆xi соотношением (доверительные интервалы берутся для одной и той же вероятности):

Данное выражение является обобщением соотношения (7.2).

В фармакопейном анализе измеряемая величина у представляет собой обычно произведение или частное случайных и постоянных величин (масс навесок, разбавлений, оптических плотностей или площадей пиков и т.д.), т.е. (К — некая константа):

В этом случае соотношение (7.2) принимает вид:

где использованы относительные доверительные интервалы.

Соотношение (7.4) применимо при любых (разных) степенях свободы (в том числе и бесконечных) для величин xi. Его преимуществом является простота и наглядность. Использование абсолютных доверительных интервалов приводит к гораздо более громоздким выражениям, поэтому рекомендуется использовать относительные величины.

При проведении фармакопейного анализа в суммарной неопределенности (∆As,r) анализа обычно всегда можно выделить такие типы неопределенностей: неопределенность пробоподготовки (∆SP,r), неопределенность конечной аналитической операции (∆FAO,r) и неопределенность аттестации стандартного образца (∆RS,r). Величина (∆RS,r) обычно столь мала, что ею можно пренебречь. Учитывая это, а также то, что анализ проводится и для испытуемого раствора (индекс «smp»), и для раствора сравнения (индекс «st»), выражение (7.5) можно представить в виде:

При этом каждое из слагаемых рассчитывается из входящих в него ком­понентов по формуле (7.5).

Если число степеней свободы величин xi одинаково или достаточно велико (> 30), выражение (7.5) дает:

Это же соотношение получается при тех же условиях и из выражения (7.2).

7.2. Подход Уэлча-Сатертуэйта

В этом подходе дисперсию величины у (s2y) рассчитывают по соотношению (7.2), не обращая внимания на различие в степенях свободы (vi) величин xi. Для полученной дисперсии s2y рассчитывают некое «эффективное» число степеней свободы veff (которое обычно является дробным), на основе которого затем по таблицам для заданной вероятности находят интерполяцией значения критерия Стьюдента. На основе его далее рассчитывают обычным путем доверительный интервал величины y (∆у):

В фармакопейном анализе для определяемой величины у обычно выполняется уравнение (7.4). В этом случае в подходе Уэлча-Сатертуэйта соотношение (7.2) переходит в выражение (7.7), и соотношение (7.8) принимает более простой вид:

Здесь величина sy,r4 рассчитывается из соотношения (7.7).

Подход Уэлча-Сатертуэйта обычно дает более узкие доверительные ин­тервалы, чем линейная модель. Однако он гораздо сложнее в применении и не позволяет выделить так просто неопределенности разных этапов (с последующими рекомендациями по их минимизации), как линейная модель в форме выражения (7.6).

При прогнозе неопределенности анализа используются генеральные величины (с бесконечным числом степеней свободы). В этом случае подход Уэлча-Сатертуэйта совпадает с линейной моделью.

ПРИЛОЖЕНИЯ

Таблица I. Критические значения контрольного критерия Q (Р, n)

Таблица II. Критические значения критерия Стьюдента

t = 1,958788 + 2,429953/f + 2,189891/f 2 + 4,630189/f 3 + 1,398179/f 9 при P = 95%;

t = 2,5638 + 5,49059/f + 2,72654/f 2 + 31,2446/f 3 + 21,6745/f 9 при P = 99%.

Таблица III. Критические значения критерия Фишера

F для P = 95 % напечатаны жирным шрифтом, а F для P = 99 % — обычным.

Добавить комментарий