Неопределенность присутствует везде: в простых решениях, таких как бросок баскетбольного мяча, или сложных, таких как анализ набора данных. Однако неопределенность не случайна, и обычно вы можете предсказать, в пределах определенной суммы, насколько точной будет ваша оценка. Формула доверительного интервала – это способ расчета неопределенности в данном эксперименте. В этой статье мы подробно рассмотрим формулу доверительного интервала, почему она важна и как ее использовать.
Формула доверительного интервала и определение
Формула доверительного интервала – это уравнение, которое, учитывая заранее определенный уровень доверия, дает диапазон значений, в который, как вы ожидаете, попадет ваш результат, если вы проведете эксперимент снова.
Самым распространенным уровнем доверия является 95%, но могут использоваться и другие уровни, такие как 90% и 99%. Например, если вы используете 95%, вы считаете, что в 95 случаях из 100 оценка попадет в параметры доверительного интервала.
Формула доверительного интервала выглядит следующим образом:
Уровень доверия задается значением альфа, используемым в эксперименте, и представляет собой число раз (из 100), когда ожидаемый результат будет воспроизведен. Если альфа равна .1, то уровень доверия будет равен 1-.1=.9, или 90%.
Общий доверительный интервал представляет собой среднее значение вашей оценки плюс или минус вариации внутри оценки. Это ожидаемый диапазон значений, в который с определенной долей уверенности должны попасть ваши значения.
Почему важна формула доверительного интервала?
Установление доверительного интервала важно с точки зрения вероятности и уверенности. Приведенная выше формула позволяет проводящим опрос оценить, насколько хорошо будут воспроизведены результаты и чего они ожидают с высокой степенью точности. Установление четких ожиданий является важной частью понимания того, насколько хорошо понимают опрос, как действуют и насколько точным может быть первоначальный набор данных. Кроме того, определение ожиданий может быть полезно при проведении анализа потребностей клиентов.
Формула доверительного интервала также полезна для определения уверенности в данной аудитории. При проведении опросов и разъяснительной работы с клиентами может быть полезно понять, что они думают и как реагируют. Доверительный интервал позволяет использовать эту информацию для точного прогнозирования их реакции на будущие эксперименты и подскажет вам, если в аудитории что-то изменится.
Руководство и пример использования формулы доверительного интервала
Здесь представлено пошаговое руководство по использованию формулы доверительного интервала. В данном примере мы будем использовать воображаемую выборку людей, совершивших 100 штрафных бросков.
Найти средний результат
Первая информация, которая вам понадобится, – это среднее значение выборки. Это средний результат по всем участникам. Чтобы его найти, сложите все результаты и разделите их на количество участников.
Наша выборка для выполненных бросков: 75, 80, 75, 80, 90, 75, 85, 75, 90, 80. Сложив их и разделив на общее количество стрелков (10), мы получим 80,5. Это означает, что средний результат по всем стрелкам составил 80,5. Доверительный интервал позволит рассчитать уверенность в том, что в следующем эксперименте будет набрано такое же среднее количество выстрелов.
Расчет стандартного отклонения
После определения среднего значения по выборке необходимо рассчитать стандартное отклонение. Это будет разница между средним значением и объемом выборки. Чтобы найти стандартное отклонение, необходимо вычесть среднее значение выборки из каждого отдельного результата и возвести каждый ответ в квадрат. Затем сложите их все и возьмите квадрат ладьи этого числа. Это и будет стандартное отклонение выборки.
Для нашего примера набора данных это выглядит следующим образом: (75 – 80.5)? + (80 – 80.5)? + (75 – 80.5)? + (80 – 80.5)? + (90 – 80.5)? + (75 – 80.5)? + (85 – 80.5)? + (75 – 80.5)? + (90 – 80.5)? + (80 – 80.5)? = 30.25 + 0.25 + 30.25 + 0.25 + 90.25 + 30.25 + 20.25 + 30.25 + 90.25 + 0.25 = 322.5 ? 10 всего стрелков = 32,25.
Найти стандартную ошибку и предел ошибки
Теперь вы можете использовать среднее выборочное и стандартное отклонение для расчета стандартной ошибки вашего исследования. Это число показывает, насколько близко выборка представляет всю совокупность. В нашем примере со штрафными бросками вы рассчитали стандартную ошибку, разделив стандартное отклонение на размер исследования: 32,25 / 10 = 3,225.
После определения стандартной ошибки вы можете легко рассчитать предел погрешности. Это говорит о том, насколько вы можете быть уверены в том, что проведете такой же эксперимент для всей популяции. Больший предел ошибки означает меньшую уверенность в воспроизведении результатов. Чтобы найти этот показатель, умножьте стандартную ошибку на два. Для наших данных это выглядит следующим образом: 3,225 x 2 = 6,45.
Подставьте свои цифры
Получив свои цифры, вы можете подставить их в формулу и рассчитать доверительный интервал. Мы будем считать, что Z-значение равно 95% и, следовательно, 0,95.
Доверительный интервал (ДИ) = ?X ± Z(S ? vn) = 80,5 ± 0,95(32,25 ? v10) = 80,5 ± 0,95(32,25 ? 3,16) = 80,5 ± 0,95(10,21) = 80.5 ± 9,70 = 90,2, 70,8.
Анализ результатов
Формула доверительного интервала определяет вероятность повторения ваших результатов для генеральной совокупности вашей выборки. Более высокая доверительная вероятность показывает большую вероятность повторения, в то время как более низкая доверительная вероятность показывает меньшую вероятность получения тех же результатов. С помощью этих цифр вы можете получить точное представление о границах ожидаемых результатов при повторном проведении эксперимента. Благодаря этому вы сможете проанализировать изменения в популяции и прогнозируемые данные.
Наш доверительный интервал для людей, выполняющих штрафные броски, составил от 90,2 до 70,8 выполненных штрафных бросков. Это означает, что среднее количество выполненных бросков должно находиться между этими двумя значениями (с достоверностью 95%) для всей популяции.
Вывод
С помощью формулы доверительного интервала вы можете точно предсказать, куда попадут люди, основываясь на предыдущих результатах и предполагаемой достоверности. Это может помочь предсказать множество вещей, от будущих данных до изменений в популяции, и, надеюсь, это руководство помогло раскрыть некоторые важные моменты для вашего следующего эксперимента.
В наши отчеты делают анализ простым. Мы помогаем вам в мгновение ока превратить данные в решения – от информационных панелей, которые можно использовать в режиме реального времени, до полного набора аналитических инструментов. Начните сегодня!
Загрузить PDF
Загрузить PDF
Доверительный интервал является показателем точности измерений. Это также показатель того, насколько стабильна полученная величина, то есть насколько близкую величину (к первоначальной величине) вы получите при повторении измерений (эксперимента). Выполните следующие действия, чтобы вычислить доверительный интервал для нужных величин.
Шаги
-
1
Запишите задачу. Например: средний вес студента мужского пола в университете АВС составляет 90 кг. Вы будете тестировать точность предсказания веса студентов мужского пола в университете АВС в пределах данного доверительного интервала.
-
2
Составьте подходящую выборку. Вы будете использовать ее для сбора данных для тестирования гипотезы. Допустим, вы уже случайно выбрали 1000 студентов мужского пола.
-
3
Рассчитайте среднее значение и стандартное отклонение этой выборки. Выберите статистические величины (например, среднее значение и стандартное отклонение), которые вы хотите использовать для анализа вашей выборки. Вот как вычислить среднее значение и стандартное отклонение:
- Для расчета среднего значения выборки сложите значения весов 1000 выбранных мужчин и разделите результат на 1000 (число мужчин). Допустим, получили средний вес, равный 93 кг.
- Для расчета стандартного отклонения выборки необходимо найти среднее значение. Затем нужно вычислить дисперсию данных или среднее значение квадратов разностей от среднего. Найдя это число, просто возьмите квадратный корень из него. Допустим, в нашем примере стандартное отклонение равно 15 кг (заметим, что иногда эта информация может быть дана вместе с условием статистической задачи).
-
4
Выберите нужный доверительный уровень. Наиболее часто используемые доверительные уровни: 90 %, 95 % и 99 %. Он также может быть дан вместе с условием задачи. Допустим, вы выбрали 95 %.
-
5
Рассчитайте предел погрешности. Вы можете найти предел погрешности с помощью следующей формулы: Za/2 * σ/√(n). Za/2 = коэффициент доверия (где а = доверительный уровень), σ = стандартное отклонение, а n = размер выборки. Это формула показывает, что вы должны умножить критическое значение на стандартную ошибку. Вот как вы можете решить эту формулу, разбив ее на части:
- Вычислите критическое значение или Za/2. Доверительный уровень равен 95 %. Преобразуйте проценты в десятичную дробь: 0,95 и разделите ее на 2, чтобы получить 0,475. Затем посмотрите в таблицу Z-оценок, чтобы найти соответствующее значение для 0,475. Вы найдете значение 1,96 (на пересечении строки 1,9 и столбца 0,06).
- Возьмите стандартную ошибку (стандартное отклонение): 15 и разделите ее на квадратный корень из размера выборки: 1000. Вы получите: 15/31,6 или 0,47 кг.
- Умножьте 1,96 на 0,47 (критическое значение на стандартную ошибку), чтобы получить 0,92 — предел погрешности.
-
6
Запишите доверительный интервал. Чтобы сформулировать доверительный интервал, просто запишите среднее значение (93) ± погрешность. Ответ: 93 ± 0,92. Вы можете найти верхнюю и нижнюю границы доверительного интервала, прибавляя и вычитая погрешность к/от средней величины. Итак, нижняя граница составляет 93 – 0,92 или 92,08, а верхняя граница составляет 93 + 0,92 или 93,92.
- Вы можете использовать следующую формулу для вычисления доверительного интервала: x̅ ± Za/2 * σ/√(n), где x̅ — среднее значение.
Реклама
Советы
- И t-оценки и z-оценки можно рассчитать вручную, а также с помощью графического калькулятора или статистических таблиц, которые часто встречаются в учебниках по статистике. Также доступны онлайн-инструменты.
- Критическое значение, используемое для расчета погрешности, является постоянным и выражается либо через t-оценку, либо через z-оценку. T-оценка обычно более предпочтительна в условиях, когда стандартное отклонение выборки неизвестно или когда используется маленькая выборка.
- Ваша выборка должна быть достаточной (по размеру) для того, чтобы вычислить правильный доверительный интервал.
- Доверительный интервал не указывает на вероятность получения того или иного результата. Например, если вы на 95 % уверены, что среднее значение вашей выборки лежит между 75 и 100, то доверительный интервал в 95 % не означает, что среднее значение попадает в ваш диапазон.
- Есть много методов, таких как простая случайная выборка, систематический отбор и стратифицированная выборка, с помощью которых вы можете собрать репрезентативную выборку для тестирования.
Реклама
Что вам понадобится
- Выборка
- Компьютер
- Доступ в интернет
- Учебник статистики
- Графический калькулятор
Об этой статье
Эту страницу просматривали 263 889 раз.
Была ли эта статья полезной?
-
Уровень доверия
Уровень доверия РД
означает, чтоправило определенияинтервала дает верный результатс
вероятностью РД,которая обычно выбирается близкой к 1,
однако, 1 не равно.Убедимся статистически
на примере в том, что доверительный
интервал с уровнем доверия РД
может не содержать (с малой вероятностью1- РД ) истинное значение
параметра.
Пример.рассмотрим
приведенный в (5) случайный интервалI(x1,
…, xn),
который
при любом значениианакрывает
это значение с большой вероятностьюРД:
Р{
I(x1,…,xn)
a } =
РД ,
и потому, если пренебречьвозможностью
осуществления событияaI,имеющего малую вероятность (1-РД),можно считать событиеaI(x1,…,xn)
практически достоверным, т.е.можно
веритьтому, что вычисленный по
конкретным наблюдениямx1,…,xnинтервалI
содержит неизвестное значение
параметраа.
Испытаем интервал (5) на 50 выборках
объема n=10для трех уровней доверияРД
: 0.9 , 0.99 , 0.999 (соответственно, три
значения
fp).
При РД
=
0.9число неверных изk
=50результатов окажется
в окрестности 5, так как среднее число
неверных
k(1- РД)
=
5;
при РД =0.99появление
хотя бы одного неверного изk =50
весьма вероятно: вероятность этого
события
1- РДk=1-0.9950
0.61;
при РД =0.999появление
хотя бы одного неверного весьма
сомнительно: вероятность этого события
1- РДk=1-0.99950
0.05.
Задание.
1. Определить, сколько раз из k =50доверительный интервал оказался
неверным;.это сделаем для трех значенийРД.Графики для РД =0.9иРД =0.99распечатать.
Выполнение в пакетах см. в пп. 2 – 4.
2. Провести аналогично 50 испытаний
доверительного интервала (7) – (9) для
случая неизвестной дисперсии.
-
Интервалы для параметров нормального распределения
Пусть х1, … ,хn
– выборка из нормального
N(a,2)распределения;
значения среднегоаи дисперсии2неизвестны. Оценки дляаи2:
,
.
(7)
Как известно, доверительным интервалом
для среднего ас уровнем доверия
РДпри неизвестной
дисперсии является интервал
I(x)
= (a1(х),
a2(х)
),
(8)
где
,
, (9) tp
– квантиль порядка
(1+РД)/2
распределения Стьюдента сn-1
степенями свободы.
Доверительным интервалом для стандартного
отклонения с уровнем
доверияРД является
интервал
I (x)=(1(х),
2(х))
,
(10)
где
,, (11)
t1 и t2–
квантили порядков соответственно
(1+РД)/2и (1- РД)/2распределения
хи-квадрат сn-1
степенями свободы.
Сгенерируем выборку объема n=20из нормального распределения с параметрамиa =10,
2=22=4
и определим доверительные интервалы
для a
и
с уровнем доверияРД: 0.8 , 0.9 , 0.95 , 0.98 , 0.99 , 0.995 , 0.998 , 0.999. Результаты
выпишем в виде таблицы. C ростомРДинтервал расширяется, с ростомn –
уменьшается.
Выполнение см. в пп. 2 – 4.
Если нас интересуют не интервалы, а
верхние или нижние доверительные
границы, то, как известно, они определяются
теми же формулами (9) è (11),
однако, значения порогов t
изменяются. Например, нижней
доверительной границей дляa
с уровнем доверияРДявляется значение
,
где tp
– квантиль порядкаРДраспределения Стьюдента сn-1
степенями свободы, а верхней границей
дляс уровнем
доверияРДявляется
,
где t2– квантиль порядка1- РД распределения
хи-квадрат сn-1
степенями свободы.
Задание:определить верхние
доверительные границы дляаис уровнем доверияРД
= 0.95 .
Соседние файлы в папке Лабораторные
- #
- #
- #
- #
- #
- #
- #
- #
Программа Эксель используется для выполнения различных статистических задач, одной из которых является вычисление доверительного интервала, который применяется как наиболее подходящая замена точечной оценки при малом объеме выборки.
Хотим сразу заметить, что сама процедура вычисления доверительного интервала довольно непростая, однако, в Excel существует ряд инструментов, призванных облегчить выполнение данной задачи. Давайте рассмотрим их.
Содержание
- Вычисление доверительного интервала
- Метод 1: оператор ДОВЕРИТ.НОРМ
- Метод 2: оператор ДОВЕРИТ.СТЬЮДЕНТ
- Заключение
Вычисление доверительного интервала
Доверительный интервал нужен для того, чтобы дать интервальную оценку каким-либо статическим данным. Основная цель этой операции – убрать неопределенности точечной оценки.
В Microsoft Excel существует два метода выполнения данной задачи:
- Оператор ДОВЕРИТ.НОРМ – применяется в случаях, когда дисперсия известна;
- Оператор ДОВЕРИТ.СТЬЮДЕНТ– когда дисперсия неизвестна.
Ниже мы пошагово разберем оба метода на практике.
Метод 1: оператора ДОВЕРИТ.НОРМ
Данная функция впервые была внедрена в арсенал программы в редакции Эксель 2010 года (до этой версии ее заменял оператор “ДОВЕРИТ”). Оператор входит в категорию “статистические”.
Формула функции ДОВЕРИТ.НОРМ выглядит так:
=ДОВЕРИТ.НОРМ(Альфа;Станд_откл;Размер)
Как мы видим, у функции есть три аргумента:
- “Альфа” – это показатель уровня значимости, который берется за основу при расчете. Доверительный уровень считается так:
1-"Альфа"
. Это выражение применимо в случае, если значение “Альфа” представлено в виде коэффициента. Например, 1-0,7=0,3, где 0,7=70%/100%.(100-"Альфа")/100
. Применятся это выражение, если мы считаем доверительным уровень со значением “Альфа” в процентах. Например, (100-70)/100=0,3.
- “Стандартное отклонение” — соответственно, стандартное отклонение анализируемой выборки данных.
- “Размер” – объем выборки данных.
Примечание: У данной функции наличие всех трех аргументов является обязательным условием.
Оператор “ДОВЕРИТ”, который применялся в более ранних редакциях программы, содержит такие же аргументы и выполняет те же самые функции.
Формула функции ДОВЕРИТ выглядит следующим образом:
=ДОВЕРИТ(Альфа;Станд_откл;Размер)
Отличий в самой формуле нет никаких, лишь название оператора иное. В редакциях приложения Эксель 2010 года и последующих этот оператор находится в категории “Совместимость”. В более же старых версиях программы он находится в разделе статических функций.
Граница доверительного интервала определяется следующей формулой:
X+(-)ДОВЕРИТ.НОРМ
где Х – это среднее значение по заданному диапазону.
Теперь давайте разберемся, как применять эти формулы на практике. Итак, у нас есть таблица с различными данными 10-ти проведенных замеров. При этом, стандартное отклонение совокупности данных равняется 8.
Перед нами стоит задача – получить значение доверительного интервала с 95%-ым уровнем доверия.
- Первым делом выбираем ячейку для вывода результата. Затем кликаем по кнопке “Вставить функцию” (слева от строки формул).
- Откроется окно Мастера функций. Кликнув по текущей категории функций, раскрываем список и щелкаем в нем по строке “Статистические”.
- В предложенном перечне кликаем по оператору “ДОВЕРИТ.НОРМ”, затем жмем OK.
- Перед нами появится окно с настройками аргументов функции, заполнив которые нажимаем кнопку OK.
- в поле “Альфа” указываем уровень значимости. В нашей задаче предполагается 95%-ый уровень доверия. Подставив данное значение в формулу расчета, которую мы рассматривали выше, получаем выражение:
(100-95)/100
. Пишем его в поле аргумента (или можно сразу написать результат вычисления, равный 0,05). - в поле “Станд_откл” согласно нашим условия, пишем цифру 8.
- в поле “Размер” указываем количество исследуемых элементов. В нашем случае было проведено 10 замеров, значит пишем цифру 10.
- в поле “Альфа” указываем уровень значимости. В нашей задаче предполагается 95%-ый уровень доверия. Подставив данное значение в формулу расчета, которую мы рассматривали выше, получаем выражение:
- Чтобы при изменении данных не пришлось заново настраивать функцию, можно автоматизировать ее. Для это применим функцию “СЧЁТ”. Ставим указатель в область ввода информации аргумента “Размер”, затем щелкаем по значку треугольника с левой стороны от строки формул и кликаем по пункту “Другие функции…”.
- В результате откроется еще одно окно Мастера функций. Выбрав категорию “Статистические”, кликаем по функции “СЧЕТ”, затем – OK.
- На экране отобразится еще одно окно с настройками аргументов функции, которая применяется для определения числа ячеек в заданном диапазоне, в которых находятся числовые данные.
Формула функции СЧЕТ пишется так:=СЧЁТ(Значение1;Значение2;...)
.
Количество доступных аргументов этой функции может достигать 255 штук. Здесь можно прописать, либо конкретные числа, либо адреса ячеек, либо диапазоны ячеек. Мы воспользуемся последним вариантом. Для этого кликаем по области ввода информации для первого аргумента, затем зажав левую кнопку мыши выделяем все ячейки одного из столбцов нашей таблицы (не считая шапки), после чего жмем кнопку OK. - В результате проделанных действий в выбранной ячейке будет выведено результат расчетов по оператору ДОВЕРИТ.НОРМ. В нашей задаче его значение оказалось равным 4,9583603.
- Но это еще не конечный результат в нашей задаче. Далее требуется рассчитать среднее значение по заданному интервалу. Для этого потребуется применить функцию “СРЗНАЧ”, которая выполняет задачу по вычислению среднего значения в пределах указанного диапазона данных.
Формула оператора пишется так:=СРЗНАЧ(число1;число2;...)
.
Выделяем ячейку, куда планируем вставить функцию и жмем кнопку “Вставить функцию”. - В категории “Статистические” выбираем нудный оператор “СРЗНАЧ” и кликаем OK.
- В аргументах функции в значении аргумента “Число” указываем диапазон, в который входят все ячейки со значениями всех замеров. Затем кликаем OK.
- В результате проделанных действий среднее значение будет автоматически подсчитано и выведено в ячейку с только что вставленной функцией.
- Теперь нам нужно рассчитать границы ДИ (доверительного интервала). Начнем с расчета значения правой границы. Выбираем ячейку, куда хотим вывести результат, и выполняем в ней сложение результатов, полученных с помощью операторов “СРЗНАЧ” и “ДОВЕРИТ.НОРМ”. В нашем случае формула выглядит так:
A14+A16
. После ее набора жмем Enter. - В результате будет произведен расчет и результат немедленно отобразится в ячейке с формулой.
- Затем аналогичным способом выполняем расчет для получения значения левой границы ДИ. Только в этом случае значение результата “ДОВЕРИТ.НОРМ” нужно не прибавлять, а вычитать из результата, полученного при помощи оператора “СРЗНАЧ”. В нашем случае формула выглядит так:
=A16-A14
. - После нажатия Enter мы получим результат в заданной ячейке с формулой.
Примечание: В пунктах выше мы постарались максимально подробно расписать все шаги и каждую применяемую функцию. Однако все прописанные формулы можно записать вместе, в составе одной большой:
- Для определения правой границы ДИ общая формула будет выглядеть так:
=СРЗНАЧ(B2:B11)+ДОВЕРИТ.НОРМ(0,05;8;СЧЁТ(B2:B11))
. - Точно также и для левой границы, только вместо плюса нужно поставить минус:
=СРЗНАЧ(B2:B11)-ДОВЕРИТ.НОРМ(0,05;8;СЧЁТ(B2:B11))
.
Метод 2: оператор ДОВЕРИТ.СТЬЮДЕНТ
Теперь давайте познакомимся со вторым оператором для определения доверительного интервала – ДОВЕРИТ.СТЬЮДЕНТ. Данная функция была внедрена в программу относительно недавно, начиная с версии Эксель 2010, и направлена на определение ДИ выбранной совокупности данных с применением распределения Стьюдента, при неизвестной дисперсии.
Формула функции ДОВЕРИТ.СТЬЮДЕНТ выглядит следующим образом:
=ДОВЕРИТ.СТЬЮДЕНТ(Альфа;Cтанд_откл;Размер)
Давайте разберем применение данного оператора на примере все той же таблицы. Только теперь стандартное отклонение по условиям задачи нам неизвестно.
- Сначала выбираем ячейку, куда планируем вывести результат. Затем кликаем по значку “Вставить функцию” (слева от строки формул).
- Откроется уже хорошо знакомое окно Мастера функций. Выбираем категорию “Статистические”, затем из предложенного списка функций щелкаем по оператору “ДОВЕРИТ.СТЬЮДЕНТ”, после чего – OK.
- В следующем окне нам нужно настроить аргументы функции:.
- В выбранной ячейке отобразится значение доверительного интервала согласно заданным нами параметрам.
- Далее нам нужно рассчитать значения границ ДИ. А для этого потребуется получить среднее значение по выбранному диапазону. Для этого снова применим функцию “СРЗНАЧ”. Алгоритм действий аналогичен тому, что был описан в первом методе.
- Получив значение “СРЗНАЧ”, можно приступать к расчетам границ ДИ. Сами формулы ничем не отличаются от тех, что использовались с оператором “ДОВЕРИТ.НОРМ”:
- Правая граница ДИ=СРЗНАЧ+ДОВЕРИТ.СТЬЮДЕНТ
- Левая граница ДИ=СРЗНАЧ-ДОВЕРИТ.СТЬЮДЕНТ
Заключение
Арсенал инструментов Excel невероятно большой, и наряду с распространенными функциями, программа предлагает большое разнообразие специальных функций, которые помогут существенно облегчить работу с данными. Возможно, описанные выше шаги некоторым пользователям, на первый взгляд, могут показаться сложными. Но после детального изучения вопроса и последовательности действий, все станет намного проще.
Часто в статистике нас интересует измерение параметров населения — чисел, описывающих некоторые характеристики всего населения.
Двумя наиболее распространенными параметрами населения являются:
1. Среднее значение населения: среднее значение некоторой переменной в популяции (например, средний рост мужчин в США).
2. Доля населения: доля некоторой переменной в населении (например, доля жителей округа, которые поддерживают определенный закон).
Хотя мы заинтересованы в измерении этих параметров, обычно слишком дорого и долго собирать данные о каждом человеке в популяции, чтобы вычислить параметр популяции.
Вместо этого мы обычно берем случайную выборку из общей совокупности и используем данные из выборки для оценки параметра совокупности.
Например, предположим, что мы хотим оценить средний вес определенного вида черепах во Флориде. Поскольку во Флориде тысячи черепах, было бы очень много времени и денег, чтобы обойти и взвесить каждую отдельную черепаху.
Вместо этого мы могли бы взять простую случайную выборку из 50 черепах и использовать средний вес черепах в этой выборке для оценки истинного среднего значения популяции:
Проблема в том, что средний вес черепах в выборке не обязательно точно соответствует среднему весу черепах во всей популяции. Например, мы можем просто случайно выбрать образец, полный черепах с низким весом, или, возможно, образец, полный тяжелых черепах.
Чтобы зафиксировать эту неопределенность, мы можем создать доверительный интервал. Доверительный интервал — это диапазон значений, который может содержать параметр генеральной совокупности с определенным уровнем достоверности. Он рассчитывается по следующей общей формуле:
Доверительный интервал = (точечная оценка) +/- (критическое значение) * (стандартная ошибка)
Эта формула создает интервал с нижней границей и верхней границей, который, вероятно, содержит параметр совокупности с определенным уровнем достоверности.
Доверительный интервал = [нижняя граница, верхняя граница]
Например, формула для расчета доверительного интервала для среднего значения генеральной совокупности выглядит следующим образом:
Доверительный интервал = x +/- z*(s/ √n )
куда:
- x : выборочное среднее
- z: выбранное значение z
- s: стандартное отклонение выборки
- n: размер выборки
Z-значение, которое вы будете использовать, зависит от выбранного вами уровня достоверности. В следующей таблице показано значение z, которое соответствует популярным вариантам выбора уровня достоверности:
| Уровень достоверности | z-значение | | — | — | | 0,90 | 1,645 | | 0,95 | 1,96 | | 0,99 | 2,58 |
Например, предположим, что мы собираем случайную выборку черепах со следующей информацией:
- Размер выборки n = 25
- Средний вес выборки x = 300
- Стандартное отклонение выборки s = 18,5
Вот как найти вычислить 90% доверительный интервал для истинного среднего веса населения:
90% доверительный интервал: 300 +/- 1,645*(18,5/√25) = [293,91, 306,09]
Мы интерпретируем этот доверительный интервал следующим образом:
Вероятность того, что доверительный интервал [293,91, 306,09] содержит истинный средний вес популяции черепах, составляет 90%.
Другой способ сказать то же самое состоит в том, что существует только 10-процентная вероятность того, что истинное среднее значение генеральной совокупности лежит за пределами 90-процентного доверительного интервала. То есть существует только 10%-ная вероятность того, что истинный средний вес популяции черепах больше 306,09 фунтов или меньше 293,91 фунтов.
Ничего не стоит, что есть два числа, которые могут повлиять на размер доверительного интервала:
1. Размер выборки: чем больше размер выборки, тем уже доверительный интервал.
2. Уровень достоверности: чем выше уровень достоверности, тем шире доверительный интервал.
Типы доверительных интервалов
Существует много типов доверительных интервалов. Вот наиболее часто используемые:
Доверительный интервал для среднего
Доверительный интервал для среднего значения — это диапазон значений, который может содержать среднее значение генеральной совокупности с определенным уровнем достоверности. Формула для расчета этого интервала:
Доверительный интервал = x +/- z*(s/ √n )
куда:
- x : выборочное среднее
- z: выбранное значение z
- s: стандартное отклонение выборки
- n: размер выборки
Ресурсы: Как рассчитать доверительный интервал для среднего
Доверительный интервал для среднего калькулятора
Доверительный интервал для разницы между средними значениями
Доверительный интервал (ДИ) для разницы между средними значениями представляет собой диапазон значений, который, вероятно, содержит истинное различие между двумя средними значениями генеральной совокупности с определенным уровнем достоверности. Формула для расчета этого интервала:
Доверительный интервал = ( x 1 – x 2 ) +/- t * √ ((s p 2 /n 1 ) + (s p 2 /n 2 ))
куда:
- x 1 , x 2 : среднее значение для образца 1, среднее значение для образца 2
- t: t-критическое значение, основанное на доверительном уровне и (n 1 +n 2 -2) степенях свободы
- s p 2 : объединенная дисперсия
- n 1 , n 2 : размер выборки 1, размер выборки 2
куда:
- Объединенная дисперсия рассчитывается как: s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
- Критическое значение t можно найти с помощью калькулятора обратного t-распределения .
Ресурсы: Как рассчитать доверительный интервал для разницы между средними
Доверительный интервал для калькулятора разницы между средними значениями
Доверительный интервал для пропорции
Доверительный интервал для доли — это диапазон значений, который может содержать долю населения с определенным уровнем достоверности. Формула для расчета этого интервала:
Доверительный интервал = p +/- z * (√ p (1-p) / n )
куда:
- p: доля выборки
- z: выбранное значение z
- n: размер выборки
Ресурсы: Как рассчитать доверительный интервал для пропорции
Доверительный интервал для калькулятора пропорций
Доверительный интервал для разницы в пропорциях
Доверительный интервал для разницы в пропорциях — это диапазон значений, который может содержать истинную разницу между двумя пропорциями населения с определенным уровнем достоверности. Формула для расчета этого интервала:
Доверительный интервал = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )
куда:
- p 1 , p 2 : доля образца 1, доля образца 2
- z: z-критическое значение, основанное на доверительном уровне
- n 1 , n 2 : размер выборки 1, размер выборки 2
Ресурсы: Как рассчитать доверительный интервал для разницы пропорций
Доверительный интервал для калькулятора разницы пропорций