Доверительный интервал и доверительная вероятность (классическая оценка)
Доверительным
называют интервал ()
, который с заданной доверительной
вероятностью δ содержит истинное
значение Х0
искомой величина; ()
и ()
являются доверительными границами
интервала. При этом обычно задаются
стандартными значениями доверительной
вероятности 0,9; 0,95; 0.99; 0,999.
Доверительной
вероятностью называют вероятность δ
того,
что истинное значение Х0
измеряемой величины содержится внутри
заданного доверительного интервала
().
При этом δ выражают либо в долях единицы
(доверительная вероятность), либо в
процентах (надежность).
В
классической теории ошибок неизвестные
σ и
заменяют их приближенными значениямии;
вычисленными из опытных данных по
формулам (34) и (35). Доверительную вероятность
и доверительный интервал определяют
по табл.1 интеграла вероятностей согласно
уравнению (27). полагая
(36)
При
этом результат измерений принято
записывать в краткой символической
форме:
(37)
Эту
запись следует понимать в том смысле,
что истинное значение Х0
с заданной вероятностью δ находится
внутри доверительного интервала ().
Классическим
методом оценки точности результата
измерений можно пользоваться лишь при
выборке с большим числом (20)
измерений.
Выборочной метод
В
классическом методе для нахождения
границ доверительного интервала
при заданной надежности δ или наоборот,
для определения δ по заданному ΔХ
необходимо знать точное значение
дисперсии σ2
генеральной совокупности измерений.
Из опытных данных нам известна лишь
дисперсия
случайной выборки из этой генеральной
совокупности. А так как рассеяние
результатов относительно средней
арифметическойвсегда меньше рассеяния относительно
истинного значения Х0,
то
Если
мы для оценки доверительного интервала
или доверительной вероятности
воспользуемся табл.2 интеграла
вероятностей, полагая
при малом числе измеренийп,
то найдем неверные значения ΔХ (заниженные)
и δ (завышенные). В этом заключается
недостаток классического метода оценки
точности результата измерений.
Оказывается,
что и при неизвестной дисперсии σг
можно дать точную оценку приближенного
равенства Хр
,
если исходить не из распределения
величины,
а из распределения другой случайной
величины
(38)
Распределение
случайной величины tδ(n)
получил английский химик и математик
В.С. Госсет, публиковавший свои работы
под псевдонимом “Стьюдент” (студент).
Плотность вероятности распределения
Стьюдента имеет вид:
(39)
где
Г (n)
– гамма функция Эйлера, являющаяся
обобщением понятия факториала.
На
рис.5 приведены графика распределения
Стьюдента для разных значений п.
При
распределение (39) переходит в распределение
Гаусса (23) и единичной дисперсией.
Распределение
Стьюдента. аналогично распределению
Гаусса, позволяет производить оценку
точности результата измерений согласно
выражению
(40)
Только
.теперь вместо
вводится коэффициент Стьюдентазависящий от числа измеренийn
и величины надежности δ .
Рис.
5
Для
коэффициентов Стьюдента составлены
подробные таблицы. Ниже приводится
небольшая часть из них.
Таблица
2
Соседние файлы в папке МЕХАНИКА
- #
12.03.20151.05 Mб275BAZA.XLS
- #
- #
- #
- #
- #
- #
- #
Доверительный интервал для математического ожидания нормальной случайной
величины при неизвестной дисперсии
Пусть
, причем
и
неизвестны. Необходимо построить доверительный интервал,
накрывающий с надежностью
истинное значение параметра
.
Для этого из генеральной
совокупности СВ
извлекается
выборка объема
:
.
1) В качестве точечной
оценки математического ожидания
используется
выборочное среднее
, а в
качестве оценки дисперсии
–
исправленная выборочная дисперсия
которой соответствует стандартное отклонение
.
2) Для нахождения
доверительного интервала строится статистика
имеющая в этом случае распределение Стьюдента с
числом степеней свободы
независимо
от значений параметров
и
.
3) Задается требуемый
уровень значимости
.
4) Применяется следующая
формула расчета вероятности:
где
–
критическая точка распределения Стьюдента, которая находится по таблице критических точек распределения Стьюдента (односторонняя критическая область).
Тогда:
Это означает, что
интервал:
накрывает неизвестный
параметр
с
надежностью
Доверительный интервал для математического ожидания
нормальной случайной величины при известной дисперсии
Пусть количественный
признак
генеральной
совокупности имеет нормальное распределение
с
заданной дисперсией
и
неизвестным математическим ожиданием
. Построим
доверительный интервал для
.
1) Пусть для оценки
извлечена
выборка
объема
. Тогда
2) Составим случайную
величину:
Нетрудно показать, что случайная величина
имеет стандартизированное нормальное распределение, то есть:
3) Зададим уровень
значимости
.
4) Применяя формулу нахождения
вероятности отклонения нормальной величины от математического ожидания, имеем:
Это означает, что
доверительный интервал
накрывает неизвестный
параметр
с надежностью
. Точность оценки определяется величиной:
Число
определяется
по таблице значений функции Лапласа из равенства
Окончательно получаем:
Доверительный интервал для
дисперсии нормальной случайной величины при неизвестном математическом ожидании
Пусть
, причем
и
–
неизвестны. Пусть для оценки
извлечена выборка объема
:
.
1) В качестве точечной оценки дисперсии
используется
исправленная выборочная дисперсия
:
которой соответствует стандартное отклонение
.
2) При нахождении
доверительного интервала для дисперсии в этом случае вводится статистика
имеющая
–
распределение с числом степеней свободы
независимо
от значения параметра
.
3) Задается требуемый
уровень значимости
.
4) Тогда, используя таблицу критических точек хи-квадрат распределения, нетрудно указать критические
точки
, для которых будет выполняться следующее
равенство:
Подставив вместо
соответствующее значение, получим:
Получаем доверительный
интервал для неизвестной дисперсии:
Доверительный интервал для
дисперсии нормальной случайной величины при известном математическом ожидании
Пусть
, причем
–
известна, а
–
неизвестна. Пусть для оценки
извлечена выборка объема
:
.
1) В качестве точечной оценки дисперсии
используется выборочная дисперсия:
2) При нахождении
доверительного интервала для дисперсии в этом случае вводится статистика
имеющая
–
распределение с числом степеней свободы
независимо
от значения параметра
.
3) Задается требуемый
уровень значимости
.
4) Тогда, используя таблицу критических точек хи-квадрат распределения,
нетрудно указать критические точки
, для которых будет выполняться следующее
равенство:
Подставив вместо
соответствующее значение, получим:
Получаем доверительный
интервал для неизвестной дисперсии:
Доверительный интервал для
среднего квадратического отклонения
Извлекая квадратный корень:
Положив:
Получим следующий
доверительный интервал для среднего квадратического
отклонения:
Для отыскания
по заданным
и
пользуются специальными таблицами.
Для проверки на нормальность заданного распределения случайной величины можно использовать
правило трех сигм.
Задача
Имеется
три независимых реализации нормальной случайной величины: 0.8, 3.2, 2.0.
Построить
доверительные интервалы для среднего и дисперсии с надежностью
Указание:
воспользоваться таблицами Стьюдента и хи-квадрат.
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Вычисление средней и дисперсии
Вычислим среднее и
исправленную дисперсию
:
Нахождение доверительных интервалов для средней и дисперсии
Найдем доверительный интервал для оценки
неизвестного среднего. Он считается по формуле:
По таблице критических точек t-критерия Стьюдента, для уровня значимости
(односторонняя критическая область):
Искомый
доверительный интервал для среднего:
Найдем доверительный интервал для оценки дисперсии.
Он считается по формуле:
Для уровня значимости
и
получаем по таблице значений хи-квадрат:
Искомый доверительный интервал для дисперсии:
Ответ
Кроме этой задачи на другой странице сайта есть
пример расчета доверительного интервала математического ожидания и среднего квадратического отклонения для интервального вариационного ряда
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Для помощи во время экзамена/зачета в онлайн режиме необходимо договариваться заранее.
Способы расчета доверительного интервала
21 апреля 2016
Часто оценщику приходится анализировать рынок недвижимости того сегмента, в котором располагается объект оценки. Если рынок развит, проанализировать всю совокупность представленных объектов бывает сложно, поэтому для анализа используется выборка объектов. Не всегда эта выборка получается однородной, иногда требуется очистить ее от экстремумов – слишком высоких или слишком низких предложений рынка. Для этой цели применяется доверительный интервал. Цель данного исследования – провести сравнительный анализ двух способов расчета доверительного интервала и выбрать оптимальный вариант расчета при работе с разными выборками в системе estimatica.pro.
Способы расчета доверительного интервала
Доверительный интервал – вычисленный на основе выборки интервал значений признака, который с известной вероятностью содержит оцениваемый параметр генеральной совокупности.
Смысл вычисления доверительного интервала заключается в построении по данным выборки такого интервала, чтобы можно было утверждать с заданной вероятностью, что значение оцениваемого параметра находится в этом интервале. Другими словами, доверительный интервал с определенной вероятностью содержит неизвестное значение оцениваемой величины. Чем шире интервал, тем выше неточность.
Существуют разные методы определения доверительного интервала. В этой статье рассмотрим 2 способа:
- через медиану и среднеквадратическое отклонение;
- через критическое значение t-статистики (коэффициент Стьюдента).
Этапы сравнительного анализа разных способов расчета ДИ:
1. формируем выборку данных;
2. обрабатываем ее статистическими методами: рассчитываем среднее значение, медиану, дисперсию и т.д.;
3. рассчитываем доверительный интервал двумя способами;
4. анализируем очищенные выборки и полученные доверительные интервалы.
Этап 1. Выборка данных
Выборка сформирована с помощью системы estimatica.pro. В выборку вошло 91 предложение о продаже 1 комнатных квартир в 3-ем ценовом поясе с типом планировки «Хрущевка».
Таблица 1. Исходная выборка
№ |
Цена 1 кв.м., д.е. |
1 |
50943 |
2 |
35000 |
3 |
51613 |
4 |
50645 |
5 |
49841 |
… |
… |
86 |
58772 |
87 |
70714 |
88 |
53393 |
89 |
54876 |
90 |
52542 |
91 |
56140 |
Рис.1. Исходная выборка
Этап 2. Обработка исходной выборки
Обработка выборки методами статистики требует вычисления следующих значений:
1. Среднее арифметическое значение
2. Медиана – число, характеризующее выборку: ровно половина элементов выборки больше медианы, другая половина меньше медианы
(для выборки, имеющей нечетное число значений)
3. Размах – разница между максимальным и минимальным значениями в выборке
4. Дисперсия – используется для более точного оценивания вариации данных
5. Среднеквадратическое отклонение по выборке (далее – СКО) – наиболее распространённый показатель рассеивания значений корректировок вокруг среднего арифметического значения.
6. Коэффициент вариации – отражает степень разбросанности значений корректировок
7. коэффициент осцилляции – отражает относительное колебание крайних значений цен в выборке вокруг средней
Таблица 2. Статистические показатели исходной выборки
Показатель |
Значение |
Ср. значение |
54970 |
Медиана |
53934 |
Размах |
39194 |
Дисперсия |
45126821 |
СКО |
6755 |
Коэф. вариации |
12,29% |
Коэф. осциляции |
71,30% |
Коэффициент вариации, который характеризует однородность данных, составляет 12,29%, однако коэффициент осцилляции слишком велик. Таким образом, мы можем утверждать, что исходная выборка не является однородной, поэтому перейдем к расчету доверительного интервала.
Этап 3. Расчёт доверительного интервала
Способ 1. Расчёт через медиану и среднеквадратическое отклонение.
Доверительный интервал определяется следующим образом: минимальное значение – из медианы вычитается СКО; максимальное значение – к медиане прибавляется СКО.
Формула доверительного интервала:
Таким образом, доверительный интервал (47179 д.е.; 60689 д.е.)
Значения, содержащиеся в исходной выборке и не попадающие в доверительный интервал, удаляем. Удалено 20 объектов, что составило 22% выборки.
Рис. 2. Значения, попавшие в доверительный интервал 1.
Способ 2. Построение доверительного интервала через критическое значение t-статистики (коэффициент Стьюдента)
С.В. Грибовский в книге «Математические методы оценки стоимости имущества» описывает способ вычисления доверительного интервала через коэффициент Стьюдента. При расчете этим методом оценщик должен сам задать уровень значимости ∝, определяющий вероятность, с которой будет построен доверительный интервал. Обычно используются уровни значимости 0,1; 0,05 и 0,01. Им соответствуют доверительные вероятности 0,9; 0,95 и 0,99. При таком методе полагают истинные значения математического ожидания и дисперсии практически неизвестными (что почти всегда верно при решении практических задач оценки).
Формула доверительного интервала:
n – объем выборки;
– критическое значение t- статистики (распределения Стьюдента) с уровнем значимости ∝,числом степеней свободы n-1,которое определяется по специальным статистическим таблицам либо с помощью MS Excel ( →”Статистические”→ СТЬЮДРАСПОБР);
∝ – уровень значимости, принимаем ∝=0,01.
Значения, содержащиеся в исходной выборке и не попадающие в доверительный интервал, удаляем. Удалено 62 объекта, что составило 68% выборки.
Рис. 2. Значения, попавшие в доверительный интервал 2.
Этап 4. Анализ разных способов расчета доверительного интервала
Два способа расчета доверительного интервала – через медиану и коэффициент Стьюдента – привели к разным значениям интервалов. Соответственно, получилось две различные очищенные выборки.
Таблица 3. Статистические показатели по трем выборкам.
Показатель |
Исходная выборка |
1 вариант |
2 вариант |
Среднее значение |
54970 |
53593 |
54750 |
Медиана |
53934 |
53425 |
54688 |
Размах |
39194 |
12888 |
3677 |
Дисперсия |
45126821 |
8919645 |
1228707 |
СКО |
6755 |
3008 |
1128 |
Коэф. вариации |
12,29% |
5,61% |
2,06% |
Коэф. осциляции |
71,30% |
24,05% |
6,72% |
Количество выбывших объектов, шт. |
20 |
62 |
На основании выполненных расчетов можно сказать, что полученные разными методами значения доверительных интервалов пересекаются, поэтому можно использовать любой из способов расчета на усмотрение оценщика.
Однако мы считаем, что при работе в системе estimatica.pro целесообразно выбирать метод расчета доверительного интервала в зависимости от степени развитости рынка:
- если рынок неразвит, применять метод расчета через медиану и среднеквадратическое отклонение, так как количество выбывших объектов в этом случае невелико;
- если рынок развит, применять расчет через критическое значение t-статистики (коэффициент Стьюдента), так как есть возможность сформировать большую исходную выборку.
При подготовке статьи были использованы:
1. Грибовский С.В., Сивец С.А., Левыкина И.А. Математические методы оценки стоимости имущества. Москва, 2014 г.
2. Данные системы estimatica.pro
Читайте также:
Расчет корректировок методом парных продаж
Статью подготовили: Наталья Ничкова и Михаил Филимонов
Решения задач на построение доверительных интервалов
Тема построения интервальных оценок очень важна и изучается в любом курсе математической статистике. В этом разделе мы рассмотрим решения задач на построение интервалов для среднего, дисперсии, СКО и вероятности с заданным уровенем доверительной вероятности.
Лучшее спасибо – порекомендовать эту страницу
Примеры решений онлайн
Пример 1. По данным 7 измерений некоторой величины найдены средняя результатов измерений, равная 30 и выборочная дисперсия, равная 36. Найдите границы, в которых с надежностью 0,99 заключено истинное значение измеряемой величины.
Пример 2. Строительная компания хочет оценить среднюю стоимость ремонтных работ, выполняемых для клиентов. Каким должен быть объем выборки среди 1200 клиентов строительной фирмы, если среднее квадратическое отклонение по результатам пробного обследования составило 850 у.е., а предельная ошибка выборки не должна превышать 200 у.е. с вероятностью 0,95?
Пример 3. Из партии объемом 500 однородных товаров для проверки по схеме случайной бесповторной выборки отобрано 70 товаров, среди которых оказалось 56 небракованных. Найдите вероятность того, что доля бракованных товаров во всей партии отличается от полученной доли в выборке не более чем на 0,02 (по абсолютной величине), а также границы, в которых с надежностью 0,96 заключена доля бракованных товаров во всей партии.
Пример 4. Найти доверительный интервал для оценки математического ожидания $a$ нормального распределения с надежностью 0,95, зная выборочную среднюю $=75.12$, объем выборки $n=121$ и среднее квадратическое отклонение $sigma=11$.
Пример 5. По группе семей с доходом 154 руб./чел. зафиксированы следующие цифры потребления молока за месяц (на одного человека): 8,3; 8,6; 8,7; 8,8; 9,1; 9,3; 9,4; 13,4; 13,5; 13,8; 13,9; 14,1; 14,3. Найти доверительный интервал для математического ожидания и дисперсии с надежностью 0.95, дать точность оценки. Выборка произведена из нормальной совокупности.
Пример 6. По данным выборочного контроля найти выборочные математическое ожидание и дисперсию нормальной случайной величины $xi$. Найти доверительные интервалы для них, соответствующие доверительной вероятности 0,9.
Пример 7. С целью размещения рекламы опрошено 420 телезрителей, из которых данную передачу смотрят 170 человек. С доверительной вероятностью $gamma=0,91$ найти долю телезрителей, охваченных рекламой в лучшем случае.
Пример 8. Построить доверительный интервал для математического ожидания $a$ нормально распределенной генеральной совокупности с известным среднеквадратичным отклонением $sigma=6$ с помощью выборки объема $n=36$ с данным средним выборочным 75.17, с заданной надежностью 0.90.
Нужно решить задачи по доверительным интервалам?
Полезные ссылки
- Таблицы и формулы
- Решение задач на заказ
- Ссылки на учебники
- Решенные контрольные
Ищете решение задания по доверительным интервалам? Найдите свое или похожее тут: