Как найти доверительный интервал при доверительной вероятности

Теоремы 1 и 2 хотя
и являются общими, т. е. сформулированы
при достаточно широких предположениях,
они не дают возможности установить,
насколько близки оценки к оцениваемым
параметрам. Из факта, что —оценки
являются состоятельными, следует только
то, что при увеличении объема выборки
значение P(|θ*
θ|
< δ), δ < 0, приближается к 1.

Возникают следующие
вопросы.

  1. Каким должен быть
    объем выборки п,
    чтобы
    заданная точность
    |θ*
    θ|
    = δ была гарантирована с заранее принятой
    вероятностью?

  2. Какова точность
    оценки, если объем выборки известен и
    вероятность безошибочности вывода
    задана?

  3. Какова вероятность
    того, что при заданном объеме выборки
    будет обеспечена заданная точность
    оценки?

Введем несколько
новых определений.

Определение.
Вероятность
γ выполнения неравенства,
|θ*–
θ|
< δ
называется
доверительной вероятностью или
надежностью оценки
θ.

(1)

Перейдем от
неравенства |θ*–θ|
< δ к двойному неравенству. Известно,
что
.
Поэтому доверительную вероятность
можно записать в виде

(2)

Так как θ
(оцениваемый параметр) – число постоянное,
а θ*
– величина случайная, понятие доверительной
вероятности сформулировать так:
доверительной вероятностью γ
называется вероятность того, что интервал
(θ*–
δ, θ*+
δ) накрывает оцениваемый параметр.

Определение.
Случайный
интервал
(θ*–δ,
θ*+δ),
в пределах
которого с вероятностью
γ
находится неизвестный оцениваемый
параметр,
называется
доверительным интервалом
İ,
соответствующим
коэффициенту доверия
γ,

İ=(θ*–
δ,
θ*+
δ). (3)

Надежность оценки
γ может
задаваться заранее, тогда, зная закон
распределения изучаемой случайной
величины, можно найти доверительный
интервал İ.
Решается и обратная задача, когда по
заданному İ
находится соответствующая надежность
оценки.

Пусть, например,
γ
= 0,95; тогда число р
= 1 – у = 0,05
показывает, с какой вероятностью
заключение о надежности оценки ошибочно.
Число р=1–γ
называется
уровнем
значимости.
Уровень
значимости
задается заранее в зависимости от
конкретного случая. Обычно р
принимают
равным 0,05; 0,01; 0,001.

Выясним, как
построить доверительный интервал для
математического ожидания нормально
распределенного признака. Было показано,
что

Оценим математическое
ожидание с помощью выборочной средней
учитывая, что
также имеет
нормальное распределение.
Имеем

(4)

а по формуле
(12.9.2) получаем

Принимая во внимание
(13.5.12), получим

(5)

Пусть известна
вероятность γ.
Тогда

Для удобства
пользования таблицей функции Лапласа
положим
тогдаа

(6)

Интервал

(7)

накрывает параметр
а = М(Х)
с вероятностью
γ.

В большинстве
случаев среднее квадратическое отклонение
σ(Х) исследуемого
признака неизвестно. Поэтому вместо
σ(Х)
при большой
выборке (n
> 30) применяют исправленное выборочное
среднее квадратическое отклонение s,
являющееся, в свою очередь оценкой σ(X),
доверительный интервал будет иметь вид

İ
=

Пример. С
вероятностью γ = 0,95 найти доверительный
интервал для М(Х)
– длины
колоса ячменя сорта «Московский 121».
Распределение задается таблицей, в
которой’ вместо интервалов изменения
i,
хi
+ 1)
взяты числа
,
см. Считать, что случайная величинаX
подчинена
нормальному распределению.

7,5

8,5

9,5

10,5

11,5

12,5

13,5

ni

4

10

14

12

5

4

1

Решение. Выборка
большая (n
= 50). Имеем

Найдем точность
оценки

Определим
доверительные границы:

Таким образом, с
надежностью γ
= 0,95 математическое ожидание заключено
в доверительном интервале I
= (9,5; 10,3).

Итак, в случае
большой выборки (n
> 30), когда исправленное среднее
квадратическое отклонение незначительно
отклоняется от среднего квадратического
отклонения значения признака в генеральной
совокупности, можно найти доверительный
интервал. Но делать большую выборку
удается не всегда и это не всегда
целесообразно. Из (7) видно, что чем меньше
п, тем
шире доверительный интервал, т. е. I
зависит от объема выборки п.

Английский статистик
Госсет (псевдоним Стьюдент) доказал,
что в случае нормального распределения
признака X
в генеральной
совокупности нормирования случайная
величина

(8)

зависит только от
объема выборки. Была найдена функция
распределения случайной величины Т
и вероятность
P(T
< tγ),
tγ
– точность оценки. Функция, определяемая
равенством

s
(n,
tγ)
= P(|T|
< tγ)
= γ (9)

названа
t-распределением
Стьюдента
с
п
1 степенями свободы. Формула (9) связывает
случайную величину Т,
доверительный
интервал İ
и доверительную вероятность γ.
Зная две из них, можно найти третью.
Учитывая (8), имеем

(10)

Неравенство в
левой части (13.7.10) заменим равносильным
ему неравенством
.
В результате получим

или

(11)

где tγ=t(γ,n).
Для функции tγ
составлены таблицы (см. Приложение 5).
При n>30
числа tγ
и t,
найденные
по таблице функции Лапласа, практически
совпадают.

Доверительный
интервал для оценки среднего квадратического

отклонения
σx
в случае нормального
распределения.

Теорема.
Пусть
известно, что случайная величина имеет
нормальное распределение. Тогда для
оценки параметра σ
х
этого закона имеет место равенство

(12)

где γ
доверительная
вероятность, зависящая от объема выборки
п и точности оценки
β.

Функция γ
= Ψ (n,
β)
хорошо изучена. С ее помощью определяют
β =
β(γ,п).
Для β =
β(γ,п)
составлены таблицы, по которым по
известным п
(объему
выборки) и γ
(доверительной вероятности) определяется
β.

Пример. Для
оценки параметра нормально распределенной
случайной величины была сделана выборка
(дневной удой 50 коров) и вычислено s
= 1,5. Найти доверительный интервал,
накрывающий с вероятностью γ
= 0,95.

Решение.
По таблице β(γ,
п) для
n
= 50 и γ
= 0,95 находим β = 0,21 (см. Приложение 6).

В соответствии с
неравенством (13) найдем границы
доверительного интервала. Имеем

1,5 – 0,21·1,5 = 1,185; 1,5
+ 0,21·1,5 = 1,185;

1,185 < σ
< 1,185.

Нахождение объема
выборочной совокупности.

Формула

связывает δ
(точность оценки), доверительную
вероятность
и объем выборки. Зная две из этих величин,
можно найти третью. Важной является
задача определения объема выборочной
совокупностиn
при заданной
доверительной вероятности γ и заданном
доверительном интервале, определенном
точностью δ.
Как найти такой минимальный объем
выборки n,
чтобы оцениваемый параметр накрывался
доверительным интервалом с заданной
вероятностью γ?
Обозначим

тогда

Здесь σ(Х)
– среднее
квадратическое отклонение, t
– значение независимой переменной в
функции Лапласа, для которой

Пример. Высота
стебля кукурузы X
– случайная
величина, имеющая нормальное распределение.
Сколько необходимо отобрать растений,
чтобы
отличалось
от М(Х)
меньше чем
на 2 см, если известно, что по результатам
предыдущих измерений σ(Х)
= 6см.
Результат
найти с надежностью γ
– 0,95.

Решение.
Имеем γ =
0,95, Ф(t)
= 0,475, t
= 1,96

Таким образом, n
≥ 35

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Способы расчета доверительного интервала

Способы расчета доверительного интервала

21 апреля 2016

Часто оценщику приходится анализировать рынок недвижимости того сегмента, в котором располагается объект оценки. Если рынок развит, проанализировать всю совокупность представленных объектов бывает сложно, поэтому для анализа используется выборка объектов. Не всегда эта выборка получается однородной, иногда требуется очистить ее от экстремумов – слишком высоких или слишком низких предложений рынка. Для этой цели применяется доверительный интервал. Цель данного исследования – провести сравнительный анализ двух способов расчета доверительного интервала и выбрать оптимальный вариант расчета при работе с разными выборками в системе estimatica.pro.

Способы расчета доверительного интервала

Доверительный интервал – вычисленный на основе выборки интервал значений признака, который с известной вероятностью содержит оцениваемый параметр генеральной совокупности.

Смысл вычисления доверительного интервала заключается в построении по данным выборки такого интервала, чтобы можно было утверждать с заданной вероятностью, что значение оцениваемого параметра находится в этом интервале. Другими словами, доверительный интервал с определенной вероятностью содержит неизвестное значение оцениваемой величины. Чем шире интервал, тем выше неточность.

Существуют разные методы определения доверительного интервала. В этой статье рассмотрим 2 способа:

  • через медиану и среднеквадратическое отклонение;
  • через критическое значение t-статистики (коэффициент Стьюдента).

Этапы сравнительного анализа разных способов расчета ДИ:

1. формируем выборку данных;

2. обрабатываем ее статистическими методами: рассчитываем среднее значение, медиану, дисперсию и т.д.;

3. рассчитываем доверительный интервал двумя способами;

4. анализируем очищенные выборки и полученные доверительные интервалы.

Этап 1. Выборка данных

Выборка сформирована с помощью системы estimatica.pro. В выборку вошло 91 предложение о продаже 1 комнатных квартир в 3-ем ценовом поясе с типом планировки «Хрущевка».

Таблица 1. Исходная выборка

Цена 1 кв.м., д.е.

1

50943

2

35000

3

51613

4

50645

5

49841

86

58772

87

70714

88

53393

89

54876

90

52542

91

56140

Рис.1. Исходная выборка

Выборка данных

Этап 2. Обработка исходной выборки

Обработка выборки методами статистики требует вычисления следующих значений:

1. Среднее арифметическое значение

Обработка исходной выборки

2. Медиана – число, характеризующее выборку: ровно половина элементов выборки больше медианы, другая половина меньше медианы

Обработка исходной выборки1 (для выборки, имеющей нечетное число значений)

3. Размах – разница между максимальным и минимальным значениями в выборке

Обработка исходной выборки2

4. Дисперсия – используется для более точного оценивания вариации данных

Обработка исходной выборки3

5. Среднеквадратическое отклонение по выборке (далее – СКО) – наиболее распространённый показатель рассеивания значений корректировок вокруг среднего арифметического значения.

Обработка исходной выборки4

6. Коэффициент вариации – отражает степень разбросанности значений корректировок

Обработка исходной выборки5

7. коэффициент осцилляции – отражает относительное колебание крайних значений цен в выборке вокруг средней

Обработка исходной выборки6

Таблица 2. Статистические показатели исходной выборки

Показатель

Значение

Ср. значение

54970

Медиана

53934

Размах

39194

Дисперсия

45126821

СКО

6755

Коэф. вариации

12,29%

Коэф. осциляции

71,30%

Коэффициент вариации, который характеризует однородность данных, составляет 12,29%, однако коэффициент осцилляции слишком велик. Таким образом, мы можем утверждать, что исходная выборка не является однородной, поэтому перейдем к расчету доверительного интервала.

Этап 3. Расчёт доверительного интервала

Способ 1. Расчёт через медиану и среднеквадратическое отклонение.

Доверительный интервал определяется следующим образом: минимальное значение – из медианы вычитается СКО; максимальное значение – к медиане прибавляется СКО.

Формула доверительного интервала:

Форма доверительного интервала

Таким образом, доверительный интервал (47179 д.е.; 60689 д.е.)

Значения, содержащиеся в исходной выборке и не попадающие в доверительный интервал, удаляем. Удалено 20 объектов, что составило 22% выборки.

Рис. 2. Значения, попавшие в доверительный интервал 1.

Значения попавшие в доверительный интервал

Способ 2. Построение доверительного интервала через критическое значение t-статистики (коэффициент Стьюдента)

С.В. Грибовский в книге «Математические методы оценки стоимости имущества» описывает способ вычисления доверительного интервала через коэффициент Стьюдента. При расчете этим методом оценщик должен сам задать уровень значимости ∝, определяющий вероятность, с которой будет построен доверительный интервал. Обычно используются уровни значимости 0,1; 0,05 и 0,01. Им соответствуют доверительные вероятности 0,9; 0,95 и 0,99. При таком методе полагают истинные значения математического ожидания и дисперсии практически неизвестными (что почти всегда верно при решении практических задач оценки).

Формула доверительного интервала:

Форма доверительного интервала1

n – объем выборки;

Форма доверительного интервала2 – критическое значение t- статистики (распределения Стьюдента) с уровнем значимости ∝,числом степеней свободы n-1,которое определяется по специальным статистическим таблицам либо с помощью MS Excel (Форма доверительного интервала4  →”Статистические”→ СТЬЮДРАСПОБР);

∝ – уровень значимости, принимаем ∝=0,01.

Форма доверительного интервала5

Значения, содержащиеся в исходной выборке и не попадающие в доверительный интервал, удаляем. Удалено 62 объекта, что составило 68% выборки.

Рис. 2. Значения, попавшие в доверительный интервал 2.

Форма доверительного интервала6

Этап 4. Анализ разных способов расчета доверительного интервала

Два способа расчета доверительного интервала – через медиану и коэффициент Стьюдента – привели к разным значениям интервалов. Соответственно, получилось две различные очищенные выборки.

Таблица 3. Статистические показатели по трем выборкам.

Показатель

Исходная выборка

1 вариант

2 вариант

Среднее значение

54970

53593

54750

Медиана

53934

53425

54688

Размах

39194

12888

3677

Дисперсия

45126821

8919645

1228707

СКО

6755

3008

1128

Коэф. вариации

12,29%

5,61%

2,06%

Коэф. осциляции

71,30%

24,05%

6,72%

Количество выбывших объектов, шт.

20

62

На основании выполненных расчетов можно сказать, что полученные разными методами значения доверительных интервалов пересекаются, поэтому можно использовать любой из способов расчета на усмотрение оценщика.

Однако мы считаем, что при работе в системе estimatica.pro целесообразно выбирать метод расчета доверительного интервала в зависимости от степени развитости рынка:

  • если рынок неразвит, применять метод расчета через медиану и среднеквадратическое отклонение, так как количество выбывших объектов в этом случае невелико;
  • если рынок развит, применять расчет через критическое значение t-статистики (коэффициент Стьюдента), так как есть возможность сформировать большую исходную выборку.

При подготовке статьи были использованы:

1. Грибовский С.В., Сивец С.А., Левыкина И.А. Математические методы оценки стоимости имущества. Москва, 2014 г.

2. Данные системы estimatica.pro

Читайте также:

Расчет корректировок методом парных продаж

Статью подготовили: Наталья Ничкова и Михаил Филимонов

Доверительный интервал для математического ожидания нормальной случайной
величины при неизвестной дисперсии

Пусть

, причем

 и

 неизвестны.  Необходимо построить доверительный интервал,
накрывающий с надежностью

 истинное значение параметра

.

Для этого из генеральной
совокупности СВ

 извлекается
выборка объема

:

.

1) В качестве точечной
оценки математического ожидания

 используется
выборочное среднее

, а в
качестве оценки дисперсии

 –
исправленная выборочная дисперсия

которой соответствует стандартное отклонение

.

2) Для нахождения
доверительного интервала строится статистика

имеющая в этом случае распределение Стьюдента с
числом степеней свободы

 независимо
от значений параметров

 и

.

3) Задается требуемый
уровень значимости

.

4) Применяется следующая
формула расчета вероятности:

где

 –
критическая точка распределения Стьюдента, которая находится по таблице критических точек распределения Стьюдента (односторонняя критическая область).

Тогда:

Это означает, что
интервал:

накрывает неизвестный
параметр

 с
надежностью

Доверительный интервал для математического ожидания
нормальной случайной величины при известной дисперсии

Пусть количественный
признак

 генеральной
совокупности имеет нормальное распределение

 с
заданной дисперсией

 и
неизвестным математическим ожиданием

.  Построим
доверительный интервал для

.

1) Пусть для оценки

 извлечена
выборка

 объема

. Тогда

2) Составим случайную
величину:

Нетрудно показать, что случайная величина


имеет стандартизированное нормальное распределение, то есть:

3) Зададим уровень
значимости

.

4) Применяя формулу нахождения
вероятности отклонения нормальной величины от математического ожидания, имеем:

Это означает, что
доверительный интервал

накрывает неизвестный
параметр

 с надежностью

. Точность оценки определяется величиной:

Число

 определяется
по таблице значений функции Лапласа из равенства

Окончательно получаем:

Доверительный интервал для
дисперсии нормальной случайной величины при неизвестном математическом ожидании

Пусть

, причем

 и

 –
неизвестны. Пусть для оценки

 извлечена выборка объема

:

.

1) В качестве точечной оценки дисперсии

 используется
исправленная выборочная дисперсия
:

которой соответствует стандартное отклонение

.

2) При нахождении
доверительного интервала для дисперсии в этом случае вводится статистика

имеющая

 –
распределение с числом степеней свободы

 независимо
от значения параметра

.

3) Задается требуемый
уровень значимости

.

4) Тогда, используя таблицу критических точек хи-квадрат распределения, нетрудно указать критические
точки

, для которых будет выполняться следующее
равенство:

Подставив вместо

 соответствующее значение, получим:

Получаем доверительный
интервал для неизвестной дисперсии:

Доверительный интервал для
дисперсии нормальной случайной величины при известном математическом ожидании

Пусть

, причем

 –
известна, а

 –
неизвестна. Пусть для оценки

 извлечена выборка объема

:

.

1) В качестве точечной оценки дисперсии

 используется выборочная дисперсия:

2) При нахождении
доверительного интервала для дисперсии в этом случае вводится статистика

имеющая

 –
распределение с числом степеней свободы

 независимо
от значения параметра

.

3) Задается требуемый
уровень значимости

.

4) Тогда, используя таблицу критических точек хи-квадрат распределения,
нетрудно указать критические точки

, для которых будет выполняться следующее
равенство:

Подставив вместо

 соответствующее значение, получим:

Получаем доверительный
интервал для неизвестной дисперсии:

Доверительный интервал для
среднего квадратического отклонения

Извлекая квадратный корень:

Положив:

Получим следующий
доверительный интервал для среднего квадратического
отклонения:

Для отыскания

 по заданным

 и

 пользуются специальными таблицами.

Для проверки на нормальность заданного распределения случайной величины можно использовать

правило трех сигм.

Задача

Имеется
три независимых реализации нормальной случайной величины: 0.8, 3.2, 2.0.

Построить
доверительные интервалы для среднего и дисперсии с надежностью  

Указание:
воспользоваться таблицами Стьюдента и хи-квадрат.

Решение

На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:

ВКонтакте
WhatsApp
Telegram

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.

Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.

Вычисление средней и дисперсии

Вычислим среднее и
исправленную дисперсию
:

Нахождение доверительных интервалов для средней и дисперсии

Найдем доверительный интервал для оценки
неизвестного среднего. Он считается по формуле:

По таблице критических точек t-критерия Стьюдента, для уровня значимости

 (односторонняя критическая область):

 Искомый
доверительный интервал для среднего:

Найдем доверительный интервал для оценки дисперсии.
Он считается по формуле:

Для уровня значимости

 и

 получаем по таблице значений хи-квадрат:

Искомый доверительный интервал для дисперсии:

Ответ


Кроме этой задачи на другой странице сайта есть

пример расчета доверительного интервала математического ожидания и среднего квадратического отклонения для интервального вариационного ряда

На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:

ВКонтакте
WhatsApp
Telegram

Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.

Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.

Для помощи во время экзамена/зачета в онлайн режиме необходимо договариваться заранее.

Решения задач на построение доверительных интервалов

Тема построения интервальных оценок очень важна и изучается в любом курсе математической статистике. В этом разделе мы рассмотрим решения задач на построение интервалов для среднего, дисперсии, СКО и вероятности с заданным уровенем доверительной вероятности.

Понравилось? Добавьте в закладки

Примеры решений онлайн

Пример 1. По данным 7 измерений некоторой величины найдены средняя результатов измерений, равная 30 и выборочная дисперсия, равная 36. Найдите границы, в которых с надежностью 0,99 заключено истинное значение измеряемой величины.

Пример 2. Строительная компания хочет оценить среднюю стоимость ремонтных работ, выполняемых для клиентов. Каким должен быть объем выборки среди 1200 клиентов строительной фирмы, если среднее квадратическое отклонение по результатам пробного обследования составило 850 у.е., а предельная ошибка выборки не должна превышать 200 у.е. с вероятностью 0,95?

Пример 3. Из партии объемом 500 однородных товаров для проверки по схеме случайной бесповторной выборки отобрано 70 товаров, среди которых оказалось 56 небракованных. Найдите вероятность того, что доля бракованных товаров во всей партии отличается от полученной доли в выборке не более чем на 0,02 (по абсолютной величине), а также границы, в которых с надежностью 0,96 заключена доля бракованных товаров во всей партии.

Пример 4. Найти доверительный интервал для оценки математического ожидания $a$ нормального распределения с надежностью 0,95, зная выборочную среднюю $=75.12$, объем выборки $n=121$ и среднее квадратическое отклонение $sigma=11$.

Пример 5. По группе семей с доходом 154 руб./чел. зафиксированы следующие цифры потребления молока за месяц (на одного человека): 8,3; 8,6; 8,7; 8,8; 9,1; 9,3; 9,4; 13,4; 13,5; 13,8; 13,9; 14,1; 14,3. Найти доверительный интервал для математического ожидания и дисперсии с надежностью 0.95, дать точность оценки. Выборка произведена из нормальной совокупности.

Пример 6. По данным выборочного контроля найти выборочные математическое ожидание и дисперсию нормальной случайной величины $xi$. Найти доверительные интервалы для них, соответствующие доверительной вероятности 0,9.

Пример 7. С целью размещения рекламы опрошено 420 телезрителей, из которых данную передачу смотрят 170 человек. С доверительной вероятностью $gamma=0,91$ найти долю телезрителей, охваченных рекламой в лучшем случае.

Пример 8. Построить доверительный интервал для математического ожидания $a$ нормально распределенной генеральной совокупности с известным среднеквадратичным отклонением $sigma=6$ с помощью выборки объема $n=36$ с данным средним выборочным 75.17, с заданной надежностью 0.90.

Нужно решить задачи по доверительным интервалам?

Полезные ссылки

  • Таблицы и формулы
  • Решение задач на заказ
  • Ссылки на учебники
  • Решенные контрольные

Ищете решение задания по доверительным интервалам? Найдите свое или похожее тут:

Добавить комментарий