Как найти дисперсию выборки в статистике


Загрузить PDF


Загрузить PDF

Дисперсия случайной величины является мерой разброса значений этой величины. Малая дисперсия означает, что значения сгруппированы близко друг к другу. Большая дисперсия свидетельствует о сильном разбросе значений. Понятие дисперсии случайной величины применяется в статистике. Например, если сравнить дисперсию значений двух величин (таких как результаты наблюдений за пациентами мужского и женского пола), можно проверить значимость некоторой переменной.[1]
Также дисперсия используется при построении статистических моделей, так как малая дисперсия может быть признаком того, что вы чрезмерно подгоняете значения.[2]

  1. Изображение с названием Calculate Variance Step 1

    1

    Запишите значения выборки. В большинстве случаев статистикам доступны только выборки определенных генеральных совокупностей. Например, как правило, статистики не анализируют расходы на содержание совокупности всех автомобилей в России – они анализируют случайную выборку из нескольких тысяч автомобилей. Такая выборка поможет определить средние расходы на автомобиль, но, скорее всего, полученное значение будет далеко от реального.

    • Например, проанализируем количество булочек, проданных в кафе за 6 дней, взятых в случайном порядке. Выборка имеет следующий вид: 17, 15, 23, 7, 9, 13. Это выборка, а не совокупность, потому что у нас нет данных о проданных булочках за каждый день работы кафе.
    • Если вам дана совокупность, а не выборка значений, перейдите к следующему разделу.
  2. Изображение с названием Calculate Variance Step 2

    2

    Запишите формулу для вычисления дисперсии выборки. Дисперсия является мерой разброса значений некоторой величины. Чем ближе значение дисперсии к нулю, тем ближе значения сгруппированы друг к другу. Работая с выборкой значений, используйте следующую формулу для вычисления дисперсии:[3]

  3. Изображение с названием Calculate Variance Step 3

    3

    Вычислите среднее значение выборки. Оно обозначается как x̅.[4]
    Среднее значение выборки вычисляется как обычное среднее арифметическое: сложите все значения в выборке, а затем полученный результат разделите на количество значений в выборке.

    • В нашем примере сложите значения в выборке: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Теперь результат разделите на количество значений в выборке (в нашем примере их 6): 84 ÷ 6 = 14.
      Выборочное среднее x̅ = 14.
    • Выборочное среднее – это центральное значение, вокруг которого распределены значения в выборке. Если значения в выборке группируются вокруг выборочного среднего, то дисперсия мала; в противном случае дисперсия велика.
  4. Изображение с названием Calculate Variance Step 4

    4

    Вычтите выборочное среднее из каждого значения в выборке. Теперь вычислите разность x_{i} – x̅, где x_{i} – каждое значение в выборке. Каждый полученный результат свидетельствует о мере отклонения конкретного значения от выборочного среднего, то есть как далеко это значение находится от среднего значения выборки.[5]

  5. Изображение с названием Calculate Variance Step 5

    5

    Возведите в квадрат каждый полученный результат. Как отмечалось выше, сумма разностей x_{i} – x̅ должна быть равна нулю. Это означает, что средняя дисперсия всегда равна нулю, что не дает никакого представления о разбросе значений некоторой величины. Для решения этой проблемы возведите в квадрат каждую разность x_{i} – x̅. Это приведет к тому, что вы получите только положительные числа, которые при сложении никогда не дадут 0.[6]

  6. Изображение с названием Calculate Variance Step 6

    6

  7. Изображение с названием Calculate Variance Step 7

    7

    Полученный результат разделите на n – 1, где n – количество значений в выборке. Некоторое время назад для вычисления дисперсии выборки статистики делили результат просто на n; в этом случае вы получите среднее значение квадрата дисперсии, которое идеально подходит для описания дисперсии данной выборки. Но помните, что любая выборка – это лишь небольшая часть генеральной совокупности значений. Если взять другую выборку и выполнить такие же вычисления, вы получите другой результат. Как выяснилось, деление на n – 1 (а не просто на n) дает более точную оценку дисперсии генеральной совокупности, в чем вы и заинтересованы. Деление на n – 1 стало общепринятым, поэтому оно включено в формулу для вычисления дисперсии выборки.[7]

    • В нашем примере выборка включает 6 значений, то есть n = 6.
      Дисперсия выборки = s^{2}={frac  {166}{6-1}}= 33,2
  8. Изображение с названием Calculate Variance Step 8

    8

    Отличие дисперсии от стандартного отклонения. Заметьте, что в формуле присутствует показатель степени, поэтому дисперсия измеряется в квадратных единицах измерения анализируемой величины. Иногда такой величиной довольно сложно оперировать; в таких случаях пользуются стандартным отклонением, которое равно квадратному корню из дисперсии. Именно поэтому дисперсия выборки обозначается как s^{2}, а стандартное отклонение выборки – как s.

    • В нашем примере стандартное отклонение выборки: s = √33,2 = 5,76.

    Реклама

  1. Изображение с названием Calculate Variance Step 9

    1

    Проанализируйте некоторую совокупность значений. Совокупность включает в себя все значения рассматриваемой величины. Например, если вы изучаете возраст жителей Ленинградской области, то совокупность включает возраст всех жителей этой области. В случае работы с совокупностью рекомендуется создать таблицу и внести в нее значения совокупности. Рассмотрим следующий пример:

  2. Изображение с названием Calculate Variance Step 10

    2

    Запишите формулу для вычисления дисперсии генеральной совокупности. Так как в совокупность входят все значения некоторой величины, то приведенная ниже формула позволяет получить точное значение дисперсии совокупности. Для того чтобы отличить дисперсию совокупности от дисперсии выборки (значение которой является лишь оценочным), статистики используют различные переменные: [8]

  3. Изображение с названием Calculate Variance Step 11

    3

    Вычислите среднее значение совокупности. При работе с генеральной совокупностью ее среднее значение обозначается как μ (мю). Среднее значение совокупности вычисляется как обычное среднее арифметическое: сложите все значения в генеральной совокупности, а затем полученный результат разделите на количество значений в генеральной совокупности.

    • Имейте в виду, что средние величины не всегда вычисляются как среднее арифметическое.
    • В нашем примере среднее значение совокупности: μ = {frac  {5+5+8+12+15+18}{6}} = 10,5
  4. Изображение с названием Calculate Variance Step 12

    4

    Вычтите среднее значение совокупности из каждого значения в генеральной совокупности. Чем ближе значение разности к нулю, тем ближе конкретное значение к среднему значению совокупности. Найдите разность между каждым значением в совокупности и ее средним значением, и вы получите первое представление о распределении значений.

    • В нашем примере:
      x_{1} – μ = 5 – 10,5 = -5,5
      x_{2} – μ = 5 – 10,5 = -5,5
      x_{3} – μ = 8 – 10,5 = -2,5
      x_{4} – μ = 12 – 10,5 = 1,5
      x_{5} – μ = 15 – 10,5 = 4,5
      x_{6} – μ = 18 – 10,5 = 7,5
  5. Изображение с названием Calculate Variance Step 13

    5

    Возведите в квадрат каждый полученный результат. Значения разностей будут как положительными, так и отрицательными; если нанести эти значения на числовую прямую, то они будут лежать справа и слева от среднего значения совокупности. Это не годится для вычисления дисперсии, так как положительные и отрицательные числа компенсируют друг друга. Поэтому возведите в квадрат каждую разность, чтобы получить исключительно положительные числа.

    • В нашем примере:
      (x_{i} – μ)^{2} для каждого значения совокупности (от i = 1 до i = 6):
      (-5,5)^{2} = 30,25
      (-5,5)^{2} = 30,25
      (-2,5)^{2} = 6,25
      (1,5)^{2} = 2,25
      (4,5)^{2} = 20,25
      (7,5)^{2} = 56,25
  6. Изображение с названием Calculate Variance Step 14

    6

    Найдите среднее значение полученных результатов. Вы нашли, как далеко каждое значение совокупности расположено от ее среднего значения. Найдите среднее значение суммы квадратов разностей, поделив ее на количество значений в генеральной совокупности.

    • В нашем примере:
      Дисперсия совокупности = {frac  {30,25+30,25+6,25+2,25+20,25+56,25}{6}}={frac  {145,5}{6}}= 24,25
  7. Изображение с названием Calculate Variance Step 15

    7

    Соотнесите это решение с формулой. Если вы не поняли, как приведенное выше решение соотносится с формулой, ниже представлено объяснение решения:

    Реклама

Советы

  • Дисперсию довольно сложно интерпретировать, поэтому в большинстве случаев она вычисляется как промежуточная величина, которая необходима для нахождения стандартного отклонения.
  • При вычислении дисперсии выборки деление на n-1, а не просто на n, называется коррекцией Бесселя. Дисперсия выборки представляет собой только оценочное значение дисперсии генеральной совокупности, при этом выборочное среднее смещено, чтобы соответствовать этому оценочному значению. Коррекция Бесселя устраняет такое смещение.[9]
    Это связано с тем, что при анализе n – 1 значения использование n-го значения уже ограничено, так как только определенные значения приводят к выборочному среднему (x̅), которое используется в формуле для вычисления дисперсии.[10]

Реклама

Об этой статье

Эту страницу просматривали 121 777 раз.

Была ли эта статья полезной?

Выборочная дисперсия, описание

Выборочная дисперсия является сводной характеристикой для наблюдения рассеяния количественного признака выборки вокруг среднего значения.

Определение

Выборочная дисперсия – это среднее арифметическое значений вариантов части отобранных объектов генеральной совокупности (выборки).

Связь выборочной и генеральной дисперсии

Генеральная дисперсия представляет собой среднее арифметическое квадратов отступлений значений признаков генеральной совокупности от их среднего значения.

Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.

Определение

Генеральная совокупность – это комплекс всех возможных объектов, относительно которых планируется вести наблюдение и формулировать выводы.

Выборочная совокупность или выборка является частью генеральной совокупности, выбранной для изучения и составления заключения касательной всей генеральной совокупности.

Как вычислить выборочную дисперсию

Выборочная дисперсия при различии всех значений варианта выборки находится по формуле:

({widehat D}_В=frac{displaystylesum_{i-1}^n{(x_i-{overline x}_В)}^2}n)

Для значений признаков выборочной совокупности с частотами n1, n2,…,nформула выглядит следующим образом:

({widehat D}_В=frac{displaystylesum_{i-1}^kn_i{(x_i-{overline x}_В)}^2}n)

Квадратный корень из выборочной дисперсии характеризует рассеивание значений вариантов выборки вокруг своего среднего значения. Данная характеристика называется выборочным средним квадратическим отклонением и имеет вид:

({widehatsigma}_В=sqrt{{widehat D}_В})

Упрощенный способ вычисления выборочной или генеральной дисперсии производят по формуле:

(D=overline{x^2}-left[overline xright]^2)

Если вариационный ряд выборочной совокупности интервальный, то за xi принимается центр частичных интервалов. 

Пример

Найти выборочную дисперсию выборки со значениями:

  • xi: 1, 2, 3, 4;
  • ni: 20, 15, 10, 5.

Решение

Для начала необходимо определить выборочную среднюю:

({overline x}_В=frac1{50}(1cdot20+2cdot15+3cdot10+4cdot5)=frac1{50}cdot100=2)

Затем найдем выборочную дисперсию:

(D_В=frac1{50}({(1-2)}^2cdot20+{(2-2)}^2cdot15+{(3-2)}^2cdot10+{(4-2)}^2cdot5)=1)

Исправленная дисперсия

Математически выборочная дисперсия не соответствует генеральной, поскольку выборочная используется для смещенного оценивания генеральной дисперсии. По этой причине математическое ожидание выборочной дисперсии вычисляется так:

(Mleft[D_Bright]=frac{n-1}nD_Г)

В данной формуле DГ – это истинное значение дисперсии генеральной совокупности.

Исправить выборочную дисперсию можно путем умножения ее на дробь:

(frac n{n-1})

Получим формулу следующего вида:

(S^2=frac n{n-1}cdot D_В=frac{displaystylesum_{i=1}^kn_i{(x_i-{overline x}_В)}^2}{n-1})

Исправленная дисперсия используется для несмещенной оценки генеральной дисперсии и обозначается S2

Среднеквадратическая генеральная совокупность оценивается при помощи исправленного среднеквадратического отклонения, которое вычисляется по формуле:

(S=sqrt{S^2})

При нахождении выборочной и исправленной дисперсии разнятся лишь знаменатели в формулах. Различия в этих характеристиках при больших n незначительны. Применение исправленной дисперсии целесообразно при объеме выборки меньше 30.

Для чего применяют исправленную выборочную дисперсию

Исправленную выборочную используют для точечной оценки генеральной дисперсии.

Пример

Длину стержня измерили одним и тем же прибором пять раз. В результате получили следующие величины: 92 мм, 94 мм, 103 мм, 105 мм, 106 мм. Задача найти выборочную среднюю длину предмета и выборочную исправленную дисперсию ошибок измерительного прибора.

Решение

Сначала вычислим выборочную среднюю:

({overline x}_В=frac{92+94+103+105+106}5=100)

Затем найдем выборочную дисперсию:

(D_В=frac{displaystylesum_{i=1}^k{(x_i-{overline x}_В)}^2}n=frac{{(92-100)}^2+{(94-100)}^2+{(103-100)}^2+{(105-100)}^2+{(106-100)}^2}5=34)

Теперь рассчитаем исправленную дисперсию:

(S^2=frac5{5-1}cdot34=42,5)

Выборочная дисперсия в математической статистике — это оценка теоретической дисперсии распределения, рассчитанная на основе данных выборки. Виды выборочных дисперсий:

  • смещённая;
  • несмещённая, или исправленная

Содержание

  • 1 Определения
  • 2 Замечание
  • 3 Свойства выборочных дисперсий
  • 4 См. также

Определения[править | править код]

Пусть X_{1},ldots ,X_{n},ldots — выборка из распределения вероятности. Тогда

  • выборочная дисперсия — это случайная величина
S_{n}^{2}={frac  {1}{n}}sum limits _{{i=1}}^{n}left(X_{i}-{bar  {X}}right)^{2}={frac  {1}{n}}sum limits _{{i=1}}^{n}X_{i}^{2}-left({frac  {1}{n}}sum limits _{{i=1}}^{n}X_{i}right)^{2},

где символ {bar  {X}} обозначает выборочное среднее;

  • несмещённая (исправленная) дисперсия — это случайная величина
S^{2}={frac  {1}{n-1}}sum limits _{{i=1}}^{n}left(X_{i}-{bar  {X}}right)^{2}.

Замечание[править | править код]

Очевидно,

S^{2}={frac  {n}{n-1}}S_{n}^{2}.

Свойства выборочных дисперсий[править | править код]

  • Выборочная дисперсия является теоретической дисперсией выборочного распределения. Более точно, пусть {hat  {F}}(x) — выборочная функция распределения данной выборки. Тогда для любого фиксированного omega in Omega функция {hat  {F}}(omega ,x) является (неслучайной) функцией дискретного распределения. Дисперсия этого распределения равна S_{n}^{2}(omega ).
  • Обе выборочные дисперсии являются состоятельными оценками теоретической дисперсии. Если {mathrm  {D}}[X_{i}]=sigma ^{2}<infty , то
S_{n}^{2}to ^{{!!!!!!{mathbb  {P}}}};sigma ^{2}

и

S^{2}to ^{{!!!!!!{mathbb  {P}}}};sigma ^{2},

где символ «to ^{{!!!!!!{mathbb  {P}}}}» обозначает сходимость по вероятности.

  • Выборочная дисперсия является смещённой оценкой теоретической дисперсии, а исправленная выборочная дисперсия — несмещённой:
{mathbb  {E}}left[S_{n}^{2}right]={frac  {n-1}{n}}sigma ^{2},

и

{mathbb  {E}}left[S^{2}right]=sigma ^{2}.
  • Выборочная дисперсия нормального распределения имеет распределение хи-квадрат. Пусть X_{i}sim {mathrm  {N}}(mu ,sigma ^{2}),;i=1,2,ldots . Тогда
(n-1){frac  {S^{2}}{sigma ^{2}}}equiv n{frac  {S_{n}^{2}}{sigma ^{2}}}sim chi ^{2}(n-1).

См. также[править | править код]

  • Дисперсия случайной величины
  • Выборочное среднее
  • Несмещённая оценка
  • Дисперсия Аллана
  • Доверительный интервал для дисперсии нормальной выборки

Для того чтобы охарактеризовать
рассеяние наблюдаемых значений
количественного признака выборки вокруг
своего среднего значения ,
вводят сводную
характеристику – выборочную дисперсию.

Выборочной дисперсией

называют среднее
арифметическое квадратов отклонения
наблюдаемых значений признака от их
среднего значения .

Если все значения x1,
х2,
…, xn
признака выборки объема п
различны, то

.

Если же значения признака
x1,
х2,
…, xk
имеют соответственно
частоты п1,
n2,…,
nk,
причем n1
+ n
2+…+nk
= n
, то

,

т.е. выборочная дисперсия есть средняя
взвешенная квадратов отклонений с
весами, равными соответствующим частотам.

Пример.
Выборочная
совокупность задана таблицей распределения

xi

1
2 3 4

ni
20 15
10
5

Найти выборочную
дисперсию.

Решение.
Найдем выборочную среднюю (см. § 4):

.

Найдем выборочную
дисперсию:

.

Кроме дисперсии для характеристики
рассеяния значений признака выборочной
совокупности вокруг своего среднего
значения пользуются сводной
характеристикой-средним квадратическим
отклонением.

Выборочным средним
квадратическим отклонением
(стандартом)
называют квадратный
корень из выборочной дисперсии:

.

§ 10. Формула для вычисления дисперсии

Вычисление дисперсии, безразлично-выборочной
или генеральной, можно упростить,
используя следующую теорему.

Теорема. Дисперсия
равна среднему квадратов значений
признака минус квадрат общей средней:

.

Доказательство. Справедливость теоремы
вытекает из преобразований:

.

Итак,

,

где
,.

Пример.
Найти
дисперсию по данному распределению

xi
1
2 3 4

ni
20
15
10
5

Решение.
Найдем
общую среднюю:

.

Найдем
среднюю квадратов
значений признака:

.

Искомая дисперсия

=5-22=1.

§11. Групповая, внутригрупповая, межгрупповая и общая дисперсии

Допустим, что все значения
количественного признака X
совокупности,
безразлично-генеральной или выборочной,
разбиты на k
групп. Рассматривая
каждую группу как самостоятельную
совокупность, можно найти групповую
среднюю (см. § 6) и дисперсию значений
признака, принадлежащих группе,
относительно групповой средней.

Групповой дисперсией называют
дисперсию значений признака, принадлежащих
группе, относительно групповой средней

,

где ni

частота значения
xi;
j

номер группы;

– групповая средняя
группы j;

объем группыj.

Пример
1.
Найти
групповые дисперсии совокупности,
состоящей из следующих двух групп:

первая группа

вторая группа

xi

ni

xi

ni

2

1

3

2

4

7

8

3

5

2

Решение.
Найдем
групповые средние:

;

.

Найдем
искомые
групповые дисперсии:

;

.

Зная дисперсию каждой группы, можно
найти их среднюю арифметическую.

Внутригрупповой дисперсией называют
среднюю арифметическую дисперсий,
взвешенную по объемам групп:

,

где Nj
– объем группы
j;
п =
объем всей совокупности.

Пример
2.
Найти
внутригрупповую дисперсию по данным
примера 1.

Решение.
Искомая внутригрупповая дисперсия
равна

Зная групповые средние и общую среднюю,
можно найти дисперсию групповых средних
относительно общей средней.

Межгрупповой дисперсией называют
дисперсию групповых средних относительно
общей средней:

,

где

групповая средняя группыj;
Nj
– объем группы j;

– общая средняя;
n
=
объем всей совокупности.

Пример
3.
Найти
межгрупповую дисперсию по

данным
примера 1.

Решение.
Найдем общую среднюю:

.

Используя
вычисленные выше величины
=
4,=
6, найдем искомую межгрупповую дисперсию:

.

Теперь целесообразно ввести специальный
термин для дисперсии всей совокупности.

Общей дисперсией называют дисперсию
значений признака всей совокупности
относительно общей средней:

,

где ni
– частота значения
xi
;

общая средняя; n
– объем всей совокупности.

Пример
4.
Найти
общую дисперсию по данным примера 1.

Решение.
Найдем искомую общую дисперсию, учитывая,
что общая средняя равна 14/3:

Замечание.
Найденная общая дисперсия равна сумме
внутригрупповой и межгрупповой дисперсий:

Dобщ=
148/45;

Dвнгр
+ Dмежгр=
12/5 + 8/9= 148/45.

В следующем
параграфе будет доказано, что такая
закономерность справедлива для любой
совокупности.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Генеральная и выборочная дисперсия

Для анализа полученных данных в математической статистике используют различные виды показателей вариации, среди которых:

  • размах вариации;
  • среднее абсолютное отклонение;
  • дисперсия.

Разберем понятие дисперсии, ее виды и свойства.

Дисперсия — величина, являющаяся мерой разброса полученных в ходе наблюдений данных относительно истинного значения.

Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.

Дисперсия является точечной оценкой параметра, так как имеет одно конкретное числовое значение.

Статистический анализ при исследовании некоторого объекта может быть сплошным или выборочным в зависимости от охватываемого объема данных.

В обоих вариантах результаты анализа распространяют на генеральную совокупность, однако при сплошном анализе наблюдению подвергают абсолютно все имеющиеся данные. Выборочный анализ, напротив, предполагает наблюдение только за некоторой выбранной частью данных. При этом выбранная совокупность должна сохранять структуру и закономерности генеральной.

Дисперсию также делят на два вида в зависимости от используемых данных:

  • генеральная дисперсия;
  • выборочная дисперсия.

Как видно из названия, дисперсии отличаются объемом выборки, на основе которой происходит расчет и анализ.

Выборочная дисперсия, определение, формулы для вычисления

Пусть имеется некоторая выборка Y из генеральной совокупности объемом n. Среднее значение выборки обозначим как ({overline y}_в).

Выборочная дисперсия (D_в) — величина, равная среднему арифметическому отклонению квадратов разности признаков выборки (y_1,;y_2,;…y_n) от ее среднего значения ({overline y}_в).

Данные в выборке могут располагаться хаотично, то есть быть несгруппированными, или же сформированы в вариационный ряд.

Выборочную дисперсию для несгруппированной выборки можно посчитать по формуле:

Формула 1

 (D_в=frac{{displaystylesum_{i=1}^n}(y_i-{overline y}_в)}n)

В случае вариационного ряда используют кратные значения и частоты для дискретного представления; середины частичных интервалов и частоты для интервального представления.

Формула 2

 (D_в=frac{{displaystylesum_{i=1}^k}(y’_i-{overline y}_в)cdot n_i}n)

где (y’_i )— кратное (одинаковое) значение в выборке или значение, соответствующее середине интервала;

(n_i )— частота.

Выборочная дисперсия, рассчитанная по приведенным выше формулам, дает недостоверное (заниженное) значение. Это значит, что при большом количестве экспериментов выборочная дисперсия будет давать смещенное относительно истинного значения генеральной совокупности значение.

Чтобы получить несмещенную выборочную дисперсию, используют следующую формулу:

Формула 3

 (D_в=frac{{displaystylesum_{i=1}^n}{(y_i-{overline y}_в)}^2}{n-1})

Примечание 1

 Как правило при использовании термина «выборочная дисперсия» имеют в виду именно несмещенную выборочную дисперсию.

Генеральная дисперсия, определение, что является оценкой, формулы для вычисления

Пусть имеется некоторая генеральная совокупность X объемом N и среднее значение признаков совокупности (X — {overline x}_г.)

Генеральная дисперсия (D_г) есть среднее арифметическое отклонение квадратов разности признаков (x_1,;x_2,;…x_n) генеральной совокупности X от их среднего значения ({overline x}_г).

Примечание 2

Иногда генеральную дисперсию называют теоретической.

Аналогично выборочной, генеральная дисперсия может быть рассчитана для несгруппированных данных генеральной совокупности:

Формула 4

(D_г=frac{{displaystylesum_{i=1}^N}{(x_i-{overline x}_г)}^2}N)

и для сформированного вариационного ряда:

Формула 5

(D_г=frac{{displaystylesum_{i=1}^K}{(x’_i-{overline x}_г)}^2cdot n_i}N)

Значение теоретической дисперсии бывает сложно вычислить из-за большого объема данных или их недостатка. Тогда для оценки используют выборочную дисперсию. Но если для оценки генеральной дисперсии применить выборочную, это приведет к возникновению ряда систематических ошибок. В результате оценка будет произведена неверно, а значение генеральной дисперсии занижено.

Чтобы устранить возникающую погрешность в качестве оценки генеральной дисперсии используют исправленную или несмещенную выборочную дисперсию, формула которой представлена выше.

Оценки параметров распределения

Оценкой параметра в статистике считают численное значение какого-либо параметра данной выборки.

Приведем оценки параметров распределения случайной величины, которые связаны с дисперсией.

Среднеквадратическое отклонение (δ) — характеристика рассеивания случайной величины относительно ее математического ожидания. Определяется как корень квадратный из дисперсии.

Формула 6

(delta=sqrt D)

Математическое ожидание случайной величины X — среднее (по весу вероятностей возможных значений) значение случайной величины. Обозначается как M(X).

Математическое ожидание и дисперсия для дискретной случайной величины связаны соотношением:

Формула 7

 (D=Mleft[X-M(X)right]^2)

для непрерывной:

Формула 8

 (D=int_{-infty}^infty(x-M{(x))}^2cdot f(x)dx)

где f(x) — функция распределения случайной величины.

Отметим, что указанные выше параметры могут быть определены как для генеральной совокупности, так и для некоторой выборки.

Примеры решения задач

Пример 1

Напряжение в цепи измеряют 6 раз с помощью одного и того же вольтметра. Получены следующие значения: 210 В, 200 В, 195 В, 205 В, 190 В, 200 В. Найти выборочную смещенную дисперсию и дать оценку генеральной дисперсии.

Решение.

Сначала вычислим выборочное среднее значение:

({overline x}_в=frac{210+200+195+205+190+200}6=200;B.)

Теперь найдем выборочную дисперсию:

(D_в=frac{{(210-200)}^2+{(200-200)}^2+{(195-200)}^2+{(205-200)}^2+{(190-200)}^2+{(200-200)}^2}6=frac{250}6approx42.)

Оценкой генеральной дисперсии является исправленная или выборочная несмещенная дисперсия. Чтобы вычислить исправленную дисперсию, умножим полученную ранее выборочную дисперсию на множитель (frac n{n-1} (n=6):)

(D_и=frac n{n-1}cdot D_в=frac65cdotfrac{250}6=50.)

Примечание 3

Данный пример показывает, что значение выборочной смещенной дисперсии занижено относительно генеральной.

Пример 2

Случайная величина задана следующей таблицей распределения, среднее значение выборки равно 14. Найти выборочную несмещенную дисперсию и среднеквадратическое отклонение.

blobid1645452910973.jpg

Решение.

Вычислим выборочную несмещенную дисперсию:

(D_в=frac{2{(10-14)}^2+1{(3-14)}^2+1{(11-14)}^2+3{(8-14)}^2+2{(6-14)}^2}9cdotfrac98=frac{398}8approx50.)

Теперь найдем среднеквадратическое отклонение:

(delta=sqrt{D_в}=sqrt{frac{398}8}=frac{sqrt{199}}2approx7.)

Добавить комментарий