Как найти выборочную дисперсию признака

Выборочная дисперсия, описание

Выборочная дисперсия является сводной характеристикой для наблюдения рассеяния количественного признака выборки вокруг среднего значения.

Определение

Выборочная дисперсия – это среднее арифметическое значений вариантов части отобранных объектов генеральной совокупности (выборки).

Связь выборочной и генеральной дисперсии

Генеральная дисперсия представляет собой среднее арифметическое квадратов отступлений значений признаков генеральной совокупности от их среднего значения.

Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.

Определение

Генеральная совокупность – это комплекс всех возможных объектов, относительно которых планируется вести наблюдение и формулировать выводы.

Выборочная совокупность или выборка является частью генеральной совокупности, выбранной для изучения и составления заключения касательной всей генеральной совокупности.

Как вычислить выборочную дисперсию

Выборочная дисперсия при различии всех значений варианта выборки находится по формуле:

({widehat D}_В=frac{displaystylesum_{i-1}^n{(x_i-{overline x}_В)}^2}n)

Для значений признаков выборочной совокупности с частотами n1, n2,…,nформула выглядит следующим образом:

({widehat D}_В=frac{displaystylesum_{i-1}^kn_i{(x_i-{overline x}_В)}^2}n)

Квадратный корень из выборочной дисперсии характеризует рассеивание значений вариантов выборки вокруг своего среднего значения. Данная характеристика называется выборочным средним квадратическим отклонением и имеет вид:

({widehatsigma}_В=sqrt{{widehat D}_В})

Упрощенный способ вычисления выборочной или генеральной дисперсии производят по формуле:

(D=overline{x^2}-left[overline xright]^2)

Если вариационный ряд выборочной совокупности интервальный, то за xi принимается центр частичных интервалов. 

Пример

Найти выборочную дисперсию выборки со значениями:

  • xi: 1, 2, 3, 4;
  • ni: 20, 15, 10, 5.

Решение

Для начала необходимо определить выборочную среднюю:

({overline x}_В=frac1{50}(1cdot20+2cdot15+3cdot10+4cdot5)=frac1{50}cdot100=2)

Затем найдем выборочную дисперсию:

(D_В=frac1{50}({(1-2)}^2cdot20+{(2-2)}^2cdot15+{(3-2)}^2cdot10+{(4-2)}^2cdot5)=1)

Исправленная дисперсия

Математически выборочная дисперсия не соответствует генеральной, поскольку выборочная используется для смещенного оценивания генеральной дисперсии. По этой причине математическое ожидание выборочной дисперсии вычисляется так:

(Mleft[D_Bright]=frac{n-1}nD_Г)

В данной формуле DГ – это истинное значение дисперсии генеральной совокупности.

Исправить выборочную дисперсию можно путем умножения ее на дробь:

(frac n{n-1})

Получим формулу следующего вида:

(S^2=frac n{n-1}cdot D_В=frac{displaystylesum_{i=1}^kn_i{(x_i-{overline x}_В)}^2}{n-1})

Исправленная дисперсия используется для несмещенной оценки генеральной дисперсии и обозначается S2

Среднеквадратическая генеральная совокупность оценивается при помощи исправленного среднеквадратического отклонения, которое вычисляется по формуле:

(S=sqrt{S^2})

При нахождении выборочной и исправленной дисперсии разнятся лишь знаменатели в формулах. Различия в этих характеристиках при больших n незначительны. Применение исправленной дисперсии целесообразно при объеме выборки меньше 30.

Для чего применяют исправленную выборочную дисперсию

Исправленную выборочную используют для точечной оценки генеральной дисперсии.

Пример

Длину стержня измерили одним и тем же прибором пять раз. В результате получили следующие величины: 92 мм, 94 мм, 103 мм, 105 мм, 106 мм. Задача найти выборочную среднюю длину предмета и выборочную исправленную дисперсию ошибок измерительного прибора.

Решение

Сначала вычислим выборочную среднюю:

({overline x}_В=frac{92+94+103+105+106}5=100)

Затем найдем выборочную дисперсию:

(D_В=frac{displaystylesum_{i=1}^k{(x_i-{overline x}_В)}^2}n=frac{{(92-100)}^2+{(94-100)}^2+{(103-100)}^2+{(105-100)}^2+{(106-100)}^2}5=34)

Теперь рассчитаем исправленную дисперсию:

(S^2=frac5{5-1}cdot34=42,5)

Для того чтобы охарактеризовать
рассеяние наблюдаемых значений
количественного признака выборки вокруг
своего среднего значения ,
вводят сводную
характеристику – выборочную дисперсию.

Выборочной дисперсией

называют среднее
арифметическое квадратов отклонения
наблюдаемых значений признака от их
среднего значения .

Если все значения x1,
х2,
…, xn
признака выборки объема п
различны, то

.

Если же значения признака
x1,
х2,
…, xk
имеют соответственно
частоты п1,
n2,…,
nk,
причем n1
+ n
2+…+nk
= n
, то

,

т.е. выборочная дисперсия есть средняя
взвешенная квадратов отклонений с
весами, равными соответствующим частотам.

Пример.
Выборочная
совокупность задана таблицей распределения

xi

1
2 3 4

ni
20 15
10
5

Найти выборочную
дисперсию.

Решение.
Найдем выборочную среднюю (см. § 4):

.

Найдем выборочную
дисперсию:

.

Кроме дисперсии для характеристики
рассеяния значений признака выборочной
совокупности вокруг своего среднего
значения пользуются сводной
характеристикой-средним квадратическим
отклонением.

Выборочным средним
квадратическим отклонением
(стандартом)
называют квадратный
корень из выборочной дисперсии:

.

§ 10. Формула для вычисления дисперсии

Вычисление дисперсии, безразлично-выборочной
или генеральной, можно упростить,
используя следующую теорему.

Теорема. Дисперсия
равна среднему квадратов значений
признака минус квадрат общей средней:

.

Доказательство. Справедливость теоремы
вытекает из преобразований:

.

Итак,

,

где
,.

Пример.
Найти
дисперсию по данному распределению

xi
1
2 3 4

ni
20
15
10
5

Решение.
Найдем
общую среднюю:

.

Найдем
среднюю квадратов
значений признака:

.

Искомая дисперсия

=5-22=1.

§11. Групповая, внутригрупповая, межгрупповая и общая дисперсии

Допустим, что все значения
количественного признака X
совокупности,
безразлично-генеральной или выборочной,
разбиты на k
групп. Рассматривая
каждую группу как самостоятельную
совокупность, можно найти групповую
среднюю (см. § 6) и дисперсию значений
признака, принадлежащих группе,
относительно групповой средней.

Групповой дисперсией называют
дисперсию значений признака, принадлежащих
группе, относительно групповой средней

,

где ni

частота значения
xi;
j

номер группы;

– групповая средняя
группы j;

объем группыj.

Пример
1.
Найти
групповые дисперсии совокупности,
состоящей из следующих двух групп:

первая группа

вторая группа

xi

ni

xi

ni

2

1

3

2

4

7

8

3

5

2

Решение.
Найдем
групповые средние:

;

.

Найдем
искомые
групповые дисперсии:

;

.

Зная дисперсию каждой группы, можно
найти их среднюю арифметическую.

Внутригрупповой дисперсией называют
среднюю арифметическую дисперсий,
взвешенную по объемам групп:

,

где Nj
– объем группы
j;
п =
объем всей совокупности.

Пример
2.
Найти
внутригрупповую дисперсию по данным
примера 1.

Решение.
Искомая внутригрупповая дисперсия
равна

Зная групповые средние и общую среднюю,
можно найти дисперсию групповых средних
относительно общей средней.

Межгрупповой дисперсией называют
дисперсию групповых средних относительно
общей средней:

,

где

групповая средняя группыj;
Nj
– объем группы j;

– общая средняя;
n
=
объем всей совокупности.

Пример
3.
Найти
межгрупповую дисперсию по

данным
примера 1.

Решение.
Найдем общую среднюю:

.

Используя
вычисленные выше величины
=
4,=
6, найдем искомую межгрупповую дисперсию:

.

Теперь целесообразно ввести специальный
термин для дисперсии всей совокупности.

Общей дисперсией называют дисперсию
значений признака всей совокупности
относительно общей средней:

,

где ni
– частота значения
xi
;

общая средняя; n
– объем всей совокупности.

Пример
4.
Найти
общую дисперсию по данным примера 1.

Решение.
Найдем искомую общую дисперсию, учитывая,
что общая средняя равна 14/3:

Замечание.
Найденная общая дисперсия равна сумме
внутригрупповой и межгрупповой дисперсий:

Dобщ=
148/45;

Dвнгр
+ Dмежгр=
12/5 + 8/9= 148/45.

В следующем
параграфе будет доказано, что такая
закономерность справедлива для любой
совокупности.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Онлайн калькулятор для расчета выборочной дисперсии (дисперсия выборки). Выборочная дисперсия‭ ‬-‭ ‬это показатель разброса,‭ ‬наблюдаемого в определенной выборке данных.‭ ‬С вычислительной точки зрения ее можно объяснить как – среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения.

Для того, чтобы оценить дисперсию по выборке необходимо:
– Вычислить математические ожидания данных (выборочное среднее – среднее арифметическое значений вариант в выборке).
Вычитаем математическое ожидание из исходного значения для всех данных из выборки и возводим результат в квадрат.
Складываем все полученные в предыдущем шаге значения и делим сумму на N-1.

×

Пожалуйста напишите с чем связна такая низкая оценка:

×

Для установки калькулятора на iPhone – просто добавьте страницу
«На главный экран»

Для установки калькулятора на Android – просто добавьте страницу
«На главный экран»

Смотрите также

Автор статьи

Евгений Николаевич Беляев

Эксперт по предмету «Математика»

Задать вопрос автору статьи

Генеральная дисперсия

Пусть нам дана генеральная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Определение 1

Генеральная совокупность — совокупность случайно отобранных объектов данного вида, над которыми проводят наблюдения с целью получения конкретных значений случайной величины, проводимых в неизменных условиях при изучении одной случайной величины данного вида.

Определение 2

Генеральная дисперсия — среднее арифметическое квадратов отклонений значений вариант генеральной совокупности от их среднего значения.

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда генеральная дисперсия вычисляется по формуле:

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае генеральная дисперсия вычисляется по формуле:

С этим понятием также связано понятие генерального среднего квадратического отклонения.

Определение 3

Генеральное среднее квадратическое отклонение — квадратный корень из генеральной дисперсии:

[{sigma }_г=sqrt{D_г}]

Выборочная дисперсия

Пусть нам дана выборочная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:

Определение 4

Выборочная совокупность — часть отобранных объектов из генеральной совокупности.

Определение 5

Выборочная дисперсия — среднее арифметическое значений вариант выборочной совокупности.

«Дисперсия: генеральная, выборочная, исправленная» 👇

Пусть значения вариант $x_1, x_2,dots ,x_k$ имеют, соответственно, частоты $n_1, n_2,dots ,n_k$. Тогда выборочная дисперсия вычисляется по формуле:

Рассмотрим частный случай. Пусть все варианты $x_1, x_2,dots ,x_k$ различны. В этом случае $n_1, n_2,dots ,n_k=1$. Получаем, что в этом случае выборочная дисперсия вычисляется по формуле:

С этим понятием также связано понятие выборочного среднего квадратического отклонения.

Определение 6

Выборочное среднее квадратическое отклонение — квадратный корень из генеральной дисперсии:

[{sigma }_в=sqrt{D_в}]

Исправленная дисперсия

Для нахождения исправленной дисперсии $S^2$ необходимо умножить выборочную дисперсию на дробь $frac{n}{n-1}$, то есть

С этим понятием также связано понятие исправленного среднего квадратического отклонения, которое находится по формуле:

!!! В случае, когда значение вариант не являются дискретными, а представляют из себя интервалы, то в формулах для вычисления генеральной или выборочной дисперсий за значение $x_i$ принимается значение середины интервала, которому принадлежит $x_i.$

Пример задачи на нахождение дисперсии и среднего квадратического отклонения

Пример 1

Выборочная совокупность задана следующей таблицей распределения:

Рисунок 1.

Найдем для нее выборочную дисперсию, выборочное среднее квадратическое отклонение, исправленную дисперсию и исправленное среднее квадратическое отклонение.

Решение:

Для решения этой задачи для начала сделаем расчетную таблицу:

Рисунок 2.

Величина $overline{x_в}$ (среднее выборочное) в таблице находится по формуле:

[overline{x_в}=frac{sumlimits^k_{i=1}{x_in_i}}{n}]

То есть

[overline{x_в}=frac{sumlimits^k_{i=1}{x_in_i}}{n}=frac{305}{20}=15,25]

Найдем выборочную дисперсию по формуле:

[D_в=frac{sumlimits^k_{i=1}{{{(x}_i-overline{x_в})}^2n_i}}{n}=frac{523,75}{20}=26,1875]

Выборочное среднее квадратическое отклонение:

[{sigma }_в=sqrt{D_в}approx 5,12]

Исправленная дисперсия:

[{S^2=frac{n}{n-1}D}_в=frac{20}{19}cdot 26,1875approx 27,57]

Исправленное среднее квадратическое отклонение:

[S=sqrt{S^2}approx 5,25]

Находи статьи и создавай свой список литературы по ГОСТу

Поиск по теме

Генеральная и выборочная дисперсия

Для анализа полученных данных в математической статистике используют различные виды показателей вариации, среди которых:

  • размах вариации;
  • среднее абсолютное отклонение;
  • дисперсия.

Разберем понятие дисперсии, ее виды и свойства.

Дисперсия — величина, являющаяся мерой разброса полученных в ходе наблюдений данных относительно истинного значения.

Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.

Дисперсия является точечной оценкой параметра, так как имеет одно конкретное числовое значение.

Статистический анализ при исследовании некоторого объекта может быть сплошным или выборочным в зависимости от охватываемого объема данных.

В обоих вариантах результаты анализа распространяют на генеральную совокупность, однако при сплошном анализе наблюдению подвергают абсолютно все имеющиеся данные. Выборочный анализ, напротив, предполагает наблюдение только за некоторой выбранной частью данных. При этом выбранная совокупность должна сохранять структуру и закономерности генеральной.

Дисперсию также делят на два вида в зависимости от используемых данных:

  • генеральная дисперсия;
  • выборочная дисперсия.

Как видно из названия, дисперсии отличаются объемом выборки, на основе которой происходит расчет и анализ.

Выборочная дисперсия, определение, формулы для вычисления

Пусть имеется некоторая выборка Y из генеральной совокупности объемом n. Среднее значение выборки обозначим как ({overline y}_в).

Выборочная дисперсия (D_в) — величина, равная среднему арифметическому отклонению квадратов разности признаков выборки (y_1,;y_2,;…y_n) от ее среднего значения ({overline y}_в).

Данные в выборке могут располагаться хаотично, то есть быть несгруппированными, или же сформированы в вариационный ряд.

Выборочную дисперсию для несгруппированной выборки можно посчитать по формуле:

Формула 1

 (D_в=frac{{displaystylesum_{i=1}^n}(y_i-{overline y}_в)}n)

В случае вариационного ряда используют кратные значения и частоты для дискретного представления; середины частичных интервалов и частоты для интервального представления.

Формула 2

 (D_в=frac{{displaystylesum_{i=1}^k}(y’_i-{overline y}_в)cdot n_i}n)

где (y’_i )— кратное (одинаковое) значение в выборке или значение, соответствующее середине интервала;

(n_i )— частота.

Выборочная дисперсия, рассчитанная по приведенным выше формулам, дает недостоверное (заниженное) значение. Это значит, что при большом количестве экспериментов выборочная дисперсия будет давать смещенное относительно истинного значения генеральной совокупности значение.

Чтобы получить несмещенную выборочную дисперсию, используют следующую формулу:

Формула 3

 (D_в=frac{{displaystylesum_{i=1}^n}{(y_i-{overline y}_в)}^2}{n-1})

Примечание 1

 Как правило при использовании термина «выборочная дисперсия» имеют в виду именно несмещенную выборочную дисперсию.

Генеральная дисперсия, определение, что является оценкой, формулы для вычисления

Пусть имеется некоторая генеральная совокупность X объемом N и среднее значение признаков совокупности (X — {overline x}_г.)

Генеральная дисперсия (D_г) есть среднее арифметическое отклонение квадратов разности признаков (x_1,;x_2,;…x_n) генеральной совокупности X от их среднего значения ({overline x}_г).

Примечание 2

Иногда генеральную дисперсию называют теоретической.

Аналогично выборочной, генеральная дисперсия может быть рассчитана для несгруппированных данных генеральной совокупности:

Формула 4

(D_г=frac{{displaystylesum_{i=1}^N}{(x_i-{overline x}_г)}^2}N)

и для сформированного вариационного ряда:

Формула 5

(D_г=frac{{displaystylesum_{i=1}^K}{(x’_i-{overline x}_г)}^2cdot n_i}N)

Значение теоретической дисперсии бывает сложно вычислить из-за большого объема данных или их недостатка. Тогда для оценки используют выборочную дисперсию. Но если для оценки генеральной дисперсии применить выборочную, это приведет к возникновению ряда систематических ошибок. В результате оценка будет произведена неверно, а значение генеральной дисперсии занижено.

Чтобы устранить возникающую погрешность в качестве оценки генеральной дисперсии используют исправленную или несмещенную выборочную дисперсию, формула которой представлена выше.

Оценки параметров распределения

Оценкой параметра в статистике считают численное значение какого-либо параметра данной выборки.

Приведем оценки параметров распределения случайной величины, которые связаны с дисперсией.

Среднеквадратическое отклонение (δ) — характеристика рассеивания случайной величины относительно ее математического ожидания. Определяется как корень квадратный из дисперсии.

Формула 6

(delta=sqrt D)

Математическое ожидание случайной величины X — среднее (по весу вероятностей возможных значений) значение случайной величины. Обозначается как M(X).

Математическое ожидание и дисперсия для дискретной случайной величины связаны соотношением:

Формула 7

 (D=Mleft[X-M(X)right]^2)

для непрерывной:

Формула 8

 (D=int_{-infty}^infty(x-M{(x))}^2cdot f(x)dx)

где f(x) — функция распределения случайной величины.

Отметим, что указанные выше параметры могут быть определены как для генеральной совокупности, так и для некоторой выборки.

Примеры решения задач

Пример 1

Напряжение в цепи измеряют 6 раз с помощью одного и того же вольтметра. Получены следующие значения: 210 В, 200 В, 195 В, 205 В, 190 В, 200 В. Найти выборочную смещенную дисперсию и дать оценку генеральной дисперсии.

Решение.

Сначала вычислим выборочное среднее значение:

({overline x}_в=frac{210+200+195+205+190+200}6=200;B.)

Теперь найдем выборочную дисперсию:

(D_в=frac{{(210-200)}^2+{(200-200)}^2+{(195-200)}^2+{(205-200)}^2+{(190-200)}^2+{(200-200)}^2}6=frac{250}6approx42.)

Оценкой генеральной дисперсии является исправленная или выборочная несмещенная дисперсия. Чтобы вычислить исправленную дисперсию, умножим полученную ранее выборочную дисперсию на множитель (frac n{n-1} (n=6):)

(D_и=frac n{n-1}cdot D_в=frac65cdotfrac{250}6=50.)

Примечание 3

Данный пример показывает, что значение выборочной смещенной дисперсии занижено относительно генеральной.

Пример 2

Случайная величина задана следующей таблицей распределения, среднее значение выборки равно 14. Найти выборочную несмещенную дисперсию и среднеквадратическое отклонение.

blobid1645452910973.jpg

Решение.

Вычислим выборочную несмещенную дисперсию:

(D_в=frac{2{(10-14)}^2+1{(3-14)}^2+1{(11-14)}^2+3{(8-14)}^2+2{(6-14)}^2}9cdotfrac98=frac{398}8approx50.)

Теперь найдем среднеквадратическое отклонение:

(delta=sqrt{D_в}=sqrt{frac{398}8}=frac{sqrt{199}}2approx7.)

Добавить комментарий