Как найти статистический ряд распределения частот

Пусть
требуется изучить статистическую
совокупность относительно некоторого
количественного признака X.
Числовые значения признака будем
обозначать через хi.

Из
генеральной совокупности извлекается
выборка объёма п.

  1. Количественный
    признак
    Х
    дискретная
    случайная величина
    .

Наблюдаемые
значения хi
называют вариантами,
а последовательность вариантов,
записанных в возрастающем
порядке, –
вариационным
рядом
.

Пусть
x1
наблюдалось n1
раз,

x2
наблюдалось n2
раз,

xk
наблюдалось nk
раз,

причем

.
Числа ni
называют
частотами,
а их отношение к объёму выборки, т.е.

,

относительными
частотами
(или
частостями), причем

.

Значение
вариант и соответствующие им частоты
или относительные
частоты можно записать в виде таблиц 1
и 2.

Таблица
1

Варианта
xi

x1

x2

xk

Частота
ni

n1

n2

nk

Таблицу
1 называют дискретным
статистическим
рядом распределения (ДСР) частот,
или
таблицей частот.

Таблица
2

Варианта
xi

x1

x2

xk

Относительная
частота wi

w1

w2

wk

Таблица
2 
ДСР
относительных частот,
или
таблица относительных частот.

Определение.
Модой
называется наиболее часто встречающийся
вариант, т.е. вариант с наибольшей
частотой. Обозначается xмод.

Определение.
Медианой
называется
такое значение признака, которое делит
всю статистическую совокупность,
представленную в виде вариационного
ряда, на две равных по числу части.
Обозначается

.

Если
n
нечетно, т.е. n
= 2
m
+ 1
,
то

=
xm+1.

Если
n
четно, т.е. n
= 2
m,
то

.

Пример
3
.
По результатам наблюдений: 1, 7, 7, 2, 3, 2,
5, 5, 4, 6, 3, 4, 3, 5, 6, 6, 5, 5, 4, 4 построить ДСР
относительных частот. Найти моду и
медиану.

Решение.
Объем выборки n
= 20. Составим ранжированный ряд элементов
выборки: 1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 6,
7, 7. Выделим варианты и подсчитаем их
частоты (в скобках): 1 (1), 2 (2), 3 (3),

4 (4),
5 (5), 6 (3), 7 (2). Строим таблицу:

xi

1

2

3

4

5

6

7

wi

1/20

2/20

3/20

4/20

5/20

3/20

2/20

Наиболее
часто встречающийся вариант xi
=
5. Следовательно, xмод
=
5. Так
как объем выборки n
– четное число, то


Если
на плоскости нанести точки

и соединить их отрезками прямых, то
получим полигон
частот
.

Если
на плоскости нанести точки

,
то получим полигон
относительных частот
.

Пример 4.
Построить полигон частот и полигон
относительных частот по данному
распределению выборки:

xi

4

7

8

12

17

ni

2

4

5

6

3

wi

2/20

4/20

5/20

6/20

3/20

Решение.
На рисунке 2 показан полигон частот и
на рисунке 3 – полигон относительных
частот.

Рис.
2 Рис.
3

Замечание.
Чем круче полигон, тем равномернее
процесс.

  1. Пусть
    количественный признак
    X
    непрерывная
    случайная величина
    ,
    принимающая значения из интервала
    (а,b).
    Весь диапазон наблюдаемых данных делят
    на частичные
    интервалы

    [хi;
    xi+1),
    которые берут обычно одинаковыми по
    длине:

    =
    xi+1

    xi
    (i
    = 0, 1, …,
    k).
    Для определения величины интервала

    можно использовать формулу
    Стерджеса
    :

где
(xmax

xmin)
разность между наибольшим и наименьшим
значениями признака, k
= 1 +
log2
n

число интервалов (log2
n

3,322

lg
n).
Если окажется, что h

дробное число, то за длину частичного
интервала следует брать либо ближайшее
целое число, либо ближайшую простую
дробь. За начало первого интервала
рекомендуется брать величину xнач
=
xmin


.
В каждом
из частичных интервалов подсчитывают
число наблюдаемых значений, т.е. частоту
ni.
По частотам находят относительные
частоты


.
Полученные интервалы и соответствующие
им частоты (или относительные частоты)
записывают в виде таблицы 3. При этом
правая граница последнего интервала
тоже включается.

Таблица
3

Частичный
интервал [xi,xi+1)

[x0,
x
1)

[x1,
x
2)

[xk-1,
x
k]

Относительная
частота wi

w1

w2

wk

Таблица
3 называется интервальным
статистическим рядом распределения
(ИСР) относительных частот
,
который задаёт распределение
выборки.
Аналогично
составляется ИСР
частот
.

Пример
5
.
Измерили рост (с точностью до см) 30
наудачу отобранных студентов. Результаты
измерений таковы:

178,
160, 154, 183, 155, 153, 167, 186, 163, 155, 157, 175, 170, 166, 159,

173,
182, 167, 171, 169, 179, 165, 156, 179, 158, 171, 175, 173, 164, 172.

Построить
интервальный статистический ряд
относительных частот.

Решение.
Для
удобства проранжируем полученные
данные:

153,
154, 155, 155, 156, 157, 158, 159, 160, 163, 164, 165, 166, 167, 167,

169,
170, 171, 171, 172, 173, 173, 175, 175, 178, 179, 179, 182, 183, 186.

Отметим,
что Х

рост студента 
непрерывная случайная величина. Как
видим, xmin
=
153, хmax
=
186; по формуле Стерджеса, при n
= 30, находим длину частичного интервала

Примем

= 6. Тогда хнач
= 153 –

=150.
Исходные данные разбиваем на шесть (k
=
1 + log230
= 5,907 
6) интервалов:

[150,
156), [156, 162), [162, 168), [168, 174), [174, 180), [180, 186].

Подсчитав
число студентов ni,
попавших в каждый из полученных
промежутков, получим ИСР:

[xi,xi+1)

[150,
156)

[156,
162)

[162,
168)

[168,
174)

[174,180)

[180,186]

ni

4

5

6

7

5

3

wi

4/30

5/30

6/30

7/30

5/30

3/30

Первая
и третья строчка таблицы образует ИСР
относительных частот.

Замечание.
При
решении учебных задач на построение
ИСР можно пользоваться следующими
правилами.

  1. Назначаются нижняя
    граница а
    и верхняя граница b
    для вариант так, чтобы отрезок [a;
    b]
    вместил всю выборку; часто полагают

    ,

    ,
    но иногда a
    и b
    назначают из соображений удобства, но
    не слишком далеко от

    и

    .

  2. Находится число
    k
    равных по длине частичных интервалов
    варьирования, которое зависит от объема
    выборки и обычно 6

    k

    20
    ;
    рассчитывается длина интервалов
    группирования

    .

Интервальный
статистический ряд распределения,
представленный графически, называется
гистограммой.

Гистограмма
относительных частот

строится следующим образом: по оси
абсцисс откладываются
интервалы (хi;
х
i+1)
и на каждом из них строится прямоугольник
высотой

где

;

.

Площадь
iго
прямоугольника

.

Площадь
всей гистограммы

.

З
амечание:

гистограмма на рисунке 4 – гистограмма
относительных частот.

x3

Рис.
4

Можно
построить гистограмму
частот
,
высоты прямоугольников которых равны


.

Пример 6.
Построить гистограмму частот по данному
ИСР частот:

[xi;
xi+1)

[100;
120)

[120;
140)

[140;
160)

[160;
180)

[180;
200]

ni

20

50

80

40

10

Решение.
По ИСР частот находим длину частичных
интервалов

= 20 и высоты прямоугольников hi
=

.
Результаты занесем в таблицу:

[xi;
xi+1)

[100;
120)

[120;
140)

[140;
160)

[160;
180)

[180;
200]

ni

20

50

80

40

10

hi

1

2,5

4

2

0,5

Искомая
гистограмма частот изображена на рис.
5.


hi

xi


xi

Рис.
5

В
теории вероятностей гистограмме
относительных частот соответствует
график плотности распределения
вероятностей. Распределение выборки,
задаваемое интервальным статистическим
рядом (табл. 3) или таблицей относительных
частот (табл. 2), называется эмпирическим
распределением случайной величины.

По
теореме Бернулли относительная частота
wi,
появление события в п
независимых
испытаниях
сходится
по вероятности к вероятности рi
этого события

.
Значит во второй строке таблицы 3 и
таблицы 2 стоят
приближённые значения вероятностей рi
следующих событий

и

,
поэтому
распределение выборки называют
эмпирическим распределением случайной
величины X.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Поможем решить контрольную, написать реферат, курсовую и диплом от 800р
Узнать стоимость

Статистическое распределение выборки

Содержание:

  • Примеры использования формул и таблиц для решения практических задач
  • Статистический интервальный ряд распределения

Предположим случай, когда из генеральной совокупности извлекается некоторая выборка, при этом каждому значению соответствует некоторый параметр, означающий количество раз, когда появлялось данное значение. Здесь $x_1$ было зафиксировано $n_1$ раз, $x_2$ было обнаружено $n_2$$x_k$ выявлено $n_k$. При этом

$sum_{i=1}^{k}n_i=n$

Где n — объём рассматриваемой выборки.

Определение 1

Используется следующая терминология: $x_k$ носят наименование вариантов, а последовательность таких вариантов, зафиксированный по возрастанию именуется вариационным рядом. Количество наблюдений каждого из вариантов носят название частот. При этом частное частот и выборки называют относительными частотами.

Определение 2

Статистическое распределение —это название всего набора вариантов и частот, которые с ними соотносятся. Чаще всего задаётся с помощью специальной таблицы, где представлены частоты, а также интервалы им соответствующие.

$x_1$ $x_2$ $x_k$
$n_1$ $n_2$ $n_k$
$frac{n_1}{n}$ $frac{n_2}{n}$ $frac{n_k}{n}$

Здесь в первой строке представлены варианты, во второй частоты, в третьеq взяты относительные частоты.

Для определения размера интервала используется следующее выражение:

$d=frac{x_{max}- x_{min}}{1+3,332cdot lg n}$

Здесь $x_{max}$, $x_{min}$ наибольшее и наименьшее значения ряда вариантов, а n характеризуем объём выборки.

Примеры использования формул и таблиц для решения практических задач

Пример 1

В ходе проведения измерений в однородных группах, были определены следующие значения выборки: 71, 72, 74, 70, 70, 72, 71, 74, 71, 72, 71, 73, 72, 72, 72, 74, 72, 73, 72, 74. Необходимо использовать данные значения, что определить ряд распределения частот и ряд распределения относительных частот.

Решение.

1) Составим статистический ряд распределения частот:

xi 70 71 72 73 74
ni 2 4 8 2 4

2) Рассчитаем суммарный размер выборки: n=2+4+8+2+4=20. Определим относительные частоты, для этого используем формулы: ni/n=wi: wi=2/20=0.1; w2=4/20=0.2; w3=0.4; w4=4/20=0.1; w5=2/20=0.2. Теперь зафиксируем в таблице распределение относительных частот:

xi 70 71 72 73 74
wi 0.1 0.2 0.4 0.1 0.2

Контрольная сумма должна равняться единице: 0,1+0,2+0,4+0,1+0,2=1.

Полигон частот

Название «полигоном частот» применяют для обозначения ломаной линии, каждый отрезок, которой соединяют точки $(х_1,n_1),(х_2,n_2),…,(х_k,n_k)$. Для построения на графике полигона частот по оси абсцисс отмечают варианты $х_2$, при этом на оси ординат отсчитывают– соответствующие частоты $n_i$. Когда полученные точки $(х_i,n_i)$ соединяются с помощью отрезков, то автоматически получают полигон частот.

Статистический интервальный ряд распределения.

Статистическим дискретным рядом (или эмпирической функцией распределения) обычно пользуются, если число различающихся вариант в полученной выборке не слишком большое. Также применение возможно, когда дискретность имеет важное значение для экспериментатора. В тех случаях, когда важный для задачи признак генеральной совокупности Х распределяется непрерывным образом, либо его дискретность нет возможности учесть, то варианты предпочтительнее всего группировать, чтобы получить интервалы.

Статистическое распределение допустимо задавать в том числе в качестве последовательности интервалов и частот, соответствующих этим интервалам. При это за частоту какого-либо интервала принимается сумма всех частот, вошедших в данный интервал.

Особенно следует отметить ,что $h_i-h_{i-1}=h$ при всех i, т.е. группировка проводится с равным шагом h. Также в вопросе группировки можно ориентироваться на ряд полученных опытным путём рекомендацийу, касающихся таких параметров, как а, k и $h_i$:

1. $Rраз_{мах}=X_{max}-X_{min}$

2. $h=R/k$; k-число групп

3.$ kgeq 1+3.321lgn$ (формула Стерджеса)

4. $a=x_{min}, b=x_{max}$

5.$ h=a+h_i, i=0,1…k$

Определённую в ходе решения задачи группировку удобнее всего скомпоновать и перевести в вид специальной таблицы, которая также может именоваться — «статистический интервальный ряд распределения»:

Интервалы группировки [h0;h1) [h1;h2) [hk-2;hk-1) [hk-1;hk)
Частоты n1 n2 nk-1 nk

Таблицу подобного вида можно сделать, поменяв частоты $n_i$ на относительные частоты:

Интервалы группировки [h0;h1) [h1;h2) [hk-2;hk-1) [hk-1;hk)
Отн. частоты w1 w2 wk-1 wk

236

проверенных автора готовы помочь в написании работы любой сложности

Мы помогли уже 4 396 ученикам и студентам сдать работы от решения задач до дипломных на отлично! Узнай стоимость своей работы за 15 минут!

Пример 2

На склад пришла крупная партия деталей. Из них методом случайного отбора взято 50 экземпляров. Рассматривая изделия по одному, особенно интересующему признаку — размеру, определённому с точностью до 1 см, получим следующий вариационный ряд: 22, 47, 26, 26, 30, 28, 28, 31, 31, 31, 32, 32, 33, 33, 33, 33, 34, 34, 34, 34, 34, 35, 35, 36, 36, 36, 36, 36, 37, 37, 37, 37, 37, 37, 38, 38, 40, 40, 40, 40, 40, 41, 41, 43, 44, 44, 45, 45, 47, 50. Требуется произвести расчёт и определить статистический интервальный ряд распределения.

Решение

Найдём параметры выборки используя сведения из условия задачи.

$k geq1+3,321cdot lg50=1+3.32lg(5cdot10)=1+3.32(lg5+lg10)=6.6$

Получили a=22, k=7, h=(50-22)/7=4, hi=22+4i, i=0,1,…,7.

Интервалы группировки 22-26 26-30 30-34 34-38 38-42 42-46 46-50
Частоты 1 4 10 18 9 5 3
Отн. частоты 0.02 0.08 0.2 0.36 0.18 0.1 0.06

Десятичные логарифмы от 1 до 10

n 1 2 3 4 5 6 7 8 9 10
lnn≈ 0 0.3 0.48 0.6 0.7 0.78 0.85 0.9 0.95 1

Не получается написать работу самому?

Доверь это кандидату наук!

Пусть из генеральной совокупности извлечена выборка объ­ема П, в которой значение X1 некоторого исследуемого призна­ка Х наблюдалось П1 раз, значение X2 — п2 раз, …, значение XKNk раз. Значения Xi называются Вариантами, а их после­довательность, записанная в возрастающем порядке,— Вариационным рядом. Числа Ni называются Частотами, а их отно­шения к объему выборки

Относительными частотами. При этом Ni = П. Модой Мo называется варианта, имеющая наибольшую частоту. Ме­дианой те называется варианта, которая делит вариационный ряд на две части с одинаковым числом вариант в каждой. Если число вариант нечетно, т. е. K = 2L + 1, то Me = Xl+1; если же число вариант четно (k = 2L), То те = (Xl + Xl+1)/2. Разма­хом варьирования называется разность между максимальной и минимальной вариантами или длина интервала, которому принадлежат все варианты выборки:

Перечень вариант и соответствующих им частот называ­ется Статистическим распределением выборки. Здесь имеет­ся аналогия с законом распределения случайной величины: в теории вероятностей — это соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике — это соответствие между наблюда­емыми вариантами и их частотами (относительными частота­ми). Нетрудно видеть, что сумма относительных частот равна единице: Wi = 1.

Пример 2. Выборка задана в виде распределения частот:

Найти распределение относительных частот и основные харак­теристики вариационного ряда.

Решение. Найдем объем выборки: П = 2 + 4 + 5 + 6 + 3 = 20. Относительные частоты соответственно равны W1 = 2/20 = 0,1; W2 = 4/20 = 0,2; W3 = 5/20 = 0,25; W4 = 6/20 = 0,3; W5 = 3/20 = 0,15. Контроль: 0,1 + 0,2 + 0,25 + 0,3 + 0,15 = 1. Искомое распределение относительных частот имеет вид

Мода этого вариационного ряда равна 12. Число вариант в дан­ном случае нечетно: K = 2 ∙ 2 + 1, поэтому медиана Me = X3 = 8. Размах варьирования, согласно формуле (18.48), R = 17 – 4 = 13.

< Предыдущая   Следующая >

При систематизации данных выборочных обследований используются статистические дискретные и интервальные ряды распределения.

1. Статистическое дискретное распределение. Полигон.
Пусть из генеральной совокупности извлечена выборка, причем х1 наблюдалось n1 раз, х2 – n2 раз, хk – nk раз и ∑ni=n – объем выборки. Наблюдаемые значения х1 называют вариантами, а последовательность вариант, записанных в возрастающем порядке – вариационным рядом. Число наблюдений варианты называют частотой, а ее отношение к объему выборки – относительной частотой ni/n=wi

ОПРЕДЕЛЕНИЕ. Статистическим (эмпирическим) законом распределения выборки, или просто статистическим распределением выборки называют последовательность вариант хi и соответствующих им частот ni или относительных частот wi.

Статистическое распределение выборки удобно представлять в форме таблицы распределения частот, называемой статистическим дискретным рядом распределения:

x1 x2 xm
n1 n2 nm

(сумма всех частот равна объему выборки ∑ni=n)
или в виде таблицы распределения относительных частот:

x1 x2 xm
w1 w2 wm

(сумма всех относительных частот равна единице ∑wi=1)

Пример 1. При измерениях в однородных группах обследуемых получены следующие выборки: 71, 72, 74, 70, 70, 72, 71, 74, 71, 72, 71, 73, 72, 72, 72, 74, 72, 73, 72, 74 (частота пульса). Составить по этим результатам статистический ряд распределения частот и относительных частот.

Решение. 1) Статистический ряд распределения частот:

xi 70 71 72 73 74
ni 2 4 8 2 4

2) Объем выборки: n=2+4+8+2+4=20. Найдем относительные частоты, для чего разделим частоты на объем выборки ni/n=wi: wi=2/20=0.1; w2=4/20=0.2; w3=0.4; w4=4/20=0.1; w5=2/20=0.2. Напишем распределение относительных частот:

xi 70 71 72 73 74
wi 0.1 0.2 0.4 0.1 0.2

Контроль: 0,1+0,2+0,4+0,1+0,2=1.

Полигоном частот называют ломаную, отрезки, которой соединяют точки (х1,n1),(х2,n2),…,(хk,nk). Для построения полигона частот на оси абсцисс откладывают варианты х2, а на оси ординат – соответствующие им частоты ni. Точки (хi,ni) соединяют отрезками и получают полигон частот.

Полигоном относительных частот называют ломаную, отрезки, которой соединяют точки (х1,w1),(х2,w2),…,(хk,wk). Для построения полигона относительных частот на оси абсцисс откладывают варианты хi, а на оси ординат соответствующие им частоты wi. Точки (хi,wi) соединяют отрезками и получают полигон относительных частот.

Пример 2. Постройте полигон частот и относительных частот по данным примера 1.
Решение: Используя дискретный статистический ряд распределения, составленный в примере 1 построим полигон частот и полигон относительных частот:

2. Статистический интервальный ряд распределения. Гистограмма. Статистическим дискретным рядом (или эмпирической функцией распределения) обычно пользуются в том случае, когда отличных друг от друга вариант в выборке не слишком много, или тогда, когда дискретность по тем или иным причинам существенна для исследователя. Если же интересующий нас признак генеральной совокупности Х распределен непрерывно или его дискретность нецелесообразно ( или невозможно) учитывать, то варианты группируются в интервалы.

Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (в качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал).

Замечание. Часто hi-hi-1=h при всех i, т.е. группировку осуществляют с равным шагом h. В этой ситуации можно руководствоваться следующими эмперическими рекомендациями по выборке а, k и hi:

1. Rразмах=Xmax-Xmin
2. h=R/k; k-число групп
3. k≥1+3.321lgn (формула Стерджеса)
4. a=xmin, b=xmax
5. h=a+ih, i=0,1…k

Полученную группировку удобно представить в форме частотной таблицы, которая носит название статистический интервальный ряд распределения:

Интервалы группировки [h0;h1) [h1;h2) [hk-2;hk-1) [hk-1;hk)
Частоты n1 n2 nk-1 nk

Аналогическую таблицу можно образовать, заменяя частоты ni относительными частотами:

Интервалы группировки [h0;h1) [h1;h2) [hk-2;hk-1) [hk-1;hk)
Отн. частоты w1 w2 wk-1 wk

Пример 3. Из очень большой партии деталей извлечена случайная выборка объема 50 интересующий нас признак Х-размеры деталей, измеренные с точностью до 1см, представлен следующим вариоционным рядом: 22, 47, 26, 26, 30, 28, 28, 31, 31, 31, 32, 32, 33, 33, 33, 33, 34, 34, 34, 34, 34, 35, 35, 36, 36, 36, 36, 36, 37, 37, 37, 37, 37, 37, 38, 38, 40, 40, 40, 40, 40, 41, 41, 43, 44, 44, 45, 45, 47, 50. Найти статистический интервальный ряд распределения.

Решение. Определим характеристики группировки с помощью замечания.
k≥1+3.321lg50=1+3.32lg(5•10)=1+3.32(lg5+lg10)=6.6
Имеем, a=22, k=7, h=(50-22)/7=4, hi=22+4i, i=0,1,…,7.

Интервалы группировки 22-26 26-30 30-34 34-38 38-42 42-46 46-50
Частоты ni 1 4 10 18 9 5 3
Отн.частоты wi 0.02 0.08 0.2 0.36 0.18 0.1 0.06

Десятичные логарифмы от 1 до 10

n 1 2 3 4 5 6 7 8 9 10
lnn 0 0.3 0.48 0.6 0.7 0.78 0.85 0.9 0.95 1

Наиболее информативной графической формой частот является специальный график, называемы гистограммой частот.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты).

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии ni/h. Площадь i-го частичного прямоугольника равна h•ni/h=ni – сумме частот вариант i-го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению wi/h (плотность относительной частоты).

Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии wi/h. Площадь i-го частичного прямоугольника равна h•wi/h=wi – относительной частоте вариант, попавших в i-й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.

Пример 4. Постройте гистограмму частот и относительных частот по данным примера 3.

Выборочная медиана – это середина вариационного ряда, значение, расположенное на одинаковом расстоянии от левой и правой границы выборки.

Выборочная мода – это наиболее вероятное, т.е. чаще всего встречающееся, значение в выборке.

Добавлять комментарии могут только зарегистрированные пользователи.

Регистрация Вход

Добавить комментарий