По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города:
Размер вклада, руб. | До 400 | 400 – 600 | 600 – 800 | 800 – 1000 | Свыше 1000 |
---|---|---|---|---|---|
Число вкладчиков | 32 | 56 | 120 | 104 | 88 |
Определите:
1) размах вариации;
2) средний размер вклада;
3) среднее линейное отклонение;
4) дисперсию;
5) среднее квадратическое отклонение;
6) коэффициент вариации вкладов.
Решение:
Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.
Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200.
Размер вклада, руб. | 200 – 400 | 400 – 600 | 600 – 800 | 800 – 1000 | 1000 – 1200 |
---|---|---|---|---|---|
Число вкладчиков | 32 | 56 | 120 | 104 | 88 |
1) Определим размах вариации как разность между наибольшим и наименьшим значением признака:
Размах вариации размера вклада равен 1000 рублей.
2) Средний размер вклада определим по формуле средней арифметической взвешенной.
Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов.
Среднее значение первого интервала будет равно:
второго – 500 и т. д.
Занесём результаты вычислений в таблицу:
Размер вклада, руб. | Число вкладчиков, f | Середина интервала, х | xf |
---|---|---|---|
200-400 | 32 | 300 | 9600 |
400-600 | 56 | 500 | 28000 |
600-800 | 120 | 700 | 84000 |
800-1000 | 104 | 900 | 93600 |
1000-1200 | 88 | 1100 | 96800 |
Итого | 400 | – | 312000 |
Средний размер вклада в Сбербанке города будет равен 780 рублей:
3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:
Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий:
1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2).
2. Определяются абсолютные отклонения вариант от средней:
3. Полученные отклонения умножаются на частоты:
4. Находится сумма взвешенных отклонений без учёта знака:
5. Сумма взвешенных отклонений делится на сумму частот:
Удобно пользоваться таблицей расчётных данных:
Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля.
4) Дисперсия – это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической.
Расчёт дисперсии в интервальных рядах распределения производится по формуле:
Порядок расчёта дисперсии в этом случае следующий:
1. Определяют среднюю арифметическую взвешенную, как показано в п. 2).
2. Находят отклонения вариант от средней:
3. Возводят в квадрат отклонения каждой варианты от средней:
4. Умножают квадраты отклонений на веса (частоты):
5. Суммируют полученные произведения:
6. Полученная сумма делится на сумму весов (частот):
Расчёты оформим в таблицу:
5) Среднее квадратическое отклонение размера вклада определяется как корень квадратный из дисперсии:
6) Коэффициент вариации – это отношение среднего квадратического отклонения к средней арифметической:
По величине коэффициента вариации можно судить о степени вариации признаков совокупности. Чем больше его величина, тем больше разброс значений признаков вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна средняя.
5.1. Методические рекомендации и решения типовых задач
Вариация
– это изменение (колеблемость) значений
признака в пределах изучаемой совокупности
при переходе от одного объекта (группы
объектов), или от одного случая к другому.
Абсолютные и относительные показатели
вариации, характеризующие колеблемость
значений варьирующего признака,
позволяют, в частности, измерить степень
связи и взаимозависимости между
признаками, определить степень
однородности совокупности, типичности
и устойчивости средней, определить
величину погрешности выборочного
наблюдения, статистически оценить закон
распределения совокупности и т. п.
В этой теме
необходимо уяснить сущность (смысл),
назначение и способы вычисления каждого
показателя вариации, рассматриваемого
в курсе теории статистики: размах
вариации, среднее линейное отклонение,
средний квадрат отклонений (дисперсию),
среднее квадратическое отклонение,
относительные коэффициенты вариации
(коэффициент осцилляции, коэффициент
среднего линейного отклонения, коэффициент
вариации).
Размах вариации
(R)
представляет
собой разность между максимальным
(хmax)
и минимальным (хmin)
значениями признака в совокупности (в
ряду распределения):
R
= хmax
– хmin.
(5.1)
Мерой других
показателей вариации является разность
не между крайними значениями признака,
а средняя разность между каждым значением
признака и средней величиной этих
признаков. Разность между отдельным
значением признака и средней называют
отклонением.
Среднее линейное
отклонение
вычисляется по следующим формулам:
по индивидуальным
(несгруппированным) данным
;
(5.2)
по вариационным
рядам (сгруппированным данным)
.
(5.3)
Так как алгебраическая
сумма отклонений индивидуальных значений
признака от средней (согласно нулевому
свойству) всегда равна нулю, то при
расчете среднего линейного отклонения
используется арифметическая сумма
отклонений, взятая по модулю, т.е.
.
Среднее линейное
отклонение имеет ту же размерность, что
и признак, для которого оно исчисляется.
Дисперсия и
среднее квадратическое отклонение.
Среднее линейное отклонение относительно
редко применяется для оценки вариации
признака. Поэтому обычно вычисляются
дисперсия (2)
и среднее квадратическое отклонение
().
Эти показатели применяются не только
для оценки вариации признака, но и для
измерения связи между ними, для оценки
величины ошибки выборочного наблюдения
и других целей.
Дисперсия признака
рассчитывается по формулам:
по первичным данным
; (5.4)
по вариационным
рядам
. (5.5)
Среднее
квадратическое отклонение
представляет собой корень квадратный
из дисперсии:
по первичным данным
; (5.6)
по вариационным
рядам
. (5.7)
Среднее квадратическое
отклонение так же, как и среднее линейное
отклонение, имеет ту же размерность,
что и сам исходный признак.
Дисперсию можно
определить и как разность между средним
квадратом вариантов и квадратом их
средней величины, т. е.
.
(5.8)
В этом случае по
первичным данным дисперсия равна:
(5.9)
Применительно к
сгруппированным данным, расчет дисперсии
этим способом в развернутом виде
представим в таком виде:
. (5.10)
Для рядов
распределения с равными интервалами
значение дисперсии можно вычислить,
применяя способ условных моментов, т.
е.
, (5.11)
где
– первый условный момент; (5.12)
– второй условный момент. (5.13)
Среднее квадратическое
отклонение по способу условных моментов
определяется по формуле:
(5.14)
Преобразуя выражение
расчета дисперсии по способу условных
моментов, получим формулу вида:
(5.15)
На основе одних и
тех же исходных данных получим одинаковое
значение дисперсии.
Относительные
показатели вариации вычисляются как
отношение ряда абсолютных показателей
вариации к их средней арифметической
и выражаются в процентах:
коэффициент
осцилляции –
; (5.16)
коэффициент
относительного линейного отклонения
–
; (5.17)
коэффициент
вариации –
. (5.18)
Задача 1.
Рассмотрим способы расчета показателей
вариации на основе данных табл. 5.1.
Таблица 5.1.Исходные
данные для расчета показателей вариации
Затраты |
Количество |
Середина |
xf |
х2 |
х2f |
|||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
до |
10 |
9 |
90 |
-4,2 |
42 |
17,64 |
176,4 |
81 |
810 |
-2 |
-20 |
40 |
10-12 |
10 |
11 |
110 |
-2,2 |
22 |
4,84 |
48,4 |
121 |
1210 |
-1 |
-10 |
10 |
12-14 |
50 |
13 |
650 |
-0,2 |
10 |
0,04 |
2,0 |
169 |
8450 |
0 |
0 |
0 |
14-16 |
20 |
15 |
300 |
1,8 |
36 |
3,24 |
64,8 |
225 |
4500 |
1 |
20 |
20 |
16 |
10 |
17 |
170 |
3,8 |
38 |
14,44 |
144,4 |
289 |
2890 |
2 |
20 |
40 |
Итого |
100 |
– |
1320 |
– |
148 |
– |
436 |
– |
17860 |
10 |
110 |
; к = 2
Приведенный ряд
распределения ранжированный, поэтому
здесь легко найти минимальное значение
признака, оно равно 8 мин. (10 – 2), и
максимальное, равное 18 мин. (16 + 2). Значит,
размах вариации признака в этом ряду
составит 10 мин., т. е.
R
= xmax
– xmin
= 18 – 8 = 10 мин.
Вычислим среднее
линейное отклонение. Прежде всего
необходимо вычислить среднюю величину
.
Все вычисления будем вести в табличной
форме (табл. 5.1.), отводя для каждой
вычислительной операции графу в таблице.
Поскольку исходные
данные представлены рядом распределения,
то
мин.
мин.
Покажем способы
расчета дисперсии:
а) обычным способом
(по определению):
;
б) как разность
между средним квадратом и квадратом
средней величины:
Для определения
величины дисперсии по этой формуле
необходимо вычислить средний квадрат
вариантов признака по формуле:
;
2=178,6
– (13,2)2=4,36;
в) по способу
условных моментов:
;
;
.
г) на основе
преобразования формулы расчета дисперсии
по способу условных моментов имеем:
Дисперсия – число
отвлеченное, не имеющее единиц измерения.
Среднее квадратическое
отклонение вычислим путем извлечения
корня квадратного из дисперсии:
мин.
По способу условных
моментов величину среднего квадратического
отклонения определим так:
мин.
Вычислим относительные
показатели вариации:
%;
%;
%.
Основным относительным
показателем вариации является коэффициент
вариации (V).
Он используется для сравнительной
оценки меры колеблемости признаков,
выраженных в различных единицах
измерения.
Наряду с вариацией
количественных признаков может
наблюдаться и вариация качественных
признаков (в частности альтернативной
изменчивости качественных признаков).
В этом случае каждая единица изучаемой
совокупности либо обладает каким-то
свойством, либо нет (например, каждый
взрослый человек либо работает, либо
нет). Наличие признака у единиц совокупности
обозначают 1, а отсутствие –0; долю же
единиц совокупности, обладающих изучаемым
признаком, обозначают p,
а не обладающих им – q.
Дисперсия альтернативного признака
определяется по формуле:
; (5.19)
p
+ q
= 1 (5.20)
Если, например,
доля поступивших в университет равна
30%, а не поступивших – 70%, то дисперсия
равна 0,21(0,3 · 0,7). максимальное значение
произведения pq
равно 0,25 (при условии, когда одна половина
единиц обладает данным признаком, а
другая половина нет: (0,5 · 0,5 = 0,25).
Способ разложения
общей дисперсии.
Для оценки влияния различных факторов,
определяющих колеблемость индивидуальных
значений признака, воспользуемся
разложением общей дисперсии на
составляющие: на так называемую групповую
дисперсию и среднюю из внутригрупповых
дисперсий:
, (5.21)
где
– общая дисперсия, характеризующая
вариацию признака как результат влияния
всех факторов, определяющих индивидуальные
различия единиц совокупности.
Вариацию признака,
обусловленную влиянием фактора,
положенного в основу группировки,
характеризует межгрупповая дисперсия
2,
которая является мерой колеблемости
частных средних по группам
вокруг общей средней и исчисляется по
формуле:
, (5.22)
где nj
– число единиц совокупности в каждой
группе;
j
– порядковый номер группы.
Вариацию признака,
обусловленную влиянием всех прочих
факторов, кроме группировочного
(факторного), характеризует в каждой
группе внутригрупповая дисперсия:
, (5.23)
где i
– порядковый номер x
и f
в пределах каждой группы.
По совокупности
в целом средняя из внутригрупповых
дисперсий определяется по формуле:
(5.24)
Отношение
межгрупповой дисперсии 2
к общей
даст коэффициент детерминации:
(5.25)
который характеризует
долю вариации результативного признака,
обусловленную вариацией факторного
признака, положенного в основание
группировки.
Показатель,
полученный как корень квадратный из
коэффициента детерминации, называется
коэффициентом эмпирического корреляционного
отношения, т.е.:
(5.26)
Он характеризует
тесноту связи между результативным и
факторным (положенным в основу группировки)
признаками. Численное значение
коэффициента эмпирического корреляционного
отношения имеет два знака: .
При решении вопроса о том, с каким знаком
его следует брать, необходимо иметь
ввиду: если вариация факторного и
результативного признаков идет синхронно
в одном и том же направлении (возрастает
или убывает), то корреляционные отношение
берется со знаком плюс; если же изменение
этих признаков идет в противоположных
направлениях, то оно берется со знаком
минус.
Для вычисления
групповых и межгрупповых дисперсий
можно применять любой из описанных выше
способов исчисления среднего квадрата
отклонений.
Задача 2.
Вычислим все названные дисперсии по
исходным данным табл. 5.2.
Таблица 5.2.
Распределение
посевной площади озимой пшеницы по
урожайности
Номер |
Урожайность, (х) |
Посевная площадь, (f) |
xf |
x2 |
x2f |
1 |
2 |
3 |
4 |
5 |
6 |
1 |
20 |
80 |
1600 |
400 |
32000 |
2 |
22 |
50 |
1100 |
484 |
24200 |
3 |
25 |
20 |
500 |
625 |
12500 |
4 |
28 |
50 |
1400 |
784 |
39200 |
5 |
30 |
100 |
3000 |
900 |
90000 |
6 |
35 |
80 |
2800 |
1225 |
98000 |
7 |
38 |
50 |
1900 |
1444 |
72200 |
8 |
40 |
70 |
2800 |
1600 |
112000 |
Итого |
500 |
15100 |
x |
480100 |
Вычислим среднюю
урожайность озимой пшеницы по всем
участкам (общая средняя):
ц/га.
Общую дисперсию
найдем по формуле:
В гр. 6 табл. 5.2.
вычислим значения для расчета среднего
квадрата вариантов признака:
.
Находим общую
дисперсию:
Урожайность зависит
от многих факторов (качество почвы,
размер внесения органических и минеральных
удобрений, качество семян, сроки сева,
уход за посевами и др.) Общая дисперсия
в данном случае измеряет колеблемость
урожайности за счет всех факторов.
Задача 3.
Разобьем совокупность участков на две
группы: I
группа – посевные площади, на которых
не вносились органические удобрения;
II
– площади, на которых они вносились. К
первой группе отнесем участки 1-4, а ко
второй – 4-8. По данным этих групп
рассчитаем остальные из необходимых
нам дисперсий, используя уже произведенные
в табл. 5.2. вычисления.
Таблица 5.3. Расчетные
данные для вычисления межгрупповой и
групповых дисперсий
Номер участка |
Урожайность, |
Посевная |
xf |
x2 |
x2f |
Номер участка |
Урожайность, |
Посевная |
xf |
x2 |
x2f |
1 |
20 |
80 |
1600 |
400 |
32000 |
5 |
30 |
100 |
3000 |
900 |
90000 |
2 |
22 |
50 |
1100 |
484 |
24200 |
6 |
35 |
80 |
2800 |
1225 |
98000 |
3 |
25 |
20 |
500 |
625 |
12500 |
7 |
38 |
50 |
1900 |
1444 |
72200 |
4 |
28 |
50 |
1400 |
784 |
39200 |
8 |
40 |
70 |
2800 |
1600 |
112000 |
Итого |
200 |
4600 |
x |
107900 |
Итого |
300 |
10500 |
x |
372200 |
Определяем:
для |
для |
а) |
а) |
ц/га; |
ц/га; |
б) |
б) |
; |
; |
в) |
в) |
. |
. |
Определяем среднюю
из групповых дисперсий:
.
Находим межгрупповую
дисперсию:
.
Средняя из групповых
дисперсий измеряет колеблемость признака
за счет всех прочих факторов, кроме
положенного в основание группировки
(разграничения на группы), а межгрупповая
– за счет именно этого фактора. Сумма
этих дисперсий должна дать общую
дисперсию, а именно:
Отношение
межгрупповой дисперсии к общей в нашем
примере даст следующее значение
коэффициента детерминации:
,
или 71,8%,
т. е. вариация
урожайности озимой пшеницы на 71,8% зависит
от вариации размеров внесения органических
удобрений. Остальные же 28,2% вариации
урожайности зависит от влияния всех
остальных факторов, кроме размеров
внесения органических удобрений.
Коэффициент
эмпирического корреляционного отношения
составит:
.
Это говорит о том,
что внесение органических удобрений
оказывает весьма существенное влияние
на урожайность.
Статистические
характеристики асимметрии и эксцесса.
Выяснение общего характера распределения
предполагает оценку степени его
однородности, а также вычисление
показателей асимметрии и эксцесса.
Величина показателя
асимметрии может быть положительной
(правосторонняя асимметрия) и отрицательной
(левосторонняя асимметрия). Существует
следующее соотношение между показателями
центра распределения: при правосторонней
асимметрии –
;
при левосторонней асимметрии –.
Коэффициент
асимметрии исчисляется по формуле:
, (5.27)
где М3
– центральный момент третьего порядка,
который в вариационных интервальных
рядах с равновеликими интервалами
определяется через систему условных
моментов по выражению:
. (5.28)
Значение
в системе стандартных условных моментов
исчисляется по формуле:
. (5.29)
Оценка степени
существенности показателя асимметрии
дается с помощью его среднеквадратической
ошибки:
. (5.30)
Если отношение
,
асимметрия существенна, и распределение
признака в генеральной совокупности
не является симметричным. Если отношение,
асимметрия несущественна, ее наличие
может быть объяснено влиянием случайных
обстоятельств.
Для симметричных
распределений рассчитывается показатель
экцесса (островершинности):
. (5.31)
Четвертый центральный
момент (М4)
вычисляется по уравнению:
М4
= m4
– 4m3m1
+ 6m2m21
– 3m41. (5.32)
Средняя квадратическая
ошибка эксцесса рассчитывается по
формуле
(5.33)
Если отношение
,
то следует предложить, что эксцесс
свойствен распределению признака в
генеральной совокупности и наоборот.
Задача 4.
Покажем способы расчета коэффициентов
асимметрии и эксцесса по данным табл.
5.4.
Таблица 5.4.
Исходные данные для вычисления
коэффициентов асимметрии и эксцесса
Затраты времени |
Количество (f) |
Середина интервала, (х) |
|||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
до |
10 |
9 |
-2 |
-20 |
40 |
-80 |
160 |
10-12 |
10 |
11 |
-1 |
-10 |
10 |
-10 |
10 |
12-14 |
50 |
13 |
0 |
0 |
0 |
0 |
0 |
14-16 |
20 |
15 |
1 |
20 |
20 |
20 |
20 |
16 |
10 |
17 |
2 |
20 |
40 |
80 |
160 |
Итого |
100 |
x |
x |
10 |
110 |
10 |
350 |
Вычислим значения
условных моментов:
На основе комбинации
первого, второго и третьего условных
моментов исчислим третий центральный
момент:
М3
= 0,1-31,10,1+2(0,1)3=-0,228.
Значение среднего
квадратического отклонения вычислим
по формуле:
Определим коэффициент
асимметрии:
.
Наличие знака
минус при коэффициенте свидетельствует
о левосторонней асимметрии.
Вычислим величину
средней квадратической ошибки коэффициента
асимметрии:
.
Критерий tAS
вычислим по формуле:
.
Поскольку tAS
3, то это свидетельствует о несущественности
асимметрии распределения деталей по
затратам времени на их изготовление.
Для расчета
коэффициента эксцесса вычислим значение
четвертого центрального момента:
М4
= 3,5 – 4
0,1
0,1 + 6
1,1 (0,1)2
– 3(0,1)4
= 3,5256.
Определим коэффициент
эксцесса:
Величина
среднеквадратической ошибки эксцесса
составит:
Критерий tЕХ
определим по формуле:
Так как tEX
3, то наличие эксцесса не свойственно
распределению признака в генеральной
совокупности.
ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №5.
Расчёт показателей вариации.
Студент должен:
знать:
– область применения и методику расчёта
степенных средних величин;
уметь:
– исчислять
степенные средние
величины;
– формулировать вывод по полученным
результатам.
Методические указания
Наряду со средними
величинами в статистике исчисляются показатели вариации. Вариацией в статистике
называются различия индивидуальных значений изучаемого признака. Возникает
вариация в силу того, что отдельные значения признака статистической совокупности
формируются под воздействием разнообразных факторов. Значение изучения вариации
в том, что по колеблемости признаков можно судить о качественной однородности
совокупности. Совокупности могут иметь одинаковые значения средней величины, но
отличаться колеблемостью индивидуальных значений.
Например: По имеющимся данным о дневной выработке рабочих двух бригад определить
среднюю выработку рабочего за день в каждой бригаде, сделать вывод об
однородности рассматриваемых совокупностей и надёжности их средних.
Выработка в первой
бригаде: 31, 25, 30, 26, 28 деталей.
Выработка во второй
бригаде: 27, 20, 56, 19, 18 деталей.
Решение:
Исходные данные не
сгруппированы, поэтому для расчёта средней выработки применяем среднюю
арифметическую простую. Средняя дневная выработка рабочего:
в первой бригаде
во второй бригаде
Среднедневная выработка рабочего в
обеих бригадах одинакова, но индивидуальные
значения выработки во второй бригаде подвержены значительным колебаниям. Это
вызывает необходимость измерять вариацию.
К
абсолютным показателям вариации относятся
размах вариации, среднее линейное отклонение,
дисперсия и среднее квадратическое отклонение.
Элементарным
показателем колеблемости является размах вариации, который определяется
как разность между наибольшим и наименьшим значением признака: R=Хmax – Xmin
В нашем примере размах
вариации индивидуальной выработки:
в первой бригаде R1 =31-25=6 деталей
во второй бригаде R2 =56-18=38 деталей
Сравнение этих
показателей свидетельствует о том, что размах вариации индивидуальной выработки
во второй бригаде на 32 детали больше, чем в первой бригаде. Однако размах
вариации не улавливает колеблемости вариантов внутри изучаемой совокупности.
Для получения обобщающей характеристики колеблемости всех вариантов
совокупности исчисляются другие показатели вариации.
Среднее линейное отклонение даёт обобщённую характеристику степени колеблемости признака
в совокупности относительно среднего уровня признака и рассчитывается как средняя арифметическая из индивидуальных
линейных отклонений по формуле:
–
для
невзвешенных данных
–
для
взвешенных данных
где – индивидуальное
линейное отклонение.
Показатель
среднего линейного отклонения нашел широкое применение на практике. С его
помощью анализируют состав работающих, ритмичность производства, равномерность
поставок материалов; разрабатывают системы материального стимулирования. Но
этот показатель усложняет расчёты вероятностного типа, затрудняет применение
методов математической статистики. Поэтому в статистических научных
исследованиях для измерения вариации чаще всего применяют показатель дисперсии.
В
статистике дисперсия, центральный момент второго порядка, является оценкой
одноимённого показателя теории вероятностей и оценкой дисперсии в
математической статистике, что позволяет использовать теоретические положения
этих дисциплин для анализа социально – экономических процессов. На дисперсии
практически основаны все метод математической статистики. Большое значение
имеет правило сложения дисперсий. Дисперсия рассчитывается как средний квадрат отклонений индивидуальных значений
признака от среднего
значения признака по формуле:
–
для
невзвешенных данных
–
для
взвешенных данных
Среднее квадратическое отклонение является обобщающей характеристикой размеров вариации признака совокупности. Это – мера вариации, показатель надёжности средней. Чем меньше значение
среднего квадратического отклонения, тем лучше средняя величина представляет собой
рассматриваемую совокупность.Среднее квадратическое отклонение рассчитывается
по формуле:
Для
расчёта показателей вариации в нашем примере строим вспомогательную таблицу:
Первая бригада |
Вторая бригада |
||||
Выработка,деталей (Хi ) |
Индивидуальное линейное отклонение |
|
Выработка, деталей (Хi ) |
Индивидуальное линейное отклонение |
|
25 |
|-3| |
9 |
18 |
|-10| |
100 |
26 |
|-2| |
4 |
19 |
|-9| |
81 |
28 |
0 |
0 |
20 |
|-8| |
64 |
30 |
2 |
4 |
27 |
|-1| |
1 |
31 |
3 |
9 |
56 |
28 |
784 |
Итого: |
10 |
26 |
56 |
1030 |
Среднее
линейное отклонение:
в первой бригаде ; во второй
бригаде .
Дисперсия:
в первой бригаде ; во
второй бригаде .
Среднее квадратическое отклонение:
в первой бригаде ; во второй бригаде
Таким образом,
выполненные нами расчёты показывают, что колеблемость индивидуальных значений
выработки во второй бригаде намного выше, чем в первой бригаде.
Для
целей сравнения колеблемости различных признаков в одной и той же совокупности
или же при сравнении колеблемости одного и того же признака в нескольких
совокупностях исчисляют показатели
вариации в относительных величинах. Базой для сравнения должна служить
средняя арифметическая. Эти показатели вычисляются как отношение размаха
вариации, среднего линейного отклонения или среднего квадратического отклонения
к средней арифметической (реже к медиане). Чаще всего они выражаются в
процентах и определяют не только сравнительную оценку вариации, но и дают
характеристику однородности совокупности. Совокупность
считается однородной, если коэффициент вариации не превышает 33% (для
распределения близкого к нормальному). Различают следующие относительные
показатели вариации:
Коэффициент осцилляции (vR) рассчитывается по формуле:
и отражает относительную меру
колеблемости крайних значений признака вокруг средней.
Линейный коэффициент вариации (vd) рассчитывается
по формуле:
и отражает долю усреднённого значения
абсолютных отклонений от средней величины.
Коэффициент вариации (vσ ) как относительное квадратическое отклонение от средней величины
рассчитывается по формуле:
Рассчитаем относительные
показатели вариации для нашего примера.
Коэффициент осцилляции
Для первой бригады: Для
второй бригады:
Линейный коэффициент вариации
Для первой бригады: Для
второй бригады:
Коэффициент вариации
Для первой бригады: Для
второй бригады:
Величина рассчитанных
нами коэффициентов свидетельствует о том, что колеблемость индивидуальных
значений выработки во второй бригаде высокая. Первую совокупность можно считать
однородной, а её среднюю – надёжной. Вторую совокупность следует считать
неоднородной, а её среднюю – ненадёжной.
Рассмотрим
примеры расчёта показателей вариации для сгруппированных данных.
Пример
1. По имеющимся данным узла связи рассчитайте абсолютные и относительные
показатели вариации. Сделать вывод об однородности рассматриваемой совокупности
и надёжности её средней.
Количество |
Число |
12 13 14 15 16 17 18 |
18 22 34 26 20 13 7 |
Итого |
140 |
Решение:
Исходные
данные представлены в виде дискретного ряда распределения.
Для
исчисления среднего значения признака и показателей вариации строим и
рассчитываем вспомогательную таблицу:
Количество слов в телеграмме(Хi) |
Число телеграмм (fi) |
|
|
|
|
|
12 |
18 |
216 |
|
54 |
9 |
162 |
13 |
22 |
286 |
|
44 |
4 |
88 |
14 |
34 |
476 |
|
34 |
1 |
34 |
15 |
26 |
390 |
0 |
0 |
0 |
0 |
16 |
20 |
320 |
1 |
20 |
1 |
20 |
17 |
13 |
221 |
2 |
26 |
4 |
52 |
18 |
7 |
126 |
3 |
21 |
9 |
63 |
итого |
140 |
2035 |
199 |
419 |
1). Определяем среднее количество слов в телеграмме по
формуле средней арифметической взвешенной, так как исходные данные
сгруппированы:
2). Определяем абсолютные показатели
вариации:
Размах вариации R=Хmax – Xmin=18-12=6 слов
Среднее линейное отклонение по
формуле для взвешенных данных:
где – индивидуальное
линейное отклонение.
Дисперсию исчисляем по формуле для
взвешеных данных
Среднее квадратическое отклонение:
3). Определяем относительные
показатели вариации:
Коэффициент осцилляции: т.е. колеблемость крайних значений признака вокруг средней
составляет 40%.
Линейный коэффициент
вариации: , т.е. доля усреднённого значения абсолютных отклонений от
средней величины составляет 9,3%.
Коэффициент вариации:
Вывод:
Величина рассчитанного нами коэффициента вариации свидетельствует о том, что
колеблемость индивидуальных значений слов в телеграмме невысокая, т.е. Vσ ≤ 33%.
Поэтому совокупность можно считать
однородной, а её среднюю – надёжной.
Пример 2. Имеются следующие данные о
распределении сотрудников организации по среднемесячной заработной плате.
Рассчитать абсолютные и относительные показатели вариации. Сделать вывод об
однородности рассматриваемой совокупности и надёжности её средней.
Группы сотрудников по |
Количество сотрудников, чел. (fi) |
До 3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10 и свыше |
14 22 25 29 10 8 6 5 3 |
Итого: |
122 |
Решение:
Исходные данные представлены в виде
интервального ряда распределения.
Для исчисления среднего значения
признака и показателей вариации строим и рассчитываем вспомогательную таблицу:
Группы по ной |
Централь- ное (Хс) |
Коли- чество ников, |
|
|
|
|
|
До 3 |
2,5 |
14 |
35 |
|
38,36 |
7,51 |
105,14 |
3-4 |
3,5 |
22 |
77 |
|
38,28 |
3,03 |
66,61 |
4-5 |
4,5 |
25 |
112,5 |
|
18,5 |
0,55 |
13,69 |
5-6 |
5,5 |
29 |
159,5 |
0,26 |
7,54 |
0,07 |
1,96 |
6-7 |
6,5 |
10 |
65 |
1,26 |
12,6 |
1,59 |
15,90 |
7-8 |
7,5 |
8 |
60 |
2,26 |
18,08 |
5,11 |
40,86 |
8-9 |
8,5 |
6 |
51 |
3,26 |
19,56 |
10,63 |
63,76 |
9-10 |
9,5 |
5 |
47,5 |
4,26 |
21,3 |
18,15 |
90,74 |
10 и выше |
10,5 |
3 |
31,5 |
5,26 |
15,78 |
27,67 |
83,00 |
итого |
122 |
639 |
190 |
481,66 |
1). Определяем среднюю
заработную плату по формуле средней арифметической взвешенной для интервального
ряда распределения:
2). Определяем абсолютные показатели
вариации:
Размах вариации не рассчитываем, т.к.
нижняя граница первого интервала и верхняя граница последнего интервала не
указаны.
Среднее линейное отклонение по
формуле для взвешенных данных:
где – индивидуальное
линейное отклонение.
Дисперсию исчисляем по формуле для
взвешеных данных:
Среднее квадратическое отклонение:
3). Определяем относительные показатели вариации:
Коэффициент осцилляции (VR) не рассчитываем, т.к. не
рассчитывали размах вариации.
Линейный коэффициент вариации: , т.е. доля усреднённого значения абсолютных отклонений от
средней величины составляет 29,8%.
Коэффициент вариации:
Вывод: Величина
рассчитанного нами коэффициента вариации свидетельствует о том, что
колеблемость индивидуальных значений заработной платы высокая, т.е. Vσ ≥ 33%. Поэтому совокупность считаем неоднородной, а
её среднюю – ненадёжной.
Свойства дисперсии
Свойство 1.
Дисперсия постоянной величины равна нулю.
Свойство 2.
Уменьшение всех значений признака на одну и ту же величину А не меняет величины
дисперсии:
Значит, средний квадрат отклонений можно вычислить не по заданным
значениям признака, а по отклонениям их от какого-то постоянного числа.
Свойство 3.
Уменьшение всех значений признака в раз уменьшает
дисперсию в раз, а среднее квадратическое
отклонение – в раз:
Значит, все значения признака можно разделить на какое-то постоянное
число (скажем, на величину интервала ряда), исчислить среднее квадратическое
отклонение, а затем умножить его на постоянное число:
Свойство 4.
Если исчислить средний квадрат отклонений от любой величины А, в той или иной
степени отличающейся от средней арифметической (), то он всегда будет больше среднего квадрата отклонений,
исчисленного от средней арифметической:
Средний квадрат отклонений при этом будет больше на вполне определенную
величину – на квадрат разности средней и этой условно взятой величины, т. е. на
:
или
Значит, дисперсия от средней всегда меньше дисперсий, исчисленных от
любых других величин, т. е. она имеет свойство минимальности.
В случае когда А приравнивается к нулю и, следовательно, не вычисляются
отклонения, формула принимает такой вид:
или
Значит, средний квадрат отклонений равен среднему квадрату значений
признака минус квадрат среднего значения признака
Виды (показатели) дисперсий и правило
их сложения
В статистическом исследовании очень
часто бывает необходимо не только изучить вариации признака по всей
совокупности, но и проследить количественные изменения признака по однородным
группам совокупности, а также и между группами. Следовательно, помимо общей
средней для всей совокупности необходимо просчитывать и частные средние
величины по отдельным группам.
Различают три вида дисперсий:
–
общая;
–
средняя
внутригрупповая;
–
межгрупповая.
Общая дисперсия () характеризует вариацию признака всей совокупности под
влиянием всех тех факторов, которые обусловили данную вариацию. Эта величина
определяется по формуле
где – общая средняя
арифметическая всей исследуемой совокупности.
Средняя внутригрупповая
дисперсия () свидетельствует о случайной вариации, которая может
возникнуть под влиянием каких-либо неучтенных факторов и которая не зависит от
признака-фактора, положенного в основу группировки. Данная дисперсия
рассчитывается следующим образом: сначала рассчитываются дисперсии по отдельным
группам ():
,
а затем – рассчитывается средняя внутригрупповая дисперсия :
где ni –
число единиц в группе
Межгрупповая дисперсия
() (дисперсия групповых средних) характеризует систематическую
вариацию, т.е. различия в величине исследуемого признака, возникающие под
влиянием признака-фактора, который положен в основу группировки. Эта дисперсия
рассчитывается по формуле:
где – средняя величина по отдельной группе.
Все три вида дисперсии связаны между собой: общая дисперсия
равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии:
Данное соотношение отражает закон,
который называют правилом сложения дисперсий.
Согласно этому закону (правилу), общая дисперсия, которая возникает под
влиянием всех факторов, равна сумме дисперсий, которые появляются как под
влиянием признака-фактора, положенного в основу группировки, так и под влиянием
других факторов. Благодаря правилу сложения дисперсий можно определить, какая
часть общей дисперсии находится под влиянием признака-фактора, положенного в
основу группировки.
Правило сложения дисперсий широко
применяется при исчислении показателей тесноты связи, в дисперсионном анализе,
при оценке точности типической выборки и в ряде других случаев.