Лекция
№6
Показатели вариации.
Различие
индивидуальных значений признака внутри
изучаемой совокупности в статистике
называется вариацией
признака.
Она
возникает в результате того, что его
индивидуальные значения складываются
под совокупным влиянием разнообразных
факторов, которые по-разному сочетаются
в каждом отдельном случае.
Средняя
величина —
это абстрактная, обобщающая характеристика
признака изучаемой совокупности, но
она не показывает строения совокупности,
которое весьма существенно для ее
познания. Средняя величина не дает
представления о том, как отдельные
значения изучаемого признака группируются
вокруг средней, сосредоточены ли они
вблизи или значительно отклоняются от
нее. В некоторых случаях отдельные
значения признака близко примыкают к
средней арифметической и мало от нее
отличаются. В таких случаях средняя
хорошо представляет всю совокупность.
В
других, наоборот, отдельные значения
совокупности далеко отстают от средней,
и средняя плохо представляет всю
совокупность.
Колеблемость
отдельных значений характеризуют
показатели вариации.
Термин
“вариация” произошел от латинского
variatio –“изменение,
колеблемость, различие”.
Однако не всякие различия принято
называть вариацией. Под вариацией в
статистике понимают такие количественные
изменения величины исследуемого
признака в пределах однородной
совокупности, которые обусловлены
перекрещивающимся влиянием действия
различных факторов. Различают вариацию
признака: случайную и систематическую.
Анализ
систематической вариации позволяет
оценить степень зависимости изменений
в изучаемом признаке от определяющих
ее факторов. Например, изучая силу и
характер вариации в выделяемой
совокупности, можно оценить, насколько
однородной является данная совокупность
в количественном, а иногда и качественном
отношении, а следовательно, насколько
характерной является исчисленная
средняя величина. Степень близости
данных отдельных единиц хi к средней
измеряется рядом абсолютных, средних
и относительных показателей.
Абсолютные и средние показатели вариации и способы их расчета.
Для
характеристики совокупностей и
исчисленных величин важно знать, какая
вариация изучаемого признака скрывается
за средним.
Для
характеристики колеблемости признака
используется ряд показателей. Наиболее
простой из них – размах вариации.
Размах
вариации
– это разность между наибольшим ()
и наименьшим ()
значениями вариантов.
Пример
1.
Таблица
6.1
Группы |
Число |
90 |
28 |
100 |
48 |
110 |
20 |
120 |
4 |
ИТОГО |
100 |
Определяем
показатель размаха вариации:
R =
130 – 90 = 40 млн. руб.
Этот
показатель улавливает только крайние
отклонения и не отражает отклонений
всех вариант в ряду.
Чтобы
дать обобщающую характеристику
распределению отклонений, исчисляют
среднее линейное отклонение d, которое
учитывает различие всех единиц изучаемой
совокупности.
Среднее
линейное отклонение определяется как
средняя арифметическая из отклонений
индивидуальных значений от средней,
без учета знака этих отклонений:
.
Порядок
расчета среднего линейного отклонения
следующий:
1) по
значениям признака исчисляется средняя
арифметическая:
;
2)
определяются отклонения каждой варианты
от средней
;
3)
рассчитывается сумма абсолютных величин
отклонений:
;
4)
сумма абсолютных величин отклонений
делится на число значений:
.
Пример
2.
Таблица
6.2
Табельный |
|
|
// |
1 |
2 |
– 8 |
8 |
2 |
3 |
– 7 |
7 |
3 |
12 |
2 |
2 |
4 |
15 |
5 |
5 |
5 |
18 |
8 |
8 |
Итого |
50 |
0 |
30 |
d==
Если
данные наблюдения представлены в виде
дискретного ряда распределения с
частотами, среднее линейное отклонение
исчисляется по формуле средней
арифметической взвешенной:
Порядок
расчета среднего линейного отклонения
взвешенного следующий:
1)
вычисляется средняя арифметическая
взвешенная:
;
2)
определяются абсолютные отклонения
вариант от средней //;
3)
полученные отклонения умножаются на
частоты
;
4)
находится сумма взвешенных отклонений
без учета знака:
;
5)
сумма взвешенных отклонений делится
на сумму частот:
.
Соседние файлы в папке statistica
- #
- #
- #
- #
- #
- #
- #
- #
- #
По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города:
Размер вклада, руб. | До 400 | 400 – 600 | 600 – 800 | 800 – 1000 | Свыше 1000 |
---|---|---|---|---|---|
Число вкладчиков | 32 | 56 | 120 | 104 | 88 |
Определите:
1) размах вариации;
2) средний размер вклада;
3) среднее линейное отклонение;
4) дисперсию;
5) среднее квадратическое отклонение;
6) коэффициент вариации вкладов.
Решение:
Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.
Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200.
Размер вклада, руб. | 200 – 400 | 400 – 600 | 600 – 800 | 800 – 1000 | 1000 – 1200 |
---|---|---|---|---|---|
Число вкладчиков | 32 | 56 | 120 | 104 | 88 |
1) Определим размах вариации как разность между наибольшим и наименьшим значением признака:
Размах вариации размера вклада равен 1000 рублей.
2) Средний размер вклада определим по формуле средней арифметической взвешенной.
Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов.
Среднее значение первого интервала будет равно:
второго – 500 и т. д.
Занесём результаты вычислений в таблицу:
Размер вклада, руб. | Число вкладчиков, f | Середина интервала, х | xf |
---|---|---|---|
200-400 | 32 | 300 | 9600 |
400-600 | 56 | 500 | 28000 |
600-800 | 120 | 700 | 84000 |
800-1000 | 104 | 900 | 93600 |
1000-1200 | 88 | 1100 | 96800 |
Итого | 400 | – | 312000 |
Средний размер вклада в Сбербанке города будет равен 780 рублей:
3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:
Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий:
1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2).
2. Определяются абсолютные отклонения вариант от средней:
3. Полученные отклонения умножаются на частоты:
4. Находится сумма взвешенных отклонений без учёта знака:
5. Сумма взвешенных отклонений делится на сумму частот:
Удобно пользоваться таблицей расчётных данных:
Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля.
4) Дисперсия – это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической.
Расчёт дисперсии в интервальных рядах распределения производится по формуле:
Порядок расчёта дисперсии в этом случае следующий:
1. Определяют среднюю арифметическую взвешенную, как показано в п. 2).
2. Находят отклонения вариант от средней:
3. Возводят в квадрат отклонения каждой варианты от средней:
4. Умножают квадраты отклонений на веса (частоты):
5. Суммируют полученные произведения:
6. Полученная сумма делится на сумму весов (частот):
Расчёты оформим в таблицу:
5) Среднее квадратическое отклонение размера вклада определяется как корень квадратный из дисперсии:
6) Коэффициент вариации – это отношение среднего квадратического отклонения к средней арифметической:
По величине коэффициента вариации можно судить о степени вариации признаков совокупности. Чем больше его величина, тем больше разброс значений признаков вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна средняя.
Содержание курса лекций «Статистика»
Показатели вариации в анализе взаимосвязей
Для измерения степени колеблемости отдельных значений признака относительно средней исчисляют основные показатели вариации.
Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для полного анализа изучаемого процесса или явления. Иногда совершенно непохожие по своему внутреннему строению совокупности могут иметь равные средние величины. Поэтому для более детального изучения того или иного явления необходимо учитывать разброс или вариацию значений отдельных единиц совокупности. Измерение вариации признаков имеет как теоретическое, так и практическое значение.
Так, например, для выявления наиболее стабильно работающего коллектива или предприятия наравне с другими показателями рассчитывают и основные показатели вариации. Эти показатели дают возможность количественно определить размеры устойчивости производительности труда, уровня квалификации, цен на основные виды выпускаемой продукции и т.п. Измерение размеров вариации такого показателя, как «выполнение работ в срок» имеет важное значение для принятия решений заказчиками и инвесторами, т.к. ситуация, в которой присутствует изменчивость признака, часто содержит риск. Особое значение показатели вариации приобретают в анализе рынка ценных бумаг, где мера колеблемости отождествляется с мерой рискованности вложения денежных средств.
Основными показателями, характеризующими вариацию, являются:
- размах вариации;
- среднее линейное отклонение;
- дисперсия;
- среднее квадратическое отклонение;
- коэффициент вариации.
1) Размах вариации
(9.1 ) – размах вариации
2) Среднее линейное отклонение исчисляют для того, чтобы дать обобщающую характеристику распределению отклонений:
(9.2) – среднее линейное отклонение для несгруппированных данных
(9.3) – среднее линейное отклонение для вариационного ряда
где –абсолютные значения отклонений отдельных вариантов xi от средней арифметической ; fi – частота.
3. Дисперсия – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической:
(9.4) – дисперсия
4. Среднее квадратическое отклонение – корень квадратный из дисперсии:
(9.5) – среднее квадратическое отклонение для несгруппированных данных
(9.6)- среднее квадратическое отклонение для вариационного ряда
!!!В отличие от дисперсии среднее квадратическое отклонение является абсолютной мерой вариации признака в совокупности и выражается в единицах измерения варьирующего признака (руб., тыс., млн и т.д.).!!!
5. Коэффициент вариации – используется для сравнительной оценки вариации, а также для характеристики однородности совокупности:
(9.7) – коэффициент вариации
Пример. Для иллюстрации расчетов воспользуемся данными нижеприведенной табл. 9.1:
Таблица 9.1 ‑ Данные о продаже основных марок холодильников:
Модель | Цена
( $ ) |
Объем продаж (шт.) | xifi | |
1 | Siemens | 1000 | 30 | 30000 |
2 | Bosch | 800 | 26 | 20800 |
3 | AEG Santo | 900 | 24 | 21600 |
4 | Miele KF | 1200 | 30 | 36000 |
5 | Gorenje | 870 | 20 | 17400 |
6 | Haier | 570 | 23 | 13110 |
7 | Samsung | 760 | 30 | 22800 |
8 | Zanussi | 700 | 20 | 14000 |
9 | Daewoo | 460 | 20 | 9200 |
10 | Beko | 650 | 25 | 16250 |
11 | Candy | 480 | 20 | 9600 |
10 | Whirpool | 470 | 21 | 9870 |
ИТОГО | 8860 | 289 | 220630 |
Рассчитаем размах вариации.
R= 1200-460=740$
Пример вычисления размаха вариации
Размах вариации служит незаменимой мерой разброса экстремальных значений признака. Кроме характеристики границ разброса признака, размах вариации может быть использован для выявления ошибок. При наличии очень больших (или очень малых) ошибочно записанных значений признака размах вариации сразу резко возрастает, что требует проверки и корректировки исходных данных.
Недостатком данного показателя является то, что он оценивает только границы варьирующего признака и не отражает его колеблемость внутри этих границ. Вследствие этого размах вариации может неправильно характеризовать общую колеблемость признака.
Этого недостатка лишен другой показатель – дисперсия, рассчитываемый как средний квадрат отклонений значений признака от их средней величины.
Между индивидуальными отклонениями от средней и колеблемостью признака существует прямая зависимость: чем сильнее колеблемость признака, тем больше отклонения его значений от средней величины и менее устойчив изучаемый показатель.
Как и средняя величина этот показатель может быть рассчитан в двух формах: взвешенной и невзвешенной
По приведенным выше данным определим средневзвешенную цену холодильника:
Пример вычисления средней арифметической взвешенной
Далее рассчитаем дисперсию:
Пример вычисления дисперсии
!!!Следует отметить, что дисперсия еще не дает представления об однородности совокупности, и этому показателю трудно дать экономическую интерпретацию, т.к. он рассчитан в квадратных единицах. Поэтому следующим шагом в исследовании однородности совокупности является расчет среднего квадратического отклонения, показывающего, насколько в среднем отклоняются конкретные варианты признака от его среднего значения. Оно определяется как квадратный корень из дисперсии и имеет ту же размерность что и изучаемый признак.!!!
Рассчитаем среднее квадратическое отклонение
Пример вычисления среднего квадратического отклонения
Вывод: Таким образом, цена каждой марки холодильника отклоняется от средней цены в среднем на 271,1 $
Рассмотренные показатели позволяют получить абсолютное значение вариации признака. Однако для сравнения разных совокупностей с точки зрения устойчивости какого-либо одного признака или для определения однородности совокупности рассчитывают относительные показатели.
Эти показатели вычисляются как отношение размаха вариации, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего эти показатели выражаются в процентах.
Определим значение показателя вариации по вышеприведенным данным таблицы
Пример вычисления показателя вариации
Совокупность считается однородной, если V не превышает 33%.
Если V<10% вариация признака слабая;
10% < V<25% – вариация средняя;
V>25% – вариация сильная.
Вывод: Рассчитанная величина свидетельствует о неоднородности цен на холодильники, т.к. однородной совокупность считается, если коэффициент вариации меньше 33% (для распределений близких к нормальному).
!! Следует отметить, что коэффициент вариации может быть более 100%, что, в частности, может быть при наличии значений сильно отличающихся от средней величины. Такой результат означает, что в исследуемой совокупности сильна вариация признаков по отношению к средней величине.
Изучая вариацию интересующего нас признака в пределах исследуемой совокупности и опираясь на общую среднюю в расчетах, трудно оценить степень воздействия на него какого-либо отдельного признака.
При проведении такого анализа исходная совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным (оказывающим влияние на взаимосвязанный с ним признак) и результативным (подверженным влиянию).
Для выявления взаимосвязи исходная совокупность делится по факторному признаку на группы. Выводы о степени взаимосвязи базируются на анализе вариации результативного признака. Если статистическая совокупность разбита на группы по какому-либо признаку, то для оценки влияния различных факторов, определяющих вариацию индивидуальных значений признака, используют правило сложения дисперсий.
Общая дисперсия представляет собой сумму средней из виутригрупповой и межгрупповой и дисперсий:
(9.8) – общая дисперсия
где:
Общая дисперсия характеризует вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности.
(9.9)
где:
Межгрупповая дисперсия характеризует вариацию, обусловленную влиянием фактора, положенного в основу группировки.
(9.10) – межгрупповая дисперсия
где:
Средняя из внутригрупповых дисперсий отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка. Другими словами внутригрупповая дисперсия отражает случайную вариацию. Внутригрупповая дисперсия рассчитывается отдельно по каждой j-ой группе.
(9.11) – внутригрупповая дисперсия
где:
Для всех групп в целом вычисляется средняя из внутригрупповых дисперсий, взвешенных на частоты соответствующих групп по формуле:
(9.12) – средняя из внутригрупповых дисперсий
Взаимосвязь между тремя видами дисперсий получила название правила сложения дисперсий. Таким образом, зная два вида дисперсий всегда можно определить третий:
(9.13) – правило сложения дисперсий
Из этого равенства следует, что общая дисперсия, как правило, будет больше средней из групповых дисперсий. Это обусловлено тем, что при расчленении общей совокупности единиц на части по какому-либо признаку образуются более или менее однородные группы, в результате чего сокращается колеблемость признаков в пределах каждой группы. Это приводит к тому, что средняя из групповых дисперсий оказывается меньше дисперсии признака по всей совокупности единиц, причем разница между этими показателями будет тем больше, чем однороднее получаются группы в результате расчленения общей совокупности.
Теснота связи между факторным и результативным признаками оценивается на основе эмпирического корреляционного отношения:
(9.14)
Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.
Пример. На следующем условном примере исследуем зависимость объема выполненных работ от формы собственности проектно-изыскательских организаций.
Таблица 9.2. Выполнение работ проектно-изыскательскими организациями разной формы собственности
Форма собственности | Количество предприятий |
Объем выполненных работ (млн. руб.) |
Итого |
Государственная | 4 | 10,30,20,40 | 100 |
Негосударственная | 6 | 20, 40, 60, 20, 50, 50 | 240 |
Итого | 10 | 340 |
Решение:
1) Определим средний объем работ для предприятий двух форм собственности.
2) Определим средний объем работ для каждой формы собственности.
3) Рассчитаем общую и внутригрупповые (т.е. для каждой группы) дисперсии.
4) Определим среднюю из внутригрупповых и межгрупповую дисперсию. Для этого полученные ранее данные заносятся в таблицу расчета.
Таблица 9.3. – Вспомогательная таблица
Форма собственности |
Число предприятий |
Средняя
по группе |
Внутригрупповые дисперсии |
Государственная | 4 | 25 | 125 |
Негосударственная | 6 | 40 | 233 |
Итого | 10 |
Пример. Средняя из внутригрупповых дисперсий
Пример. Межгрупповая дисперсия
На последнем этапе решения задачи необходимо проверить тождество, отражающее закон сложения дисперсий:
Проверка закона сложения дисперсий: 54,0+189,8=243,8
Вывод: Таким образом, можно сделать вывод о том, что объем работ, выполненных проектно-изыскательскими организациями на 22% [(54,0/243,8) х 100%] зависит от фактора, положенного в основание группировки, т.е. от формы собственности, а на 78% [(189,8/243,8)х100%)] ‑ от прочих факторов.
Вывод о том, что объем выполненных работ в гораздо большей степени зависит от каких-либо других факторов, чем от формы собственности предприятий подтверждается и величиной эмпирического корреляционного отношения:
Вывод: Величина этого показателя свидетельствует о том, что зависимость объема работ от формы собственности предприятия невелика
Содержание курса лекций «Статистика»
Контрольные задания
- Распределение студентов одного из факультетов по возрасту характеризуется следующими данными:
Возраст студентов, лет | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | Всего |
Число студентов | 20 | 80 | 90 | 110 | 130 | 170 | 90 | 60 | 750 |
Вычислить: а) размах вариации; б)среднее линейное отклонение; в) дисперсию; г) среднее квадратическое отклонение; относительные показатели вариации возраста студентов.
2. По данным статистических ежегодников постройте таблицу с рядом показателей и определите показатели вариации: а) размах; б) среднее линейное отклонение; в) среднее квадратическое отклонение; г) коэффициент вариации. Оцените количественную однородность совокупности.
Содержание курса лекций «Статистика»
В статистике под вариацией понимают количественные
изменения величины исследуемого признака в пределах однородной совокупности,
обусловленные взаимодействием различных факторов. Причины, порождающие вариацию социально-экономических
явлений, очень сложны и многообразны. Они лежат в коренных особенностях
исследуемого явления, в его сущности, а также в методологии сбора исходной
информации. Социально-экономические явления, как правило, обладают большой
вариацией. Если исследуются результаты целенаправленной человеческой
деятельности, то вариация будет выражать вмешательство многочисленных факторов,
природу которых не всегда можно установить. Однако, в большинстве теоретических
исследований и практических применений статистики необходимы наряду со средней
показатели вариации, характеризующие группировку значений признака вокруг
средней, т. е. степень упорядоченности
статистической совокупности.
В соответствии с определением вариация измеряется
степенью колеблемости вариантов признака от уровня их
средней величины. Именно на этом и основано большинство показателей,
применяемых в статистике для измерения вариации значений признака в
совокупности. К показателям вариации относятся: размах вариации, среднее
линейное отклонение, дисперсия, среднее квадратическое
отклонение, коэффициент вариации.
Простейшим показателем вариации является размах вариации, определяемый как разность между максимальным и минимальным значениями
признака:
Размах вариации выражается в тех же единицах
измерений, что в варианты ряда. По величине его можно определить, например,
передовое и отстающее в достижении какой-либо цели. Величина вариации служит
также и для характеристики средней. Размах вариации имеет и самостоятельное
значение. Например, в промышленности для измерения точности изделий
устанавливают определенные пределы, соответствующие иногда величине размаха
вариации их признаков.
Однако показатель размаха вариации не может в полной
мере охарактеризовать колеблемость ряда, поскольку он
не учитывает промежуточных значений вариантов внутри этих пределов, а по этому
не отражает колеблемость ряда в целом, кроме того, он
полностью зависит от максимального и минимального значений, которые могут
оказаться не достаточно характерными.
Таким образом, размах вариации отражает иногда
случайную, а не типичную для данного ряда величину колеблемости.
По этому необходимы другие показатели вариации, основанные на всех значениях
признака в данной совокупности, а именно: среднее линейное отклонение,
дисперсия и среднее квадратическое отклонение.
Среднее линейное отклонение представляет среднюю
арифметическую из абсолютных значений отклонений отдельных вариантов от их
среднего значения.
Для данных, где частота каждого варианта равна
единице, среднее линейное отклонение определяется по формуле:
Для вариационных рядов
определяется с учетом частот по формуле:
Среднее линейное отклонение по сравнению с размахом
вариации дает более полную характеристику колеблемости
признака в совокупности.
Средний квадрат отклонений вариантов от их средней
величины называют дисперсией
.
Дисперсия рассчитывается по формуле:
Для негруппированных
данных, где частота каждого варианта равна единице, дисперсия рассчитывается по
формуле простой средней:
Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:
либо при равенстве весов:
Среднее квадратическое
отклонение является также обобщающим показателем колеблемости
признака и характеризует средний показатель отклонения вариантов ряда от их
общей средней. Выражается s в тех же именованных числах, в которых выражены
варианты совокупности и средняя величина.
Дисперсия и среднее квадратическое отклонение – наиболее широко применяемые
показатели вариации. Объясняется это тем, что они входят в большинство теорем
теории вероятностей, служащих фундаментом математической статистики. Кроме
того, дисперсия может быть разложена на составные элементы, позволяющие оценить
влияние различных факторов, обусловливающих вариацию признака. Порядок расчета
среднего квадратического отклонения следующий:
1) Определяется средняя
величина:
2) Рассчитывается
отклонения вариантов от средней:
3) Отклонение каждого
варианта от средней возводится в квадрат:
4) Квадрат отклонений
взвешивается по частотам:
5) Взвешенные по
частотам квадраты отклонений суммируются:
6) Полученная сумма
делится на сумму частот, и из нее извлекается квадратный корень.
Среднее квадратическое
отклонение можно вычислить, составив следующую расчетную таблицу:
№ п/п |
Линейные отклонения от средней
|
Квадрат линейных отклонений
|
Взвешенные квадраты
|
|
… | … | … | … | … |
Итого |
Среднее квадратическое
отклонение можно вычислить на основании математических преобразований значений
варьирующего признака, применяя способ условных моментов:
где первый условный
момент:
второй условный момент:
Среднее квадратическое
отклонение по способу условных моментов определяется по формуле:
Система условных
моментов различных порядков, в частности, третьего
и
четвертого
используется при расчете различных
статистических характеристик (например, коэффициентов асимметрии и эксцесса).
Чем больше σ, тем разнообразнее состав
совокупности по величине изучаемого признака, и, наоборот, чем меньше σ, тем
состав совокупности по величине изучаемого признака более одинаков. Однако
оценка величины σ
как качественной характеристики ряда в конечном итоге определяется сущностью
изучаемых явлений. Среднее квадратическое отклонение
используется для сопоставления вариации по однородным совокупностям, а также
для одной совокупности за разные годы. Среднее квадратическое
отклонение является критерием надежности средней. Чем меньше оно, тем лучше
средняя арифметическая отражает всю представляемую совокупность.
Коэффициент осцилляции – процентное отношение размаха
вариации к средней
Линейный
коэффициент вариации (относительное линейное отклонение) измеряют через
соотношение среднего линейного отклонения и средней:
Коэффициент вариации представляет собой отношение
среднего квадратического отклонения к средней
арифметической:
Характеризуя степень колеблемости
признака, коэффициент вариации позволяет давать сравнительную характеристику
этой колеблемости одного и того же признака в
различных совокупностях.
Коэффициент вариации используется также, если
сравнивается степень вариации одного и того же признака в двух совокупностях,
имеющих разные по величине средние. Как относительные величины коэффициенты
вариации могут сопоставляться не только для одинаковых одноименных показателей,
но и для различных показателей, выраженных в разных единицах измерения. Таким
образом, коэффициент вариации в отличие от среднего квадратического
отклонения позволяет сопоставить глубину вариации неоднородных совокупностей.
Для изучения показателей общественного здоровья, для выявления общих закономерностей различных явлений, врачу необходимо знать и владеть методикой вычисления средних величин, так как эти свойства не могут быть обнаружены при анализе единичных явлений.
ЗАДАЧИ ДЛЯ РЕШЕНИЯ
Таблицы
Логическая структура темы “Средние величины”
Логическая структура темы “Вариационный ряд”
Коэффициенты К для вычисления среднего квадратичного отклонения
Структура вариационного ряда по сигмальным отклонениям
Оценка достоверности результатов исследования
Понятие о средних величинах, свойства и их применение в практике врача.
ВАРИАЦИОННЫЙ РЯД
1. Определение вариационного ряда
Вариационный ряд – это ряд чисел (вариант), характеризующих изучаемый признак, расположенных в ранговом порядке (в убывающей или возрастающей последовательности) с соответствующими этим вариантам (V) частотами (Р).
V– варианта, каждое числовое значение изучаемого количественного признака.
Р– численность отдельной варианты в изучаемой совокупности, величина, указывающая сколько раз встречается данная варианта в вариационном ряду.
N– общее число наблюдений, из которых состоит вариационный ряд.
Вариационный ряд применяется для определения среднего уровня признака (средних величин) и уровней разнообразия признака (критериев разнообразия).
2. Построение вариационного ряда:
а) Провести ранжирование вариант ряда, т.е. расположить их в убывающей или возрастающей последовательности.
б) Составить вариационный ряд (ряд) вариант с соответствующими им частотами.
в) Подсчитать число наблюдений (∑ p= n)
3. Виды вариационных рядов
1) Простой – каждой варианте (V) соответствует частота р = 1.
2) Взвешенный – варианты в ряду встречаются с разной частотой (p > 1).
4. Преобразование вариационных рядов (группировка).
Группировка – это способ укорочения вариационного ряда в целях уменьшения последующих счетных операций.
5. Этапы построения сгруппированного вариационного ряда.
(по учебнику)
6. Применение средних величин:
- Для оценки состояния здоровья: показатели физического развития, например: средний вес, средний рост и т.д.; показатели соматического состояния, например: уровень давления, средний уровень холестерина и т.д.
- Для оценки организации медицинской помощи: показатели деятельности каждого врача в отдельности и лечебно-профилактического учреждения в целом. Например: среднее число посещений в день к врачу, средняя длительность лечения по отдельным заболеваниям.
- В санитарно-противоэпидемической работе.
7. Свойства средней арифметической в вариационном ряду:
- Имеет абстрактный характер;
- Занимает серединное положение в вариационном ряду;
- Сумма отклонений всех вариант от средней равна нулю (на этом свойстве основан расчет М по способу «моментов»);
- Единство суммарного действия (∑ v p = M n).
8. Способы расчета средней арифметической (М).
Среднеарифметический способ расчета применяется для вычисления среднеарифметической простой и среднеарифметической взвешенной.
9. Критерии разнообразия признака и методика их расчета.
1) Среднее квадратическое отклонение – сигма(σ):
а) вычисление по способу моментов;
б) по амплитуде ряда
Аmp = Vmax – Vmin
Коэффициент К находим по таблице в зависимости от числа наблюдений n, на пересечении десятков и единиц.
Например, если n = 32, то К = 4,14.
2) Коэффициент вариации (С)
Практическое применение среднего квадратического отклонения.
- При оценке физического развития индивида и коллективов, при диагностике – для дифференциации устойчивых и неустойчивых признаков.
- Для определения стандартов одежды, обуви, школьной мебели и др.
- на основе построения вариационного ряда и определении его структуры – оценки разнообразия какого-либо признака.
- Для определения параметров «нормы» и патологии (по сигмальной оценке М ±σ).
УЧЕБНОЕ ЗАДАНИЕ К ЗАДАЧАМ:
1. Вычислить среднюю арифметическую величину (М) и критерии разнообразия вариационного ряда (σ, Cv).
2. Оценить полученные результаты и сделать соответствующие выводы.
3. Сравнить полученные данные с результатами других исследований.
ЗАДАЧА-ЭТАЛОН
Условие задачи:
В районе А. проведено измерение роста 67 девушек 17-летнего возраста (данные представлены ниже). Средний рост девушек 17-летнего возраста района В.
М2 = 165,4 см, σ = ±10,2 см.
Расчет по способу средней взвешенной
n = 67
Оценивая полученные результаты (Мv), делаем соответствующие выводы.
Средний рост девушек 17-летнего возраста в районе города А cоставляет 165,36 см, σ = ± 5,07 см.
Сравниваем полученные данные с результатами измерения среднего роста 17-летних девушек в районе В.
М = 165,36 см, σ = ± 5,07 см
М2 = 165,4 см, σ = ± 10,2 см , что свидетельствует о большей вариабельности изучаемого признака в районе В.
Оценка достоверности средних величин проводится по ошибке (m)
Оценка достоверности различий средних величин по величине коэффициента t:
Если t = 1,96 и более, то различия достоверны.
ОПРЕДЕЛЕНИЕ НЕОБХОДИМОЙ ЧИСЛЕННОСТИ ВЫБОРКИ
Одной из наиболее важных и ответственных задач при организации и проведении выборочного наблюдения – установление необходимой численности выборочной совокупности. То есть такой ее численности, которая обеспечивала бы получение данных, достаточно правильно отражающих изучаемые свойства генеральной совокупности.
При этом должно быть учтено:
1) с какой степенью точности следует получить предельную ошибку выборки в результате выборочного наблюдения;
2) какова должна быть вероятность того, что будет обеспечена обусловленная точность результатов выборочного наблюдения;
3) какова степень колеблемости изучаемых свойств в исследуемой генеральной совокупности.
Это значит, что необходимая численность выборки (n) устанавливается в зависимости от размеров предельной ошибки выборки (∆), от величины коэффициента доверия (t) и от размеров величины дисперсии (σ2).
Сами формулы необходимой численности выборки выводятся из формул предельной ошибки выборки следующим образом.
При повторном отборе:
а) для средней
в формуле предельной ошибки выборки
обе ее стороны возводим в квадрат и получаем
откуда
и затем
Таким образом, в этом случае необходимая численность выборочной совокупности равная произведению квадрата коэффициента доверия и дисперсии признака, деленному на квадрат предельной ошибки выборки;
б) для доли
в формуле предельной ошибки выборки
обе ее стороны возводим в квадрат и получаем
откуда
и затем
Таким образом, в этом случае необходимая численность выборочной совокупности равна произведению квадрата коэффициента доверия и дисперсии доли, деленному на квадрат предельной ошибки выборки.
При бесповторном отборе:
а) для средней
из формулы предельной ошибки выборки
после ряда преобразований получаем
Такова формула необходимой численности выборочной совокупности для определения средней путем бесповторного отбора.
б) для доли
Из формулы предельной ошибки выборки
после ряда преобразований получаем
Такова формула необходимой численности выборочной совокупности для определения доли путем бесповторного отбора.
Приведем краткий пример определения необходимой численности выборочной совокупности исходя из условий повторного отбора.
Допустим, что с вероятностью 0,954 требуется определить какое количество историй болезни необходимо отобрать для экспертной оценки качества лечения больных сахарным диабетом при условии, что предельная ошибка выборки не должна превышать 2.
Таким образом:
в этих условиях:
Следовательно, на выборку в порядке случайного отбора должно быть отобрано 50 историй болезни.
Если всего пролечено 500 пациентов, то доля выборки составляет
Заметим, что, так как в данном примере доля выборки очень небольшая, то расчет, полученный по формуле повторной выборки, может быть применен и для выборки бесповторной.
Таким образом, для выборочной проверки должна быть отобрана каждая десятая история болезни.
ЗАДАЧИ ДЛЯ РЕШЕНИЯ