Содержание курса лекций «Статистика»
Статистическая сводка и группировка. В результате проведения статистического наблюдения получают данные о признаках каждой обследованной единицы статистической совокупности. Однако эти массивы данных, содержащие подробные сведения о каждой единице совокупности, собирают не для того, чтобы получить характеристики каждой из них, а с целью изучить совокупность в целом, выявить ее характерные группы и закономерности. Для этого необходимо обобщить и систематизировать сведения, полученные в ходе статистического наблюдения.
Обобщение и систематизация первичных статистических данных – это самостоятельный этап статистического исследования, основная задача которого получить полную и всестороннюю характеристику как совокупности в целом, так и отдельных ее частей и представить полученную информацию об изучаемой совокупности в наиболее удобной для пользователей форме. В статистической практике данный этап статистического исследования называют этапом сводки и группировки статистических данных.
Статистическая сводка
Сводка – это научная обработка первичных данных с целью получения обобщенных характеристик изучаемого социально-экономического явления по ряду существенных для него признаков с целью выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.
По глубине и точности обработки материала различают простую сводку и сложную сводку.
Простая сводка – это операция по подсчету общих итогов по совокупности единиц наблюдения и оформление этого материала в статистических таблицах.
Сложная сводка – это комплекс последовательных операций, включающих группировку полученных при наблюдении материалов, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов по каждой группе и подгруппе, и по всему объекту и представление результатов в виде статистических таблиц.
Этапы проведение сводки
- Выбор группировочного признака.
- Определение порядка формирования групп.
- Разработка системы статистических показателей для характеристики групп и объекта в целом
- Разработка макетов статистических таблиц для представления результатов сводки.
Статистическая группировка
Группировка – разбиение общей совокупности единиц объекта наблюдения по одному или нескольким существенным признакам на однородные группы, различающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализировать связи между отдельными признаками.
Задачи, решаемые с помощью метода группировок:
- выделение социально-экономических типов явлений;
- изучение структуры явления и структурных сдвигов, происходящих в нем;
- выявление взаимосвязи и взаимозависимости между явлениями.
Виды группировок. В соответствии с познавательными задачами, решаемыми в ходе построения статистических группировок, различают следующие их виды: типологические, структурные, аналитические.
Типологическая группировка – это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида основное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого социально-экономического явления.
Структурная группировка – предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.
Аналитическая группировка – выявляет взаимосвязи между изучаемыми явлениями и признаками, их характеризующими.
!!!В статистике при изучении связей социально-экономических явлений признаки подразделяют на факторные и результативные.
Факторные признаки, под их воздействием изменяются результативные признаки. Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака систематически возрастает или убывает значение признака результативного и наоборот.!!!
Особенности построения аналитической группировки:
- единицы статистической совокупности группируются по факторному признаку;
- каждая выделенная группа характеризуется средними величинами результативного признака.
По способу построения группировки бывают простые и комбинационные.
Простая группировка – группы образованы только по одному признаку.
Комбинационная группировка – разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).
Сначала группы формируются по одному признаку, затем группы делятся на подгруппы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупности одновременно по нескольким взаимосвязанным признакам.
При построении комбинационной группировки возникает вопрос о последовательности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала производить группировку по атрибутивным признакам, значения которых имеют ярко выраженные качественные различия.
Этапы построения статистических группировок
- Определение группировочного признака.
- Определение размаха вариации.
- Определение числа групп.
- Расчет ширины интервала группировки.
- Определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу.
При небольшом объеме совокупности (n<50) не следует образовывать большого количества групп, так как группы будут включать недостаточное число единиц объекта. Показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.
Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В этом случае количество групп зависит, в первую очередь, от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше можно образовать групп.
При определении числа групп необходимо принять во внимание размах вариации признака (R), который позволяет оценить вариацию признака между крайними значениями признака – максимальным (Хmax) и минимальным (Xmin) и определяется по формуле 5.1): (5.1)
Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано большее число групп. При этом может возникнуть проблема получения пустых групп, т.е. групп, не содержащих ни одной единицы наблюдения.
Определение числа групп можно осуществить несколькими способами. Формально-математический способ предполагает использование формулы Стерджесса (формула 5.2): (5.2)
где n – число групп; N – число единиц совокупности.
Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.
Применение данной формулы дает хорошие результаты в том случае, если совокупность состоит из большого числа единиц наблюдения (n>50).
Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (σ). Если величина интервала равна 0,5σ, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3σ и σ, то совокупность делится, собственно, на 9 и 6 групп. Однако при определении групп данными методами существует большая вероятность получения «пустых» или малочисленных групп, характеристики изучаемого явления на основе которых будут недостаточно типичными для выделенной группы и изучаемой совокупности в целом.
Когда определено число групп, то следует определить интервалы группировки.
Интервал – это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.
Интервалы группировки бывают: равные и неравные; открытые и закрытые.
Ширина равного интервала определяется по (формуле 5.3):
(5.3)
Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.
Полученную по формуле (5.3) величину округляют и она будет являться шириной интервала.
Существуют следующие правила определения ширины интервала.
Если величина интервала, рассчитанная по формуле (5.3) представляет собой величину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.
Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например, 14,876), то это значение необходимо округлит до целого числа (15).
В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.
Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами.
Неравные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если после построения равных интервалов по изучаемому признаку образуются группы, содержащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необходимость в увеличении интервалов группировки.
Также неравные интервалы могут быть прогрессивно-возрастающие или прогрессивно-убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической и геометрической прогрессии, определяется следующим образом:hi+1=hi+а,
а в геометрической прогрессии: hi +1= hi ×q, где:
а – константа: для прогрессивно-возрастающих интервалов имеет знак «+», а при прогрессивно-убывающих – знак «-».
q — константа: для прогрессивно-возрастающих – больше «1»; для прогрессивно-убывающих ‑ меньше «1».
Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.
Например, при построении группировки строительных компаний города по показателю численности работающих, который варьирует от 500 человек до 3500 человек, нецелесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и крупнейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500–1000, 1000–2000, 2000–3500, т.е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии. Выбор исследователя в построении равных или неравных интервалов зависит от степени заполнения каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае – объединять.
Интервалы статистической группировки
Интервалы группировок могут быть закрытыми и открытыми.
Закрытые интервалы – это интервалы, у которых есть и верхняя и нижняя границы.
Открытые интервалы – это интервалы, у которых указана только одна граница: как правило, верхняя – у первого интервала и нижняя – у последнего.
Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50–100, 100–150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех остальных значений изучаемого признака.
Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственными силами (тыс. руб.): 1200–1400, 1400–1600, 1600–1800, 1800–2000), то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. ‑ соответственно второго и третьего и т.д., т.е. верхняя граница i-го интервала равна нижней границе (i+1)-го интервала.
При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы наблюдения, значения признака у которых совпадают с границами интервалов.
Например, во вторую или третью группу должна войти строительная фирма с объемом строительно-монтажных работ 1600 тыс. рублей? Если верхняя граница формируется по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в противном случае – ко второй. Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строительных фирм по объему строительно-монтажных работ преобразуются в следующие: до 1400, 1400–1600, 1600–1800, 1800 и более). В данном случае, вопрос отнесения отдельных единиц совокупности, значения которых являются граничными, к той или иной группе решается на основе анализа последнего открытого интервала. Возможны два случая обозначения последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае, строительные фирмы с объемом строительно-монтажных работ 1600 тыс. руб. попадут в третью группу; во втором случае – во вторую группу.
Если в основании группировки лежит дискретный признак, то нижняя граница 1-го интервала равна верхней границе i-1-го интервала, увеличенной на 1.
Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100–150, 151–200, 201–300.
Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами.
Специализированные интервалы – применяются дли выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.
При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими. Такие интервалы называются произвольными и, как правило, используются при группировке предприятий, например, по уровню рентабельности.
Пример. Далее на примере данных приведенных в табл. 5.1. произведем аналитическую группировку совокупности, включающей 30 банков.
Таблица 5.1 ‑ Совокупность 30 банков Российской Федерации
(на 01.01.19 г., цифры условные)
Номер банка | Капитал, млн. руб. | Активы, млн. руб. |
Работающие активы, млн. руб |
1 | 2 | 3 | 4 |
1 | 207,7 | 2,48 | 1,14 |
2 | 200,3 | 2,40 | 1,10 |
3 | 190,2 | 2,28 | 1,05 |
4 | 323,2 | 3,88 | 1,88 |
5 | 247,1 | 2,96 | 1,36 |
6 | 177,7 | 2,12 | 0,97 |
7 | 242,5 | 2,90 | 1,33 |
8 | 182,9 | 2,18 | 0,99 |
9 | 315,6 | 3,78 | 1,73 |
10 | 183,2 | 2,20 | 1,01 |
11 | 320,2 | 3,84 | 1,76 |
12 | 207,3 | 2,48 | 1,14 |
13 | 181,0 | 2,17 | 0,99 |
14 | 172,4 | 2,06 | 0,94 |
15 | 234,3 | 2,81 | 1,29 |
16 | 189,5 | 2,27 | 1,04 |
17 | 187,8 | 2,24 | 1,03 |
18 | 166,9 | 1,99 | 0,91 |
19 | 157,7 | 1,88 | 0,86 |
20 | 168,3 | 2,02 | 0,93 |
21 | 224,4 | 2,69 | 1,23 |
22 | 166,5 | 1,99 | 0,91 |
23 | 198,5 | 2,38 | 1,09 |
24 | 240,4 | 2,88 | 1,32 |
25 | 229,3 | 2,75 | 1,26 |
26 | 175,2 | 2,10 | 0,96 |
27 | 156,0 | 1,87 | 0,86 |
28 | 160,1 | 1,92 | 0,88 |
29 | 178,7 | 2,14 | 0,98 |
30 | 171,6 | 2,05 | 0,94 |
По данным табл.5.1 группировочным (факторным) признаком является капитал, результативным – прибыль. Группировку производим по факторному признаку. Зададим количество групп (условно) – 4, а величину интервала определим по формуле (5.3).
Обозначим границы групп:
1-я группа – 156,0-197,8;
2-я группа – 197,8-239,6;
3-я группа – 239,6-281,4;
4-я группа – 281,4-323,2.
После того, как определен группировочный признак – капитал, задано число групп – 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их величины по каждой группе.
Далее показатели, характеризующие банки, разносятся по четырем указанным группам и подсчитываются групповые итоги. Результаты группировки заносятся в таблицу и определяются общие итоги по совокупности единиц наблюдения по каждому показателю.
Таблица 5.2 ‑ Группировка коммерческих банков по величине капитала
Группы банков
по величине капитала, млн. руб |
Число
банков |
Капитал,
млн. руб |
Активы,
млн. руб |
Работающие
активы, млн. руб |
156,0-197,8
197,8-239,6 239,6-281,4 281,4-323,2 |
17
7 3 3 |
2966,5
1501,8 730,0 958,8 |
35,48
17,99 8,74 11,5 |
16,25
8,25 4,01 5,37 |
Итого | 30 | 6157,1 | 73,71 | 33,88 |
Структурная группировка коммерческих банков на основе данных таблицы 5.2 будет иметь вид:
Таблица 5.3 ‑ Группировка коммерческих банков по величине капитала (в % к итогу)
Группы банков по величине капитала, млн. руб. | Число банков в % к итогу | Капитал | Активы | Работающие активы |
156,0-197,8 | 56,7 | 48,2 | 48,1 | 48,0 |
197,8-239,6 | 23,3 | 24,4 | 24,4 | 24,3 |
239,6-281,4 | 10,0 | 11,9 | 11,9 | 11,8 |
281,4-323,2 | 10,0 | 15,5 | 15,6 | 15,9 |
Итого | 100,0 | 100,0 | 100,0 | 100,0 |
Из таблицы 5.3 видно, что в основном преобладают малые банки ‑ 56,7%, на долю которых приходится 48,2% всего капитала. Более конкретный анализ взаимосвязи показателей можно сделать на основе аналитической группировки.
Таблица 5.4 ‑ Группировка коммерческих банков по величине капитала
Группы банков по величине капитала, млн. руб. |
Число банков | Капитал, млн. руб. | Активы, млн. руб. | Работающие активы, млн. руб. | |||
всего | в среднем на один банк | всего | в среднем на один банк | всего | в среднем на один банк | ||
156,0-197,8 | 17 | 2966,5 | 174,5 | 35,48 | 2,09 | 16,25 | 0,96 |
197,8-239,6 | 7 | 1501,8 | 214,5 | 17,99 | 2,57 | 8,25 | 1,18 |
239,6-281,4 | 3 | 730,0 | 243,3 | 8,74 | 2,91 | 4,01 | 1,34 |
281,4-323,2 | 3 | 958,8 | 319,6 | 11,5 | 3,83 | 5,37 | 1,79 |
Итого | 30 | 6157,1 | 205,2 | 73,71 | 2,46 | 33,88 | 1,13 |
Величина капитала, все активы банка и работающие активы прямо зависят между собой, и чем крупнее банк, тем эффективнее управление работающими активами.
Мы рассмотрели примеры группировок по одному признаку. Однако в ряде случаев для решения поставленных задач такая группировка является недостаточной. В этих случаях переходят к группировке исследуемой совокупности по двум и более существенным признакам во взаимосвязи (комбинационной группировке).
От группировок следует отличать классификацию. Классификацией называется систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия.
Ряды распределения представляют собой простейшую группировку, в которой каждая выделенная группа характеризуется только частотой.
В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.
Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, характеризующим состояние изучаемого явления и не имеющим числового выражения.
Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.
Вариационными рядами называют ряды распределения, построенные по количественному признаку, т.е. признаку, имеющему числовое выражение у отдельных единиц совокупности. Вариационный ряд состоит из двух элементов: вариантов и частот.
Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.
Частотами называются численности отдельных вариант, или каждой группы вариационного ряда. Частоты показывают, как часто встречаются те или иные значения признака в изучаемой совокупности. Сумма всех частот определяет численность всей совокупности, ее объем.
Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.
В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды.
Дискретный вариационный ряд ‑ это ряд распределения в котором группы составлены по признаку, изменяющемуся прерывно, т.е. через определенное число единиц и характеризуют распределение единиц совокупности по дискретному признаку, принимающему только целые значения.
Например, группы студентов по баллу в сессию по предмету: 5,4,3,2.
Интервальный вариационный ряд распределения – это ряд распределения, в котором группировочный признак, составляющий основание группировки, может принимать в интервале любые значения, отличающиеся друг от друга на сколь угодную малую величину
Построение интервальных вариационных рядов целесообразно прежде всего при непрерывной вариации признака, а также если дискретная вариация признака проявляется в широких пределах, то есть число вариантов дискретного признака достаточно велико.
Правила построения рядов распределения аналогичны правилам построения группировки.
Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, огиву и кумуляту распределения.
Полигон используется при изображении дискретных вариационных рядов. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала для выражения величины частот. Полученные на пересечении оси абсцисс (х) и оси ординат (у) точки соединяются прямыми линиями, в результате чего получают ломаную линию, называемую полигоном частот. Иногда для замыкания полигона предлагается крайние точки (слева и справа на ломаной линии) соединить с точками на оси абсцисс, в результате чего получается многоугольник.
Гистограмма применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенным на соответствующих интервалах. Высота столбиков должна быть пропорциональна частотам. В результате получается график, на котором ряд распределения изображен в виде смежных друг с другом столбиков.
Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединить прямыми линиями.
При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах. Это необходимо сделать для устранения влияния величины интервала на распределение интервала и получения возможности сравнивать частоты.
Плотность распределения – это частота, рассчитанная на единицу ширины интервалу то есть, сколько единиц в каждой группе приходится на единицу величины интервала.
Для графического изображения вариационных рядов может использоваться кумулятивная кривая. При помощи кумуляты изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам. Накопленные частоты показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение.
При построении кумуляты интервального вариационного ряда по оси абсцисс (х) откладываются варианты ряда, а по оси ординат (у) накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломаную линию, то есть кумуляту.
Если при графическом изображении вариационного ряда в виде кумуляты оси х и у поменять местами, то получим огиву.
Контрольные задания
- В чем суть и каково значение сводки как второго этапа статистического исследования?
- Какова роль группировок в статистике?
- Что такое ряды распределения?
- Дайте характеристику вариационному ряду.
- Пользуясь формулой Стерджесса, определите интервал группировки сотрудников фирмы по уровню доходов, если общая численность сотрудников составляет 50 человек, а минимальный и максимальный доход соответственно равен 50000 и 300000 рублей.
- По данным статистических сборников, постройте группировку численности безработных двух регионов по полу и возрасту (% к итогу) с целью приведения их к сопоставимому виду. Сделайте сравнительный анализ результатов.
- Имеются следующие данные об успеваемости в летнюю сессию 2019 г.: 5, 4, 4, 4. 3. 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5, 5, 2, 3, 3. Постройте по этим данным: а) ряд распределения студентов по баллам оценок, полученных в сессию; б) ряд распределения студентов по уровню успеваемости, выделив в нем 2 группы студентов: не успевающие (2 балла), успевающие (3 балла и выше); в) каким видом ряда распределения (вариационным или атрибутивным) является каждый из этих двух рядов?
- Какие из указанных ниже группировок являются типологическими: а) группировка населения по полу; б) группировка населения по отраслям, занятого в народном хозяйстве; в) группировка вложений на строительство объектов производственного и непроизводственного назначения; г) группировка предприятий общественного питания по формам собственности.
Содержание курса лекций «Статистика»
Интервальный вариационный ряд и его характеристики
- Построение интервального вариационного ряда по данным эксперимента
- Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения
- Выборочная средняя, мода и медиана. Симметрия ряда
- Выборочная дисперсия и СКО
- Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации
- Алгоритм исследования интервального вариационного ряда
- Примеры
п.1. Построение интервального вариационного ряда по данным эксперимента
Интервальный вариационный ряд – это ряд распределения, в котором однородные группы составлены по признаку, меняющемуся непрерывно или принимающему слишком много значений.
Общий вид интервального вариационного ряда
Интервалы, (left.left[a_{i-1},a_iright.right)) | (left.left[a_{0},a_1right.right)) | (left.left[a_{1},a_2right.right)) | … | (left.left[a_{k-1},a_kright.right)) |
Частоты, (f_i) | (f_1) | (f_2) | … | (f_k) |
Здесь k – число интервалов, на которые разбивается ряд.
Размах вариации – это длина интервала, в пределах которой изменяется исследуемый признак: $$ F=x_{max}-x_{min} $$
Правило Стерджеса
Эмпирическое правило определения оптимального количества интервалов k, на которые следует разбить ряд из N чисел: $$ k=1+lfloorlog_2 Nrfloor $$ или, через десятичный логарифм: $$ k=1+lfloor 3,322cdotlg Nrfloor $$
Скобка (lfloor rfloor) означает целую часть (округление вниз до целого числа).
Шаг интервального ряда – это отношение размаха вариации к количеству интервалов, округленное вверх до определенной точности: $$ h=leftlceilfrac Rkrightrceil $$
Скобка (lceil rceil) означает округление вверх, в данном случае не обязательно до целого числа.
Алгоритм построения интервального ряда
На входе: все значения признака (left{x_jright}, j=overline{1,N})
Шаг 1. Найти размах вариации (R=x_{max}-x_{min})
Шаг 2. Найти оптимальное количество интервалов (k=1+lfloorlog_2 Nrfloor)
Шаг 3. Найти шаг интервального ряда (h=leftlceilfrac{R}{k}rightrceil)
Шаг 4. Найти узлы ряда: $$ a_0=x_{min}, a_i=1_0+ih, i=overline{1,k} $$ Шаг 5. Найти частоты (f_i) – число попаданий значений признака в каждый из интервалов (left.left[a_{i-1},a_iright.right)).
На выходе: интервальный ряд с интервалами (left.left[a_{i-1},a_iright.right)) и частотами (f_i, i=overline{1,k})
Заметим, что поскольку шаг h находится с округлением вверх, последний узел (a_kgeq x_{max}).
Например:
Проведено 100 измерений роста учеников старших классов.
Минимальный рост составляет 142 см, максимальный – 197 см.
Найдем узлы для построения соответствующего интервального ряда.
По условию: (N=100, x_{min}=142 см, x_{max}=197 см).
Размах вариации: (R=197-142=55) (см)
Оптимальное число интервалов: (k=1+lfloor 3,322cdotlg 100rfloor=1+lfloor 6,644rfloor=1+6=7)
Шаг интервального ряда: (h=lceilfrac{55}{5}rceil=lceil 7,85rceil=8) (см)
Получаем узлы ряда: $$ a_0=x_{min}=142, a_i=142+icdot 8, i=overline{1,7} $$
(left.left[a_{i-1},a_iright.right)) cм | (left.left[142;150right.right)) | (left.left[150;158right.right)) | (left.left[158;166right.right)) | (left.left[166;174right.right)) | (left.left[174;182right.right)) | (left.left[182;190right.right)) | (left[190;198right]) |
п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения
Относительная частота интервала (left.left[a_{i-1},a_iright.right)) – это отношение частоты (f_i) к общему количеству исходов: $$ w_i=frac{f_i}{N}, i=overline{1,k} $$
Гистограмма относительных частот интервального ряда – это фигура, состоящая из прямоугольников, ширина которых равна шагу ряда, а высота – относительным частотам каждого из интервалов.
Площадь гистограммы равна 1 (с точностью до округлений), и она является эмпирическим законом распределения исследуемого признака.
Полигон относительных частот интервального ряда – это ломаная, соединяющая точки ((x_i,w_i)), где (x_i) – середины интервалов: (x_i=frac{a_{i-1}+a_i}{2}, i=overline{1,k}).
Накопленные относительные частоты – это суммы: $$ S_1=w_1, S_i=S_{i-1}+w_i, i=overline{2,k} $$ Ступенчатая кривая (F(x)), состоящая из прямоугольников, ширина которых равна шагу ряда, а высота – накопленным относительным частотам, является эмпирической функцией распределения исследуемого признака.
Кумулята – это ломаная, которая соединяет точки ((x_i,S_i)), где (x_i) – середины интервалов.
Например:
Продолжим анализ распределения учеников по росту.
Выше мы уже нашли узлы интервалов. Пусть, после распределения всех 100 измерений по этим интервалам, мы получили следующий интервальный ряд:
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
(left.left[a_{i-1},a_iright.right)) cм | (left.left[142;150right.right)) | (left.left[150;158right.right)) | (left.left[158;166right.right)) | (left.left[166;174right.right)) | (left.left[174;182right.right)) | (left.left[182;190right.right)) | (left[190;198right]) |
(f_i) | 4 | 7 | 11 | 34 | 33 | 8 | 3 |
Найдем середины интервалов, относительные частоты и накопленные относительные частоты:
(x_i) | 146 | 154 | 162 | 170 | 178 | 186 | 194 |
(w_i) | 0,04 | 0,07 | 0,11 | 0,34 | 0,33 | 0,08 | 0,03 |
(S_i) | 0,04 | 0,11 | 0,22 | 0,56 | 0,89 | 0,97 | 1 |
Построим гистограмму и полигон:
Построим кумуляту и эмпирическую функцию распределения:
Эмпирическая функция распределения (относительно середин интервалов): $$ F(x)= begin{cases} 0, xleq 146\ 0,04, 146lt xleq 154\ 0,11, 154lt xleq 162\ 0,22, 162lt xleq 170\ 0,56, 170lt xleq 178\ 0,89, 178lt xleq 186\ 0,97, 186lt xleq 194\ 1, xgt 194 end{cases} $$
п.3. Выборочная средняя, мода и медиана. Симметрия ряда
Выборочная средняя интервального вариационного ряда определяется как средняя взвешенная по частотам: $$ X_{cp}=frac{x_1f_1+x_2f_2+…+x_kf_k}{N}=frac1Nsum_{i=1}^k x_if_i $$ где (x_i) – середины интервалов: (x_i=frac{a_{i-1}+a_i}{2}, i=overline{1,k}).
Или, через относительные частоты: $$ X_{cp}=sum_{i=1}^k x_iw_i $$
Модальным интервалом называют интервал с максимальной частотой: $$ f_m=max f_i $$ Мода интервального вариационного ряда определяется по формуле: $$ M_o=x_o+frac{f_m-f_{m-1}}{(f_m-f_{m-1})+(f_m+f_{m+1})}h $$ где
(h) – шаг интервального ряда;
(x_o) – нижняя граница модального интервала;
(f_m,f_{m-1},f_{m+1}) – соответственно, частоты модального интервала, интервала слева от модального и интервала справа.
Медианным интервалом называют первый интервал слева, на котором кумулята превысила значение 0,5. Медиана интервального вариационного ряда определяется по формуле: $$ M_e=x_o+frac{0,5-S_{me-1}}{w_{me}}h $$ где
(h) – шаг интервального ряда;
(x_o) – нижняя граница медианного интервала;
(S_{me-1}) накопленная относительная частота для интервала слева от медианного;
(w_{me}) относительная частота медианного интервала.
Расположение выборочной средней, моды и медианы в зависимости от симметрии ряда аналогично их расположению в дискретном ряду (см. §65 данного справочника).
Например:
Для распределения учеников по росту получаем:
(x_i) | 146 | 154 | 162 | 170 | 178 | 186 | 194 | ∑ |
(w_i) | 0,04 | 0,07 | 0,11 | 0,34 | 0,33 | 0,08 | 0,03 | 1 |
(x_iw_i) | 5,84 | 10,78 | 17,82 | 57,80 | 58,74 | 14,88 | 5,82 | 171,68 |
$$ X_{cp}=sum_{i=1}^k x_iw_i=171,68approx 171,7 text{(см)} $$ На гистограмме (или полигоне) относительных частот максимальная частота приходится на 4й интервал [166;174). Это модальный интервал.
Данные для расчета моды: begin{gather*} x_o=166, f_m=34, f_{m-1}=11, f_{m+1}=33, h=8\ M_o=x_o+frac{f_m-f_{m-1}}{(f_m-f_{m-1})+(f_m+f_{m+1})}h=\ =166+frac{34-11}{(34-11)+(34-33)}cdot 8approx 173,7 text{(см)} end{gather*} На кумуляте значение 0,5 пересекается на 4м интервале. Это – медианный интервал.
Данные для расчета медианы: begin{gather*} x_o=166, w_m=0,34, S_{me-1}=0,22, h=8\ \ M_e=x_o+frac{0,5-S_{me-1}}{w_me}h=166+frac{0,5-0,22}{0,34}cdot 8approx 172,6 text{(см)} end{gather*} begin{gather*} \ X_{cp}=171,7; M_o=173,7; M_e=172,6\ X_{cp}lt M_elt M_o end{gather*} Ряд асимметричный с левосторонней асимметрией.
При этом (frac{|M_o-X_{cp}|}{|M_e-X_{cp}|}=frac{2,0}{0,9}approx 2,2lt 3), т.е. распределение умеренно асимметрично.
п.4. Выборочная дисперсия и СКО
Выборочная дисперсия интервального вариационного ряда определяется как средняя взвешенная для квадрата отклонения от средней: begin{gather*} D=frac1Nsum_{i=1}^k(x_i-X_{cp})^2 f_i=frac1Nsum_{i=1}^k x_i^2 f_i-X_{cp}^2 end{gather*} где (x_i) – середины интервалов: (x_i=frac{a_{i-1}+a_i}{2}, i=overline{1,k}).
Или, через относительные частоты: $$ D=sum_{i=1}^k(x_i-X_{cp})^2 w_i=sum_{i=1}^k x_i^2 w_i-X_{cp}^2 $$
Выборочное среднее квадратичное отклонение (СКО) определяется как корень квадратный из выборочной дисперсии: $$ sigma=sqrt{D} $$
Например:
Для распределения учеников по росту получаем:
$x_i$ | 146 | 154 | 162 | 170 | 178 | 186 | 194 | ∑ |
(w_i) | 0,04 | 0,07 | 0,11 | 0,34 | 0,33 | 0,08 | 0,03 | 1 |
(x_iw_i) | 5,84 | 10,78 | 17,82 | 57,80 | 58,74 | 14,88 | 5,82 | 171,68 |
(x_i^2w_i) – результат | 852,64 | 1660,12 | 2886,84 | 9826 | 10455,72 | 2767,68 | 1129,08 | 29578,08 |
$$ D=sum_{i=1}^k x_i^2 w_i-X_{cp}^2=29578,08-171,7^2approx 104,1 $$ $$ sigma=sqrt{D}approx 10,2 $$
п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации
Исправленная выборочная дисперсия интервального вариационного ряда определяется как: begin{gather*} S^2=frac{N}{N-1}D end{gather*}
Стандартное отклонение выборки определяется как корень квадратный из исправленной выборочной дисперсии: $$ s=sqrt{S^2} $$
Коэффициент вариации это отношение стандартного отклонения выборки к выборочной средней, выраженное в процентах: $$ V=frac{s}{X_{cp}}cdot 100text{%} $$
Подробней о том, почему и когда нужно «исправлять» дисперсию, и для чего использовать коэффициент вариации – см. §65 данного справочника.
Например:
Для распределения учеников по росту получаем: begin{gather*} S^2=frac{100}{99}cdot 104,1approx 105,1\ sapprox 10,3 end{gather*} Коэффициент вариации: $$ V=frac{10,3}{171,7}cdot 100text{%}approx 6,0text{%}lt 33text{%} $$ Выборка однородна. Найденное значение среднего роста (X_{cp})=171,7 см можно распространить на всю генеральную совокупность (старшеклассников из других школ).
п.6. Алгоритм исследования интервального вариационного ряда
На входе: все значения признака (left{x_jright}, j=overline{1,N})
Шаг 1. Построить интервальный ряд с интервалами (left.right[a_{i-1}, a_ileft.right)) и частотами (f_i, i=overline{1,k}) (см. алгоритм выше).
Шаг 2. Составить расчетную таблицу. Найти (x_i,w_i,S_i,x_iw_i,x_i^2w_i)
Шаг 3. Построить гистограмму (и/или полигон) относительных частот, эмпирическую функцию распределения (и/или кумуляту). Записать эмпирическую функцию распределения.
Шаг 4. Найти выборочную среднюю, моду и медиану. Проанализировать симметрию распределения.
Шаг 5. Найти выборочную дисперсию и СКО.
Шаг 6. Найти исправленную выборочную дисперсию, стандартное отклонение и коэффициент вариации. Сделать вывод об однородности выборки.
п.7. Примеры
Пример 1. При изучении возраста пользователей коворкинга выбрали 30 человек.
Получили следующий набор данных:
18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29
Постройте интервальный ряд и исследуйте его.
1) Построим интервальный ряд. В наборе данных: $$ x_{min}=18, x_{max}=38, N=30 $$ Размах вариации: (R=38-18=20)
Оптимальное число интервалов: (k=1+lfloorlog_2 30rfloor=1+4=5)
Шаг интервального ряда: (h=lceilfrac{20}{5}rceil=4)
Получаем узлы ряда: $$ a_0=x_{min}=18, a_i=18+icdot 4, i=overline{1,5} $$
(left.left[a_{i-1},a_iright.right)) лет | (left.left[18;22right.right)) | (left.left[22;26right.right)) | (left.left[26;30right.right)) | (left.left[30;34right.right)) | (left.left[34;38right.right)) |
Считаем частоты для каждого интервала. Получаем интервальный ряд:
(left.left[a_{i-1},a_iright.right)) лет | (left.left[18;22right.right)) | (left.left[22;26right.right)) | (left.left[26;30right.right)) | (left.left[30;34right.right)) | (left.left[34;38right.right)) |
(f_i) | 1 | 7 | 12 | 6 | 4 |
2) Составляем расчетную таблицу:
(x_i) | 20 | 24 | 28 | 32 | 36 | ∑ |
(f_i) | 1 | 7 | 12 | 6 | 4 | 30 |
(w_i) | 0,033 | 0,233 | 0,4 | 0,2 | 0,133 | 1 |
(S_i) | 0,033 | 0,267 | 0,667 | 0,867 | 1 | – |
(x_iw_i) | 0,667 | 5,6 | 11,2 | 6,4 | 4,8 | 28,67 |
(x_i^2w_i) | 13,333 | 134,4 | 313,6 | 204,8 | 172,8 | 838,93 |
3) Строим полигон и кумуляту
Эмпирическая функция распределения: $$ F(x)= begin{cases} 0, xleq 20\ 0,033, 20lt xleq 24\ 0,267, 24lt xleq 28\ 0,667, 28lt xleq 32\ 0,867, 32lt xleq 36\ 1, xgt 36 end{cases} $$ 4) Находим выборочную среднюю, моду и медиану $$ X_{cp}=sum_{i=1}^k x_iw_iapprox 28,7 text{(лет)} $$ На полигоне модальным является 3й интервал (самая высокая точка).
Данные для расчета моды: begin{gather*} x_0=26, f_m=12, f_{m-1}=7, f_{m+1}=6, h=4\ M_o=x_o+frac{f_m-f_{m-1}}{(f_m-f_{m-1})+(f_m+f_{m+1})}h=\ =26+frac{12-7}{(12-7)+(12-6)}cdot 4approx 27,8 text{(лет)} end{gather*}
На кумуляте медианным является 3й интервал (преодолевает уровень 0,5).
Данные для расчета медианы: begin{gather*} x_0=26, w_m=0,4, S_{me-1}=0,267, h=4\ M_e=x_o+frac{0,5-S_{me-1}}{w_{me}}h=26+frac{0,5-0,4}{0,267}cdot 4approx 28,3 text{(лет)} end{gather*} Получаем: begin{gather*} X_{cp}=28,7; M_o=27,8; M_e=28,6\ X_{cp}gt M_egt M_0 end{gather*} Ряд асимметричный с правосторонней асимметрией.
При этом (frac{|M_o-X_{cp}|}{|M_e-X_{cp}|} =frac{0,9}{0,1}=9gt 3), т.е. распределение сильно асимметрично.
5) Находим выборочную дисперсию и СКО: begin{gather*} D=sum_{i=1}^k x_i^2w_i-X_{cp}^2=838,93-28,7^2approx 17,2\ sigma=sqrt{D}approx 4,1 end{gather*}
6) Исправленная выборочная дисперсия: $$ S^2=frac{N}{N-1}D=frac{30}{29}cdot 17,2approx 17,7 $$ Стандартное отклонение (s=sqrt{S^2}approx 4,2)
Коэффициент вариации: (V=frac{4,2}{28,7}cdot 100text{%}approx 14,7text{%}lt 33text{%})
Выборка однородна. Найденное значение среднего возраста (X_{cp}=28,7) лет можно распространить на всю генеральную совокупность (пользователей коворкинга).
Статистическая сводка и группировка
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ
Краткая теория
Статистическая сводка
Процесс
упорядочения, систематизации и обобщения данных называется статистической
сводкой. В результате определенным образом выполненной обработки статистических
данных представляется возможным выявить сущность социально-экономических
явлений, характерные черты и существенные особенности отдельных объектов или их
групп, обнаружить закономерности и тенденции их развития.
Сводка
статистических данных осуществляется по заранее разработанным программе и
плану. При разработке программы определяются статистические подлежащее и
сказуемое. Подлежащее – это объект исследования, расчлененный на группы и
подгруппы; сказуемое – статистические показатели, которые характеризуют
подлежащее сводки.
Программа
сводки определяется задачами статистического исследования, которые можно свести
к следующим положениям:
-
выделение групп, на которые может быть расчленена изучаемая совокупность
явлений; -
определение перечня группировочных признаков, позволяющих произвести
разграничение единиц совокупности; -
обозначение границ интервалов групп при классификации по количественным
признакам; -
разработка системы статистических показателей для характеристики выделенных
групп.
В плане
сводки решаются вопросы о способах ее осуществления (вручную или с
использованием средств вычислительной техники), последовательности отдельных
операций сводки, выделении этапов сводки, выполняемых в децентрализованном и
централизованном порядке, сроках выполнения каждого этапа сводки, способах
представления результатов сводки (ряды распределения, статистические таблицы,
статистические графики и т. д.).
Статистическая группировка
Группировка
– это разделение изучаемой совокупности по значениям одного или нескольких
признаков на качественно однородные группы и характеристика этих групп с помощью
определенной системы показателей.
В
зависимости от поставленной цели и конкретного содержания исследуемого
материала посредством группировок решают три основные задачи:
- выделение социально-экономических типов явлений (процессов);
- выявление состава (структуры) изучаемой совокупности;
- установление причинно-следственных связей между признаками явлений (процессов).
Соответственно
перечисленным выше задачам используются три вида группировок: типологические,
структурные и аналитические (факторные).
Построение
группировки предполагает определение группировочного признака или основания
группировки, т. е. признака, по которому совокупность будет расчленена на
группы. Группировочные признаки могут быть количественными (возраст, уровень
производительности труда, рентабельность и т. д.) и атрибутивными (пол,
профессия, регионы и т. д.).
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Величина интервалов и формула Стерджесса
При
построении группировки по количественному признаку устанавливаются границы
выделяемых групп. В этом случае, решая вопрос о величине интервала группировки
(или о числе групп), следует выбирать такое число групп, чтобы сводную
информацию можно было достаточно легко интерпретировать.
Величина
интервала при выборе равных интервалов группировки и известном числе групп
определяется по формуле:
где
и
– максимальное и минимальное значения
группировочного признака;
– число выделяемых групп.
Хороший
способ приближенного определения интервала группировки при неизвестном
изначально числе групп может быть получен на основании формулы Стерджесса:
где
– число единиц совокупности
Величина
равного интервала при построении используется обычно в тех случаях, когда
соотношение максимального и минимального значений группировочного признака в
вариационном ряду распределения не превышает десятикратного значения. При
значительной вариации группировочного признака целесообразно применять кратные
интервалы. В практике статистических исследований обычно используют удвоенные
кратные интервалы, т. е. величина каждого последующего интервала по сравнению с
предыдущим удваивается.
В
отдельных случаях статистика использует также неравные интервалы (например, при
большом объеме изучаемой совокупности, сильной колеблемости группировочного
признака и т. д.) и стандартные шкалы интервалов.
Интервалы
группировки считаются обоснованными, если коэффициенты вариации анализируемых
признаков по группам не превышают 33 %.
Вторичная группировка
Специфическим
видом группировок является так называемая вторичная группировка — операция
образования новых групп на основании уже имеющейся группировки.
Вторичная
группировка может строиться путем непосредственного укрупнения групп и по
способу пропорционального дробления групп.
Смежные темы решебника:
- Полигон, гистограмма, кумулята, огива
- Показатели вариации
- Эмпирическое корреляционное отношение
Примеры решения задач
Пример 1
По данным
таблицы произвести группировку заводов по производству продукции за отчетный
период, образовав пять групп заводов. Каждую группу охарактеризуйте числом
заводов, числом работающих, среднегодовой стоимостью ОПФ. Наряду с абсолютными
показателями по группам, вычислить их процентное соотношение. Сделать выводы.
Показатели 24-х заводов отрасли
Номер п/п |
Среднегодовая стоимость ОПФ, млн. руб. |
Среднесписочное число работающих за отчетный период, чел. |
Производство продукции за отчетный период, млн.р. |
1 | 4,3 | 142,0 | 1,8 |
2 | 3,5 | 143,0 | 4,0 |
3 | 4,3 | 134,0 | 12,7 |
4 | 2,1 | 159,0 | 9,2 |
5 | 7,2 | 137,0 | 5,7 |
6 | 3,2 | 88,0 | 16,7 |
7 | 7,5 | 91,0 | 6,1 |
8 | 5,2 | 57,0 | 19,5 |
9 | 5,7 | 157,0 | 7,9 |
10 | 9,1 | 79,0 | 15,8 |
11 | 2,6 | 97,0 | 16,1 |
12 | 1,1 | 85,0 | 12,2 |
13 | 6,0 | 100,0 | 7,1 |
14 | 2,4 | 149,0 | 11,7 |
15 | 3,7 | 151,0 | 13,2 |
16 | 5,4 | 138,0 | 11,7 |
17 | 5,7 | 74,0 | 1,2 |
18 | 2,7 | 91,0 | 16,8 |
19 | 4,3 | 77,0 | 1,2 |
20 | 4,5 | 160,0 | 3,0 |
21 | 2,1 | 90,0 | 6,3 |
22 | 3,9 | 88,0 | 8,7 |
23 | 1,0 | 83,0 | 8,5 |
24 | 3,4 | 109,0 | 17,1 |
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
При построении группировки с равными
интервалами величина интервала h определяется по формуле
где
– наибольшее
и наименьшее значения признака в исследуемой совокупности
k- число групп
При
. границы интервалов имеют следующий вид:
Номер группы | Нижняя граница, млн. руб. | Верхняя граница, млн. руб. |
1 | 1,2 | 4,9 |
2 | 4,9 | 8,6 |
3 | 8,6 | 12,3 |
4 | 12,3 | 16 |
5 | 16 | 19,7 |
Расположим предприятия по
возрастанию группировочного признака:
Расчетная вспомогательная таблица
Группы предприятий, млн.р. | Номер п/п |
Среднегодовая стоимость ОПФ, млн. руб. |
Среднесписочное число работающих за отчетный период, чел. |
Производство продукции за отчетный период, млн.р. |
1,2 – 4,9 | 17 | 5,7 | 74 | 1,2 |
19 | 4,3 | 77 | 1,2 | |
1 | 4,3 | 142 | 1,8 | |
20 | 4,5 | 160 | 3 | |
2 | 3,5 | 143 | 4 | |
Всего | 5 | 22,3 | 596 | 11,2 |
4,9 – 8,6 | 5 | 7,2 | 137 | 5,7 |
7 | 7,5 | 91 | 6,1 | |
21 | 2,1 | 90 | 6,3 | |
13 | 6 | 100 | 7,1 | |
9 | 5,7 | 157 | 7,9 | |
23 | 1 | 83 | 8,5 | |
Всего | 6 | 29,5 | 658 | 41,6 |
8,6 – 12,3 | 22 | 3,9 | 88 | 8,7 |
4 | 2,1 | 159 | 9,2 | |
14 | 2,4 | 149 | 11,7 | |
16 | 5,4 | 138 | 11,7 | |
12 | 1,1 | 85 | 12,2 | |
Всего | 5 | 14,9 | 619 | 53,5 |
12,3 – 16 | 3 | 4,3 | 134 | 12,7 |
15 | 3,7 | 151 | 13,2 | |
10 | 9,1 | 79 | 15,8 | |
Всего | 3 | 17,1 | 364 | 41,7 |
16 – 19,7 | 11 | 2,6 | 97 | 16,1 |
6 | 3,2 | 88 | 16,7 | |
18 | 2,7 | 91 | 16,8 | |
24 | 3,4 | 109 | 17,1 | |
8 | 5,2 | 57 | 19,5 | |
Всего | 5 | 17,1 | 442 | 86,2 |
Получаем следующую группировку:
Группировка предприятий по признаку “Производство продукции”
Производство продукции за отчетный период, млн. р. |
Число предприятий | Число работающих |
Среднегодовая стоимость ОПФ |
|||
ед. | в % к итогу | чел. | в % к итогу | млн.р. | в % к итогу | |
1,2 – 4,9 | 5 | 20,8 | 596 | 22,2 | 22,3 | 22,1 |
4,9 – 8,6 | 6 | 25,0 | 658 | 24,6 | 29,5 | 29,2 |
8,6 – 12,3 | 5 | 20,8 | 619 | 23,1 | 14,9 | 14,8 |
12,3 – 16 | 3 | 12,5 | 364 | 13,6 | 17,1 | 16,9 |
16 – 19,7 | 5 | 20,8 | 442 | 16,5 | 17,1 | 16,9 |
Итого | 24 | 100,0 | 2679 | 100,0 | 100,9 | 100,0 |
Вывод к задаче
Таким образом наиболее у наиболее
многочисленной группы предприятий производство продукции находится в пределах
от 4,9 до 8,6 млн.р. Эта группа по численности составляет 25% от исследуемой
совокупности, в ней работает 24,6% работающих, а стоимость ОПФ составляет 29,5%
от итоговой. В самой малочисленной группе производится от 12,3 до 16 млн.р., в
ней работает 13,6% работающих, а стоимость ОПФ составляет 16,9% от итоговой.
Пример 2
Для
выявления взаимосвязи между среднегодовой стоимостью основных фондов и стоимостью
произведенной продукции произведите аналитическую группировку предприятий,
выделив четыре группы предприятий по стоимости основных фондов с равными
интервалами.
Стоимость основных фондов и
произведенной продукции по 20 предприятиям отрасли, млн. ден.ед.
№ п/п |
Среднегодовая стоимость основных фондов |
Стоимость произведенной продукции |
1 | 62 | 71 |
2 | 72 | 79 |
3 | 74 | 85 |
4 | 24 | 30 |
5 | 41 | 52 |
6 | 46 | 56 |
7 | 54 | 54 |
8 | 144 | 166 |
9 | 140 | 160 |
10 | 118 | 139 |
11 | 122 | 143 |
12 | 78 | 84 |
13 | 82 | 95 |
14 | 82 | 92 |
15 | 88 | 99 |
16 | 86 | 104 |
17 | 90 | 101 |
18 | 94 | 112 |
19 | 100 | 115 |
20 | 112 | 123 |
Итого | 1709 | 1960 |
Определите
по каждой группе и в целом по отрасли:
- количество предприятий;
- стоимость основных фондов: всего и в среднем на одно предприятие;
- стоимость произведенной продукции: всего и в среднем на одно предприятие;
- стоимость произведенной продукции на рубль основных фондов (фондоотдачу);
Результаты
расчетов представьте в таблице. Сделайте выводы.
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Решение
При построении группировки с равными
интервалами величина интервала h определяется по формуле
где
– наибольшее
и наименьшее значения признака в исследуемой совокупности
k- число групп
При
границы интервалов
имеют следующий вид:
Номер группы | Нижняя граница, млн. д.е. | Верхняя граница, млн. д.е. |
1 | 24 | 54 |
2 | 54 | 84 |
3 | 84 | 114 |
4 | 114 | 144 |
Расположим
предприятия по возрастанию группировочного признака:
Расчетная вспомогательная таблица
Группы предприятий, млн.д.е. |
№ п/п |
Среднегодовая стоимость основных фондов, млн.д.е. |
Стоимость произведенной продукции, млн.д.е. |
4 | 24 | 30 | |
24-54 | 5 | 41 | 52 |
6 | 46 | 56 | |
Итого | 3 | 111 | 138 |
7 | 54 | 54 | |
54-84 | 1 | 62 | 71 |
2 | 72 | 79 | |
3 | 74 | 85 | |
12 | 78 | 84 | |
13 | 82 | 95 | |
14 | 82 | 92 | |
Итого | 7 | 504 | 560 |
16 | 86 | 104 | |
84-114 | 15 | 88 | 99 |
17 | 90 | 101 | |
18 | 94 | 112 | |
19 | 100 | 115 | |
20 | 112 | 123 | |
Итого | 6 | 570 | 654 |
10 | 118 | 139 | |
114-144 | 11 | 122 | 143 |
9 | 140 | 160 | |
8 | 144 | 166 | |
Итого | 4 | 524 | 608 |
Получаем следующую группировку:
Группировка предприятий отрасли
Группы предприятий, млн.д.е. | Число предприятий | Среднегодовая стоимость основных фондов, млн.д.е. | Стоимость произведенной продукции, млн.д.е. | Фондоотдача, ден.ед. | ||
всего | на одно предприятие | всего | на одно предприятие | |||
24-54 | 3 | 111 | 37,0 | 138 | 46 | 1,243 |
54-84 | 7 | 504 | 72,0 | 560 | 80 | 1,111 |
84-114 | 6 | 570 | 95,0 | 654 | 109 | 1,147 |
114-144 | 4 | 524 | 131,0 | 608 | 152 | 1,160 |
Итого | 20 | 1709 | 85,5 | 1960 | 98 | 1,147 |
Вывод к задаче
Таким
образом с увеличением среднегодовой стоимости основных фондов увеличивается
стоимость произведенной продукции. Фондоотдача также имеет тенденцию к
увеличению. Средняя фондоотдача по всей совокупности предприятий составила
1,147 ден.ед.
Пример 3
Имеются
данные об уровне выполнения норм выработки рабочими двух цехов
машиностроительного предприятия:
Цех №1 | Цех №2 | ||
Уровень выполнения норм выработки | Число рабочих | Уровень выполнения норм выработки | Число рабочих |
до 90 | 4 | до 93,9 | 6 |
90 – 90,9 | 16 | 94 – 98,9 | 15 |
94 – 99,9 | 24 | 99 – 100,9 | 14 |
100-105,9 | 66 | 101 – 104,9 | 28 |
106-109,9 | 40 | 105 – 108,9 | 36 |
110 и выше | 25 | 109 – 114,9 | 18 |
115 и выше | 13 | ||
Итого | 175 | Итого | 130 |
Приведите
данные к сопоставимости. Определите, какова доля не выполняющих норму рабочих в
каждом цехе. Сделайте вывод, в каком из цехов уровень выполнения норм выработки
лучше.
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Осуществим
вторичную группировку по обеим цехам по способу пропорционального дробления.
Данные
разобьем на 4 группы по выработке:
до 100
100 –
104,9
105-
109,9
110 и
выше
Цех №1:
Число рабочих в 1-й
группе (<100):
Число рабочих во 2-й
группе (100-104,9):
Число рабочих во 3-й
группе (105-109,9):
Число рабочих во 3-й
группе (110 и выше):
Цех №2:
Число рабочих в 1-й группе
(<100)
Число рабочих во 2-й
группе (100-104,9)
Число рабочих во 3-й
группе (105-109,9)
Число рабочих во 3-й
группе (110 и выше)
Получаем:
Вторичная группировка
Цех №1 | Цех №2 | ||
Уровень выполнения норм выработки | Число рабочих | Уровень выполнения норм выработки | Число рабочих |
до 100 | 44 | до 100 | 28 |
100 – 104,9 | 55 | 100 – 104,9 | 35 |
105 – 109,9 | 51 | 105 – 109,9 | 39 |
110 и выше | 25 | 110 и выше | 28 |
Итого | 175 | 130 |
Доля
рабочих, не выполняющих норму в 1-м цехе:
Доля
рабочих, не выполняющих норму во 2-м цехе:
Вывод к задаче
Таким
образом, выполнение норм выработки во 2-м цехе лучше, чем в первом.
Пример 4
Имеются
следующие данные о распределении сельскохозяйственных предприятий региона по
величине валовой продукции:
Группы сельскохозяйственных предприятий по величине валовой продукции, млн.руб. |
Число предприятий, в % к итогу | Валовая продукция, в % к итогу |
до 100 | 10 | 17,9 |
100-300 | 60 | 42,4 |
свыше 300 | 30 | 39,7 |
Итого | 100,0 | 100,0 |
Применяя
метод вторичной группировки, образуйте группы сельскохозяйственных предприятий
по величине валовой продукции, млн.р.
до 10,
10-50, 50-100, 100-200, 200-250, свыше 250.
По каждой
группе рассчитайте оба показателя.
Решение
Осуществим
вторичную группировку по способу пропорционального дробления групп:
В первую группу
войдет 1/10 часть 1-го интервала
Во вторую группу
войдет 2/5 части 1-го интервала
В третью группу
войдет половина 1-го интервала
В четвертую группу
войдет 4/5 части 2-го интервала
В пятую группу войдет
1/5 часть 2-го интервала и 3-й интервал
Вторичная группировка
Группы сельскохозяйственных предприятий по величине валовой продукции, млн.руб. |
Число предприятий, % к итогу |
Стоимость реализованной продукции, % к итогу |
до 10 | 1 | 1,79 |
10-50 | 4 | 7,16 |
50-100 | 5 | 8,95 |
100-250 | 48 | 33,92 |
свыше 250 | 42 | 48,18 |
Итого | 100,0 | 100,0 |
Задачи контрольных и самостоятельных работ
Задача 1
1.
Произведите группировку магазинов №№5…27 по признаку относительного уровня
издержек обращения (в% к розничным продажам), образовав при этом 4 группы с
равными интервалами.
2.
Охарактеризуйте каждую группу и всю совокупность магазинов числом магазинов,
размером розничных продаж, издержек обращения и торговой площади.
3.
Определите средние размеры розничных продаж, издержек обращения и торговой
площади, приходящиеся на один магазин.
4.
Определите средний относительный уровень издержек обращения по каждой группе и
в целом.
Полученные
результаты оформите в виде статистической таблицы. Сделайте выводы.
Номер магазина |
Розничные продажи (млрд. руб.) |
Издержки обращения (млрд. руб.) | Стоимость основных средств (среднегодовая) (млрд. руб.) | Численность продавцов (чел.) | Торговая площадь (м2) |
5 | 235 | 24,8 | 7,8 | 132 | 1335 |
6 | 80 | 9,2 | 2,2 | 41 | 946 |
7 | 113 | 10,9 | 3,2 | 40 | 1435 |
8 | 300 | 30,1 | 6,8 | 184 | 1820 |
9 | 142 | 16,7 | 5,7 | 50 | 1256 |
10 | 280 | 46,8 | 6,3 | 105 | 1353 |
11 | 156 | 30,4 | 5,7 | 57 | 1138 |
12 | 213 | 28,1 | 5,0 | 100 | 1216 |
13 | 298 | 38,53 | 6,7 | 112 | 1352 |
14 | 242 | 34,2 | 6,5 | 106 | 1445 |
15 | 130 | 20,1 | 4,8 | 62 | 1246 |
16 | 184 | 22,3 | 6,8 | 60 | 1332 |
17 | 96 | 9,8 | 3,0 | 34 | 680 |
18 | 304 | 38,7 | 6,9 | 109 | 1435 |
19 | 95 | 11,7 | 2,8 | 38 | 582 |
20 | 352 | 40,1 | 8,3 | 115 | 1677 |
21 | 101 | 13,6 | 3,0 | 40 | 990 |
22 | 148 | 21,6 | 4,1 | 50 | 1354 |
23 | 74 | 9,2 | 2,2 | 30 | 678 |
24 | 135 | 20,2 | 4,6 | 52 | 1380 |
25 | 320 | 40,0 | 7,1 | 140 | 1840 |
26 | 155 | 22,4 | 5,6 | 50 | 1442 |
27 | 262 | 29,1 | 6,0 | 102 | 1720 |
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 2
Имеются
следующие данные об урожайности картофеля и количеством внесенных минеральных
удобрений по 10 сельскохозяйственным предприятиям:
Номер колхоза | Урожайность, ц/га |
Внесено минеральных удобрений на 1 га, кг |
Номер колхоза | Урожайность, ц/га |
Внесено минеральных удобрений на 1 га, кг |
1 | 128 | 140 | 6 | 183 | 197 |
2 | 179 | 262 | 7 | 201 | 246 |
3 | 221 | 289 | 8 | 195 | 276 |
4 | 136 | 191 | 9 | 141 | 187 |
5 | 164 | 202 | 10 | 192 | 253 |
Для
изучения зависимости между урожайностью картофеля и внесенными минеральными
удобрениями произведите группировку сельскохозяйственных предприятий, образовав
3 группы предприятий с равными интервалами. По каждой группе и по совокупности
в целом подсчитайте:
1) число
предприятий;
2)
среднюю урожайность картофеля;
3)
средний объем внесенных минеральных удобрений на 1 га, кг.
Результаты
представьте в таблице и сделайте выводы.
Задача 3
Имеются
следующие данные о распределении сельскохозяйственных предприятий региона по
величине валовой продукции:
Группы сельскохозяйственных предприятий по величине валовой продукции, млн.руб. |
Число предприятий, в % к итогу | Валовая продукция, в % к итогу |
до 100 | 10 | 17,9 |
100-300 | 60 | 42,4 |
свыше 300 | 30 | 39,7 |
Итого | 100,0 | 100,0 |
Применяя
метод вторичной группировки, образуйте группы сельскохозяйственных предприятий
по величине валовой продукции, млн.р.
до 10,
10-50, 50-100, 100-200, 200-250, свыше 250.
По каждой
группе рассчитайте оба показателя.
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 4
Используя
данные по варианту задания, выполнить следующие расчеты:
1.
Сгруппировать показатели.
2.
Согласно полученной группировки рассчитать моду и медиану.
3.
Рассчитать средние величины, дисперсию и коэффициент вариации.
4. Найти
уровень взаимосвязи между показателями при помощи корреляционно-регрессионного
анализа.
Имеются
данные о деятельности банков одного из регионов.
№ п/п |
Срок функционирования, лет |
Объем привлеченных средств, млн. ден.ед. |
1 | 7 | 46 |
2 | 4 | 40 |
3 | 3 | 38 |
4 | 7 | 49 |
5 | 2 | 41 |
6 | 9 | 55 |
7 | 6 | 60 |
8 | 12 | 58 |
9 | 3 | 38 |
10 | 9 | 56 |
11 | 5 | 48 |
12 | 2 | 40 |
13 | 10 | 62 |
14 | 4 | 54 |
15 | 7 | 57 |
16 | 2 | 43 |
17 | 3 | 46 |
18 | 10 | 58 |
19 | 5 | 53 |
20 | 8 | 51 |
21 | 3 | 42 |
22 | 6 | 58 |
23 | 8 | 56 |
24 | 9 | 49 |
25 | 10 | 47 |
26 | 4 | 43 |
27 | 9 | 46 |
28 | 11 | 48 |
29 | 5 | 57 |
30 | 8 | 59 |
Итого |
На основе соответствующих вашему
варианту данных построить интервальный вариационный ряд банков по объему
привлеченных средств (4 интервала) и изобразить графически.
По данным подсчитайте:
1) Средний размер привлекаемых
средств (способ моментов и квадратов);
2) Моду, медиану привлекаемых
средств;
3) Показатели вариации;
4) Показатели корреляции и
регрессии.
Сделать вывод. Начертить 4 вида
графиков.
Задача 5
По
имеющимся данным о сбыте продукции (в тыс. руб.) в различных фирмах города
произвести группировку данных, образовав 4 равных интервалов. Оформить в
таблице.
По
полученному интервальному ряду определить (аналитически и графически): средний
объем сбыта, моду, медиану.
87, 75,
66, 60, 87, 67, 66, 69, 89, 74, 90, 78, 99, 86, 76, 95, 69, 68, 87, 63
Задача 6
Произвести
анализ 20 банков, применив метод группировок, используя данные, приведенные в
таблице ниже:
Основные
показатели деятельности банков (млн.руб.)
Номер банка |
Капитал |
Чистые активы |
Прибыль |
1 | 5170 | 74104 | 1222 |
2 | 6412 | 22311 | 502 |
3 | 6424 | 30978 | 1372 |
4 | 4467 | 46331 | 1845 |
5 | 9454 | 7741 | 214 |
6 | 4357 | 19422 | 215 |
7 | 4033 | 9203 | 336 |
8 | 2755 | 12082 | 504 |
9 | 6868 | 57821 | 2635 |
10 | 3896 | 23787 | 794 |
11 | 3660 | 37528 | 694 |
12 | 7301 | 43129 | 934 |
13 | 3564 | 40927 | 1405 |
14 | 3327 | 17881 | 220 |
15 | 3280 | 21955 | 654 |
16 | 5153 | 31627 | 2173 |
17 | 5400 | 16068 | 1463 |
18 | 2613 | 13851 | 229 |
19 | 5196 | 6588 | 570 |
20 | 2609 | 22781 | 445 |
Задача 7
Используя
данные таблицы по 20 фирмам, сгруппируйте фирмы по следующим признакам:
низкорентабельные, рентабельные, высокорентабельные. В качестве основы
группировки возьмите прибыль на одного работающего. Для каждого выделенного
типа рассчитайте число фирм, среднюю численность персонала, стоимость
реализованной продукции на одного работающего. Результаты представьте в виде
таблицы и изобразите графически. Предложите анализ возможных факторов повышения
рентабельности.
Итоги деятельности фирм,
расположенных на территории района
Номер в реестре | Заявленная отпускная стоимость реализованной продукции (млн. руб.) | Среднесписочная численность персонала | Заявленная прибыль (млн. руб.) | Расходы на рекламу (млн. руб.) |
6 | 195,2 | 181 | 16,3 | 4,0 |
7 | 157,8 | 1123 | 12,5 | 1,2 |
8 | 98,3 | 265 | 7,8 | 0,4 |
9 | 541,2 | 312 | 28,1 | 3,5 |
10 | 325,1 | 198 | 35,3 | 7,8 |
11 | 398,5 | 253 | 23,4 | 4,9 |
12 | 38,4 | 126 | 6,7 | 2,2 |
13 | 137,6 | 78 | 14,3 | 5,6 |
14 | 56,5 | 44 | 3,4 | 2,7 |
15 | 41,2 | 58 | 6,5 | 2,4 |
16 | 168,5 | 87 | 13,9 | 3,7 |
17 | 174,3 | 128 | 10,2 | 5,1 |
18 | 184,1 | 165 | 20,5 | 5,9 |
19 | 241,6 | 188 | 13,3 | 1,8 |
20 | 58,0 | 39 | 10,2 | 3,4 |
21 | 302,7 | 155 | 16,7 | 2,9 |
22 | 87,5 | 61 | 5,3 | 0,2 |
23 | 611,5 | 3875 | 58,3 | 10,7 |
24 | 257,6 | 189 | 25,0 | 3,2 |
25 | 107,4 | 98 | 8,8 | 3,7 |
Задача 8
Имеются
данные о распределении коммерческих банков по объявленному уставному фонду:
Регион 1 | Регион 2 | ||
Группы банков по уставному фонду | Удельный вес банков в общем их числе | Группы банков по уставному фонду | Удельный вес банков в общем их числе |
до 100 | 7 | до 100 | 2 |
100-500 | 9 | 100-300 | 5 |
500-1000 | 18 | 300-500 | 6 |
1000-5000 | 34 | 500-700 | 7 |
5000-20000 | 22 | 700-1000 | 12 |
свыше 20000 | 10 | 1000-3000 | 28 |
3000-5000 | 18 | ||
5000-10000 | 14 | ||
свыше 10000 | 8 | ||
Итого | 100 | Итого | 100 |
С целью
сравнения осуществите вторичную группировку коммерческих банков, для чего
выделите следующие группы банков по объявленному уставному фонду:
до 100,
100-500, 500-1000, 1000-5000, 5000-10000, свыше 10000 тыс.у.е. Сделайте выводы.
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 9
Имеются
следующие данные по предприятиям по численности рабочих в 2012 г. Данные
представлены в таблице:
Исходные
данные
Предприятия со среднегодовой численностью рабочих (чел.) |
Число предприятий в процентах к итогу, % |
до 100 |
33,9 |
100-200 | 20,0 |
200-500 | 23,7 |
500-1000 | 11,8 |
1000-3000 | 8,0 |
3000-5000 | 2,3 |
5000 и более |
0,3 |
Итого | 100,0 |
Используя
данные таблицы, необходимо провести перегруппировку предприятий по
численности рабочих, приняв следующие интервалы:
до 50
чел.
50 – 300
чел.
300 – 800
чел.
800 -1500
чел.
1500 –
4000 чел.
4000 –
9000 чел.
более
9000 чел.
Задача 10
Имеются
следующие данные о распределении промышленных предприятий двух регионов по
численности занятого на них промышленно-производственного персонала.
Регион 1 | Регион 2 | ||||
Группы предприятий по численности работающих, чел. |
Число предприятий, % |
Численность промышленно-производственного персонала, тыс.чел. |
Группы предприятий по численности работающих, чел. |
Число предприятий, % |
Численность промышленно-производственного персонала, тыс.чел. |
до 100 | 32 | 1 | до 300 | 34 | 1 |
101-500 | 38 | 4 | 301-600 | 28 | 6 |
501-1000 | 17 | 10 | 601-1000 | 20 | 10 |
1001-2000 | 9 | 15 | 1001-2000 | 13 | 15 |
2001-5000 | 3 | 32 | 2001-4000 | 4 | 43 |
5001 и более | 1 | 38 | 4001 и более | 1 | 25 |
Итого | 100 | 100 | Итого | 100 | 100 |
Постройте
вторичную группировку данных о распределении промышленных предприятий, пересчитав
данные:
а)
региона 2 в соответствии с группировкой региона 1;
б)
региона 1 в соответствии с группировкой региона 2;
в)
регионов 1 и 2, образовав следующие группы промышленных предприятий по
численности ППП: до 500, 500-1000, 1000-2000, 2000-3000, 3000-4000, 4000-5000,
5000 и более.
Задача 11
По данным
таблицы 2 произвести вторичную группировку, образовав три группы предприятий по
среднегодовой стоимости ОПФ.
Группы предприятий по среднегодовой стоимости ОПФ, тыс.руб. |
Число предприятий, % |
Объем продукции, % |
Среднегодовая численность работающих |
Среднегодовая стоимость ОПФ |
до 75 | 6.4 | 0.1 | 0.8 | 0.0 |
75-200 | 5.5 | 0.2 | 0.5 | 0.1 |
200-300 | 15.4 | 1.8 | 2.4 | 0.4 |
300-2500 | 36.6 | 9.7 | 12.4 | 4.4 |
2500-5000 | 30.4 | 17.2 | 17.3 | 9.6 |
5000-10000 | 1.9 | 27.7 | 29.0 | 20.8 |
и более | 3.8 | 43.3 | 37.6 | 64.7 |
Итого | 100.0 | 100.0 | 100.0 | 100.0 |
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ
Группировочный
признак при анализе выбирается из
условия выполнения цели группировки.
Так, если есть
статистические данные о промышленных
предприятиях отрасли, то можно в качестве
группировочного признака выбрать такие
величины:
-
число рабочих на
предприятии; -
число всех
работающих; -
мощность
энергоустановок; -
объем выпуска
продукции; -
стоимость ОПФ и
т.д.
Таким образом, по
каждому из этих признаков, множество
предприятий отрасли можно разбить на
группы.
При построении
интервальных группировок вопросы о
числе групп и величине интервала в
группе решаются на основе теоретического
(качественного) анализа сущности
изучаемого явления, цели исследования
и характера изменения признака. Интервалы
не должны быть слишком широкими, так
как иначе в один интервал попадут
качественно различные элементы. В то
же время они не должны быть слишком
узкими, так как в этом случае число
единиц в группе может оказаться
незначительным и характеристики группы
не будут типичными.
При
построении группировки с равными
интервалами величину интервала групп
определяют по формуле
,
где
– максимальное значение признака в
совокупности;
–минимальное
значение признака в совокупности; m
– число
групп (устанавливается исследователем).
При
выборе числа групп необходимо учитывать
следующее:
1) в каждую группу
должно попасть достаточно большое число
единиц;
-
число
единиц в группах не должно резко
отличаться друг от друга, то есть должно
быть примерно одного порядка; -
число
групп должно быть 4 – 6 и зависит, как
правило, от числа наблюдений.
Число групп может
быть определено по формуле Стэрджесса:
,
где N
–
число единиц совокупности.
Группировки
с неравными
интервалами целесообразно применять
в тех случаях, когда исходные статистические
данные разнятся на весьма значительную
величину, т.е. когда слишком велик размах
вариации в исходной совокупности (в
этом случае возникает проблема пустых
групп).
Группировки
с неравными интервалами подразделяют
на:
-
группировки
с прогрессивно возрастающими или
убывающими интервалами (по арифметической
либо геометрической прогрессии).
Например, по численности работающих
промышленные предприятия могут быть
разбиты на следующие группы с арифметически
возрастающими величинами интервалов:
до 100 человек, 100-200, 200-300, 300-500, 500—1000, 1000
и более человек. Это объясняется тем,
что изменение количества работающих
на 50-100 человек имеет существенное
значение для мелких предприятий, а для
крупных — не имеет; -
группировки
с равнонаполненными
группами (численность
каждой группы примерно одна и та же).
Равномерное распределение единиц
совокупности по группам обеспечивает
статистическую устойчивость характеристик,
рассчитанных для отдельных групп.
1.3.4. Вторичная группировка данных
Группировки,
которые выполняются на основе первичного
статистического материала (впервые) —
первичные.
Вторичная группировка
— образование новых групп на основе
ранее осуществленной группировки.
Получение новых групп на основе имеющихся
возможно двумя способами: объединением
первоначальных интервалов (путем их
укрупнения) и долевой перегруппировкой
(на основе закрепления за каждой группой
определенной доли единиц совокупности).
Вторичные группировки используют, когда
имеющиеся группировки не удовлетворяют
требованиям анализа — несопоставимы
из-за различного числа выделенных групп
или неодинаковых границ интервалов. К
этому методу прибегают также в тех
случаях, когда в результате первоначальной
группировки нечетко проявился характер
распределения изучаемой совокупности.
В этом случае
производят укрупнение или уменьшение
интервалов. Также вторичная группировка
используется для приведения к сопоставимому
виду группировок с различными интервалами
с целью их сравнения. Рассмотрим приемы
вторичной группировки на примерах.
Пример 1. Произвести
укрупнение интервалов на основе данных
таблицы 1:
Таблица 1
Группы |
Число |
Товарооборот |
До |
15 |
93 |
10 — 15 |
8 |
112 |
15 — 20 |
13 |
200 |
20 — 30 |
3 |
68 |
30 — 50 |
9 |
378 |
50 — 60 |
7 |
385 |
60 — 70 |
3 |
180 |
70 — 100 |
8 |
600 |
100 — 200 |
22 |
2400 |
Свыше |
12 |
3744 |
Итого |
100 |
8160 |
Приведенная
группировка недостаточно наглядна,
потому что не показывает четкой и строгой
закономерности в изменении товарооборота
по группам.
Уплотним ряды
распределения, образовав шесть групп.
Новые группы образованы путем суммирования
первоначальных групп (табл. 2).
Таблица 2
Группы |
Число |
Товарооборот |
Товарооборот |
До |
15 |
93 |
6,2 |
10 — 20 |
21 |
312 |
14,8 |
20 — 50 |
12 |
446 |
37,1 |
50 — 100 |
18 |
1165 |
64,8 |
100 — 200 |
22 |
2400 |
109,0 |
Свыше |
12 |
3744 |
312,0 |
Итого |
100 |
8160 |
81,6 |
Совершенно четко
видно, чем крупнее магазины, тем выше
уровень товарооборота.
Пример 2. Имеются
следующие данные о распределении
колхозов по числу дворов (табл. 3).
Таблица 3
№ п/п |
Группы |
Удельный |
Группы |
Удельный |
1 |
До |
4,3 |
до |
1,0 |
2 |
100 — 200 |
18,4 |
50 – 70 |
1,0 |
3 |
200 — 300 |
19,5 |
70 – 100 |
2,0 |
4 |
300 — 500 |
28,1 |
100 – 150 |
10,0 |
5 |
Свыше |
29,7 |
150 – 250 |
18 |
250 – 400 |
21 |
|||
400 – 500 |
23 |
|||
свыше |
24 |
|||
Итого |
100 |
Итого |
100 |
Эти данные не
позволяют провести сравнение распределения
колхозов в 2-х районах по числу дворов,
так как в этих районах имеется различное
число групп колхозов. Необходимо ряды
распределения привести к сопоставимому
виду.
За основу сравнения
необходимо взять распределение колхозов
1 района. Следовательно, по второму
району надо произвести вторичную
группировку, чтобы образовать такое же
число групп и с теми же интервалами, как
и в первом районе. Получим следующие
данные (табл. 4).
Таблица 4
Группы |
Удельный |
Расчеты |
|
I |
II |
||
до |
4,3 |
4,0 |
1+1+2=4 |
100 – 200 |
18,4 |
19,0 |
10+9=19 |
200 – 300 |
19,5 |
16,0 |
9+7=16 |
300 – 500 |
28,1 |
37,0 |
21-7=14, 14+23=37 |
свыше |
29,7 |
24,0 |
24 |
Итого |
100,0 |
100,0 |
Для определения
числа колхозов, которые надо взять из
пятой группы во вновь образованную,
условно примем, что это число колхозов
должно быть пропорционально удельному
весу отобранных дворов в группе.
Определяем удельный
вес 50 дворов в пятой группе.
(50 * 18) / (250 – 150) = 9
Определяем удельный
вес 50 дворов в шестой группе.
(50 * 21) / (400 – 250) = 7 и
т.д.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #