Как найти середину интервала
При статистической обработке результатов исследований самого разного рода полученные значения часто группируются в последовательность интервалов. Для расчета обобщающих характеристик таких последовательностей иногда приходится вычислять середину интервала – «центральную варианту». Методы ее расчета достаточно просты, но имеют некоторые особенности, вытекающие как из используемой для измерения шкалы, так и из характера группировки (открытые или закрытые интервалы).
Инструкция
Если интервал является участком непрерывной числовой последовательности, то для нахождения ее середины используйте обычные математические методы вычисления среднеарифметического значения. Минимальное значение интервала (его начало) сложите с максимальным (окончанием) и разделите результат пополам – это один из способов вычисления среднеарифметического значения. Например, это правило применимо, когда речь идет о возрастных интервалах. Скажем, серединой возрастного интервала в диапазоне от 21 года до 33 лет будет отметка в 27 лет, так как (21+33)/2=27.
Иногда бывает удобнее использовать другой метод вычисления среднеарифметического значения между верхней и нижней границами интервала. В этом варианте сначала определите ширину диапазона – отнимите от максимального значения минимальное. Затем поделите полученную величину пополам и прибавьте результат к минимальному значению диапазона. Например, если нижняя граница соответствует значению 47,15, а верхняя – 79,13, то ширина диапазона составит 79,13-47,15=31,98. Тогда серединой интервала будет 63,14, так как 47,15+(31,98/2) = 47,15+15,99 = 63,14.
Если интервал не является участком обычной числовой последовательности, то вычисляйте его середину в соответствии с цикличностью и размерностью используемой измерительной шкалы. Например, если речь идет об историческом периоде, то серединой интервала будет являться определенная календарная дата. Так для интервала с 1 января 2012 года по 31 января 2012 серединой будет дата 16 января 2012.
Кроме обычных (закрытых) интервалов статистические методы исследований могут оперировать и «открытыми». У таких диапазонов одна из границ не определена. Например, открытый интервал может быть задан формулировкой «от 50 лет и старше». Середина в этом случае определяется методом аналогий – если все остальные диапазоны рассматриваемой последовательности имеют одинаковую ширину, то предполагается, что и этот открытый интервал имеет такую же размерность. В противном случае вам надо определить динамику изменения ширины интервалов, предшествующих открытому, и вывести его условную ширину, исходя из полученной тенденции изменения.
Источники:
- что такое открытый интервал
Войти на сайт
или
Забыли пароль?
Еще не зарегистрированы?
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Расчет средней величины в интервальных вариационных рядах немного отличается от расчета в рядах дискретных. Как рассчитать среднюю арифметическую и среднюю гармоническую в дискретных рядах можно посмотреть вот ЗДЕСЬ. Такое различие вполне объяснимо – это связано с особенностью интервальных рядов, в которых изучаемый признак приведен в интервале от и до.
Итак, посмотрим особенности расчета на примере.
Пример 1. Имеются данные о дневном заработке рабочих предприятия.
Дневной заработок рабочего, руб. | Число рабочих, чел. |
500-1000 | 15 |
1000-1500 | 30 |
1500-2000 | 80 |
2000-2500 | 60 |
2500-3000 | 25 |
Итого | 210 |
Нам необходимо рассчитать среднедневную заработную плату рабочего.
Начало решения задачи будет аналогичным правилам расчета средней величины, которые можно посмотреть в этой статье.
Начинаем мы с определения варианты и частоты, поскольку ищем мы средний заработок за день, то варианта это первая колонка, а частота вторая. Данные у нас заданы явным количеством, поэтому расчет проведем по формуле средней арифметической взвешенной (так как данные приведены в табличном виде). Но на этом сходства заканчиваются и появляются новые действия.
Дневной заработок рабочего, руб. х | Число рабочих, чел. f |
500-1000 | 15 |
1000-1500 | 30 |
1500-2000 | 80 |
2000-2500 | 60 |
2500-3000 | 25 |
Итого | 210 |
Дело в том, что интервальный рад представляет осредняемую величину в виде интервала. 500-1000, 2000-2500 и так далее. Чтобы решить эту проблему необходимо провести промежуточные действия, и только потом подсчитать среднюю величину по основной формуле.
Что же требуется в данном случае сделать. Все достаточно просто, чтобы провести расчет нам нужно, чтобы варианта была представлена одним числом, а не интервалом. Для получения такого значения находят так называемое ЦЕНТРАЛЬНОЕ ЗНАЧЕНИЕ ИНТЕРВАЛА (или середину интервала). Определяется оно путем сложение верхней и нижней границ интервала и делением на два.
Проведем необходимые расчеты и подставим данные в таблицу.
И так далее по всем интервалам рассчитываем центральное значение. В итоге получаем следующие результаты.
Дневной заработок рабочего, руб. х | Число рабочих, чел. f | х’ | |
500-1000 | 15 | 750 | |
1000-1500 | 30 | 1250 | |
1500-2000 | 80 | 1750 | |
2000-2500 | 60 | 2250 | |
2500-3000 | 25 | 2750 | |
Итого | 210 | — |
После того как мы рассчитали центральные значения далее проведем расчеты в таблицы и подставим итоговые данные в формулу, аналогично тому как мы уже рассматривали ранее.
Дневной заработок рабочего, руб. х | Число рабочих, чел. f | х’ | x’f |
500-1000 | 15 | 750 | 11250 |
1000-1500 | 30 | 1250 | 37500 |
1500-2000 | 80 | 1750 | 140000 |
2000-2500 | 60 | 2250 | 135000 |
2500-3000 | 25 | 2750 | 68750 |
Итого | ∑f = 210 | — | ∑ x’f = 392500 |
В итоге получаем, что среднедневная заработная плата одного рабочего составляет 1869 рублей.
Это пример решения, если интервальный ряд представлен со всеми закрытыми интервалами. Но достаточно часто бывает, когда два интервала открытые, первый и последний. В таких ситуациях прямой расчет центрального значения невозможен, но есть два варианта как это сделать.
Пример 2. Имеются данные о продолжительности производственного стажа персонала предприятия. Рассчитать среднюю продолжительность стада одного сотрудника.
Длительность производственного стажа, лет | Число сотрудников, человек |
до 3 | 19 |
3-6 | 21 |
6-9 | 15 |
9-12 | 10 |
12 и более | 5 |
Итого | 70 |
В данном случае принцип решения останется точно таким же. Единственно, что поменялось в этой задаче, так это первый и последний интервалы. До 3 лет и 12 лет и более это и есть те самые открытые интервалы. Именно тут возникнет вопрос, а как же найти центральное значение интервала для таких интервалов.
Поступить в этой ситуации можно двумя способами:
- Предположить какой бы мог быть интервал, учитывая, что нам приведены интервалы равные, то это вполне возможно. Интервал до 3 мог бы выглядеть как 0-3, и тогда его центральное значение будет (0+3)/2 = 1,5 года. Интервал 12 и более мог бы выглядеть как 12-15, и тогда его центральное значение было бы (12+15)/2 = 13,5 года. Все оставшиеся центральные значения интервала рассчитываются аналогично. В результате получаем следующее.
Длительность производственного стажа, лет х | Число сотрудников, человек f | х’ | x’f |
до 3 | 19 | 1,5 | 28,5 |
3-6 | 21 | 4,5 | 94,5 |
6-9 | 15 | 7,5 | 112,5 |
9-12 | 10 | 10,5 | 105,0 |
12 и более | 5 | 13,5 | 67,5 |
Итого | ∑f = 70 | — | ∑ x’f = 408,0 |
Средняя продолжительность стажа 5,83 года.
- Принять за центральное значение, то данное которое имеется в интервале, без дополнительных расчетов. В нашем случае в интервале до 3 это будет 3, а в интервале 12 и более это будет 12. Такой способ больше подходит для ситуаций, когда интервалы неравные и предположить какой интервал мог бы быть сложно. Рассчитаем нашу задачу по таким данным далее.
Длительность производственного стажа, лет х | Число сотрудников, человек f | х’ | x’f |
до 3 | 19 | 3 | 57,0 |
3-6 | 21 | 4,5 | 94,5 |
6-9 | 15 | 7,5 | 112,5 |
9-12 | 10 | 10,5 | 105,0 |
12 и более | 5 | 12 | 60,0 |
Итого | ∑f = 70 | — | ∑ x’f = 429,0 |
Средняя продолжительность стажа 6,13 года.
Домашнее задание
- Рассчитать средний размер посевной площади на одно фермерское хозяйство по следующим данным.
Размер посевной площади, га | Количество фермерских хозяйств |
0-20 | 64 |
20-40 | 58 |
40-60 | 32 |
60-80 | 21 |
80-100 | 12 |
Итого | 187 |
- Рассчитайте средний возраст работника предприятия по следующим данным
Возраст персонала, лет | Число сотрудников, человек |
до 18 | 7 |
18-25 | 68 |
25-40 | 79 |
40-55 | 57 |
55 и старше | 31 |
Итого | 242 |
Теперь Вы умеете рассчитывать среднюю в интервальном вариационном ряду!
Может еще поучимся? Загляни сюда!
Совет 1: Как обнаружить середину интервала
При статистической обработке итогов изысканий самого различного рода полученные значения зачастую группируются в последовательность промежутков. Для расчета обобщающих колляций таких последовательностей изредка доводится вычислять середину интервала – «центральную варианту». Способы ее расчета довольно примитивны, но имеют некоторые особенности, вытекающие как из применяемой для измерения шкалы, так и из нрава группировки (открытые либо закрытые промежутки).
Инструкция
1. Если промежуток является участком постоянной числовой последовательности, то для нахождения ее середины используйте обыкновенные математические способы вычисления среднеарифметического значения. Минимальное значение интервала (его предисловие) сложите с максимальным (окончанием) и поделите итог напополам – это один из методов вычисления среднеарифметического значения. Скажем, это правило применимо, когда речь идет о возрастных интервала х. Скажем, серединой возрастного интервала в диапазоне от 21 года до 33 лет будет отметка в 27 лет, потому что (21+33)/2=27.
2. Изредка бывает комфортнее применять иной способ вычисления среднеарифметического значения между верхней и нижней границами интервала . В этом варианте вначале определите ширину диапазона – отнимите от максимального значения минимальное. После этого поделите полученную величину напополам и прибавьте итог к минимальному значению диапазона. Скажем, если нижняя граница соответствует значению 47,15, а верхняя – 79,13, то ширина диапазона составит 79,13-47,15=31,98. Тогда серединой интервала будет 63,14, потому что 47,15+(31,98/2) = 47,15+15,99 = 63,14.
3. Если промежуток не является участком обыкновенной числовой последовательности, то вычисляйте его середину в соответствии с повторяемостью и размерностью применяемой измерительной шкалы. Скажем, если речь идет об историческом периоде, то серединой интервала будет являться определенная календарная дата. Так для интервала с 1 января 2012 года по 31 января 2012 серединой будет дата 16 января 2012.
4. Помимо обыкновенных (закрытых) промежутков статистические способы изысканий могут оперировать и «открытыми». У таких диапазонов одна из границ не определена. Скажем, открытый промежуток может быть задан формулировкой «от 50 лет и старше». Середина в этом случае определяется способом аналогий – если все остальные диапазоны рассматриваемой последовательности имеют идентичную ширину, то предполагается, что и данный открытый промежуток имеет такую же размерность. В отвратном случае вам нужно определить динамику метаморфозы ширины промежутков, предшествующих открытому, и вывести его условную ширину, исходя из полученной склонности метаморфозы.
Совет 2: Как обнаружить середину
Изредка в повседневной деятельности может появиться надобность обнаружить середину отрезка прямой линии. Скажем, если предстоит сделать выкройку, эскиз изделия либо легко распилить на две равные части деревянный брусок. На поддержка приходит геометрия и немножко житейской смекалки.
Вам понадобится
- Циркуль, линейка; булавка, карандаш, нить
Инструкция
1. Воспользуйтесь обыкновенными инструментами, предуготовленными для измерения длины. Это самый легкой метод разыскать середину отрезка. Измерьте линейкой либо рулеткой длину отрезка, поделите полученное значение напополам и отмерьте от одного из концов отрезка полученный итог. Вы получите точку, соответствующую середине отрезка.
2. Существует больше точный метод нахождения середины отрезка, вестимый из курса школьной геометрии. Для этого возьмите циркуль и линейку, причем линейку может заменить всякий предмет подходящей длины с ровной стороной.
3. Установите расстояние между ножками циркуля так, дабы оно было равным длине отрезка либо же огромным, чем половина отрезка. После этого поставьте иглу циркуля в один из концов отрезка и проведите полуокружность так, дабы она пересекала отрезок. Переставьте иглу в иной конец отрезка и, не меняя размах ножек циркуля, проведите вторую полуокружность верно таким же образом.
4. Вы получили две точки пересечения полуокружностей по обе стороны от отрезка, середину которого мы хотим обнаружить. Объедините эти две точки при помощи линейки либо ровного бруска. Соединительная линия пройдет в точности посередине отрезка.
5. Если под рукой не оказалось циркуля либо длина отрезка значительно превышает возможный размах его ножек, дозволено воспользоваться простым приспособлением из подручных средств. Изготовить его дозволено из обыкновенной булавки, нитки и карандаша. Привяжите концы нитки к булавке и карандашу, при этом длина нитки должна немножко превышать длину отрезка. Таким импровизированным заменителем циркуля остается проделать шаги, описанные выше.
Видео по теме
Полезный совет
Довольно верно обнаружить середину доски либо бруска вы можете, использовав обыкновенную нитку либо шнур. Для этого отрежьте нить так, дабы она соответствовала длине доски либо бруска. Остается сложить нить верно напополам и разрезать на две равные части. Приложите один конец полученной мерки к концу измеряемого предмета, а 2-й конец будет соответствовать его середине.
Календарь брачности (распределение браков по возрасту в условной или реальной когорте) характеризуется средним возрастом вступления в брак, который рассчитывается как средняя из возрастов людей, вступивших в брак в определенном году или в реальном поколении, взвешенная возрастными коэффициентами брачности. При этом принимают гипотезу, что средний возраст вступления в брак в возрастном интервале приходится на середину возрастного интервала:
(bar{x} = frac{sum_{x = 15}^{50}{{_{n}^{}b}_{x} cdot (x + frac{n}{2})}}{sum_{x = 15}^{50}{_{n}^{}b}_{x}})
где х – начало возрастного интервала, в котором зарегистрирован брак; n – длина возрастного интервала, в котором зарегистрирован брак; (х+ n/2) – середина возрастного интервала или средний возраст вступления в брак в данном интервале; nbx – возрастной показатель интенсивности вступления в брак в возрасте x (возрастной коэффициент брачности, среднее число браков, приходящееся на 1000 человек данного возраста). Как правило рассчитывают средний возраст регистрации брака для всех браков, а также для первых браков. На основе этого показателя можно судить о постарении или омоложении брачности.
В России рост среднего возраста вступления в первый брак наблюдается с конца 1990х гг., начался он примерно на 20 лет позже, чем в странах Западной Европы (Рис. 6).
Рисунок 6. Средний возраст вступления в первый брак в ряде стран Европы (женщины)
Источник: http://www.demoscope.ru/weekly/app/app4019.php
Минимальный возраст вступления в брак определяется законодательством о браке (в России – 18 лет, по специальному разрешению – 16 лет). В качестве верхней границы возраста вступления в брак в демографических исследованиях обычно принимают 50 лет, поскольку браки, заключенные после этого возраста, практически не будут оказывать влияния на воспроизводство населения.
На основе данных переписи населения можно рассчитать так называемый средний расчетный возраст вступления в первый брак (SMAM, Singulate mean age at marriage), предложенный Дж. Хаджналом ((John Hajnal “Age at marriage and proportion marrying”, Population Studies, vol. VII, No 2 (November 1953), pp. 111-136 http://www.demoscope.ru/weekly/knigi/volkov/demogr015.html ).
Формула для расчета этого показателя для пятилетних возрастных интервалов:
(SMAM = 15 + frac{n cdot sum_{x = 15}^{50}{{_{n}^{}C}_{x} – 35 cdot C_{50}}}{1 – C_{50}}),
(C_{50} = 0,5 cdot ({_{5}^{}C}_{45} + {_{5}^{}C}_{50}))
где nСх – доли никогда не состоявших в браке в отдельных возрастных группах (можно рассчитать по материалам переписи населения или выборочного обследования), С50 – доля никогда не вступавших в брак в течение жизни или доля так называемого окончательного безбрачия в точном возрасте 50 лет.
Принцип расчета этого показателя основан на определении числа человеко-лет, прожитых до вступления в первый брак теми, кто вступил в него в течение жизни. Если принять, что вступление в первый брак начинается с возраста 15 лет, то дробь в данном показателе дает возможность рассчитать среднее число лет, прожитых данной когортой до вступления в брак: в числителе – число человеко-лет, прожитых всеми членами когорты от 15 лет до вступления в первый брак, в знаменателе – доля вступивших в первый брак из членов данной когорты.
По структуре этот показатель напоминает ожидаемую продолжительность жизни: он не зависит от влияния возрастной структуры и при его расчете предполагается, что возрастные уровни первой брачности на протяжении жизни данной когорты останутся такими же, как в том году, для которого рассчитан данный показатель, миграция и смертность не принимаются во внимание.
Пример расчета SMAM:
Точный возраст (х) | Доли никогда не вступавших в брак |
---|---|
15 | 0,983 |
20 | 0,775 |
25 | 0,403 |
30 | 0,211 |
35 | 0,130 |
40 | 0,082 |
45 | 0,061 |
50 | 0,045 |
Источник данных – Всероссийская перепись населения 2010 г. (мужчины, все население) http://www.gks.ru/free_doc/new_site/perepis2010/croc/perepis_itogi1612.htm
(C_{50} = 0,5 cdot (0,061 + 0,045) = 0,053)
(n cdot sum_{x = 15}^{50}{_{n}^{}C}_{x} = 5 cdot (0,983 + 0,775 + 0,403 + 0,211 + 0,130 + 0,082 + 0,061) = 5 cdot 2,645 = 13,225)
(SMAM = 15 + frac{13,225 – 35 cdot 0,053}{1 – 0,053} = 27,006) лет
Примеры решений задач по статистике
Решение задач по статистике и выводы к ним
Задача по статистике №1. Найти параметры интервального ряда распределения по данным таблицы, а именно: моду, медиану, среднюю арифметическую величину, среднюю взвешенную величину, коэффициент вариации, среднее квадратическое отклонение.
№ группы |
Группы компаний по основным производственным фондам, млн. руб. (х) |
Число компаний (fi) |
Середина интервала (Xi) = (начало интервала+конец интервала)/2 |
1 |
10 – 25 |
2 |
17,5 |
2 |
25 – 33 |
8 |
29 |
3 |
33 – 42 |
14 |
37,5 |
4 |
42 – 49 |
9 |
45,5 |
5 |
49 – 62 |
3 |
55,5 |
Всего: |
36 |
— |
Мы сразу добавили столбец «середина интервала». Для первой группы компаний рассчитали следующим образом: (10+25)/2=17,5 млн. руб. Для 2-5 групп расчеты произведены аналогично.
Теперь рассчитаем среднюю арифметическую величину.
средняя арифметическая = = (17,5+29+37,5+45,5+55,5)/5=37 млн. руб.
Далее рассчитаем среднюю взвешенную величину.
средняя взвешенная = = (17,5*2+29*8+37,5*14+45,5*9+55,5*3)/36=38 млн. руб.
Значение средневзвешенной величины можно считать более корректным, чем значение средней арифметической величины, поэтому далее в расчетах будем использовать среднюю взвешенную.
Теперь добавим в таблицу столбцы, данные которых нам понадобятся для расчета дисперсии.
Число компаний (f) |
Середина интервала (Xi) = (начало интервала+конец интервала)/2 |
Xi*fi |
|
|
|
2 |
17,5 |
35 |
-20,5 |
420,25 |
840,5 |
8 |
29 |
232 |
-9 |
81 |
648 |
14 |
37,5 |
525 |
-0,5 |
0,25 |
3,5 |
9 |
45,5 |
409,5 |
7,5 |
56,25 |
506,25 |
3 |
55,5 |
166,5 |
17,5 |
306,25 |
918,75 |
Итого: 36 |
— |
1368 |
— |
— |
2917 |
Рассчитаем дисперсию.
=2917/36=81,03. (дисперсия не имеет размерности)
Среднеквадратическое отклонение рассчитывается как корень квадратный из дисперсии.
=9 (млн. руб.).
Рассчитаем коэффициент вариации по формуле:
=(9/38)*100%=23,68%.
Рассчитаем моду и медиану.
Найдем моду по формуле.
Модальный интервал находим по наибольшей частоте. Наибольшая частота, т.е. частота модального интервала fМо=14. Модальный интервал от 33 до 42 млн. руб. Значит величина модального интервала i = 42-33=9.
Нижняя граница модального интервала равна 33.
Частота предмодального интервала равна 8.
Частота постмодального интервала равна 9.
Мода будет равна = 33 + 9*((14-8)/(14-8+14-9))=37,9 млн. руб.
Найдем медиану по формуле.
Медианный интервал находим по накопленной частоте. Суммируются f частоты, пока не достигается значение, превышающее середину совокупности (36/2=18 млн. руб.).
Группы компаний по основным производственным фондам, млн. руб. (х) |
Число компаний (f) |
Накопленная частота S |
10 – 25 |
2 |
2 |
25 – 33 |
8 |
10 |
33 – 42 |
14 |
24 |
42 – 49 |
9 |
33 |
49 – 62 |
3 |
36 |
Таким образом, медианный интервал от 33 до 42 млн. руб. Значит величина медианного интервала i = 42-33=9.
Частота медианного интервала fМе=14.
Нижняя граница медианного интервала равна 33.
Накопленная частота предмедианного интервала равна 10.
Медиана будет равна = 33 + 9*((36/2-10)/(14))=38,14 млн. руб.
Расчеты по теме “индексы”
Пример по выборке.
Задача по группировке.
Решение задачи по расчету средней.
Задача по кореляционному анализу
Контрольные и курсовые работы по общей теории статистики и экономической статистике по этим и другим темам представлены в соответствующем разделе сайта.