Статистика как найти середину интервалов

Как найти середину интервала

При статистической обработке результатов исследований самого разного рода полученные значения часто группируются в последовательность интервалов. Для расчета обобщающих характеристик таких последовательностей иногда приходится вычислять середину интервала – «центральную варианту». Методы ее расчета достаточно просты, но имеют некоторые особенности, вытекающие как из используемой для измерения шкалы, так и из характера группировки (открытые или закрытые интервалы).

Как найти середину интервала

Инструкция

Если интервал является участком непрерывной числовой последовательности, то для нахождения ее середины используйте обычные математические методы вычисления среднеарифметического значения. Минимальное значение интервала (его начало) сложите с максимальным (окончанием) и разделите результат пополам – это один из способов вычисления среднеарифметического значения. Например, это правило применимо, когда речь идет о возрастных интервалах. Скажем, серединой возрастного интервала в диапазоне от 21 года до 33 лет будет отметка в 27 лет, так как (21+33)/2=27.

Иногда бывает удобнее использовать другой метод вычисления среднеарифметического значения между верхней и нижней границами интервала. В этом варианте сначала определите ширину диапазона – отнимите от максимального значения минимальное. Затем поделите полученную величину пополам и прибавьте результат к минимальному значению диапазона. Например, если нижняя граница соответствует значению 47,15, а верхняя – 79,13, то ширина диапазона составит 79,13-47,15=31,98. Тогда серединой интервала будет 63,14, так как 47,15+(31,98/2) = 47,15+15,99 = 63,14.

Если интервал не является участком обычной числовой последовательности, то вычисляйте его середину в соответствии с цикличностью и размерностью используемой измерительной шкалы. Например, если речь идет об историческом периоде, то серединой интервала будет являться определенная календарная дата. Так для интервала с 1 января 2012 года по 31 января 2012 серединой будет дата 16 января 2012.

Кроме обычных (закрытых) интервалов статистические методы исследований могут оперировать и «открытыми». У таких диапазонов одна из границ не определена. Например, открытый интервал может быть задан формулировкой «от 50 лет и старше». Середина в этом случае определяется методом аналогий – если все остальные диапазоны рассматриваемой последовательности имеют одинаковую ширину, то предполагается, что и этот открытый интервал имеет такую же размерность. В противном случае вам надо определить динамику изменения ширины интервалов, предшествующих открытому, и вывести его условную ширину, исходя из полученной тенденции изменения.

Источники:

  • что такое открытый интервал

Войти на сайт

или

Забыли пароль?
Еще не зарегистрированы?

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

Расчет средней величины в интервальном вариационном ряду

Расчет средней величины в интервальных вариационных рядах немного отличается от расчета в рядах дискретных. Как рассчитать среднюю арифметическую и среднюю гармоническую в дискретных рядах можно посмотреть вот ЗДЕСЬ. Такое различие вполне объяснимо – это связано с особенностью интервальных рядов, в которых изучаемый признак приведен в интервале от и до.

Итак, посмотрим особенности расчета на примере.

Пример 1. Имеются данные о дневном заработке рабочих предприятия.

Дневной заработок рабочего, руб. Число рабочих, чел.
500-1000 15
1000-1500 30
1500-2000 80
2000-2500 60
2500-3000 25
Итого 210

Нам необходимо рассчитать среднедневную заработную плату рабочего.

Начало решения задачи будет аналогичным правилам расчета средней величины, которые можно посмотреть в этой статье.

Начинаем мы с определения варианты и частоты, поскольку ищем мы средний заработок за день, то варианта это первая колонка, а частота вторая. Данные у нас заданы явным количеством, поэтому расчет проведем по формуле средней арифметической взвешенной (так как данные приведены в табличном виде). Но на этом сходства заканчиваются и появляются новые действия.

Дневной заработок рабочего, руб. х Число рабочих, чел. f
500-1000 15
1000-1500 30
1500-2000 80
2000-2500 60
2500-3000 25
Итого 210

Дело в том, что интервальный рад представляет осредняемую величину в виде интервала. 500-1000, 2000-2500 и так далее. Чтобы решить эту проблему необходимо провести промежуточные действия, и только потом подсчитать среднюю величину по основной формуле.

Что же требуется в данном случае сделать. Все достаточно просто, чтобы провести расчет нам нужно, чтобы варианта была представлена одним числом, а не интервалом. Для получения такого значения находят так называемое ЦЕНТРАЛЬНОЕ ЗНАЧЕНИЕ ИНТЕРВАЛА (или середину интервала). Определяется оно путем сложение верхней и нижней границ интервала и делением на два.

Проведем необходимые расчеты и подставим данные в таблицу.

Raschet srednej velichiny v intervalnom variatsionnom ryadu

И так далее по всем интервалам рассчитываем центральное значение. В итоге получаем следующие результаты.

Дневной заработок рабочего, руб. х Число рабочих, чел. f х’
500-1000 15 750
1000-1500 30 1250
1500-2000 80 1750
2000-2500 60 2250
2500-3000 25 2750
Итого 210

После того как мы рассчитали центральные значения далее проведем расчеты в таблицы и подставим итоговые данные в формулу, аналогично тому как мы уже рассматривали ранее.

Дневной заработок рабочего, руб. х Число рабочих, чел. f х’ x’f
500-1000 15 750 11250
1000-1500 30 1250 37500
1500-2000 80 1750 140000
2000-2500 60 2250 135000
2500-3000 25 2750 68750
Итого ∑f = 210 ∑ x’f = 392500

Raschet srednej velichiny v intervalnom variatsionnom ryadu2

В итоге получаем, что среднедневная заработная плата одного рабочего составляет 1869 рублей.

Nafanya

Это пример решения, если интервальный ряд представлен со всеми закрытыми интервалами. Но достаточно часто бывает, когда два интервала открытые, первый и последний. В таких ситуациях прямой расчет центрального значения невозможен, но есть два варианта как это сделать.

Пример 2. Имеются данные о продолжительности производственного стажа персонала предприятия. Рассчитать среднюю продолжительность стада одного сотрудника.

Длительность производственного стажа, лет Число сотрудников, человек
до 3 19
3-6 21
6-9 15
9-12 10
12 и более 5
Итого 70

В данном случае принцип решения останется точно таким же. Единственно, что поменялось в этой задаче, так это первый и последний интервалы. До 3 лет и 12 лет и более это и есть те самые открытые интервалы. Именно тут возникнет вопрос, а как же найти центральное значение интервала для таких интервалов.

Поступить в этой ситуации можно двумя способами:

Raschet srednej velichiny v intervalnom variatsionnom ryadu3

Средняя продолжительность стажа 5,83 года.

Raschet srednej velichiny v intervalnom variatsionnyh ryadah4

Средняя продолжительность стажа 6,13 года.

Домашнее задание

Теперь Вы умеете рассчитывать среднюю в интервальном вариационном ряду!

Источник

Решение задач по статистике и выводы к ним

Задача по статистике №1. Найти параметры интервального ряда распределения по данным таблицы, а именно: моду, медиану, среднюю арифметическую величину, среднюю взвешенную величину, коэффициент вариации, среднее квадратическое отклонение.

Группы компаний по основным производственным фондам, млн. руб. (х)

Середина интервала (Xi) = (начало интервала+конец интервала)/2

Мы сразу добавили столбец «середина интервала». Для первой группы компаний рассчитали следующим образом: (10+25)/2=17,5 млн. руб. Для 2-5 групп расчеты произведены аналогично.

Теперь рассчитаем среднюю арифметическую величину.

image002средняя арифметическая = image004= (17,5+29+37,5+45,5+55,5)/5=37 млн. руб.

Далее рассчитаем среднюю взвешенную величину.

image002средняя взвешенная = image006= (17,5*2+29*8+37,5*14+45,5*9+55,5*3)/36=38 млн. руб.

Значение средневзвешенной величины можно считать более корректным, чем значение средней арифметической величины, поэтому далее в расчетах будем использовать среднюю взвешенную.

Теперь добавим в таблицу столбцы, данные которых нам понадобятся для расчета дисперсии.

Середина интервала (Xi) = (начало интервала+конец интервала)/2

Источник

Примеры решений задач по статистике

Решение задач по статистике и выводы к ним

Задача по статистике №1. Найти параметры интервального ряда распределения по данным таблицы, а именно: моду, медиану, среднюю арифметическую величину, среднюю взвешенную величину, коэффициент вариации, среднее квадратическое отклонение.

№ группы

Группы компаний по основным производственным фондам, млн. руб. (х)

Число компаний (fi)

Середина интервала (Xi) = (начало интервала+конец интервала)/2

1

10 – 25

2

17,5

2

25 – 33

8

29

3

33 – 42

14

37,5

4

42 – 49

9

45,5

5

49 – 62

3

55,5

Всего:

36

Мы сразу добавили столбец «середина интервала». Для первой группы компаний рассчитали следующим образом: (10+25)/2=17,5 млн. руб. Для 2-5 групп расчеты произведены аналогично.

Теперь рассчитаем среднюю арифметическую величину.

средняя арифметическая = = (17,5+29+37,5+45,5+55,5)/5=37 млн. руб.

Далее рассчитаем среднюю взвешенную величину.

средняя взвешенная = = (17,5*2+29*8+37,5*14+45,5*9+55,5*3)/36=38 млн. руб.

Значение средневзвешенной величины можно считать более корректным, чем значение средней арифметической величины, поэтому далее в расчетах будем использовать среднюю взвешенную.

Теперь добавим в таблицу столбцы, данные которых нам понадобятся для расчета дисперсии.

Число компаний (f)

Середина интервала (Xi) = (начало интервала+конец интервала)/2

Xi*fi

2

17,5

35

-20,5

420,25

840,5

8

29

232

-9

81

648

14

37,5

525

-0,5

0,25

3,5

9

45,5

409,5

7,5

56,25

506,25

3

55,5

166,5

17,5

306,25

918,75

Итого: 36

1368

2917

Рассчитаем дисперсию.

=2917/36=81,03. (дисперсия не имеет размерности)

Среднеквадратическое отклонение рассчитывается как корень квадратный из дисперсии.

=9 (млн. руб.).

Рассчитаем коэффициент вариации по формуле:

=(9/38)*100%=23,68%.

Рассчитаем моду и медиану.

Найдем моду по формуле.

Модальный интервал находим по наибольшей частоте. Наибольшая частота, т.е. частота модального интервала fМо=14. Модальный интервал от 33 до 42 млн. руб. Значит величина модального интервала i = 42-33=9.

Нижняя граница модального интервала равна 33.

Частота предмодального интервала равна 8.

Частота постмодального интервала равна 9.

Мода будет равна = 33 + 9*((14-8)/(14-8+14-9))=37,9 млн. руб.

Найдем медиану по формуле.

Медианный интервал находим по накопленной частоте. Суммируются f частоты, пока не достигается значение, превышающее середину совокупности (36/2=18 млн. руб.).

Группы компаний по основным производственным фондам, млн. руб. (х)

Число компаний (f)

Накопленная частота S

10 – 25

2

2

25 – 33

8

10

33 – 42

14

24

42 – 49

9

33

49 – 62

3

36

Таким образом, медианный интервал от 33 до 42 млн. руб. Значит величина медианного интервала i = 42-33=9.

Частота медианного интервала fМе=14.

Нижняя граница медианного интервала равна 33.

Накопленная частота предмедианного интервала равна 10.

Медиана будет равна = 33 + 9*((36/2-10)/(14))=38,14 млн. руб.

Расчеты по теме “индексы”

Пример по выборке.

Задача по группировке.

Решение задачи по расчету средней.

Задача по кореляционному анализу

Контрольные и курсовые работы по общей теории статистики и экономической статистике по этим и другим темам представлены в соответствующем разделе сайта.

По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города:

Размер вклада, руб. До 400 400 – 600 600 – 800 800 – 1000 Свыше 1000
Число вкладчиков 32 56 120 104 88

Определите:

1) размах вариации;

2) средний размер вклада;

3) среднее линейное отклонение;

4) дисперсию;

5) среднее квадратическое отклонение;

6) коэффициент вариации вкладов.

Решение:

Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.

Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200.

Размер вклада, руб. 200 – 400 400 – 600 600 – 800 800 – 1000 1000 – 1200
Число вкладчиков 32 56 120 104 88

1) Определим размах вариации как разность между наибольшим и наименьшим значением признака:

Формула и расчёт размаха вариации

Размах вариации размера вклада равен 1000 рублей.

2) Средний размер вклада определим по формуле средней арифметической взвешенной.

Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов.

Среднее значение первого интервала будет равно:

Средняя арифметическая простая

второго – 500 и т. д.

Занесём результаты вычислений в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х xf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Итого 400 312000

Средний размер вклада в Сбербанке города будет равен 780 рублей:

Формула и расчёт средней арифметической взвешенной

3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:

 Формула среднего линейного отклонения

Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий:

1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2).

2. Определяются абсолютные отклонения вариант от средней:

Абсолютное отклонение варианта от средней

3. Полученные отклонения умножаются на частоты:

Взвешенные абсолютные отклонения

4. Находится сумма взвешенных отклонений без учёта знака:

Сумма взвешенных абсолютных отклонений

5. Сумма взвешенных отклонений делится на сумму частот:

Отношение суммы взвешенных отклонений и суммы весов

Удобно пользоваться таблицей расчётных данных:

 Формула и расчёт среднего линейного отклонения

Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля.

4) Дисперсия – это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической.

Расчёт дисперсии в интервальных рядах распределения производится по формуле:

 Формула дисперсии

Порядок расчёта дисперсии в этом случае следующий:

1. Определяют среднюю арифметическую взвешенную, как показано в п. 2).

2. Находят отклонения вариант от средней:

Отклонение варианта от средней

3. Возводят в квадрат отклонения каждой варианты от средней:

Квадрат отклонений варианта от средней

4. Умножают квадраты отклонений на веса (частоты):

Произведение отклонения варианта от средей на частоту

5. Суммируют полученные произведения:

Сумма произведений отклонений варианта от средней на частоту

6. Полученная сумма делится на сумму весов (частот):

Формула дисперсии

Расчёты оформим в таблицу:

Формула и расчёт дисперсии

5) Среднее квадратическое отклонение размера вклада определяется как корень квадратный из дисперсии:

Расчёт среднего квадратического отклонения

6) Коэффициент вариации – это отношение среднего квадратического отклонения к средней арифметической:

 Формула и расчёт коэффициента вариации

По величине коэффициента вариации можно судить о степени вариации признаков совокупности. Чем больше его величина, тем больше разброс значений признаков вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна средняя.

Алгоритм построения интервального вариационного ряда с равными интервалами

  1. Определяем
    число интервалов (групп) вариационного
    ряда

Число
групп (интервалов)

приближенно определяется по формуле
Стерджесса:

m
= 1 + 3,322 × lg(n)

где n
– общее число единиц наблюдения (общее
количество элементов в совокупности и
т.д.), lg(n)
– десятичный логарифм от n.

Полученную
по
формуле Стерджесса величину округляют
обычно до целого большего
числа,
поскольку количество групп не может
быть дробным числом.

Если
ряд интервальный ряд с таким количеством
групп по каким-то критериям не устраивает,
то можно построить другой интервальный
ряд, округлив m
до
целого меньшего числа и выбрать из двух
рядов более подходящий.

Число
групп не должно быть больше 15.

Также
можно пользоваться следующей таблицей,
если совсем нет возможности вычислить
десятичный логарифм.

Объем выборки,
n

25-40

40-60

60-100

100-200

Больше 200

Число интервалов,
m

5-6

6-8

7-10

8-12

10-15

  1. Определяем
    ширину интервала

Ширина
интервала

для интервального вариационного ряда
с равными интервалами определяется по
формуле:

где
Xмакс
– максимальное из значений xi,
Xмин

минимальное из значений xi;
m
– число групп (интервалов).

Величину
интервала (
i)
обычно округляют до целого числа,

исключение составляют лишь случаи,
когда изучаются малейшие колебания
признака (например, при группировке
деталей по величине размера отклонений
от номинала, измеряемого в долях
миллиметра).

Часто
применяется следующее правило:

Количество
знаков
до запятой

Количество
знаков после запятой

Пример
ширины интервала по формуле

До
какого знака округляем

Пример
округленной ширины интервала

0

3

0,375

0,01

0,38

0

2

0,56

0,1

0,6

1

3

4,658

0,01

4,66

1

2

2,54

0,1

2,5

2

любое

12,54

1,0

13

3

любое

672,54

10,00

670

4

любое

3472,45

100,00

3500

и
т.д.

  1. Определяем
    границы интервалов

Нижнюю
границу

первого интервала

принимают равной минимальному значению
признака (чаще всего его предварительно
округляют до целого меньшего числа с
таким же разрядом как ширина интервала).
Например, хмин=
15, i=130,
хн
первого интервала = 10.

хн1
≈ хмин

Верхняя
граница

первого интервала соответствует значению
(Хmin
+ i).

Нижняя
граница второго интервала всегда равно
верхней границе первого интервала. Для
последующих групп границы определяются
аналогично, т е. последовательно
прибавляется величина интервала.

xвi
=
x
нi
+ i

xнi
= x
вi-1

  1. Определяем
    частоты интервалов.

Считаем,
сколько значений попало в каждый
интервал. При этом помним, что если
единица обладает значением признака,
равным величине верхней границы
интервала, то ее следует относить к
следующему интервалу.

  1. Строим
    интервальный ряд в виде таблицы.

  2. Определяем
    середины интервалов.

Для
дальнейшего анализа интервального ряда
понадобится выбрать значение признака
для каждого интервала. Это значение
признака будет общим для всех единиц
наблюдения, попавшим в этот интервал.
Т.е. отдельные элементы «теряют» свои
индивидуальные значения признака и им
присваивается одно общее значение
признака. Таким общим значением является
середина
интервала
,
которая обозначается x’i
.

Рассмотрим
на примере с ростом детей, как построить
интервальный ряд с равными интервалами.

Имеются
первоначальные данные.

 90,
91, 92, 93, 94, 95, 96, 97, 98, 99
,
 92,
93, 94, 95, 96, 98
,
100,
101, 102, 103, 104, 105, 106, 107, 108, 109
,
 100,
101, 102, 103, 104, 105, 106, 107, 108, 109
,
100,
101, 102, 104
,
 110,
112, 114, 116, 117, 120, 122, 123, 124, 129,

 110,
111, 113, 115, 116, 117, 121, 125, 126, 127
,
 110,
111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124,
125, 126, 127, 128, 129
,
 111,
113, 116, 127
,
123, 122,
130,
131, 132, 133, 134, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145,
146, 147, 148, 149, 150
,
131,
133, 135, 136, 138, 139, 140, 141, 142, 143, 145, 146, 147, 148

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #

    17.02.2016629.11 Кб140308126_71740_lekcii_upravlencheskie_resheniya.rtf

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Добавить комментарий