Как найти среднюю частоту в статистике

Продолжаем изучать элементарные задачи по математике. Сегодня мы поговорим о статистике.

Статистика — это раздел математики в котором изучаются вопросы сбора, измерения и анализа информации, представленной в числовой форме. Происходит слово статистика от латинского слова status (состояние или положение дел).

Так, с помощью статистики мы можем узнать свое положение дел, касающихся финансов. С начала месяца можно вести дневник расходов и по окончании месяца, воспользовавшись статистикой, узнать сколько денег в среднем мы тратили каждый день или какая потраченная сумма была наибольшей в этом месяце либо узнать какую сумму мы тратили наиболее часто.

На основе этой информации можно провести анализ и сделать определенные выводы: следует ли в следующем месяце немного сбавить аппетит, чтобы тратить меньше денег, либо наоборот позволить себе не только хлеб с водой, но и колбасу.

Выборка. Объем. Размах

Что такое выборка? Если говорить простым языком, то это отобранная нами информация для исследования. Например, мы можем сформировать следующую выборку — суммы денег, потраченных в каждый из шести дней. Давайте нарисуем таблицу в которую занесем расходы за шесть дней

расходы за шесть дней статистика рисунок 1

Выборка состоит из n-элементов. Вместо переменной n может стоять любое число. У нас имеется шесть элементов, поэтому переменная n равна 6

n = 6

Элементы выборки обозначаются с помощью переменных с индексами икс 1 икс 2 икс n. Последний икс n элемент является шестым элементом выборки, поэтому вместо n будет стоять число 6.

расходы за шесть дней статистика рисунок 2

Обозначим элементы нашей выборки через переменные икс 1 икс 2 икс n

Количество элементов выборки называют объемом выборки. В нашем случае объем равен шести.

Размахом выборки называют разницу между самым большим и маленьким элементом выборки.

В нашем случае, самым большим элементом выборки является элемент 250, а самым маленьким — элемент 150. Разница между ними равна 100

x max и xmin 250 и 150

размах равен 100 R 100


Среднее арифметическое

Понятие среднего значения часто используется в повседневной жизни.

Примеры:

  • средняя зарплата жителей страны;
  • средний балл учащихся;
  • средняя скорость движения;
  • средняя производительность труда.

Речь идет о среднем арифметическом — результате деления суммы элементов выборки на их количество.

Среднее арифметическое — это результат деления суммы элементов выборки на их количество.

формула нахождения среднего значения

Вернемся к нашему примеру

расходы за шесть дней статистика рисунок 2

Узнаем сколько в среднем мы тратили в каждом из шести дней:

расходы за шесть дней статистика рисунок 3


Средняя скорость движения

При изучении задач на движение мы определяли скорость движения следующим образом: делили пройденное расстояние на время. Но тогда подразумевалось, что тело движется с постоянной скоростью, которая не менялась на протяжении всего пути.

В реальности, это происходит довольно редко или не происходит совсем. Тело, как правило, движется с различной скоростью.

Когда мы ездим на автомобиле или велосипеде, наша скорость часто меняется. Когда впереди нас помехи, нам приходиться сбавлять скорость. Когда же трасса свободна, мы ускоряемся. При этом за время нашего ускорения скорость изменяется несколько раз.

Речь идет о средней скорости движения. Чтобы её определить нужно сложить скорости движения, которые были в каждом часе/минуте/секунде и результат разделить на время движения.

Задача 1. Автомобиль первые 3 часа двигался со скоростью 66,2 км/ч, а следующие 2 часа — со скоростью 78,4 км/ч. С какой средней скоростью он ехал?

средняя скорость движения рисунок 1

Сложим скорости, которые были у автомобиля в каждом часе и разделим на время движения (5ч)

нахождение средней скорости движения задача 1

Значит автомобиль ехал со средней скоростью 71,08 км/ч.

Определять среднюю скорость можно и по другому — сначала найти расстояния, пройденные с одной скоростью, затем сложить эти расстояния и результат разделить на время. На рисунке видно, что первые три часа скорость у автомобиля не менялась. Тогда можно найти расстояние, пройденное за три часа:

66,2 × 3 = 198,6 км.

Аналогично можно определить расстояние, которое было пройдено со скоростью 78,4 км/ч. В задаче сказано, что с такой скоростью автомобиль двигался 2 часа:

78,4 × 2 = 156,8 км.

Сложим эти расстояния и результат разделим на 5

нахождение средней скорости движения задача 1 второй способ


Задача 2. Велосипедист за первый час проехал 12,6 км, а в следующие 2 часа он ехал со скоростью 13,5 км/ч. Определить среднюю скорость велосипедиста.

нахождение средней скорости движения задача 2

Скорость велосипедиста в первый час составляла 12,6 км/ч. Во второй и третий час он ехал со скоростью 13,5. Определим среднюю скорость движения велосипедиста:

нахождение средней скорости движения задача 2 рисунок 2


Мода и медиана

Модой называют элемент, который встречается в выборке чаще других.

Рассмотрим следующую выборку: шестеро спортсменов, а также время в секундах за которое они пробегают 100 метров

таблица для определения моды рисунок 1

Элемент 14 встречается в выборке чаще других, поэтому элемент 14 назовем модой.

Рассмотрим еще одну выборку. Тех же спортсменов, а также смартфоны, которые им принадлежат

выборка люди и смартфоны

Элемент iphone встречается в выборке чаще других, значит элемент iphone является модой. Говоря простым языком, носить iphone модно.

Конечно элементы выборки в этот раз выражены не числами, а другими объектами (смартфонами), но для общего представления о моде этот пример вполне приемлем.


Рассмотрим следующую выборку: семеро спортсменов, а также их рост в сантиметрах:

таблица для определения медианы рисунок 1

Упорядочим данные в таблице так, чтобы рост спортсменов шел по возрастанию. Другими словами, построим спортсменов по росту:

таблица для определения медианы рисунок 2

Выпишем рост спортсменов отдельно:

180, 182, 183, 184, 185, 188, 190

В получившейся выборке 7 элементов. Посередине этой выборки располагается элемент 184. Слева и справа от него по три элемента. Такой элемент как 184 называют медианой упорядоченной выборки.

Медианой упорядоченной выборки называют элемент, располагающийся посередине.

Отметим, что данное определение справедливо в случае, если количество элементов упорядоченной выборки является нечётным.

В рассмотренном выше примере, количество элементов упорядоченной выборки было нечётным. Это позволило нам быстро указать медиану

рост семерых спортсменов рисунок 1

Но возможны случаи, когда количество элементов выборки чётно.

К примеру, рассмотрим выборку в которой не семеро спортсменов, а шестеро:

таблица для определения медианы рисунок 3

Построим этих шестерых спортсменов по росту:

таблица для определения медианы рисунок 4

Выпишем рост спортсменов отдельно:

180, 182, 184, 186, 188, 190

В данной выборке не получается указать элемент, который находился бы посередине. Если указать элемент 184 как медиану, то слева от этого элемента будут располагаться два элемента, а справа — три. Если как медиану указать элемент 186, то слева от этого элемента будут располагаться три элемента, а справа — два.

В таких случаях для определения медианы выборки, нужно взять два элемента выборки, находящихся посередине и найти их среднее арифметическое. Полученный результат будет являться медианой.

Вернемся к нашим спортсменам. В упорядоченной выборке 180, 182, 184, 186, 188, 190 посередине располагаются элементы 184 и 186

рост шестерых спортсменов рисунок 2

Найдем среднее арифметическое элементов 184 и 186

средняя арифметическое чисел 184 и 186

Элемент 185 является медианой выборки, несмотря на то, что этот элемент не является членом исходной и упорядоченной выборки. Спортсмена с ростом 185 нет среди остальных спортсменов. Рост в 185 см используется в данном случае для статистики, чтобы можно было сказать о том, что срединный рост спортсменов составляет 185 см.

Поэтому более точное определение медианы зависит от количества элементов в выборке.

Если количество элементов упорядоченной выборки нечётно, то медианой выборки называют элемент, располагающийся посередине.

Если количество элементов упорядоченной выборки чётно, то медианой выборки называют среднее арифметическое двух чисел, располагающихся посередине этой выборки.

Медиана и среднее арифметическое по сути являются «близкими родственниками», поскольку и то и другое используют для определения среднего значения. Например, для предыдущей упорядоченной выборки 180, 182, 184, 186, 188, 190 мы определили медиану, равную 185. Этот же результат можно получить путем определения среднего арифметического элементов 180, 182, 184, 186, 188, 190

среднее ариф для 180 182 184 186 188 190

Но медиана в некоторых случаях отражает более реальную ситуацию. Например, рассмотрим следующий пример:

Было подсчитано количество имеющихся очков у каждого спортсмена. В результате получилась следующая выборка:

0, 1, 1, 1, 2, 1, 2, 3, 5, 4, 5, 0, 1, 6, 1

Определим среднее арифметическое для данной выборки — получим значение 2,2

среднее ариф для 011121235450161

По данному значению можно сказать, что в среднем у спортсменов 2,2 очка

Теперь определим медиану для этой же выборки. Упорядочим элементы выборки и укажем элемент, находящийся посередине:

0, 0, 1, 1, 1, 1, 1, 1, 2, 2, 3, 4, 5, 5, 6

В данном примере медиана лучше отражает реальную ситуацию, поскольку половина спортсменов имеет не более одного очка.


Частота

Частота это число, которое показывает сколько раз в выборке встречается тот или иной элемент.

Предположим, что в школе проходят соревнования по подтягиваниям. В соревнованиях участвует 36 школьников. Составим таблицу в которую будем заносить число подтягиваний, а также число участников, которые выполнили столько подтягиваний.

таблица для определения частоты рисунок 1

По таблице можно узнать сколько человек выполнило 5, 10 или 15 подтягиваний. Так, 5 подтягиваний выполнили четыре человека, 10 подтягиваний выполнили восемь человек, 15 подтягиваний выполнили три человека.

Количество человек, повторяющих одно и то же число подтягиваний в данном случае являются частотой. Поэтому вторую строку таблицы переименуем в название «частота»:

таблица для определения частоты рисунок 2

Такие таблицы называют таблицами частот.

Частота обладает следующим свойством: сумма частот равна общему числу данных в выборке.

Это означает, что сумма частот равна общему числу школьников, участвующих в соревнованиях, то есть тридцати шести. Проверим так ли это. Сложим частоты, приведенные в таблице:

4 + 5 + 10 + 8 + 6 + 3 = 36


Относительная частота

Относительная частота это в принципе та же самая частота, которая была рассмотрена ранее, но только выраженная в процентах.

Относительная частота равна отношению частоты на общее число элементов выборки.

Вернемся к нашей таблице:

таблица для определения частоты рисунок 2

Пять подтягиваний выполнили 4 человека из 36. Шесть подтягиваний выполнили 5 человек из 36. Восемь подтягиваний выполнили 10 человек из 36 и так далее. Давайте заполним таблицу с помощью таких отношений:

таблица для определения частоты рисунок 3

Выполним деление в этих дробях:

таблица для определения частоты рисунок 4

Выразим эти частоты в процентах. Для этого умножим их на 100. Умножение на 100 удобно выполнить передвижением запятой на две цифры вправо:

таблица для определения частоты рисунок 5

Теперь можно сказать, что пять подтягиваний выполнили 11% участников, 6 подтягиваний выполнили 14% участников, 8 подтягиваний выполнили 28% участников и так далее.


Понравился урок?
Вступай в нашу новую группу Вконтакте и начни получать уведомления о новых уроках

Возникло желание поддержать проект?
Используй кнопку ниже


Как рассчитать среднее значение из таблицы частот (с примерами)

  • Редакция Кодкампа

17 авг. 2022 г.
читать 2 мин


Вы можете рассчитать среднее значение таблицы частот, используя следующую формулу:

Среднее значение = Σfx / Σf

куда:

  • Σ : причудливый символ, означающий «сумма».
  • f : Частота определенного значения
  • x : Значение в таблице частот

Следующие примеры показывают, как использовать эту формулу на практике.

Пример 1: Среднее количество побед

В следующей таблице частоты показано общее количество побед 30 футбольных команд в определенной лиге:

Мы можем использовать следующую формулу для расчета среднего количества побед:

  • Среднее = (0*2 + 1*3 + 2*7 + 3*8 + 4*7 + 5*3) / (2 + 3 + 7 + 8 + 7 + 3)
  • Среднее = (0 + 3 + 14 + 24 + 28 + 15) / (30)
  • Среднее = (84) / (30)
  • Среднее = 2,8

Среднее количество побед — 2,8 .

Пример 2: Среднее количество домашних животных

Следующая таблица частот показывает общее количество домашних животных, принадлежащих 20 различным семьям в определенном районе:

Мы можем использовать следующую формулу для расчета среднего количества домашних животных в собственности:

  • Среднее = (0*2 + 1*10 + 2*4 + 3*3 + 4*1) / (2 + 10 + 4 + 3 + 1)
  • Среднее значение = (0 + 10 + 8 + 9 + 4) / (20)
  • Среднее = (31) / (20)
  • Среднее = 1,55

Среднее количество домашних животных в собственности составляет 1,55 .

Пример 3: средний размер домохозяйства

В следующей таблице частот показан размер домохозяйства 40 различных домохозяйств в определенном районе:

Мы можем использовать следующую формулу для расчета среднего размера домохозяйства:

  • Среднее = (1*2 + 2*4 + 3*14 + 4*13 + 5*4 + 6*2 + 7*1) / (2 + 4 + 14 + 13 + 4 + 2+1)
  • Среднее значение = (2 + 8 + 42 + 52 + 20 + 12 + 7) / (40)
  • Среднее = (143) / (40)
  • Среднее значение = 3,575

Средний размер домохозяйства составляет 3,575 человек .

Дополнительные ресурсы

Как рассчитать медиану из таблицы частот
Как рассчитать моду из таблицы частот
Как найти среднее значение, медиану и моду в диаграммах «стебель-и-листья»
Как оценить среднее значение и медиану гистограмм
Когда использовать среднее значение против медианы

Написано

Редакция Кодкампа

Замечательно! Вы успешно подписались.

Добро пожаловать обратно! Вы успешно вошли

Вы успешно подписались на кодкамп.

Срок действия вашей ссылки истек.

Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.

Успех! Ваша платежная информация обновлена.

Ваша платежная информация не была обновлена.

Мода и медиана

Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду.

Обратимся снова к нашему примеру со сборной по футболу:

Чему в данном примере равна мода? Какое число наиболее часто встречается в этой выборке?

Все верно, это число ( displaystyle 181), так как два игрока имеют рост ( displaystyle 181) см; рост же остальных игроков не повторяется.

Тут все должно быть ясно и понятно, да и слово знакомое, правда?

Перейдем к медиане, ты ее должен знать из курса геометрии. Но мне не сложно напомнить, что в геометрии медиана (в переводе с латинского- «средняя») — отрезок внутри треугольника, соединяющий вершину треугольника с серединой противоположной стороны.

Ключевое слово – СЕРЕДИНА. Если ты знал это определение, то тебе легко будет запомнить, что такое медиана в статистике.

Медианой ряда чисел с нечетным числом членов называется число, которое окажется посередине, если этот ряд упорядочить (проранжировать, т.е. расположить значения в порядке убывания или возрастания).

Медианой ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине, если этот ряд упорядочить.

Ну что, вернемся к нашей выборке футболистов?

Ты заметил в определении медианы важный момент, который нам еще здесь не встречался? Конечно, «если этот ряд упорядочить»!

Для того, чтобы в ряду чисел был порядок, можно расположить значения роста футболистов как в порядке убывания, так и в порядке возрастания. Мне удобней выстроить этот ряд в порядке возрастания (от самого маленького к самому большому).

Вот, что у меня получилось:

Так, ряд упорядочили, какой еще есть важный момент в определении медианы? Правильно, четное и нечетное количество членов в выборке.

Заметил, что для четного и нечетного количества даже определения отличаются? Да, ты прав, не заметить – сложно. А раз так, то нам надо определиться, четное у нас количество игроков в нашей выборке или нечетное?

Все верно – игроков ( displaystyle 11), значит, количество нечетное! Теперь можем применять к нашей выборке менее заковыристое определение медианы для нечетного количества членов в выборке.

Ищем число, которое оказалось посередине в нашем упорядоченном ряду:

Ну вот, чисел у нас ( displaystyle 11), значит, по краям остается по пять чисел, а рост ( displaystyle 183) см будет медианой в нашей выборке.

Не так уж и сложно, правда?

Частота и относительная частота

Частота представляет собой число повторений, сколько раз за какой-то период происходило некоторое событие, проявлялось определенное свойство объекта либо наблюдаемый параметр достигал данной величины.

То есть частота определяет то, как часто повторяется та или иная величина в выборке.

Разберемся на нашем примере с футболистами. Перед нами вот такой вот упорядоченный ряд:

Частота – это число повторений какой-либо величины параметра. В нашем случае, это можно считать вот так. Сколько игроков имеет рост ( 176)?

Все верно, один игрок. Таким образом, частота встречи игрока с ростом ( 176) в нашей выборке равна ( 1).

Сколько игроков имеет рост ( 178)? Да, опять же один игрок. Частота встречи игрока с ростом ( 178) в нашей выборке равна ( 1).

Задавая такие вопросы и отвечая на них, можно составить вот такую табличку:

Ну вот, все довольно просто. Помни, что сумма частот должна равняться количеству элементов в выборке (объему выборки).

То есть в нашем примере: ( 1+1+1+2+1+1+1+1+1+1=11)

Перейдем к следующей характеристике – относительная частота.

Относительная частота – это отношение частоты к общему числу данных в ряду. Как правило, относительная частота выражается в процентах.

Обратимся опять к нашему примеру с футболистами. Частоты для каждого значения мы рассчитали, общее количество данных в ряду мы тоже знаем ( left( n=11 right)) .

Рассчитываем относительную частоту для каждого значения роста и получаем вот такую табличку:

А теперь сам составь таблицы частот и относительных частот для примера с 9-классниками, решающими задачи.


Загрузить PDF


Загрузить PDF

С абсолютной частотой все довольно просто: она определяет, сколько раз конкретное число содержится в имеющемся наборе данных (объектов или значений). А вот относительная частота характеризует отношение количества конкретного числа в наборе данных. Другими словами, относительная частота – это отношение количества определенного числа к общему количеству чисел в наборе данных. Имейте в виду, что вычислить относительную частоту достаточно легко.

  1. Изображение с названием Calculate Relative Frequency Step 1

    1

    Соберите данные. Если вы решаете математическую задачу, в ее условии должен быть дан набор данных (чисел). В противном случае проведите эксперимент или исследование и соберите необходимые данные. Подумайте, в какой форме записать исходные данные.

    • Например, нужно собрать данные о возрасте людей, которые посмотрели определенный фильм. Конечно, можно записать точный возраст каждого человека, но в этом случае вы получите довольно большой набор данных с 60-70 числами в пределах от 10 до 70 или 80. Поэтому лучше сгруппировать данные по категориям, таким как «Моложе 20», «20-29», «30-39» «40-49», «50-59» и «Старше 60». Получится упорядоченный набор данных с шестью группами чисел.
    • Другой пример: врач собирает данные о температуре пациентов в определенный день. Если записать округленные числа, например, 37, 38, 39, то результат будет не слишком точным, поэтому здесь данные нужно представить в виде десятичных дробей.
  2. Изображение с названием Calculate Relative Frequency Step 2

    2

    Упорядочьте данные. Когда вы соберете данные, у вас, скорее всего, получится хаотичный набор чисел, например, такой: 1, 2, 5, 4, 6, 4, 3, 7, 1, 5, 6, 5, 3, 4, 5, 1. Такая запись кажется практически бессмысленной и с ней сложно работать. Поэтому упорядочьте числа по возрастанию (от меньшего к большему), например, так: 1,1,1,2,3,3,4,4,4,5,5,5,5,6,6,7.[1]

    • Упорядочивая данные, будьте внимательны, чтобы не пропустить ни одного числа. Посчитайте общее количество чисел в наборе данных, чтобы убедиться, что вы записали все числа.
  3. Изображение с названием Calculate Relative Frequency Step 3

    3

    Создайте таблицу с данными. Собранные данные можно организовать в виде таблицы. Такая таблица будет включать три столбца и использоваться для вычисления относительной частоты. Столбцы обозначьте следующим образом:[2]

    Реклама

  1. Изображение с названием Calculate Relative Frequency Step 5

    1

    Найдите количество чисел в наборе данных. Относительная частота характеризует, сколько раз конкретное число содержится в имеющемся наборе данных по отношению к общему количеству чисел. Чтобы найти относительную частоту, нужно посчитать общее количество чисел в наборе данных. Общее количество чисел станет знаменателем дроби, с помощью которой будет вычислена относительная частота.[3]

    • В нашем примере набор данных содержит 16 чисел.
  2. Изображение с названием Calculate Relative Frequency Step 5

    2

    Найдите количество определенного числа. То есть посчитайте, сколько раз конкретное число встречается в наборе данных. Это можно сделать как для одного числа, так и для всех чисел из набора данных.[4]

    • Например, в нашем примере число 4 встречается в наборе данных три раза.
  3. Изображение с названием Calculate Relative Frequency Step 6

    3

    Разделите количество конкретного числа на общее количество чисел. Так вы найдете относительную частоту для определенного числа. Вычисление можно представить в виде дроби или воспользоваться калькулятором или электронной таблицей, чтобы разделить два числа.[5]

    Реклама

  1. Изображение с названием Calculate Relative Frequency Step 7

    1

    Результаты вычислений запишите в созданную ранее таблицу. Она позволит представить результаты в наглядной форме. По мере вычисления относительной частоты результаты записывайте в таблицу напротив соответствующего числа. Как правило, значение относительной частоты можно округлить до второго знака после десятичной запятой, но это на ваше усмотрение (в зависимости от требований задачи или исследования). Помните, что округленный результат не равен точному ответу.[6]

    • В нашем примере таблица относительных частот будет выглядеть следующим образом:
    • x : n(x) : P(x)
    • 1 : 3 : 0,19
    • 2 : 1 : 0,06
    • 3 : 2 : 0,13
    • 4 : 3 : 0,19
    • 5 : 4 : 0,25
    • 6 : 2 : 0,13
    • 7 : 1 : 0,06
    • Итого : 16 : 1,01
  2. Изображение с названием Calculate Relative Frequency Step 8

    2

    Представьте числа (элементы), которых нет в наборе данных. Иногда представление чисел с нулевой частотой так же важно, как и представление чисел с ненулевой частотой. Обратите внимание на собранные данные; если между данными имеются пробелы, их нужно заполнить нулями.

    • В нашем примере набор данных включает все числа от 1 до 7. Но предположим, что числа 3 нет в наборе. Возможно, это немаловажный факт, поэтому нужно записать, что относительная частота числа 3 равна 0.
  3. Изображение с названием Calculate Relative Frequency Step 9

    3

    Выразите результаты в процентах. Иногда результаты вычислений нужно преобразовать из десятичных дробей в проценты. Это общепринятая практика, потому что относительная частота характеризует процент случаев появления определенного числа в наборе данных. Чтобы преобразовать десятичную дробь в проценты, нужно десятичную запятую передвинуть на две позиции вправо и приписать символ процента.

    • Например, десятичная дробь 0,13 равна 13%.
    • Десятичная дробь 0,06 равна 6% (обратите внимание, что перед 6 стоит 0).

    Реклама

Советы

  • Относительная частота характеризует наличие или возникновение определенного события в наборе событий.
  • Если сложить относительные частоты всех чисел из набора данных, вы получите единицу. Помните, что при сложении округленных результатов сумма не будет равна 1,0.
  • Если набор данных слишком большой, чтобы обработать его вручную, воспользуйтесь программой MS Excel или MATLAB; это позволит избежать ошибок в процессе вычисления.

Реклама

Источники

Об этой статье

Эту страницу просматривали 144 126 раз.

Была ли эта статья полезной?

  1. Пользуясь формулой, вычисляем накопленные частоты интервалов. В частности,

;

;

;

.

  1. Вычисляем частости
    интервалов. Например,

;
;
.

  1. Вычисляем
    накопленные частости интервалов.

  2. Данные вычислений
    заносим в табл. 2

Таблица 2

интервала

Границы
интервала

Частота

Накопленная
частота

Частость

Накопленная
частость

1

5

7

3

3

0,06

0,06

2

7

9

9

12

0,18

0,24

3

9

11

17

29

0,34

0,58

4

11

13

10

39

0,20

0,78

5

13

15

7

46

0,14

0,92

6

15

17

4

50

0,08

1

Распределение
типа сведенного в табл. 2 представляет
собой интервальный
вариационный ряд
.

Анализ вариационных
рядов упрощается при их графическом
представлении. Наряду с гистограммой
и полигоном частот можно построить
полигон
накопленных частостей (кумулята)

График получается
при соединении точек прямыми отрезками.
Координаты точек соответствуют верхним
границам интервалов
и
накопленным частотам. Если по оси ординат
откладывать накопленные частости, то
полученный график называется полигоном
накопленных частостей
.
Если ряд не интервальный, то по оси

откладывают значения измеряемого
признака, а по оси


соответствующие накопленные частоты
или частости. На рис.2 изображен полигон
накопленных частостей для примера 3.

На
практике соседние точки чаще всего
соединяют кривыми линиями (рис. 3).

1 .3. Статистические характеристики вариационного ряда

Для
полноты картины анализа выборки
рассматривают статистические
характеристики

вариационного ряда. С этой целью оценивают
следующие качества ряда:

  • центральную
    тенденцию выборки;

  • вариацию.

Центральную
тенденцию выборки оценивают такими
статистическими характеристиками, как

  • мода;

  • медиана;

  • среднее
    арифметическое значение.

К
характеристикам вариации относят:

  • размах;

  • дисперсию;

  • среднее
    квадратическое отклонение;

  • коэффициент
    вариации;

  • ошибку
    выборочного среднего.

Модой
называется значение признака, наиболее
часто встречающееся в выборке. Мода
обозначается
.
Если значения выборки сгруппированы в
интервальный вариационный ряд, то
выбирается модальный
интервал
с
наибольшей частотой.

Медиана

это такое значение признака, при котором
одна половина значений признака меньше
ее, а другая половина 
больше (медиана делит вариационный ряд
пополам). Медиана обозначается
.
Для отыскания медианы выборку ранжируют,
то есть значения признака располагают
в порядке возрастания или убывания. В
ранжированной выборке ранг (порядковый
номер в выборке)

медианы определяют по формуле:

, где


объем выборки.

При

нечетном ранг


целое число, и медианой считают следующее
значение:
.
При

четном ранг


число не целое, представимое в виде
,
где


целое. В таком случае медианой считают
значение
.

Среднее
арифметическое
неупорядоченной
выборки вычисляют по формуле:

.

В случае интервального
вариационного ряда формула приобретает
вид:
,
где


частота
-го
интервала,


среднее арифметическое значение этого
интервала.

Размах вариации
– это разность
между максимальным и минимальным
значениями выборки:

.

Дисперсией
называется
средний квадрат отклонений значений
признака от среднего арифметического
и вычисляется по формуле:

.

Средним
квадратическим отклонением
называется
положительный квадратный корень из
дисперсии:

,

Среднее квадратическое
отклонение имеет ту же единицу измерения,
что и варьирующий признак. Оно характеризует
степень отклонения значений признака
от его среднего арифметического значения
в абсолютных единицах.

Для
сравнения варьируемости двух или
нескольких выборок, имеющих разные
единицы измерения, используют коэффициент
вариации. Коэффициент
вариации

это относительный показатель, равный
отношению среднего квадратического
отклонения к среднему арифметическому
значению:

.

Принято
считать, что если
,
то варьируемость малая,


средняя,


большая.

Отклонения
выборочных коэффициентов от параметров
в генеральной совокупности называются
ошибками
параметров. Эти ошибки возникают в силу
того, что выборочная совокупность
представляет генеральную совокупность
только приближенно. Если взять несколько
вариантов выборок объемом

из одной и той же генеральной совокупности
и вычислить для каждой из них среднее
арифметическое, то окажется, что средние
арифметические выборок варьируют вокруг
среднего арифметического для генеральной
совокупности

в

раз меньше, чем отдельные варианты. На
этом основании в качестве стандартной
ошибки выборочного среднего

принимают величину

.

Чтобы
подчеркнуть точность оценки среднего
выборочного, его чаще всего записывают
в виде: .

Пример 4.
В качестве оценки силовой подготовки
учащихся 5 класса произведен тест на
количество подтягиваний на перекладине.

Данные теста
следующие: 9, 9, 10, 11, 8, 7, 10, 7, 9, 11, 7, 8, 9, 8, 9.

Требуется вычислить
моду, медиану, среднее арифметическое
значение, размах вариации, дисперсию,
среднее квадратическое отклонение,
коэффициент вариации и ошибку выборочного
среднего данной выборки.

Решение.
Непосредственным подсчетом убеждаемся,
что значение

встречается в выборке чаще других (5
раз), следовательно,
.

Для
вычисления медианы производим ранжировку
заданной выборки:

7, 7, 7, 8, 8, 8, 9, 9, 9, 9,
9, 10, 10, 11, 11

Объем выборки


число нечетное, поэтому ранг медианы
вычисляем по формуле:

,

то есть медианой
является 8-е значение выборки),
.

Среднее арифметическое
значение выборки находим, пользуясь
формулой:

Крайние значения
ряда) определяют минимальное и максимальное
значения выборки
,
.
Согласно определению, размах вариации
равен:

.

Для удобства
вычисления дисперсии составляем таблицу.
Пользуясь суммой значений последней
колонки и формулой, находим: .

1

9

0,2

0,04

2

9

0,2

0,04

3

10

1,2

1,44

4

11

2,2

4,84

5

8

-0,8

0,64

6

7

-1,8

3,24

7

10

1,2

1,44

8

7

-1,8

3,24

9

9

0,2

0,44

10

11

2,2

4,24

11

7

-1,8

3,24

12

8

-0,8

0,64

13

9

0,2

0,04

14

8

-0,8

0,64

15

9

0,2

0,04

132

24,4

Вычислим среднее
квадратическое отклонение:
.

Коэффициент
вариации:
,
откуда делаем вывод 
результаты тестирования имеют средний
коэффициент вариации.

Ошибку выборочного
среднего арифметического находим:
.

Наконец, записываем:
.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Добавить комментарий