Загрузить PDF
Загрузить PDF
С абсолютной частотой все довольно просто: она определяет, сколько раз конкретное число содержится в имеющемся наборе данных (объектов или значений). А вот относительная частота характеризует отношение количества конкретного числа в наборе данных. Другими словами, относительная частота – это отношение количества определенного числа к общему количеству чисел в наборе данных. Имейте в виду, что вычислить относительную частоту достаточно легко.
-
1
Соберите данные. Если вы решаете математическую задачу, в ее условии должен быть дан набор данных (чисел). В противном случае проведите эксперимент или исследование и соберите необходимые данные. Подумайте, в какой форме записать исходные данные.
- Например, нужно собрать данные о возрасте людей, которые посмотрели определенный фильм. Конечно, можно записать точный возраст каждого человека, но в этом случае вы получите довольно большой набор данных с 60-70 числами в пределах от 10 до 70 или 80. Поэтому лучше сгруппировать данные по категориям, таким как «Моложе 20», «20-29», «30-39» «40-49», «50-59» и «Старше 60». Получится упорядоченный набор данных с шестью группами чисел.
- Другой пример: врач собирает данные о температуре пациентов в определенный день. Если записать округленные числа, например, 37, 38, 39, то результат будет не слишком точным, поэтому здесь данные нужно представить в виде десятичных дробей.
-
2
Упорядочьте данные. Когда вы соберете данные, у вас, скорее всего, получится хаотичный набор чисел, например, такой: 1, 2, 5, 4, 6, 4, 3, 7, 1, 5, 6, 5, 3, 4, 5, 1. Такая запись кажется практически бессмысленной и с ней сложно работать. Поэтому упорядочьте числа по возрастанию (от меньшего к большему), например, так: 1,1,1,2,3,3,4,4,4,5,5,5,5,6,6,7.[1]
- Упорядочивая данные, будьте внимательны, чтобы не пропустить ни одного числа. Посчитайте общее количество чисел в наборе данных, чтобы убедиться, что вы записали все числа.
-
3
Создайте таблицу с данными. Собранные данные можно организовать в виде таблицы. Такая таблица будет включать три столбца и использоваться для вычисления относительной частоты. Столбцы обозначьте следующим образом:[2]
Реклама
-
1
Найдите количество чисел в наборе данных. Относительная частота характеризует, сколько раз конкретное число содержится в имеющемся наборе данных по отношению к общему количеству чисел. Чтобы найти относительную частоту, нужно посчитать общее количество чисел в наборе данных. Общее количество чисел станет знаменателем дроби, с помощью которой будет вычислена относительная частота.[3]
- В нашем примере набор данных содержит 16 чисел.
-
2
Найдите количество определенного числа. То есть посчитайте, сколько раз конкретное число встречается в наборе данных. Это можно сделать как для одного числа, так и для всех чисел из набора данных.[4]
- Например, в нашем примере число встречается в наборе данных три раза.
-
3
Разделите количество конкретного числа на общее количество чисел. Так вы найдете относительную частоту для определенного числа. Вычисление можно представить в виде дроби или воспользоваться калькулятором или электронной таблицей, чтобы разделить два числа.[5]
Реклама
-
1
Результаты вычислений запишите в созданную ранее таблицу. Она позволит представить результаты в наглядной форме. По мере вычисления относительной частоты результаты записывайте в таблицу напротив соответствующего числа. Как правило, значение относительной частоты можно округлить до второго знака после десятичной запятой, но это на ваше усмотрение (в зависимости от требований задачи или исследования). Помните, что округленный результат не равен точному ответу.[6]
- В нашем примере таблица относительных частот будет выглядеть следующим образом:
- x : n(x) : P(x)
- 1 : 3 : 0,19
- 2 : 1 : 0,06
- 3 : 2 : 0,13
- 4 : 3 : 0,19
- 5 : 4 : 0,25
- 6 : 2 : 0,13
- 7 : 1 : 0,06
- Итого : 16 : 1,01
-
2
Представьте числа (элементы), которых нет в наборе данных. Иногда представление чисел с нулевой частотой так же важно, как и представление чисел с ненулевой частотой. Обратите внимание на собранные данные; если между данными имеются пробелы, их нужно заполнить нулями.
- В нашем примере набор данных включает все числа от 1 до 7. Но предположим, что числа 3 нет в наборе. Возможно, это немаловажный факт, поэтому нужно записать, что относительная частота числа 3 равна 0.
-
3
Выразите результаты в процентах. Иногда результаты вычислений нужно преобразовать из десятичных дробей в проценты. Это общепринятая практика, потому что относительная частота характеризует процент случаев появления определенного числа в наборе данных. Чтобы преобразовать десятичную дробь в проценты, нужно десятичную запятую передвинуть на две позиции вправо и приписать символ процента.
- Например, десятичная дробь 0,13 равна 13%.
- Десятичная дробь 0,06 равна 6% (обратите внимание, что перед 6 стоит 0).
Реклама
Советы
- Относительная частота характеризует наличие или возникновение определенного события в наборе событий.
- Если сложить относительные частоты всех чисел из набора данных, вы получите единицу. Помните, что при сложении округленных результатов сумма не будет равна 1,0.
- Если набор данных слишком большой, чтобы обработать его вручную, воспользуйтесь программой MS Excel или MATLAB; это позволит избежать ошибок в процессе вычисления.
Реклама
Источники
Об этой статье
Эту страницу просматривали 145 557 раз.
Была ли эта статья полезной?
Мода и медиана
Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду.
Обратимся снова к нашему примеру со сборной по футболу:
Чему в данном примере равна мода? Какое число наиболее часто встречается в этой выборке?
Все верно, это число ( displaystyle 181), так как два игрока имеют рост ( displaystyle 181) см; рост же остальных игроков не повторяется.
Тут все должно быть ясно и понятно, да и слово знакомое, правда?
Перейдем к медиане, ты ее должен знать из курса геометрии. Но мне не сложно напомнить, что в геометрии медиана (в переводе с латинского- «средняя») — отрезок внутри треугольника, соединяющий вершину треугольника с серединой противоположной стороны.
Ключевое слово – СЕРЕДИНА. Если ты знал это определение, то тебе легко будет запомнить, что такое медиана в статистике.
Медианой ряда чисел с нечетным числом членов называется число, которое окажется посередине, если этот ряд упорядочить (проранжировать, т.е. расположить значения в порядке убывания или возрастания).
Медианой ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине, если этот ряд упорядочить.
Ну что, вернемся к нашей выборке футболистов?
Ты заметил в определении медианы важный момент, который нам еще здесь не встречался? Конечно, «если этот ряд упорядочить»!
Для того, чтобы в ряду чисел был порядок, можно расположить значения роста футболистов как в порядке убывания, так и в порядке возрастания. Мне удобней выстроить этот ряд в порядке возрастания (от самого маленького к самому большому).
Вот, что у меня получилось:
Так, ряд упорядочили, какой еще есть важный момент в определении медианы? Правильно, четное и нечетное количество членов в выборке.
Заметил, что для четного и нечетного количества даже определения отличаются? Да, ты прав, не заметить – сложно. А раз так, то нам надо определиться, четное у нас количество игроков в нашей выборке или нечетное?
Все верно – игроков ( displaystyle 11), значит, количество нечетное! Теперь можем применять к нашей выборке менее заковыристое определение медианы для нечетного количества членов в выборке.
Ищем число, которое оказалось посередине в нашем упорядоченном ряду:
Ну вот, чисел у нас ( displaystyle 11), значит, по краям остается по пять чисел, а рост ( displaystyle 183) см будет медианой в нашей выборке.
Не так уж и сложно, правда?
Частота и относительная частота
Частота представляет собой число повторений, сколько раз за какой-то период происходило некоторое событие, проявлялось определенное свойство объекта либо наблюдаемый параметр достигал данной величины.
То есть частота определяет то, как часто повторяется та или иная величина в выборке.
Разберемся на нашем примере с футболистами. Перед нами вот такой вот упорядоченный ряд:
Частота – это число повторений какой-либо величины параметра. В нашем случае, это можно считать вот так. Сколько игроков имеет рост ( 176)?
Все верно, один игрок. Таким образом, частота встречи игрока с ростом ( 176) в нашей выборке равна ( 1).
Сколько игроков имеет рост ( 178)? Да, опять же один игрок. Частота встречи игрока с ростом ( 178) в нашей выборке равна ( 1).
Задавая такие вопросы и отвечая на них, можно составить вот такую табличку:
Ну вот, все довольно просто. Помни, что сумма частот должна равняться количеству элементов в выборке (объему выборки).
То есть в нашем примере: ( 1+1+1+2+1+1+1+1+1+1=11)
Перейдем к следующей характеристике – относительная частота.
Относительная частота – это отношение частоты к общему числу данных в ряду. Как правило, относительная частота выражается в процентах.
Обратимся опять к нашему примеру с футболистами. Частоты для каждого значения мы рассчитали, общее количество данных в ряду мы тоже знаем ( left( n=11 right)) .
Рассчитываем относительную частоту для каждого значения роста и получаем вот такую табличку:
А теперь сам составь таблицы частот и относительных частот для примера с 9-классниками, решающими задачи.
Ещё в курсе алгебры 7 класса мы с вами
познакомились с некоторыми из характеристик статистики.
Напомним, что статистика это
один из разделов математики. Она помогает нам накапливать и анализировать
информацию, делать выводы, планировать результат.
Само слово статистика происходит
от латинского «статус», означающего «состояние дел».
Определение:
Статистика – это наука, которая
занимается получением, обработкой и анализом количественных данных о
разнообразных массовых явлениях, происходящих в обществе и природе.
Пусть, например, на концерт
одной известной группы было продано 2000 билетов. Участники группы решили
выяснить кого больше среди почитателей их музыки: мужчин или женщин.
Конечно, определить количество тех или иных
будет очень сложно. И тут нам на помощь приходит статистика. В тех случаях,
когда бывает сложно или даже невозможно провести полное исследование, его
заменяют выборочным. Т.е. если известно, что среди 50 посетивших концерт было
40 мужчин и 10 женщин, то можно сделать вывод, что среди всех 2000 купивших
билеты, мужчин было больше.
В таких случаях, множество всех объектов, или
в нашем случае, множество всех зрителей, называется генеральной
совокупностью.
А та часть объектов, которая выбирается для
исследования, называется выборочной совокупностью, или выборкой.
В нашем случае – это те 50 человек, пол которых мы точно знаем. При этом
выборка должна быть представительной, или, как говорят, репрезентативной, т.е.
достаточной по объему и отражающей характерные особенности исследуемой генеральной
совокупности.
Для обобщения и систематизации данных,
полученных в ходе статистического наблюдения, их по какому-либо признаку
разбивают на группы и результаты, характеризующие каждую группу, сводят в
таблицы.
Пример, в конце учебного года
провели контрольный срез по математике. В ходе проверки теста получили
следующие результаты: «двойку» получили 3 ученика, «тройку» – 6 учеников, «четвёрку» – 11 учеников и «пятёрку»
– 7 учеников.
Эти данные можно свести в таблицу.
Заметим, что в нижней строке таблицы
указывается количество учеников, получивших ту или иную оценку. Или иными
словами, указывается частота появления этого числа в общем ряду
полученных оценок.
Такую таблицу называют таблицей частот.
Давайте проведём анализ полученных данных.
Иногда в таблице для каждого данного указывают
не частоту, а отношение частоты к общему числу данных в ряду. Это
число, выраженное в процентах, называют относительной частотой, а саму
таблицу – таблицей относительных частот.
Для нашего примера таблица относительных
частот выглядит так:
Нетрудно убедиться, что в данном случае сумма
относительных частот составляет 100%. Вообще сумма относительных частот,
полученных в результате любого исследования, равна 100%.
Заметим, что если в ряду имеется большое число
данных и одинаковые значения встречаются редко, то таблицы частот или
относительных частот теряют наглядность и становятся излишне
громоздкими. В таких случаях для анализа данных строят интервальный ряд.
Для этого разность между наибольшим и
наименьшим значениями делят на несколько равных частей и, округляя полученный
результат, определяют длину интервала. За начало первого интервала часто
выбирают наименьшее данное или ближайшее к нему целое число, не
превосходящее его. Для каждого интервала указывают число данных попадающих в
этот интервал. При этом граничное число считают относящимся к
следующему интервалу.
Пример. В магазине выясняли
возраст потребителей йогурта. По результатам опроса 100 человек была составлена
следующая таблица распределения потребителей йогурта по возрасту.
Пользуясь составленной таблицей, найдём
средний возраст, потребителей йогурта. Для этого составим новую таблицу частот,
заменив каждый интервал числом, которое является его серединой.
Итоги:
На этом уроке мы узнали, что множество всех
исследуемых объектов называют генеральной совокупностью. А та часть объектов,
которая выбирается для исследования, называется выборочной совокупностью, или
выборкой. Познакомились с таблицами частот и относительных частот. Провели
анализ данных на конкретном примере, и вспомнили такие статистические
характеристики, как среднее арифметическое, размах, мода и медиана. А также
узнали, для чего строят интервальные ряды и научились с ними работать.
Содержание
- Типы частот
- Шаги по составлению таблицы распределения частот
- Шаг 1
- Шаг 2
- Шаг 3
- Шаг 4
- Шаг 5
- Шаг 6
- Шаг 7
- Шаг 8
- Шаг 9
- Шаг 10
- Пример построения стола
- Упражнение решено
- Ссылки
А Распределение частоты В статистике это относится к тенденции, за которой следуют данные, организованные в группы, категории или классы, когда каждому присваивается номер, называемый частотой, который указывает, сколько данных находится в каждой группе.
Как правило, наблюдается, что эти частоты распределяются вокруг центральной группы: группы с наибольшим количеством данных.
Группы, которые находятся выше или ниже этой центральной категории, постепенно уменьшают свою частоту, становясь очень маленькими или незначительными для категорий, наиболее удаленных от категории с более высокой частотой.
Чтобы узнать частотное распределение набора данных, сначала создайте категории, а затем составьте таблицу частот. Визуальное представление частотной таблицы называется гистограммой.
Типы частот
Есть несколько типов частот:
1.- Абсолютная частота: он самый простой, и из него строятся остальные. Он просто состоит из общего количества данных, соответствующих категории.
2.- Относительная частота: абсолютная частота каждой категории, деленная на общее количество данных.
3.- Частота в процентах: это та же относительная частота, но умноженная на сто, указывающая процент появления значений в каждой категории.
4.- Накопленная частота: это сумма абсолютных частот категорий ниже или равных рассматриваемой категории.
5.- Кумулятивная частота в процентах: это сумма процентных частот категорий ниже или равных наблюдаемой категории.
Шаги по составлению таблицы распределения частот
Чтобы построить таблицу частотного распределения, необходимо выполнить несколько шагов.
Прежде всего, должны быть доступны данные, которые могут быть разного типа: возраст детей в школе, количество правильных ответов в тесте, рост сотрудников компании, длина листов. дерева и др.
Шаг 1
Определите минимальное значение xmin и максимальное значение xmax в наборе данных Икс.
Шаг 2
Рассчитайте диапазон R, который определяется как разница между максимальным значением минус минимальное значение: R = xmax – xmin.
Шаг 3
Определить количество k интервалов или классов, которые можно задать заранее. Номер k определит количество строк в частотной таблице.
Шаг 4
Если количество интервалов k ранее не указывалось, то оно должно быть установлено в соответствии со следующими руководящими принципами: наименьшее количество рекомендуемых категорий – 5, но оно может быть больше, и в этом случае предпочтительнее выбрать нечетное число.
Шаг 5
Есть формула, которая называется правило осетров что дает нам количество интервалов k рекомендуется для набора, состоящего из N данные:
k = [1 + 3,322⋅Log N]
Поскольку результат внутри скобки обязательно будет действительным числом, скобка говорит нам, что его необходимо округлить до ближайшего нечетного целого числа, чтобы получить целое значение k.
Шаг 6
Амплитуда рассчитывается К каждого интервала (классов или категорий), беря частное между диапазоном р и количество интервалов k: А = R / k. Если исходные данные являются целыми числами, то A округляется до ближайшего целого числа, в противном случае его реальное значение остается.
Шаг 7
Определите нижние пределы Li и верхние пределы Ls для каждого интервала или класса. Первый интервал или самый низкий класс имеет нижний предел Li наименьшего из исходных данных, то есть Li = xmin, а верхний предел – минимальное значение плюс ширина интервала, то есть Ls = xmin + A.
Шаг 8
Последовательные интервалы:
[xmin, xmin + A), [ xmin + A, xmin + 2⋅A), …, [ xmin + (k-1) A, xmin + k⋅A).
Шаг 9
Оценка класса Xc определяется для каждого интервала по следующей формуле: Xc = (Ls – Li) / 2 + Li.
Шаг 10
Размещается заголовок таблицы частот, который состоит из строки со следующими метками: классы, метка класса Xc, частота f, относительная частота fr (или процентная частота f%) и накопленная частота F (или накопленная частота в процентах). F%).
У нас будет следующее:
Первый столбец частотной таблицы– Содержит интервалы или классы, на которые были разделены данные.
Второй столбец: содержит метку класса (или среднюю точку) каждого подынтервала.
Третий столбец: содержит абсолютную частоту f каждого класса или категории.
Четвертая и пятая колонки: помещаются значения, соответствующие относительной частоте (или проценту) и накопленной частоте F (или накопленному проценту).
Пример построения стола
Следующие данные соответствуют правильным ответам анкеты из 100 вопросов, примененной к группе из 52 студентов:
65, 70, 70, 74, 61, 77, 85, 36, 70, 62, 62, 77, 80, 89, 39, 43, 70, 77, 79, 77, 88, 52, 85, 1, 55, 47, 73, 63, 59, 51, 56, 65, 85, 79, 53, 79, 3, 71, 7, 54, 8, 61, 61, 77, 67, 58, 61, 45, 48, 64, 15, 50.
Мы будем следовать шагам, чтобы построить таблицу частот:
1.- Минимальное и максимальное значения Xmin = 1, Xmax = 89.
2.- Диапазон: R = 89 – 1 = 88
3.- Определение количества интервалов по правило осетров: k = [1 + 3,322⋅Журнал 52] = [6,70] = 7.
4.- Расчет ширины интервалов: A = R / k = 88/7 = 12,57 ≈ 13.
5.- Интервалы: [1,14), [14, 27), [27, 40), [40, 53), [53, 66), [66, 79), [79, 92 ».
6.- Определяются оценки классов каждого интервала: 8, 21, 34, 47, 60, 73 и 86.
7.- Таблица сделана:
График частот для различных интервалов или категорий показан на рисунке 1.
Упражнение решено
Учитель записывает процент достижений целей по курсу физики для каждого студента. Однако оценка для каждого студента, хотя и зависит от процента достигнутых целей, ограничена определенными категориями, ранее установленными в правилах обучения университета.
Давайте рассмотрим конкретный случай: в разделе физики у нас есть процент достижений целей для каждого из 52 студентов:
15, 50, 62, 58, 51, 61, 62, 74, 65, 79, 59, 56, 77, 8, 55, 70, 7, 36, 79, 61, 77, 52, 35, 43, 61, 65, 70, 89, 64, 54, 85, 61, 39, 63, 70, 85, 70, 79, 48, 77, 73, 67, 45, 77, 71, 53, 88, 85, 47, 73, 77, 80.
В этом примере категории или классы соответствуют итоговой оценке, которая выставляется в соответствии с процентной долей x достигнутых целей:
1.- Очень плохо: 1 ≤ x <30
2.- Недостаточно: 30 ≤ x <50
3.- Достаточно: 50 ≤ x <70
4.- Хорошо: 70 ≤ x <85
5.- Отлично: 85 ≤ x ≤ 100
Чтобы составить частотную таблицу, данные упорядочиваются от наименьшего к наибольшему, и подсчитывается количество данных, соответствующих каждой категории, что и будет оценкой, которую студент получит за курс физики:
1.- Очень плохо: 4 ученика.
2.- Плохо: 6 учеников.
3.- Достаточно: 20 учеников.
4.- Хорошо: 17 учеников.
5.- Отлично: 5 учеников.
Ниже представлена гистограмма оценок, построенная на основе приведенной выше таблицы:
Ссылки
- Беренсон, М. 1985. Статистика для управления и экономики. Interamericana S.A.
- Канавос, Г. 1988. Вероятность и статистика: приложения и методы. Макгроу Хилл.
- Деворе, Дж. 2012. Вероятность и статистика для техники и науки. 8-е. Издание. Cengage.
- Левин, Р. 1988. Статистика для администраторов. 2-й. Издание. Прентис Холл.
- Шпигель, М. 2009. Статистика. Серия Шаум. 4-й Издание. Макгроу Хилл.
- Уолпол, Р. 2007. Вероятность и статистика для инженерии и науки. Пирсон.
Дата публикации: 09 апреля 2017.
Урок и презентация на тему: “Математическая статистика, элементы статистики”
Дополнительные материалы
Уважаемые пользователи, не забывайте оставлять свои комментарии, отзывы, пожелания! Все материалы проверены антивирусной программой.
Скачать:
Математическая статистика, элементы статистики (PPTX)
Статистика, введение
Темой сегодняшнего урока будет математическая статистика.
Этот предмет занимается статистикой, используя различные математические методы. Математическая статистика – это самостоятельно развивающийся раздел математики, в котором существуют и свои уникальные способы решения различных задач.
Так чем же занимается и для чего нужна математическая статистика?
Предположим, что у учеников девятых классов измерили рост. Как представить полученные данные? Можно записать их в строчку друг за другом, можно разделить данные по классам, можно попробовать создать таблицу. Все эти способы довольно громоздки и неудобны. Будет сложно извлечь информацию из такого набора чисел. А теперь представьте, что измерили рост учеников девятых классов всех школ в городе. Количество измерений может перевалить за тысячу.
Математическая статистика занимается обработкой данных и представлением их в виде удобном для восприятия. Это только одна из задач статистики. Построение прогнозов и оценок; применение различных методов исследования; достоверность проведенных испытаний и многое другое – вот чем занимается статистика.
Как же обрабатывает информацию статистика?
- Данные измерений упорядочивают и группируют.
- Составляют таблицы распределений данных.
- По таблицам строят графики распределений.
- В итоге создается паспорт измерений, в котором собраны числовые характеристики полученной информации.
Давайте рассмотрим эти пункты.
Упорядочивание и группировка данных
Первое, что необходимо сделать при анализе данных, определить рамки, в которых находится исследователь. Выбираются наименьшее и наибольшее допустимые значения, которые могут не совпадать с полученными данными. Например, при измерении роста учеников, шансов, что кто-то будет ниже 140 сантиметров и выше 200 сантиметров очень мало. Если найдется такой вариант, то данные статистики можно подкорректировать.
При измерении роста могут получиться числа: 140,150,160,170,180,190,200 – это общий ряд данных, которые принято располагать в порядке возрастания. Общий ряд данных может быть и другим, например: 140,145,150,155,160,…,190,195,200. Как представить общий ряд данных зависит от конкретной задачи.
Пример. Составить общий ряд данных, включающих:
а) месяцы рождения одноклассников,
б) годов рождения родственников и друзей,
в) буквы, с которых начинается слово.
Решение.
а) Всего месяцев 12, если их перечислить по цифрам, то получим общий ряд: 1,2,3,4,5,6,7,8,9,10,11,12.
б) Шанс, что кто-то из родственников старше 100 лет – мал, а что, кто-то родился в этом году – есть. Тогда общий ряд годов рождения можно составить так: 1910,1911,1912,…, 2009,2010,2011,2012,2013,2014.
в) Слово может начинаться с любой буквы алфавита, кроме ь, ы, ъ. Тогда возможны 30 вариантов, если их представить численным рядом, то получим: 1,2,3,4,…,28,29,30.
Понятие “общий ряд” не является строгим, в примере б) мы могли начать ряд с 1900 года, ряд так же назывался “общим”.
При проведении эксперимента данные из общего ряда могут не встретиться. Вернемся к нашему примеру б) и рассмотрим конкретный случай.
Вова назвал года рождения родственников: 1935,1937,1960,1965,1980,1981,1997,2005.
Общий ряд представлял собой последовательность: 1910,1911,1912,…,2009,2010,2011,2012,2013,2014.
У Вовы встретились конкретные измерения, которые называются “вариантой измерения”.
Варианта измерения – это возможный вариант проведенного измерения.
Если все варианты измерений перечислить по порядку, то получится ряд данных измерения.
Для нашего примера составим таблицу:
Пример. Выписать ряд, состоящий из букв, которые встречаются в словах: мама, папа, брат, сестра, бабушка, дедушка, тетя, дядя.
Решение. Ряд будет выглядеть так: а, б, д, е, к, м, п, р, с, т, у, ш, я. Встретились 13 букв из 33.
Некоторые буквы встречаются несколько раз, например, буква а – девять раз, другие – реже.
Определение. Если среди всех данных конкретного измерения одна из вариант встретилась ровно к раз, то число к называют кратностью измерения.
В этом примере буква а имеет кратность – 9.
Запишем кратности для каждой из букв:
Далее варианты нужно сгруппировать. Создадим сгруппированный ряд данных:
а,а,а,а,а,а,а,а,а,б,б,б,д,д,д,д,е,е,е,к,к,м,м,п,п,р,р,с,с,т,т,т,т,у,у,ш,шя,я,я.
Число повторений каждой варианты равно кратности варианты.
Составление таблицы распределения данных
Если сложить все кратности, получится количество всех данных измерения или объем измерения. Объем измерения равен количеству букв встречающихся в наших словах. Для проверки всегда складывают кратности, сумма должна равняться количеству элементов измерения.
Далее вычисляют частоту варианты.
Частота варианты=Кратность варианты/Объем измерения.
Составим таблицу частот измерений:
Сумма всех частот всегда равна единице, так как это сумма всех дробей с одинаковым знаменателем, а сумма всех числителей как раз и равна знаменателю. Для удобства, часто переводят частоты в проценты от объема измерения. Составим таблицу еще одну таблицу, каждую частоту в новой строке помножим на 100.
Графическое представление данных
Давайте построим графики функций распределения по таблицам. Договоримся, что вместо букв будем использовать цифры 1,2,3,…,13.
Тогда наша таблица примет вид:
По оси абсцисс отложим цифры, соответствующие буквам, а по оси ординат – значения частот появления варианта. Графическое изображение имеющейся информации – график распределения частот.
Таблица значений:
График распределения частот:
График распределения частот также называют полигоном распределения.
Давайте построим график распределения частот процентов. Его тоже называют полигоном распределения процентов.
Таблица значений.
Полигон распределения процентов:
Даже не большая по объему данных задача, представляет собой довольно таки утомительную процедуру подсчета и составления таблиц и графиков распределений.
Числовые характеристики данных измерения
Наши данные обладают уникальными числовыми характеристиками. Давайте определим некоторые из них.
Разность между максимальной и минимальной вариантой называют размахом измерения.
На наших графиках – это область определения (разность крайнего правого значения и крайнего левого значения на оси абсцисс). В нашем примере размах равен $13-1=12$.
Варианта, которая встречается чаще других, называется модой. В нашем примере это буква а или число 1, в зависимости от обозначения.
Если у нас есть таблица распределения частот, то в строчке частот ищем наибольшее число, и смотрим, какому варианту оно соответствует. На графике, это точка в которой достигается максимальное значение.
Наиболее важная характеристика – среднее значение (среднее арифметическое или просто среднее).
Чтобы найти среднее значение нужно:
а) Просуммировать все данные измерения.
б) Полученную сумму разделить на количество вариантов.
Для нашего примера найдем среднее значение:
$frac{1*9+2*3+3*4+4*3+5*2+6*2+7*2+8*2+9*2+10*4+11*2+12*2+13*3}{40}=5,775$.
Среднее значение можно найти другим способом:
а) Каждую варианту умножить на ее частоту.
б) Сложить получившиеся значения.
Подсчитаем этим способом:
1*0,225+2*0,075+3*0,1+4*0,075+5*0,05+6*0,05+7*0,05+8*0,05+9*0,05+10*0,1+11*0,05+12*0,05+13*0,075=5,775.
Давайте рассмотрим еще один пример.
На экзамене по математике 25 учеников 9 класса получили такие оценки:
5,4,3,3,5,4,3,3,4,4,5,5,2,2,5,5,5,3,3,4,5,5,4,3,2.
а) Составить общий ряд данных. Упорядочить и сгруппировать.
б) Составить таблицы распределения и распределения частот.
в) Построить графики распределения и распределения частот.
г) Найти среднее, моду, размах.
Решение.
Возможны такие оценки: 1,2,3,4,5 – общий ряд данных.
В нашем примере встречаются оценки: 2,3,4,5 – ряд данных, все числа в ряде – варианты измерений.
Составим сгруппированный ряд: 2,2,2,3,3,3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,5,5,5.
б) Объем измерения равен 25, так как 25 оценок выставлено.
Составим таблицу:
в) Нарисуем графики:
Полигон распределения данных:
Полигон распределения частот:
Полигон распределения частот процентов:
Все графики похожи между собой, различия только в масштабе оси ординат.
г)Найдем среднее значение:
$2*0,12+3*0,28+4*0,24+5*0,36=0,24+0,84+0,96+1,8=3,81$.
Мода: чаще всего встречается оценка пять, она и будет модой.
Размах: $5-2=3$.
Задачи статистики для самостоятельного решения
1.На экзамене по математике 50 учеников 9 класса получили такие оценки:
5,3,4,4,5,4,3,2,4,3,5,1,2,3,5,4,5,3,3,4,5,5,4,3,1,3,4,5,4,3,2,2,1,4,4,5,5,4,4,5,3,3,3,2,1,5,4,3,2,5.
а) Составить общий ряд данных. Упорядочить и сгруппировать.
б) Составить таблицы распределения и распределения частот.
в) Построить графики распределения и распределения частот.
г) Найти среднее, моду, размах.