Продолжаем изучать элементарные задачи по математике. Сегодня мы поговорим о статистике.
Статистика — это раздел математики в котором изучаются вопросы сбора, измерения и анализа информации, представленной в числовой форме. Происходит слово статистика от латинского слова status (состояние или положение дел).
Так, с помощью статистики мы можем узнать свое положение дел, касающихся финансов. С начала месяца можно вести дневник расходов и по окончании месяца, воспользовавшись статистикой, узнать сколько денег в среднем мы тратили каждый день или какая потраченная сумма была наибольшей в этом месяце либо узнать какую сумму мы тратили наиболее часто.
На основе этой информации можно провести анализ и сделать определенные выводы: следует ли в следующем месяце немного сбавить аппетит, чтобы тратить меньше денег, либо наоборот позволить себе не только хлеб с водой, но и колбасу.
Выборка. Объем. Размах
Что такое выборка? Если говорить простым языком, то это отобранная нами информация для исследования. Например, мы можем сформировать следующую выборку — суммы денег, потраченных в каждый из шести дней. Давайте нарисуем таблицу в которую занесем расходы за шесть дней
Выборка состоит из n-элементов. Вместо переменной n может стоять любое число. У нас имеется шесть элементов, поэтому переменная n равна 6
n = 6
Элементы выборки обозначаются с помощью переменных с индексами . Последний элемент является шестым элементом выборки, поэтому вместо n будет стоять число 6.
Обозначим элементы нашей выборки через переменные
Количество элементов выборки называют объемом выборки. В нашем случае объем равен шести.
Размахом выборки называют разницу между самым большим и маленьким элементом выборки.
В нашем случае, самым большим элементом выборки является элемент 250, а самым маленьким — элемент 150. Разница между ними равна 100
Среднее арифметическое
Понятие среднего значения часто используется в повседневной жизни.
Примеры:
- средняя зарплата жителей страны;
- средний балл учащихся;
- средняя скорость движения;
- средняя производительность труда.
Речь идет о среднем арифметическом — результате деления суммы элементов выборки на их количество.
Среднее арифметическое — это результат деления суммы элементов выборки на их количество.
Вернемся к нашему примеру
Узнаем сколько в среднем мы тратили в каждом из шести дней:
Средняя скорость движения
При изучении задач на движение мы определяли скорость движения следующим образом: делили пройденное расстояние на время. Но тогда подразумевалось, что тело движется с постоянной скоростью, которая не менялась на протяжении всего пути.
В реальности, это происходит довольно редко или не происходит совсем. Тело, как правило, движется с различной скоростью.
Когда мы ездим на автомобиле или велосипеде, наша скорость часто меняется. Когда впереди нас помехи, нам приходиться сбавлять скорость. Когда же трасса свободна, мы ускоряемся. При этом за время нашего ускорения скорость изменяется несколько раз.
Речь идет о средней скорости движения. Чтобы её определить нужно сложить скорости движения, которые были в каждом часе/минуте/секунде и результат разделить на время движения.
Задача 1. Автомобиль первые 3 часа двигался со скоростью 66,2 км/ч, а следующие 2 часа — со скоростью 78,4 км/ч. С какой средней скоростью он ехал?
Сложим скорости, которые были у автомобиля в каждом часе и разделим на время движения (5ч)
Значит автомобиль ехал со средней скоростью 71,08 км/ч.
Определять среднюю скорость можно и по другому — сначала найти расстояния, пройденные с одной скоростью, затем сложить эти расстояния и результат разделить на время. На рисунке видно, что первые три часа скорость у автомобиля не менялась. Тогда можно найти расстояние, пройденное за три часа:
66,2 × 3 = 198,6 км.
Аналогично можно определить расстояние, которое было пройдено со скоростью 78,4 км/ч. В задаче сказано, что с такой скоростью автомобиль двигался 2 часа:
78,4 × 2 = 156,8 км.
Сложим эти расстояния и результат разделим на 5
Задача 2. Велосипедист за первый час проехал 12,6 км, а в следующие 2 часа он ехал со скоростью 13,5 км/ч. Определить среднюю скорость велосипедиста.
Скорость велосипедиста в первый час составляла 12,6 км/ч. Во второй и третий час он ехал со скоростью 13,5. Определим среднюю скорость движения велосипедиста:
Мода и медиана
Модой называют элемент, который встречается в выборке чаще других.
Рассмотрим следующую выборку: шестеро спортсменов, а также время в секундах за которое они пробегают 100 метров
Элемент 14 встречается в выборке чаще других, поэтому элемент 14 назовем модой.
Рассмотрим еще одну выборку. Тех же спортсменов, а также смартфоны, которые им принадлежат
Элемент iphone встречается в выборке чаще других, значит элемент iphone является модой. Говоря простым языком, носить iphone модно.
Конечно элементы выборки в этот раз выражены не числами, а другими объектами (смартфонами), но для общего представления о моде этот пример вполне приемлем.
Рассмотрим следующую выборку: семеро спортсменов, а также их рост в сантиметрах:
Упорядочим данные в таблице так, чтобы рост спортсменов шел по возрастанию. Другими словами, построим спортсменов по росту:
Выпишем рост спортсменов отдельно:
180, 182, 183, 184, 185, 188, 190
В получившейся выборке 7 элементов. Посередине этой выборки располагается элемент 184. Слева и справа от него по три элемента. Такой элемент как 184 называют медианой упорядоченной выборки.
Медианой упорядоченной выборки называют элемент, располагающийся посередине.
Отметим, что данное определение справедливо в случае, если количество элементов упорядоченной выборки является нечётным.
В рассмотренном выше примере, количество элементов упорядоченной выборки было нечётным. Это позволило нам быстро указать медиану
Но возможны случаи, когда количество элементов выборки чётно.
К примеру, рассмотрим выборку в которой не семеро спортсменов, а шестеро:
Построим этих шестерых спортсменов по росту:
Выпишем рост спортсменов отдельно:
180, 182, 184, 186, 188, 190
В данной выборке не получается указать элемент, который находился бы посередине. Если указать элемент 184 как медиану, то слева от этого элемента будут располагаться два элемента, а справа — три. Если как медиану указать элемент 186, то слева от этого элемента будут располагаться три элемента, а справа — два.
В таких случаях для определения медианы выборки, нужно взять два элемента выборки, находящихся посередине и найти их среднее арифметическое. Полученный результат будет являться медианой.
Вернемся к нашим спортсменам. В упорядоченной выборке 180, 182, 184, 186, 188, 190 посередине располагаются элементы 184 и 186
Найдем среднее арифметическое элементов 184 и 186
Элемент 185 является медианой выборки, несмотря на то, что этот элемент не является членом исходной и упорядоченной выборки. Спортсмена с ростом 185 нет среди остальных спортсменов. Рост в 185 см используется в данном случае для статистики, чтобы можно было сказать о том, что срединный рост спортсменов составляет 185 см.
Поэтому более точное определение медианы зависит от количества элементов в выборке.
Если количество элементов упорядоченной выборки нечётно, то медианой выборки называют элемент, располагающийся посередине.
Если количество элементов упорядоченной выборки чётно, то медианой выборки называют среднее арифметическое двух чисел, располагающихся посередине этой выборки.
Медиана и среднее арифметическое по сути являются «близкими родственниками», поскольку и то и другое используют для определения среднего значения. Например, для предыдущей упорядоченной выборки 180, 182, 184, 186, 188, 190 мы определили медиану, равную 185. Этот же результат можно получить путем определения среднего арифметического элементов 180, 182, 184, 186, 188, 190
Но медиана в некоторых случаях отражает более реальную ситуацию. Например, рассмотрим следующий пример:
Было подсчитано количество имеющихся очков у каждого спортсмена. В результате получилась следующая выборка:
0, 1, 1, 1, 2, 1, 2, 3, 5, 4, 5, 0, 1, 6, 1
Определим среднее арифметическое для данной выборки — получим значение 2,2
По данному значению можно сказать, что в среднем у спортсменов 2,2 очка
Теперь определим медиану для этой же выборки. Упорядочим элементы выборки и укажем элемент, находящийся посередине:
0, 0, 1, 1, 1, 1, 1, 1, 2, 2, 3, 4, 5, 5, 6
В данном примере медиана лучше отражает реальную ситуацию, поскольку половина спортсменов имеет не более одного очка.
Частота
Частота это число, которое показывает сколько раз в выборке встречается тот или иной элемент.
Предположим, что в школе проходят соревнования по подтягиваниям. В соревнованиях участвует 36 школьников. Составим таблицу в которую будем заносить число подтягиваний, а также число участников, которые выполнили столько подтягиваний.
По таблице можно узнать сколько человек выполнило 5, 10 или 15 подтягиваний. Так, 5 подтягиваний выполнили четыре человека, 10 подтягиваний выполнили восемь человек, 15 подтягиваний выполнили три человека.
Количество человек, повторяющих одно и то же число подтягиваний в данном случае являются частотой. Поэтому вторую строку таблицы переименуем в название «частота»:
Такие таблицы называют таблицами частот.
Частота обладает следующим свойством: сумма частот равна общему числу данных в выборке.
Это означает, что сумма частот равна общему числу школьников, участвующих в соревнованиях, то есть тридцати шести. Проверим так ли это. Сложим частоты, приведенные в таблице:
4 + 5 + 10 + 8 + 6 + 3 = 36
Относительная частота
Относительная частота это в принципе та же самая частота, которая была рассмотрена ранее, но только выраженная в процентах.
Относительная частота равна отношению частоты на общее число элементов выборки.
Вернемся к нашей таблице:
Пять подтягиваний выполнили 4 человека из 36. Шесть подтягиваний выполнили 5 человек из 36. Восемь подтягиваний выполнили 10 человек из 36 и так далее. Давайте заполним таблицу с помощью таких отношений:
Выполним деление в этих дробях:
Выразим эти частоты в процентах. Для этого умножим их на 100. Умножение на 100 удобно выполнить передвижением запятой на две цифры вправо:
Теперь можно сказать, что пять подтягиваний выполнили 11% участников, 6 подтягиваний выполнили 14% участников, 8 подтягиваний выполнили 28% участников и так далее.
Понравился урок?
Вступай в нашу новую группу Вконтакте и начни получать уведомления о новых уроках
Возникло желание поддержать проект?
Используй кнопку ниже
Статистические исследования числовых рядов. Статистические характеристики числовых рядов
Очень часто из-за дороговизны или слишком большого числа наблюдений невозможно получить полной информации об объектах, событиях или наблюдениях. По этой причине информацию получают на основе анализа части всего множества объектов, событий или наблюдений, называемой рядом числовых данных, рядом выборочных данных или, просто, выборкой.
Выборка представляет собой конечный ряд чисел (выборочных данных), количество чисел в котором называют объемом выборки
Для обеспечения достоверности информации об объектах, событиях или наблюдениях, полученных на основе статистических исследований числовых рядов (анализа выборочных данных), отбор выборочных данных должен носить случайный характер и иметь достаточно большой объем, то есть выборка должны быть репрезентативной (представительной).
Статистические исследования числовых рядов (рядов чисел, рядов выборочных данных) удобно проводить в соответствии со следующей схемой, которую мы изложим на примере следующей выборки X :
X = {3,24; 3,44; 3,12; 3,25; 3,12; 3,34; 3,37; 3,44; 3,24; 3,12} | (1) |
-
Определяем объем выборки (число чисел в числовом ряде).
В числовом ряде (1) десять чисел, поэтому объем выборки равен 10.
-
Вычисляем среднее арифметическое числового ряда X (среднее выборочное значение), которое обозначают .
Для числового ряда (1)
-
Производим упорядочение числового ряда по возрастанию (ранжирование числовых данных). Полученный числовой ряд, который обозначим X1 , называют вариационным рядом.
Для числового ряда X вариационный ряд X1 имеет следующий вид:
X1 = {3,12; 3,12; 3,12; 3,24; 3,24; 3,25; 3,34; 3,37; 3,44; 3,44}
-
Вычисляем размах числового ряда X , то есть разность между наибольшим числом из числового ряда и наименьшим числом из числового ряда.
В числовом ряде X , как и в вариационном ряде X1 , число 3,44 является наибольшим числом, а число 3,12 является наименьшим числом. Поэтому размах числового ряда X равен
3,44 – 3,12 = 0,32
-
Вычисляем медиану числового ряда.
В случае, когда объем выборки (число членов числового ряда) – чётное число, медианой числового ряда является число, равное половине суммы двух чисел, стоящих в середине вариационного ряда.
Число членов ряда X равно чётному числу 10 , а в середине вариационного ряда X1 стоят числа 3,24 и 3,25 . Поэтому медиана числового ряда, которую обычно обозначают символом Me , равна
В случае, когда объем выборки (число членов числового ряда) –нечётное число, медианой числового ряда является число, стоящее в середине вариационного ряда.
Например, медианой числового ряда
{2; 3; 7; 9; 15}
является число 7 .
-
Составляем таблицу частот числового ряда.
Если взглянуть на числа (выборочные данные), составляющие вариационный ряд X1 , то можно заметить, некоторые числа повторяются, а другие встречаются лишь по одному разу. Это наблюдение приводит к следующему определению.
ОПРЕДЕЛЕНИЕ 1. Если выборочное данное встречается в вариационном ряде m раз, то число m называют частотой (абсолютной частотой) этого выборочного данного.
Воспользовавшись определением 1, сформируем для числового ряда X таблицу, содержащую две строки, которую называют таблицей частот (абсолютных частот) числового ряда. Для этого в первой строке таблицы запишем числа, составляющие вариационный ряд X1 , причем запишем числа в порядке возрастания и без повторений. Во второй строке таблицы запишем частоты (абсолютные частоты), соответствующие числам из первой строки таблицы.
ТАБЛИЦА ЧАСТОТ ЧИСЛОВОГО РЯДА
Числа, составляющие вариационный ряд (без повторений) 3,12 3,24 3,25 3,34 3,37 3,44 Частоты 3 2 1 1 1 2 Числа, составляющие вариационный ряд (без повторений) Частоты 3,12 3 3,24 2 3,25 1 3,34 1 3,37 1 3,44 2 ЗАМЕЧАНИЕ. Сумма частот, то есть сумма чисел, записанных во второй строке таблицы частот числового ряда, равна объему выборки (числу чисел в числовом ряде). В рассматриваемом случае это число 10 .
-
Составляем таблицу относительных частот (в процентах).
ОПРЕДЕЛЕНИЕ 2. Относительной частотой (в процентах) выборочного данного называют число процентов, которое составляет частота этого выборочного данного от всего объема выборки (количества членов числового ряда).
Для того, чтобы сформировать таблицу относительных частот числового ряда, заменим частоты, записанные во второй строке таблицы частот числового ряда, на соответствующие им относительные частоты. В результате получим следующую таблицу.
ТАБЛИЦА ОТНОСИТЕЛЬНЫХ ЧАСТОТ (В ПРОЦЕНТАХ)
Числа, составляющие вариационный ряд (без повторений) 3,12 3,24 3,25 3,34 3,37 3,44 Относительные частоты (%) 30% 20% 10% 10% 10% 20% Числа, составляющие вариационный ряд (без повторений) Относительные частоты (%) 3,12 30% 3,24 20% 3,25 10% 3,34 10% 3,37 10% 3,44 20% -
Находим моду числового ряда.
ОПРЕДЕЛЕНИЕ 3. Модой числового ряда называют выборочное данное с наибольшей частотой.
Из таблицы частот числового ряда видно, что модой числового ряда X является число 3,12 , поскольку его частота 3 является наибольшей. Очевидно, что и относительная частота этого выборочного данного является самой большой (30%) .
ЗАМЕЧАНИЕ. Объем выборки, среднее выборочное значение, размах, медиана и мода числового ряда являются одними из статистических характеристик числовых рядов.
Скачать материал
без ожидания
Скачать материал
без ожидания
- Сейчас обучается 25 человек из 17 регионов
- Сейчас обучается 139 человек из 50 регионов
Описание презентации по отдельным слайдам:
-
1 слайд
Элементы статистической обработки данных
«Алгебра 7 класс» Мордкович А.Г.
( ФГОС)
Учитель математики Леонова А.А.
МБОУ «СОШ № 64» г. Барнаул -
2 слайд
Цели урока :
Познакомить с понятием статистика, математическая статистика;
Узнать что изучает статистика;
Узнать что такое ряд, объем ряда, размах ряда, мода, медиана ряда и среднее арифметическое ряда.
Научиться находить объем ряда, размах ряда, мода, медиана ряда и среднее арифметическое ряда. -
3 слайд
Статистика — это точная наука, изучающая методы сбора, анализа и обработки данных, которые описывают массовые действия, явления и процессы
Математическая статистика – это раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений случайных массовых явлений с целью выявления существующих закономерностей. -
4 слайд
Статистика изучает:
численность отдельных групп населения страны и ее регионов,
производство и потребление разнообразных видов продукции,
перевозку грузов и пассажиров различными видами транспорта,
природные ресурсы и многое другое. -
5 слайд
Результаты статистических исследований широко используются для практических и научных выводов.
В настоящее время статистика начинает изучаться уже в средней школе, в ВУЗах это обязательный предмет, потому что связан со многими науками и отраслями.
Чтобы увеличить количество продаж в магазине, чтобы улучшить качество знаний в школе, чтобы двигать страну по экономическому росту, надо проводить статистические исследования и делать соответствующие выводы. И это должен уметь каждый. -
6 слайд
Главные цели изучения элементов статистики
Формирование умений первичной обработки статистических данных;
изображение и анализ количественной информации, представленной в разных формах (в виде таблиц, диаграмм, графиков реальной зависимостей);
формирование представлений о важных статистических идеях, а именно: идее оценивания и идее проверки статистических гипотез;
формирование умений сравнивать вероятности наступления случайных событий с результатами конкретных экспериментов. -
7 слайд
Содержание
Ряд данных
Объем ряда данных
Размах ряда данных
Мода ряда данных
Медиана ряда
Среднее арифметическое -
8 слайд
Определение
Ряд данных – это ряд результатов каких-либо измерений.
Например:1) измерения роста человека
2) Измерения веса человека (животного)
3)Показания счетчика (электроэнергии, воды, тепла…)
4) Результаты в беге на стометровку
И т.д. -
9 слайд
Задание из задачника (приложение)
«Данные и ряды данных».
П.1 Устно решите уравнения:
2x = –4;
4x = 25 – x;
17 + x = 8;
3 (x + 2) – 2 = x;
3 – x = 4 – (1 – 3x);16 –x = 2x + 1;
–4x – 8 = 0;
12x – 11 = –11(x + 1);
1–x = 6 – 2x;
– 2 – (3 – x) = – 7. -
10 слайд
Результат : РЯД
– 2, 5 , – 9 , – 2 , 0 , 5 , – 2 , 0 , 5 , – 2 .
-
11 слайд
Определение
Объемом ряда данных называется количество всех данных.Например: дан ряд чисел
2; –3; 7; -9; 10; 5
объём его будет равен 6. Почему? -
12 слайд
Результат : Объем
б) Объем ряда : 10
-
13 слайд
Определение
Размах – это разность между наибольшим и наименьшим числами из ряда данных.
Например: если дан ряд чисел
2; 5; 0; -3; 9; 12, то размах этого ряда данных будет равен 15 (т.к. 12 – ( – 3) = 15) -
14 слайд
Результат : Размах
в) Размах : 14
-
15 слайд
Определение
Модой ряда данных называется число ряда, которое встречается в этом ряду наиболее часто.
(Если таких элементов нет, то моды у данного ряда нет) -
16 слайд
Результат : МОДА
г) Мода : – 2 .
-
17 слайд
Определение :
Медиана с нечётным числом членов – это число, записанное посередине.
Медиана с чётным числом членов – это среднее арифметическое двух чисел, записанных посередине.Например: определить медиану ряда чисел
1) 7; -3; 9; -2; -3; 8; 9; -2; 3. Ответ: -3
2) -10; 10; 8; 1; -1; 10;9; -1. Ответ: 0 -
18 слайд
Чему равна медиана ряда?
Так как объем нашего ряда число четное, то медиана :
( 0 + 5) : 2 = 2,5. -
19 слайд
Определение
Среднее арифметическое – ЭТО частное от деления суммы чисел ряда на их количество.Например: дан ряд чисел
-1; 0; 2; 1; -1; 0; 2; -1.
Тогда среднее арифметическое будет равно:
(-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0,25 -
20 слайд
Среднее арифметическое ряда?
(– 2 + 5 + (– 9) +(– 2) + 0 + 5 + (– 2) + 0 + 5 + (– 2)): 10 = –2 : 10 = – 0,2
Среднее арифметическое ряда : – 0,2 -
21 слайд
Самостоятельно:
Надо найти объём ряда, размах ряда, моду, медиану и среднее арифметическое:Карточка 1. 24,5; 27; 21,5; 24; 27.
Карточка 2. 6; -4; 5; -2; -3; 3; 3; -2; 3.
Карточка 3. 12,5; 12; 12; 12,5; 13; 12,5; 13.
Карточка 4. -1; 0; 2; 1; -1; 0; 2; -1.
Карточка 5. 125; 130; 124; 131.
Карточка 6. 120; 100; 110.
-
22 слайд
Проверим
Карточка 1.
объём ряда = 5
размах ряда = 5,5
мода = 27
медиана = 21,5
среднее арифметическое = 24,8
Карточка 3.
объём ряда = 7
размах ряда = 0,5
мода = 12,5
медиана = 12,5
среднее арифметическое = 12,5Карточка 2.
объём ряда = 9
размах ряда = 10
мода = 3
медиана = -3
среднее арифметическое = 1 -
23 слайд
Проверим
Карточка 4.
объём ряда = 8
размах ряда = 3
мода = -1
медиана = 0
среднее арифметическое = 0,25
Карточка 5.
объём ряда = 4
размах ряда = 7
мода = нет
медиана = 127
среднее арифметическое =127,5
Карточка 6.
объём ряда = 3
размах ряда = 20
мода = нет
медиана = 100
среднее арифметическое = 110 -
24 слайд
Итог :
Что я сегодня узнал ?
Что научился делать ?
Смогу ли я это сделать сам ? -
25 слайд
Домашнее задание :
Выучить все определения,
П.1. (д-м)Спасибо за внимание !
Найдите материал к любому уроку, указав свой предмет (категорию), класс, учебник и тему:
6 257 950 материалов в базе
- Выберите категорию:
- Выберите учебник и тему
- Выберите класс:
-
Тип материала:
-
Все материалы
-
Статьи
-
Научные работы
-
Видеоуроки
-
Презентации
-
Конспекты
-
Тесты
-
Рабочие программы
-
Другие методич. материалы
-
Найти материалы
Материал подходит для УМК
Другие материалы
- 22.09.2017
- 919
- 3
- 21.09.2017
- 1397
- 0
Вам будут интересны эти курсы:
-
Курс повышения квалификации «Изучение вероятностно-стохастической линии в школьном курсе математики в условиях перехода к новым образовательным стандартам»
-
Курс профессиональной переподготовки «Экономика: теория и методика преподавания в образовательной организации»
-
Курс повышения квалификации «Организация научно-исследовательской работы студентов в соответствии с требованиями ФГОС»
-
Курс повышения квалификации «Разработка бизнес-плана и анализ инвестиционных проектов»
-
Курс повышения квалификации «Особенности подготовки к сдаче ОГЭ по математике в условиях реализации ФГОС ООО»
-
Курс профессиональной переподготовки «Математика и информатика: теория и методика преподавания в образовательной организации»
-
Курс повышения квалификации «Финансы предприятия: актуальные аспекты в оценке стоимости бизнеса»
-
Курс повышения квалификации «Методика обучения математике в основной и средней школе в условиях реализации ФГОС ОО»
-
Курс профессиональной переподготовки «Управление сервисами информационных технологий»
-
Курс профессиональной переподготовки «Корпоративная культура как фактор эффективности современной организации»
-
Курс профессиональной переподготовки «Политология: взаимодействие с органами государственной власти и управления, негосударственными и международными организациями»
-
Курс профессиональной переподготовки «Гражданско-правовые дисциплины: теория и методика преподавания в образовательной организации»
Элементы статистической обработки данных
7 класс
Презентация составлена учителем математики
МОУ «СОШ» п. Аджером Корткеросского района
Республики Коми
Мишариной Альбиной Геннадьевной
Статистика — это точная наука, изучающая методы сбора, анализа и обработки данных, которые описывают массовые действия, явления и процессы
Математическая статистика – это раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений случайных массовых явлений с целью выявления существующих закономерностей.
Статистика изучает:
- численность отдельных групп населения страны и ее регионов,
- производство и потребление разнообразных видов продукции,
- перевозку грузов и пассажиров различными видами транспорта,
- природные ресурсы и многое другое.
Результаты статистических исследований широко используются для практических и научных выводов.
В настоящее время статистика начинает изучаться уже в средней школе, в ВУЗах это обязательный предмет, потому что связан со многими науками и отраслями.
Чтобы увеличить количество продаж в магазине, чтобы улучшить качество знаний в школе, чтобы двигать страну по экономическому росту, надо проводить статистические исследования и делать соответствующие выводы. И это должен уметь каждый.
Главные цели изучения элементов статистики
- Формирование умений первичной обработки статистических данных;
- изображение и анализ количественной информации, представленной в разных формах (в виде таблиц, диаграмм, графиков реальной зависимостей);
- формирование представлений о важных статистических идеях, а именно: идее оценивания и идее проверки статистических гипотез;
- формирование умений сравнивать вероятности наступления случайных событий с результатами конкретных экспериментов.
Содержание
- Ряд данных
- Объем ряда данных
- Размах ряда данных
- Мода ряда данных
- Медиана ряда
- Среднее арифметическое
- Упорядоченные ряды данных
- Таблица распределения данных
- Подведём итоги
- Номинативный ряд данных
- Частота результата
- Процентная частота
- Группировка данных
- Способы обработки данных
- Подведём итоги
Определение
- Ряд данных – это ряд результатов каких-либо измерений.
Например: 1) измерения роста человека
2) Измерения веса человека (животного)
3)Показания счетчика (электроэнергии, воды, тепла…)
4) Результаты в беге на стометровку
И т.д.
Определение
Объемом ряда данных называется количество всех данных.
Например: дан ряд чисел 1; 3; 6; -4; 0
объём его будет равен 5.
Выполни задание:
объём
Ответ: 10
Определение
Размах – это разность между наибольшим и наименьшим числами из ряда данных.
Например: если дан ряд чисел 1; 3; 6; -4; 0; 2,
то размах этого ряда данных будет равен 6 (т.к. 6 – 0 = 6)
Выполни задание:
размах
Ответ: 3
Определение
Модой ряда данных называется число ряда, которое встречается в этом ряду наиболее часто.
Ряд данных может иметь или не иметь моду.
Так, в ряду данных 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 каждое из чисел 47 и 52 встречается два раза , а остальные числа – менее двух раз.
В таких случаях условились считать, что ряд имеет две моды: 47 и 52.
Выполни задание:
В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки:
3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
Определите моду данного ряда.
Ответ: 4
Так, в ряду данных
47, 46, 50, 52, 47, 52, 49, 45, 43, 53 каждое из чисел 47 и 52 встречается два раза, а остальные числа – менее двух раз. В таких случаях условились считать, что ряд имеет две моды: 47 и 52.
- Медиана с нечётным числом членов – это число, записанное посередине.
- Медиана с чётным числом членов – это среднее арифметическое двух чисел , записанных посередине.
Например: определить медиану ряда чисел
1) 6; -4; 5; -2; -3; 3; 3; -2; 3.
Ответ: -3
2) -1; 0; 2; 1; -1; 0;2; -1.
Ответ: 0
Выполни задание:
медиану
- Среднее арифметическое – ЭТО частное от деления суммы чисел ряда на их количество.
Например: дан ряд чисел -1; 0; 2; 1; -1; 0; 2; -1.
Тогда среднее арифметическое будет равно: (-1+0+2+1+(-1)+0+2+(-1)) : 8= =2 : 8=0,25
Выполни задание:
среднее арифметическое
Ответ: 3,9
ПРАКТИЧЕСКАЯ РАБОТА
Задание: охарактеризовать успеваемость ученика Иванова по математике за четвертую четверть.
ВЫПОЛНЕНИЕ РАБОТЫ:
1.Сбор информации:
Выписаны оценки из журнала: 5,4,5,3,3,5,4,4,4.
2.Обработка полученных данных:
объём = 9
размах = 5 – 3 = 2
мода = 4
медиана = 3
среднее арифметическое =(5+4+5+3+3+5+4+4+4) : 9 ≈ 4
Характеристика успеваемости : ученик не всегда готов к уроку.
В основном учится на «4». За четверть выходит «4».
Надо найти объём ряда, размах ряда, моду, медиану и среднее арифметическое:
Карточка 1. 22,5; 23; 21,5; 22; 23.
Карточка 2. 6; -4; 5; -2; -3; 3; 3; -2; 3.
Карточка 3. 12,5; 12; 12; 12,5; 13; 12,5; 13.
Карточка 4. -1; 0; 2; 1; -1; 0; 2; -1.
Карточка 5. 125; 130; 124; 131.
Карточка 6. 120; 100; 110.
Карточка 1.
объём ряда = 5
размах ряда = 10
мода = 23
медиана = 21,5
среднее арифметическое = 13,3
Карточка 3.
объём ряда = 7
размах ряда = 1
мода = 12,5
медиана = 12,5
среднее арифметическое = 12,5
Карточка 2.
объём ряда = 9
размах ряда = 10
мода = 3
медиана = -3
среднее арифметическое = 1
Карточка 4.
объём ряда = 8
размах ряда = 3
мода = -1
медиана = 0
среднее арифметическое = 0,25
Карточка 5.
объём ряда = 4
размах ряда = 7
мода = нет
медиана = 127
среднее арифметическое =127,5
Карточка 6.
объём ряда = 3
размах ряда = 20
мода = нет
медиана = 100
среднее арифметическое = 110
Определение
Упорядоченными рядами данных называются ряды, в которых данные расположены по какому то правилу
Как упорядочить ряд чисел?
- Записать числа так, чтобы каждое последующее число было не меньше (не больше) предыдущего);
- записать некоторые названия «по алфавиту»…
Причем с ами данные в ряду данных не изменяются , а изменяется только порядок их следования
Выполни задание
Дан ряд чисел:
-1;-3;-3;-2;3;3;2;0;3;3;-3;-3;1;1;-3;-1
Упорядочить его по возрастанию чисел.
Решение:
-3;-3;-3;-3;-3;-2;-1;-1;0;1;1;2;3;3;3;3
Получился упорядоченный ряд.
Сами данные в нем не изменились, изменился только порядок их следования .
Таблица распределения данных – это таблица упорядоченного ряда, в котором вместо повторений одного и того же числа записывается количество повторений.
И наоборот, если известна таблица распределения, то можно составить упорядоченный ряд данных.
Например:
Из нее получается такой упорядоченный ряд:
-3;-3;-3;-1;-1;-1;-1;5;5;7;8;8;8;8;8
Результат измерения
Сколько раз встречается в ряде данных
-3
-1
3
4
5
7
2
1
8
5
Выполни задание:
В женском обувном магазине провели статистические исследования и составили соответствующую таблицу по цене обуви и количества продаж:
Цена (руб.): 500 1200 1500 1800 2000 2500
Количество: 8 9 14 15 3 1
Для данных показателей надо найти статистические характеристики:
- составить упорядоченный ряд данных
- объем ряда данных
- размах ряда
- моду ряда
- медиану ряда
- среднее арифметическое ряда данных
И ответить на следующие вопросы:
Мы познакомились с начальными понятиями того, как происходит статистическая обработка данных:
- данные всегда являются результатом какого-либо измерения
- у ряда некоторых данных можно найти:
объём, размах, моду, медиану и
среднее арифметическое
3) любой ряд данных можно
упорядочить и составить
таблицу распределения данных
Номинативный ряд данных – это НЕ ЧИСЛОВЫЕ ДАННЫЕ, а например, имена; названия; номинации…
Например: список финалистов чемпионатов мира по футболу с 1930 года: Аргентина, Чехословакия, Венгрия, Бразилия, Венгрия, Швеция, Чехословакия, ФРГ, Италия, Нидерланды, Нидерланды, ФРГ, ФРГ,
Аргентина, Италия, Бразилия, Германия, Франция
Выполни задание:
Решение : объём =18; мода – немецкая команда.
Вероятность случайного события
Частота результата = (сколько раз результат встретился) : (объем данного ряда)
Например:
19 5
частота 5:19
Процентная частота = (частота · 100% )
Например:
если частота результата равна 5:19 = 0,263157…, то процентная частота будет равна : 0,263 · 100 = 26,3%
Часто ответы для процентных частот могут быть не точными, а приближенными
Группировка данных – применяется когда различных результатов измерений слишком много.
Т.е их объединяют в группы.
При группировке различных данных информация становится менее точной.
Способы обработки данных:
- Таблица
- Диаграмма круговая (каламбер)
Год обучения
2007-2008
1-4 кл.
250
5-9 кл
2008-2009
2009-2010
10-11 кл
253
254
258
80
248
78
240
73
Способы обработки данных
- График
- Гистограмма
(столбчатая диаграмма)
В финал конкурса
«Мисс
факультета» вышли 10 студенток,
за которых голосовали
90 студентов.
Способы обработки данных
Каламбер:
Мы узнали, что….:
- Номинативный ряд – это….
- Частота результата – это….
- Группировка данных – это…
- Способы обработки данных :
1) таблица
2) график
3) гистограмма (или столбчатая диаграмма)
4) каламбер (или круговая диаграмма)
Спасибо за внимание!
План урока:
Понятие выборки и генеральной совокупности
Среднее арифметическое выборки
Упорядоченный ряд и таблица частот
Размах выборки
Мода выборки
Медиана выборки
Ошибки в статистике
Понятие выборки и генеральной совокупности
Слово статистика, образованное от латинского status(состояние дел), появилось только в 1746 году, когда его употребил немец Готфрид Ахенвалль. Однако ещё в Древнем Китае проводились переписи населения, в ходе которых правители собирали информацию о своих владениях и жителях, проживающих в них.
В основе любого статистического исследования лежит массив информации, который называют выборкой данных. Покажем это на примере. Пусть в классе, где учится 20 учеников, проводился тест по математике, содержавший 25 вопросов. В результате учащиеся показали следующие результаты:
Ряд чисел, приведенный во второй строке таблицы (12, 19, 19, 14, 17, 16, 18, 20, 15, 25, 13, 20, 25, 16, 17, 12, 24, 13, 21, 13), будет выборкой. Также ее могут называть рядом данных или выборочной совокупностью.
В примере с классом выборка состоит из 20 чисел. Эту величину (количество чисел в ряду) называют объемом выборки. Каждое отдельное число в ряду именуют вариантой выборки.
В примере со школьным классом в выборку попали все его ученики. Это позволяет точно определить, насколько хорошо учащиеся написали математический тест. Однако иногда необходимо проанализировать очень большие группы населения, состоящие из десятков и даже сотен миллионов человек. Например, необходимо узнать, какая часть населения страны курит. Опросить каждого жителя государства невозможно, поэтому в ходе исследования опрашивают лишь его малую часть. В этом случае статистики выделяют понятие генеральная совокупность.
Так, если с помощью опроса 10 тысяч человек ученые делают выводы о распространении курения в России, то все российское население будет составлять генеральную совокупность исследования, а опрошенные 10 тысяч людей вместе образуют выборку.
Среднее арифметическое выборки
Сбор информации о выборке является лишь первой стадией статистического исследования. Далее ее необходимо обобщить, то есть получить некоторые цифры, характеризующие выборку. Самой часто используемой статистической характеристикой является среднее арифметическое.
Другими словами, для подсчета среднего арифметического необходимо просто сложить все числа в ряде данных, а потом поделить получившееся значение на количество чисел в ряде. Так, в примере с тестом по математике (таблица 1) средний балл учащихся составит: (12+19+19+14+17+16+18+20+15+25+13+20+25+16+17+12+24+13+21+13):20=
= 349:20 = 17,45.
Среднее арифметическое позволяет одним числом характеризовать какое-либо качество всех объектов группы. Чем больше средний балл учащихся в классе, тем выше их успеваемость. Чем меньше среднее количество голов, пропускаемых футбольной командой за один матч, тем лучше она играет в обороне. Если средняя зарплата программистов в городе составляет 90 тысяч рублей, а дворников – 25 тысяч рублей, то это значит, что программисты значительно более востребованы на рынке труда, а потому при выборе будущей профессии лучше предпочесть именно эту специальность.
Упорядоченный ряд и таблица частот
В ряде данных в таблице 1 числа приведены в произвольном порядке. Перепишем ряд так, чтобы все числа шли в неубывающем порядке, то есть от самого маленького к самому большому:
12, 12, 13, 13, 13, 14, 15, 16, 16, 17, 17, 18, 19, 19, 20, 20, 21, 24, 25, 25.
Такую запись называют упорядоченным рядом данных.
Его характеристики ничем не отличаются от изначальной выборки, однако с ним удобнее работать. С его помощью можно видеть, что ни одному ученику не удалось набрать 22 или 23 балла на тесте, но сразу двое учащихся дали 25 правильных ответов. На основе упорядоченного ряда данных несложно составить таблицу частот, в которой будет указано, как часто та или иная варианта выборки встречается в ряде. Выглядеть она будет так:
При составлении этой таблицы мы исключили из нее те варианты количества набранных баллов, частота которых равна нулю (от 0 до 12, 22 и 23).Заметим, что сумма чисел в нижней строке таблицы частот должна равняться объему выборки. Действительно,
2+3+1+1+2+2+1+2+2+1+1+2 = 20.
С помощью таблицы частот можно быстрее посчитать среднее арифметическое выборки. Для этого каждую варианту надо умножить на ее частоту, после чего сложить полученные результаты и поделить их на объем выборки:
(12•2+13•3+14•1+15•1+16•2+17•2+18•1+19•2+20•2+21•1+24•1+25•2):20 =
(24+39+14+15+32+34+18+38+40+42+24+50):20 = 349:20 = 17,45.
Размах выборки
Следующий важная характеристика ряда данных – это размах выборки.
Если выборка представлена в виде упорядоченного ряда данных, то достаточно вычесть из последнего числа ряда первое число. Так, размах выборки результатов теста в классе равен:
25 – 12 = 13,
так как самые лучшие ученики смогли решить все 25 заданий, а наихудший учащийся ответил правильно только на 13 вопросов.
Размах выборки характеризует стабильность, однородность исследуемых свойств. Например, пусть два спортсмена-стрелка в ходе соревнований производят по 5 выстрелов по круговой мишени, где за попадание начисляют от 0 до 10 очков. Первый стрелок показал результаты 8, 9, 9, 8, 9 очков. Второй же спортсмен в своих попытках показал результаты 7, 10, 10, 6, 10. Средние арифметические этих рядов равны:
(8+9+9+8+9):5 = 43:5 = 8,6;
(7+10+10+6+10):5 = 43:5 = 8,6.
Получается, что в среднем оба стрелка стреляют одинаково точно, однако первый спортсмен демонстрирует более стабильные результаты. У его выборки размах равен
9 – 8 = 1,
в то время как размах выборки второго спортсмена равен
10 – 6 = 4.
Размах выборки может быть очень важен в метеорологии. Например, в Алма-Ате и Амстердаме средняя температура в течение года почти одинакова и составляет 10°С. Однако в Алма-Ате в январе и феврале иногда фиксируются температуры ниже -30°С, в то время как в Амстердаме за всю историю наблюдений она никогда не падала ниже -20°С.
Мода выборки
Иногда важно знать не среднее арифметическое выборки, а то, какая из ее вариант встречается наиболее часто. Так, при управлении магазином одежды менеджеру не важен средний размер продаваемых футболок, а необходима информация о том, какие размеры наиболее популярны. Для этого используется такой показатель, как мода выборки.
В примере с математическим тестом сразу 3 ученика набрали по 13 баллов, а частота всех других вариант не превысила 2, поэтому мода выборки равна 13. Возможна ситуация, когда в ряде есть сразу две или более вариант, которые встречаются одинаково часто и чаще остальных вариант. Например, в ряде
1, 2, 3, 3, 3, 4, 5, 5, 5
варианты 3 и 5 встречаются по три раза. В таком случае ряд имеет сразу две моды – 3 и 5, а всю выборку именуют мультимодальной. Особо выделяется случай, когда в выборке все варианты встречаются с одинаковой частотой:
6, 6, 7, 7, 8, 8.
Здесь числа 6, 7 и 8 встречаются одинаково часто (по два раза), а другие варианты отсутствуют. В таких случаях говорят, что ряд не имеет моды.
Медиана выборки
Иногда, например, при расчете средней зарплаты, среднее арифметическое не вполне адекватно отражает ситуацию. Это происходит из-за наличия в выборке чисел, очень сильно отличающихся от среднего. Так, из-за огромных зарплат некоторых начальников большинство рядовых сотрудников компаний обнаруживают, что их зарплата ниже средней. В таких случаях целесообразно использовать такую характеристику, как медиану ряда. Это такое значение, которое делит ряд данных пополам. В упорядоченном ряде 2, 3, 6, 8, 8, 12, 15, 15, 18, 19, 25 медианой будет равна 12, так как именно она находится в середине ряда:
Однако таким образом можно найти только медиану ряда, в котором находится нечетное количество чисел. Если же их количество четное, то за медиану условно принимают среднее арифметическое двух средних чисел. Так, для ряда 2, 3, 6, 8, 8, 12, 15, 15, 18, 19, 25, 30, содержащего 12 чисел, медиана будет равна среднему значению 12 и 15, которые занимают 6-ое и 7-ое место в ряду:
Вернемся к примеру с математическим тестом в школе. Так как его сдавали 20 учеников, а 20 – четное число, то для расчета медианы следует найти среднее арифметическое 10-ого и 11-ого числа в упорядоченном ряде
12, 12, 13, 13, 13, 14, 15, 16, 16, 17, 17, 18, 19, 19, 20, 20, 21, 24, 25, 25.
Эти места занимают числа 17 и 17 (выделены жирным шрифтом). Медиана ряда будет равна
(17+17):2 = 34:2 = 17.
Три приведенные основные статистические характеристики выборки, а именно среднее арифметическое, мода и медиана, называются мерами центральной тенденции. Они позволяют одним числом указать значение, относительно которого группируются все числа ряда.
Рассмотрим для наглядности ещё один пример. Врач в ходе диспансеризации измерил вес мальчиков в классе. В результате он получил 10 значений (в кг):
39, 41, 67, 36, 60, 58, 46, 44, 39, 69.
Найдем среднее арифметическое, размах, моду и медиану для этого ряда.
Решение. Сначала перепишем ряд в упорядоченном виде:
36, 39, 39, 41, 44, 46, 58, 60, 67, 69.
Так как в ряде 10 чисел, то объем выборки равен 10. Найдем среднее арифметическое. Для этого сложим все числа в ряде и поделим их на объем выборки (то есть на 10):
(36+39+39+41+44+46+58+60+67+69):10 =
= 499:10 = 49,9 кг.
Размах выборки равен разнице между наибольшей и наименьшей вариантой в ней. Самый тяжелый мальчик весит 69 кг, а самый легкий – 36 кг, а потому размах ряда равен
69 – 36 = 33 кг.
В упорядоченном ряде только одно число, 39, встречается дважды, а все остальные числа встречаются по одному разу. Поэтому мода ряда будет равна 39 кг.
В выборке 10 чисел, а это четное число. Поэтому для нахождения медианы надо найти два средних по счету значение найти их среднее. На 5-ом и 6-ом месте в ряде находятся числа 44 и 46. Их среднее арифметическое равно
(44+46):2 = 90:2 = 45 кг.
Поэтому и медиана ряда будет равна 45 кг.
Ошибки в статистике
Статистика является очень мощным инструментом для исследований во всех областях человеческой деятельности. Однако иногда ее иронично называют самой точной из лженаук. Известно и ещё одно высказывание, приписываемое политику Дизраэли, согласно которому существует просто ложь, наглая ложь и статистика. С чем же связана такая репутация этой дисциплины?
Дело в том, что некоторые люди и организации часто манипулируют данными статистики, чтобы убедить других в своей правоте или преимуществах товара, которые они продают. Требуются определенные навыки, чтобы правильно пользоваться статистикой. Одна из самых распространенных ошибок – это неправильный выбор выборки.
В 1936 году перед президентскими выборами в США был проведен телефонный опрос, который показал, что с большим преимуществом победу должен одержать Альфред Лендон. Однако на выборах Франклин Рузвельт набрал почти вдвое больше голосов. Ошибка была связана с тем, что в те годы телефон могли позволить себе только богатые люди, которые в большинстве своем поддерживали Лендона. Однако бедные люди (а их, конечно же, больше, чем богатых) голосовали за Рузвельта.
Ещё один пример – это агитация в конце XIX века в США к службе на флоте. Пропагандисты в своей рекламе указывали, что, согласно статистике, смертность на флоте во время войны (испано-американской) составляет 0,09%, в то время как среди населения Нью-Йорка она равнялась 0,16%. Получалось, что служить на флоте в военное время безопаснее, чем жить мирной жизнью. Однако на самом деле причина таких цифр заключается в том, что во флот всегда отбирали молодых мужчин с хорошим здоровьем, которые не могли умереть от «старческих» болезней, в то время как в население Нью-Йорка входят больные и старые люди.
При указании среднего значения исследователь может использовать разные характеристики – среднее арифметическое, медиана, мода. При этом почти всегда среднее арифметическое несколько больше медианы. Именно поэтому большинство людей, узнающих о средней зарплате в стране, удивляются, так как они столько не зарабатывают. Правильнее ориентироваться на медианную зарплату.
Ну и наконец, нельзя забывать, что любая статистика может показать только корреляцию между двумя величинами, но это не всегда означает причинно-следственную связь. Так, известно, что чем больше в городе продается мороженого, тем больше в это же время людей тонет на пляжах. Означает ли это, что поедание мороженого увеличивает риск во время плавания? Нет. Дело в том, что оба этих показателя, продажи мороженого и количество утонувших, зависят от третьей величины – температуры в городе. Чем жарче на улице, тем большее количество людей ходят на пляж и тем больше мороженого продается в магазинах.