Загрузить PDF
Загрузить PDF
В статистике размах – разница между наибольшим и наименьшим результатами наблюдений. Размах показывает разброс значений в совокупности данных. Если размах большой, то значения в совокупности сильно разбросаны; если размах – небольшая величина, то значения в совокупности лежат близко друг к другу. Если вы хотите узнать, как вычислить размах, выполните следующие действия.
Шаги
-
1
Запишите значения совокупности данных. Чтобы найти размах, нужно перечислить все значения для определения максимального и минимального чисел. Например: 14 , 19, 20 , 24, 25, 28.
- Будет легче определить наибольшее и наименьшее значение в совокупности, если вы запишете значения в порядке возрастания. В нашем примере: 14, 19, 20, 24, 24, 25, 28 .
- Запись значений по возрастанию также может помочь вам сделать другие расчеты, как например моду, среднее или медиану совокупности.
-
2
Определите максимальное и минимальное числа. В нашем примере, это 14 и 28.
-
3
Вычтете наименьшее число из наибольшего. Теперь, когда вы определили самое маленькое и самое большое число в совокупности, вам нужно вычесть их друг из друга: 25 – 14 = 11 – это и есть размах.
-
4
Выделите размах. Как только вы нашли размах, четко выделите его. Это поможет вам избежать путаницы с любыми другими статистическими величинами, такими как среднее, медиана или мода.
Реклама
Советы
- Медиана статистической совокупности данных – такое значение, которое делит эту совокупность на две равные части. Таким образом, медиана не вычисляется путем деления размаха на 2. Чтобы найти медиану, необходимо перечислить значения данных по возрастанию и найти значение в середине списка. Это значение и является медианой. Например, если у Вас есть список из 29 значений (по возрастанию), пятнадцатое значение будет равноудалено от верхней и нижней части этого списка, так что пятнадцатое значение является медианой, независимо от того, как это значение соотносится с размахом.
- Вы также можете интерпретировать “размах” в алгебраических выражениях, но сначала Вы должны понять концепцию алгебраической функции. Так как функция может быть задана на любом числе, даже неизвестном, то это число представляется в виде переменной (обычно «х»). Область определения – множество всех возможных значений х. Область значения функции (размах) – множество всех возможных значений функции (у) при определенных значениях х. К сожалению, нет единого способа вычислить область значения функции. Иногда, построив график функции или вычислив несколько значений, можно получить четкую закономерность.
Реклама
Об этой статье
Эту страницу просматривали 51 992 раза.
Была ли эта статья полезной?
Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 26 февраля 2021 года; проверки требуют 3 правки.
У этого термина существуют и другие значения, см. размах.
Размах — разность между наибольшим и наименьшим значениями результатов наблюдений. Пусть — взаимно независимые случайные величины с функцией распределения и плотностью вероятности . В этом случае размах определяется как разность между наибольшим и наименьшим значениями среди ; размах представляет собой случайную величину, которой соответствует функция распределения:
(при w >= 0; если w < 0, то P {W <= w} = 0).
В математической статистике размах, надлежащим образом нормированный, применяется как оценка неизвестного квадратичного отклонения. Например, если имеют нормальное распределение с параметрами (а, s), то при n = 5 и 10, соответственно, величины 0,4299W5 и 0,3249W10 будут несмещенными оценками s. Такие оценки часто используют при статистическом контроле качества, поскольку определение Р. нескольких результатов измерений не требует сложных вычислений.
Литература[править | править код]
- Вальд А. , Математическая статистика с техническими приложениями, пер. с англ., М., 1956.
Примечания[править | править код]
Кроме среднего арифметического числовой ряд можно описать и с помощью других характеристик. Одной из них является размах ряда.
В статистике размахом ряда называют разницу между самым большим и самым маленьким результатами наблюдений. Другими словами, в совокупности данных размах отражает разброс значений.
Таким образом, если размах — большая величина, то и значения в совокупности будут сильно разбросаны, а если размах маленький, то, соответственно, значения будут располагаться рядом друг с другом.
На письме размах ряда обычно сокращенно обозначают буквой $R$.
Размах ряда — это разность между наибольшим и наименьшим значениями чисел.
Формула для расчета
Для того чтобы рассчитать размах ряда, можно применить следующую формулу:
$$textcolor{blue}{R}=textcolor{lightblue}{x}-textcolor{green}{y}$$
В свою очередь, $textcolor{blue}{R}$ — размах ряда, $textcolor{lightblue}{x}$ — максимальное значение, а $textcolor{green}{y}$ — минимальное. Используя эту формулу можно с легкостью решать задачи, где нужно найти значение $textcolor{blue}{R}$.
Чтобы найти размах ряда нужно из наибольшего значения вычесть наименьшее.
Рассмотрим на примере. Дровосек пилил бревно. Чтобы брёвна можно было аккуратно сложить, он старался делать их примерно одной длины. Когда работа была сделана, он решил проверить, как хорошо у него это получилось. Для этого он измерил все брёвна и получил такие значения:
$$43, 32, 36, 51, 48$$
Рассчитаем размах ряда. Выбираем самое большое и самое маленькое число.
$$43, textcolor{green}{32}, 36, textcolor{lightblue}{51}, 48$$
Вычитаем из наибольшего наименьшее:
$$textcolor{lightblue}{51}-textcolor{green}{32} = 19$$
$19$ — размах ряда.
Как найти размах в численных данных? Работа с большими численными данными тесно связана со статистикой. Размах — это статистический термин, который определяет простое действие над численными данными.
Статистика — раздел математики, в котором изучают информацию разного рода, а также проводят над ней всякие операции, чтобы:
выявить закономерности;
спрогнозировать вероятности;
проанализировать результаты каких-либо действий;
и др.
Сегодня мы не будем изучать все статистические операции над численной информацией, но подробнее остановимся на вопросе: как найти размах?
Как найти размах
Чтобы найти размах в статистике, нам нужно будет коротко остановиться еще на двух терминах: объем и выборка.
Для удобства давайте разработаем условный недельный бюджет расходов. Например:
понедельник — 110;
вторник — 140;
среда — 100;
четверг — 160;
пятница — 260;
суббота — 220;
воскресенье — 50.
Допустим, такой бюджет мы составили на 1 месяц, чтобы понять наши ежемесячные расходы. Если мы возьмем из месячной статистики результаты одной недели, тогда это и будет выборкой. То есть выборка — это определенное количество информации из большого массива данных, которую вы извлекли для дальнейшего анализа. В выборке может участвовать любое количество элементов.
Обычно элементам выборки для удобства присваивают индексы при помощи переменных. Например: x1, x2, x3 и др. То есть в нашем случае у нас будет х1 – х7 или 7 элементов. Количество элементов выборки — это и есть объем. По сути, мы имеет выборку объемом в 7 элементов. Теперь самое важное — как найти размах?
Размах в статистике
Размах в статистике, он же размах в выборке — это разница между самым большим элементом выборки и самым маленьким. Глядя на наш еженедельный бюджет, мы видим, что самым большим элементом у нас является 260, а самым маленьким — 50.
Как найти размах нашей выборки: 260 – 50 = 210. Размах нашей выборки равен 210. Размах в статистике помогает определить амплитуду изменений наших статистических данных.
Как найти размах, используя программирование
Искать размах в статистике при помощи программирования — это базовые вещи, которые изучают все специалисты big data. Поиск осуществляется на том языке, при помощи которого вы взаимодействуете с данными. Например: Python, R, Java, Scala, Julia и др. Язык влияет только на реализацию поиска размаха, но алгоритм будет везде одинаковый.
Как найти размах в статистике при помощи программирования:
Вначале нужно сделать выборку данных из их общего массива.
Отсортировать элементы выборки по возрастанию, то есть от меньшего к большему.
После сортировки нужно определить наименьшее и наибольшее значения элементов. После сортировки элемент выборки с самым меньшим индексом будет иметь наименьшее значение, элемент с наибольшим индексом будет иметь наибольшее значение.
Математически вычислить разницу между большим и меньшим значениями выборки.
Вывести полученный размах на экран.
Заключение
Как найти размах в статистике? Для этого нужно определить наибольшее и наименьшее значения выборки и найти их разницу. Реализовать подобные действия можно при помощи любого языка программирования, который поддерживает работу с массивами данных.
План урока:
Понятие выборки и генеральной совокупности
Среднее арифметическое выборки
Упорядоченный ряд и таблица частот
Размах выборки
Мода выборки
Медиана выборки
Ошибки в статистике
Понятие выборки и генеральной совокупности
Слово статистика, образованное от латинского status(состояние дел), появилось только в 1746 году, когда его употребил немец Готфрид Ахенвалль. Однако ещё в Древнем Китае проводились переписи населения, в ходе которых правители собирали информацию о своих владениях и жителях, проживающих в них.
В основе любого статистического исследования лежит массив информации, который называют выборкой данных. Покажем это на примере. Пусть в классе, где учится 20 учеников, проводился тест по математике, содержавший 25 вопросов. В результате учащиеся показали следующие результаты:
Ряд чисел, приведенный во второй строке таблицы (12, 19, 19, 14, 17, 16, 18, 20, 15, 25, 13, 20, 25, 16, 17, 12, 24, 13, 21, 13), будет выборкой. Также ее могут называть рядом данных или выборочной совокупностью.
В примере с классом выборка состоит из 20 чисел. Эту величину (количество чисел в ряду) называют объемом выборки. Каждое отдельное число в ряду именуют вариантой выборки.
В примере со школьным классом в выборку попали все его ученики. Это позволяет точно определить, насколько хорошо учащиеся написали математический тест. Однако иногда необходимо проанализировать очень большие группы населения, состоящие из десятков и даже сотен миллионов человек. Например, необходимо узнать, какая часть населения страны курит. Опросить каждого жителя государства невозможно, поэтому в ходе исследования опрашивают лишь его малую часть. В этом случае статистики выделяют понятие генеральная совокупность.
Так, если с помощью опроса 10 тысяч человек ученые делают выводы о распространении курения в России, то все российское население будет составлять генеральную совокупность исследования, а опрошенные 10 тысяч людей вместе образуют выборку.
Среднее арифметическое выборки
Сбор информации о выборке является лишь первой стадией статистического исследования. Далее ее необходимо обобщить, то есть получить некоторые цифры, характеризующие выборку. Самой часто используемой статистической характеристикой является среднее арифметическое.
Другими словами, для подсчета среднего арифметического необходимо просто сложить все числа в ряде данных, а потом поделить получившееся значение на количество чисел в ряде. Так, в примере с тестом по математике (таблица 1) средний балл учащихся составит: (12+19+19+14+17+16+18+20+15+25+13+20+25+16+17+12+24+13+21+13):20=
= 349:20 = 17,45.
Среднее арифметическое позволяет одним числом характеризовать какое-либо качество всех объектов группы. Чем больше средний балл учащихся в классе, тем выше их успеваемость. Чем меньше среднее количество голов, пропускаемых футбольной командой за один матч, тем лучше она играет в обороне. Если средняя зарплата программистов в городе составляет 90 тысяч рублей, а дворников – 25 тысяч рублей, то это значит, что программисты значительно более востребованы на рынке труда, а потому при выборе будущей профессии лучше предпочесть именно эту специальность.
Упорядоченный ряд и таблица частот
В ряде данных в таблице 1 числа приведены в произвольном порядке. Перепишем ряд так, чтобы все числа шли в неубывающем порядке, то есть от самого маленького к самому большому:
12, 12, 13, 13, 13, 14, 15, 16, 16, 17, 17, 18, 19, 19, 20, 20, 21, 24, 25, 25.
Такую запись называют упорядоченным рядом данных.
Его характеристики ничем не отличаются от изначальной выборки, однако с ним удобнее работать. С его помощью можно видеть, что ни одному ученику не удалось набрать 22 или 23 балла на тесте, но сразу двое учащихся дали 25 правильных ответов. На основе упорядоченного ряда данных несложно составить таблицу частот, в которой будет указано, как часто та или иная варианта выборки встречается в ряде. Выглядеть она будет так:
При составлении этой таблицы мы исключили из нее те варианты количества набранных баллов, частота которых равна нулю (от 0 до 12, 22 и 23).Заметим, что сумма чисел в нижней строке таблицы частот должна равняться объему выборки. Действительно,
2+3+1+1+2+2+1+2+2+1+1+2 = 20.
С помощью таблицы частот можно быстрее посчитать среднее арифметическое выборки. Для этого каждую варианту надо умножить на ее частоту, после чего сложить полученные результаты и поделить их на объем выборки:
(12•2+13•3+14•1+15•1+16•2+17•2+18•1+19•2+20•2+21•1+24•1+25•2):20 =
(24+39+14+15+32+34+18+38+40+42+24+50):20 = 349:20 = 17,45.
Размах выборки
Следующий важная характеристика ряда данных – это размах выборки.
Если выборка представлена в виде упорядоченного ряда данных, то достаточно вычесть из последнего числа ряда первое число. Так, размах выборки результатов теста в классе равен:
25 – 12 = 13,
так как самые лучшие ученики смогли решить все 25 заданий, а наихудший учащийся ответил правильно только на 13 вопросов.
Размах выборки характеризует стабильность, однородность исследуемых свойств. Например, пусть два спортсмена-стрелка в ходе соревнований производят по 5 выстрелов по круговой мишени, где за попадание начисляют от 0 до 10 очков. Первый стрелок показал результаты 8, 9, 9, 8, 9 очков. Второй же спортсмен в своих попытках показал результаты 7, 10, 10, 6, 10. Средние арифметические этих рядов равны:
(8+9+9+8+9):5 = 43:5 = 8,6;
(7+10+10+6+10):5 = 43:5 = 8,6.
Получается, что в среднем оба стрелка стреляют одинаково точно, однако первый спортсмен демонстрирует более стабильные результаты. У его выборки размах равен
9 – 8 = 1,
в то время как размах выборки второго спортсмена равен
10 – 6 = 4.
Размах выборки может быть очень важен в метеорологии. Например, в Алма-Ате и Амстердаме средняя температура в течение года почти одинакова и составляет 10°С. Однако в Алма-Ате в январе и феврале иногда фиксируются температуры ниже -30°С, в то время как в Амстердаме за всю историю наблюдений она никогда не падала ниже -20°С.
Мода выборки
Иногда важно знать не среднее арифметическое выборки, а то, какая из ее вариант встречается наиболее часто. Так, при управлении магазином одежды менеджеру не важен средний размер продаваемых футболок, а необходима информация о том, какие размеры наиболее популярны. Для этого используется такой показатель, как мода выборки.
В примере с математическим тестом сразу 3 ученика набрали по 13 баллов, а частота всех других вариант не превысила 2, поэтому мода выборки равна 13. Возможна ситуация, когда в ряде есть сразу две или более вариант, которые встречаются одинаково часто и чаще остальных вариант. Например, в ряде
1, 2, 3, 3, 3, 4, 5, 5, 5
варианты 3 и 5 встречаются по три раза. В таком случае ряд имеет сразу две моды – 3 и 5, а всю выборку именуют мультимодальной. Особо выделяется случай, когда в выборке все варианты встречаются с одинаковой частотой:
6, 6, 7, 7, 8, 8.
Здесь числа 6, 7 и 8 встречаются одинаково часто (по два раза), а другие варианты отсутствуют. В таких случаях говорят, что ряд не имеет моды.
Медиана выборки
Иногда, например, при расчете средней зарплаты, среднее арифметическое не вполне адекватно отражает ситуацию. Это происходит из-за наличия в выборке чисел, очень сильно отличающихся от среднего. Так, из-за огромных зарплат некоторых начальников большинство рядовых сотрудников компаний обнаруживают, что их зарплата ниже средней. В таких случаях целесообразно использовать такую характеристику, как медиану ряда. Это такое значение, которое делит ряд данных пополам. В упорядоченном ряде 2, 3, 6, 8, 8, 12, 15, 15, 18, 19, 25 медианой будет равна 12, так как именно она находится в середине ряда:
Однако таким образом можно найти только медиану ряда, в котором находится нечетное количество чисел. Если же их количество четное, то за медиану условно принимают среднее арифметическое двух средних чисел. Так, для ряда 2, 3, 6, 8, 8, 12, 15, 15, 18, 19, 25, 30, содержащего 12 чисел, медиана будет равна среднему значению 12 и 15, которые занимают 6-ое и 7-ое место в ряду:
Вернемся к примеру с математическим тестом в школе. Так как его сдавали 20 учеников, а 20 – четное число, то для расчета медианы следует найти среднее арифметическое 10-ого и 11-ого числа в упорядоченном ряде
12, 12, 13, 13, 13, 14, 15, 16, 16, 17, 17, 18, 19, 19, 20, 20, 21, 24, 25, 25.
Эти места занимают числа 17 и 17 (выделены жирным шрифтом). Медиана ряда будет равна
(17+17):2 = 34:2 = 17.
Три приведенные основные статистические характеристики выборки, а именно среднее арифметическое, мода и медиана, называются мерами центральной тенденции. Они позволяют одним числом указать значение, относительно которого группируются все числа ряда.
Рассмотрим для наглядности ещё один пример. Врач в ходе диспансеризации измерил вес мальчиков в классе. В результате он получил 10 значений (в кг):
39, 41, 67, 36, 60, 58, 46, 44, 39, 69.
Найдем среднее арифметическое, размах, моду и медиану для этого ряда.
Решение. Сначала перепишем ряд в упорядоченном виде:
36, 39, 39, 41, 44, 46, 58, 60, 67, 69.
Так как в ряде 10 чисел, то объем выборки равен 10. Найдем среднее арифметическое. Для этого сложим все числа в ряде и поделим их на объем выборки (то есть на 10):
(36+39+39+41+44+46+58+60+67+69):10 =
= 499:10 = 49,9 кг.
Размах выборки равен разнице между наибольшей и наименьшей вариантой в ней. Самый тяжелый мальчик весит 69 кг, а самый легкий – 36 кг, а потому размах ряда равен
69 – 36 = 33 кг.
В упорядоченном ряде только одно число, 39, встречается дважды, а все остальные числа встречаются по одному разу. Поэтому мода ряда будет равна 39 кг.
В выборке 10 чисел, а это четное число. Поэтому для нахождения медианы надо найти два средних по счету значение найти их среднее. На 5-ом и 6-ом месте в ряде находятся числа 44 и 46. Их среднее арифметическое равно
(44+46):2 = 90:2 = 45 кг.
Поэтому и медиана ряда будет равна 45 кг.
Ошибки в статистике
Статистика является очень мощным инструментом для исследований во всех областях человеческой деятельности. Однако иногда ее иронично называют самой точной из лженаук. Известно и ещё одно высказывание, приписываемое политику Дизраэли, согласно которому существует просто ложь, наглая ложь и статистика. С чем же связана такая репутация этой дисциплины?
Дело в том, что некоторые люди и организации часто манипулируют данными статистики, чтобы убедить других в своей правоте или преимуществах товара, которые они продают. Требуются определенные навыки, чтобы правильно пользоваться статистикой. Одна из самых распространенных ошибок – это неправильный выбор выборки.
В 1936 году перед президентскими выборами в США был проведен телефонный опрос, который показал, что с большим преимуществом победу должен одержать Альфред Лендон. Однако на выборах Франклин Рузвельт набрал почти вдвое больше голосов. Ошибка была связана с тем, что в те годы телефон могли позволить себе только богатые люди, которые в большинстве своем поддерживали Лендона. Однако бедные люди (а их, конечно же, больше, чем богатых) голосовали за Рузвельта.
Ещё один пример – это агитация в конце XIX века в США к службе на флоте. Пропагандисты в своей рекламе указывали, что, согласно статистике, смертность на флоте во время войны (испано-американской) составляет 0,09%, в то время как среди населения Нью-Йорка она равнялась 0,16%. Получалось, что служить на флоте в военное время безопаснее, чем жить мирной жизнью. Однако на самом деле причина таких цифр заключается в том, что во флот всегда отбирали молодых мужчин с хорошим здоровьем, которые не могли умереть от «старческих» болезней, в то время как в население Нью-Йорка входят больные и старые люди.
При указании среднего значения исследователь может использовать разные характеристики – среднее арифметическое, медиана, мода. При этом почти всегда среднее арифметическое несколько больше медианы. Именно поэтому большинство людей, узнающих о средней зарплате в стране, удивляются, так как они столько не зарабатывают. Правильнее ориентироваться на медианную зарплату.
Ну и наконец, нельзя забывать, что любая статистика может показать только корреляцию между двумя величинами, но это не всегда означает причинно-следственную связь. Так, известно, что чем больше в городе продается мороженого, тем больше в это же время людей тонет на пляжах. Означает ли это, что поедание мороженого увеличивает риск во время плавания? Нет. Дело в том, что оба этих показателя, продажи мороженого и количество утонувших, зависят от третьей величины – температуры в городе. Чем жарче на улице, тем большее количество людей ходят на пляж и тем больше мороженого продается в магазинах.