Download Article
Download Article
How to find the mode, median, mean and range. Be sure to arrange the numbers by their numerical value. The order should range from low to high or high to low. An example of correct order would be: 1, 8, 12, 16, 18 and 22. An incorrect order wold be: 8, 1, 12, 18, 16 and 22. Follow these steps to figure out the different attributes:
-
1
Order the set of numbers.[1]
-
2
Identify the number that appears most often.[2]
- This number is the mode of the given set of numbers.
- This number is the mode of the given set of numbers.
Advertisement
-
1
Order the set of numbers.
-
2
If the amount of numbers is odd, count equally sideways to find the number in the middle. The middle number is the median of the given set of numbers.[3]
-
3
If the amount of numbers is even, find the average of the 2 numbers in the middle. This number is the median of the given set of numbers.[4]
Advertisement
-
1
Add the numbers together.
-
2
Divide the total by the amount of numbers in the set.[5]
- The result is the mean (or average) of the given set of numbers.
- The result is the mean (or average) of the given set of numbers.
Advertisement
-
1
Find the highest and lowest number in the set.
-
2
Find the difference between the highest and lowest number in the set.[6]
- The difference is the range of the given set of numbers.
- The difference is the range of the given set of numbers.
Advertisement
Add New Question
-
Question
Alison has 6 blank cards . What should she write on them to get mean 6, mode 6, median 6, range 2?
She would have to write (in no particular order): 5, 6, 6, 6, 6, and 7. The mean is (5+6+6+6+6+7) ÷ 6 = 36/6 = 6. The mode is 6, because there are more sixes than any other number. The median is 6, because if the six numbers are written in either descending or ascending order, the average of the two middle numbers (6 and 6) is 6. The range is 2, because the difference between the highest and lowest numbers (7 and 5) is 2.
-
Question
If there is a zero in the set of numbers, how is the range to be found?
The same way you usually would. Find the difference between the highest and lowest numbers, and if one of those happens to be zero, then just use zero.
-
Question
If within a set of numbers, the numbers occur the same number of times, how do I find the mode?
This would be a multi-modal data set where each number is a mode.
See more answers
Ask a Question
200 characters left
Include your email address to get a message when this question is answered.
Submit
Advertisement
Video
-
To remember the meaning of Median: Median sounds like Medium – Middle.
-
To remember the meaning of Range: You can think of mountain ranges that range from highest peak to lowest peak.
-
To remember the meaning of Mean/Average: You can think that Mean is the meanest equation/Think of Average heights.
Show More Tips
Thanks for submitting a tip for review!
Advertisement
-
Don’t forget to order your numbers.
Advertisement
References
About This Article
Article SummaryX
The mode, median, mean, and range are all used to describe a set of numbers. The mode is the number that appears most frequently. The median is the number in the set that’s in the middle. The mean is the average of all the numbers in the set, and the range is the difference between the highest and lowest numbers in the set. To figure them out, first, order the set of numbers numerically. Look for the number that appears most often. This number is the range. Then, find the median by picking the middle number. For instance, if you have 9 numbers, the 5th number is your median. To find the mean, add all the numbers in the set together, then divide them by the amount of numbers in the set. For the range, subtract the lowest number from the highest number. The difference is the range. To learn how to find the median in an even set of numbers, read on!
Did this summary help you?
Thanks to all authors for creating a page that has been read 80,373 times.
Did this article help you?
При анализе наборов данных в предстатистических курсах вам часто может потребоваться найти диапазон чисел данного набора. Значение диапазона указывает степень разнообразия в наборе данных. Это общая математическая проблема, с которой студенты могут столкнуться во многих стандартных тестах. Как только вы узнаете, что такое математическое определение диапазона, вы можете использовать простую математическую операцию для решения этого типа проблемы.
-
Когда числа в наборе данных очень разбросаны, диапазон будет иметь тенденцию быть большим. (См. Ссылку 2)
Помимо термина “статистический диапазон”, некоторые другие термины, связанные с анализом наборов данных, представляют собой среднее значение, медиану и режим (См. Ресурс 1)
Знайте, что для вычисления диапазона чисел набора данных вы должны вычесть наименьшее числовое значение из наибольшего числового значения в наборе. Диапазон представляет собой просто разницу этих двух чисел и указывает, насколько разбросан набор данных. Обратите внимание, что набор данных – это просто список чисел.
Порядок чисел, указанных в наборе данных, от наименьшего до наибольшего значения, чтобы облегчить расчет. Как пример, используйте набор данных с номерами 10, 8, 11, 12, 1, 3, 1, 4, 6 и 5. Расположите эти числа в порядке возрастания, чтобы получить 1, 1, 3, 4, 5, 6, 8, 10, 11 и 12.
Найдите самые маленькие и самые большие номера набора данных. Для примера, приведенного на шаге 2, эти числа равны 1 и 12 соответственно.
Рассчитайте диапазон набора данных, вычтя наименьшее из наибольшего числа, указанного на шаге 3. Диапазон для примера – 12 – 1 = 11.
Практикуйте метод, описанный в шагах 2 – 4, чтобы найти диапазон следующих тестовых оценок: 55, 60, 75, 80, 85, 90 и 100. Поскольку оценки уже в порядке от наименьшего до наибольшего значения, вы вычитаете 55 из 100, чтобы получить 45 в качестве диапазона для этого набора данных.
подсказки
Описание изображения
Вид на пустую аудиторию колледжа с задней стороны.
Для любого человека, заинтересованного в карьере математика или человека, который использует математику, например, в бизнесе, важно уметь четко объяснять формулы и решения. В случае нахождения диапазона функции, вы можете найти это значение несколькими способами. Умение объяснить эти методы может оказаться полезным по мере развития ваших математических и коммуникативных навыков.
В этой статье мы дадим определение математического диапазона, области и функции, а затем расскажем, как найти диапазон функции с помощью формулы, графика и отношения.
Основные выводы:
-
В математике функция представляет собой определенную связь между независимой переменной (x) и зависимой переменной (y).
-
Диапазон функции относится ко всем возможным значениям y.
-
Формула для нахождения диапазона функции: y = f(x). Отношение является функцией только в том случае, если каждому значению x соответствует только одно значение y.
Что такое функция?
Функция – это прикладной математический термин, используемый для описания взаимосвязи между двумя переменными. В формуле вы можете представить функцию в виде:
y = f(x)
В этой формуле y является функцией x, то есть при изменении значения x изменяется и значение y (или диапазон, или зависимая переменная). Например:
Если x равен 2 в уравнении y = x -1, то значение y равно 1: y = 2-1
Но если x имеет значение 10, то y также изменится – до 9, или y=10-1
Что такое диапазон функции?
Значения переменных меняются, что можно представить в виде набора значений, называемых областью и диапазоном функции:
-
Домен: Область функции – это набор чисел, представляющих все значения, которые может иметь x.
-
Диапазон: Диапазон – это набор чисел, которые представляют все потенциальные значения, которые y может иметь на основе функции.
3 способа найти диапазон функции
Для x в упорядоченной паре (x, y) может соответствовать только одно значение y. Для y, однако, существует больше возможностей. Нахождение диапазона функции означает нахождение всех возможных значений, которые может иметь y в зависимости от x. Вы можете найти диапазон функции тремя способами: формула, график или зависимость.
1. Нахождение диапазона функции с помощью формулы
Формула может представлять, как переменная x взаимодействует с переменной y. Эти формулы могут выглядеть по-разному в зависимости от того, какое взаимодействие имеют значения. Ниже приведены шаги, которые можно использовать для алгебраического нахождения диапазона функции:
1. Запишите формулу
Запись формулы – где y = f(x)- может помочь вам определить некоторые аспекты связи между двумя переменными.
Пример: Если вы продаете журналы по 10 долларов за штуку, то ваш общий объем продаж, f(x), равен количеству проданных журналов, x, умноженному на 10. Итак, формула f(x) = 10(x). Если вы продаете ноль, 2, 4 или 10 журналов, то ваши общие продажи составляют $0, $20, $40 и $100.
2. Найдите другие пары координат
Если применить формулу y = f(x), то она показывает положительную зависимость между x и y для всех журналов продаж. Чтобы перепроверить эту информацию, вы можете нарисовать переменные в виде упорядоченных пар на графике. Полученный график является линейным и имеет тенденцию к росту. Это подтверждает вывод о том, что функция положительна.
3. Напишите диапазон
Зная, что вы не можете продавать отрицательные журналы, вы можете определить, что диапазон функции никогда не бывает меньше нуля. Поскольку вы всегда можете продать больше журналов, вы знаете, что диапазон может постоянно увеличиваться на интервалы в 10 раз. Таким образом, вы можете записать диапазон функции в виде эквивалентности.
В данном примере диапазон f(x) = все кратные 10 ? 0.
2. Нахождение диапазона функции с помощью графика
График может обеспечить визуальное представление формы, которую принимает функция, позволяя увидеть, как координаты y взаимодействуют с координатами x. Вот шаги для нахождения диапазона функции с помощью графика:
1. Нарисуйте функцию на графике
Чтобы найти диапазон функции на графике, отметьте (или постройте) координаты области (x) и диапазона (y) на листе бумаги с помощью маленьких точек. Это поможет вам увидеть форму функции. Вы можете увидеть прямую линию, изогнутую линию в форме u или n или что-то похожее на волны.
При построении графика перемещайтесь влево или вправо по оси x, в зависимости от того, отрицательна или положительна координата x. Затем вы двигаетесь вверх или вниз по оси y, в зависимости от того, положительна или отрицательна координата y.
После завершения работы проследите за формой графика. Например, если вы нарисуете координаты {(2, 1), (3, 2), (4, 3)}, то они образуют прямую линию, которая идет вверх (1, 2, 3).
2. Найдите минимум функции
Как только вы получите функцию в виде графика, вы сможете увидеть важные особенности, например, минимум. Это самая низкая точка, которую функция достигает визуально. Минимум может быть бесконечным, то есть график неограниченно расширяется вниз. Если это так, то нижний конец диапазона может быть представлен символом бесконечности (?).
3. Найдите максимум функции
Максимум – это наивысшая точка, которую функция достигает визуально. Как и минимум, это число может быть бесконечным. Это также может быть конкретное место на графике, которое можно записать в виде упорядоченной пары. Например, если максимум находится при 3 на оси x и 10 на оси y, то его координаты будут (3, 10).
4. Запишите диапазон в виде эквивалентности
Иногда невозможно написать каждую y-координату функции. Здесь вы можете указать диапазон как эквивалентность, используя символ меньше, чем (<), символ больше чем (>), меньше или равно символу (?) или символ больше или равно (?).
Пример: Для диапазона {-1, 1, 2, 3} вы можете использовать утверждение как:
-1 ? f(x) ? 3
Если ваш диапазон функции имеет бесконечную составляющую, например {-?, 10}, вы можете записать эквивалентность как:
f(x) ? 10
3. Нахождение диапазона функции с помощью отношения
Третий способ найти диапазон функции – записать ее в виде отношения. Отношение – это набор упорядоченных пар, представляющих координаты на графике. Вы можете записать пары отношения в форме (x, y). Ниже описаны шаги, которые можно использовать для нахождения диапазона функции, записанной в виде отношения:
1. Напишите отношение
Когда вы видите набор упорядоченных пар (x, y), вам может быть проще работать с отношением после того, как вы запишете пары на бумаге. Запишите весь набор в фигурных скобках. Например:
{(2, 1), (4, 5), (9, 21) (7, 14), (5, 14)}
2. Составьте список y-координат отношения
Вы можете перечислить y-координаты отношения, взяв второе число из каждой пары координат и записав их в фигурных скобках. Это поможет вам легче представить диапазон значений y.
Это также поможет вам сократить объем информации, с которой вы работаете при нахождении диапазона, или y. Используя приведенный выше пример, вы бы записали y-координаты как:
{1, 5, 21, 14, 14}
3. Удалите все дублирующиеся числа
В этом наборе отношений число 14 встречается дважды. Для нахождения диапазона функции второе 14 не имеет значения, поэтому его можно убрать. Вы можете записать новый список y-координат в виде:
{1, 5, 21, 14}
4. Напишите диапазон от наименьшего до наибольшего
Поскольку числа расположены не по порядку, трудно определить диапазон. Вы можете изменить порядок чисел, чтобы облегчить определение диапазона. Упорядоченный от наименьшего к наибольшему, набор y-координат отношения является таковым:
{1, 5, 14, 21}
Как только вы измените порядок чисел, вы получите диапазон функции с помощью отношения. Итак, для набора отношений:
{(2, 1), (4, 5), (9, 21) (7, 14), (5, 14)}
Диапазон после вычитания:
{1, 5, 14, 21}
5. Убедитесь, что отношение является функцией
Проверив, что каждое значение x дает одно и то же число y, вы можете подтвердить, что отношение является функцией. Отношение является функцией, только если каждому значению x соответствует только одно значение y.
Пример: Если вы вводите x как 2 и получаете на выходе 4, но в следующий раз, когда вы вводите x как 2, вы получаете на выходе 7, то это отношение не является функцией. Если вы каждый раз получаете одно и то же число, то отношение является функцией.
Для примера набора отношений {(2, 1), (4, 5), (9, 21) (7, 14), (5, 14)}, значения x 2, 4, 9, 7 и 5 имеют только одно связанное выходное число каждое, и поэтому это функция, а найденный диапазон функции проверяется.
Интервальный вариационный ряд и его характеристики
- Построение интервального вариационного ряда по данным эксперимента
- Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения
- Выборочная средняя, мода и медиана. Симметрия ряда
- Выборочная дисперсия и СКО
- Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации
- Алгоритм исследования интервального вариационного ряда
- Примеры
п.1. Построение интервального вариационного ряда по данным эксперимента
Интервальный вариационный ряд – это ряд распределения, в котором однородные группы составлены по признаку, меняющемуся непрерывно или принимающему слишком много значений.
Общий вид интервального вариационного ряда
Интервалы, (left.left[a_{i-1},a_iright.right)) | (left.left[a_{0},a_1right.right)) | (left.left[a_{1},a_2right.right)) | … | (left.left[a_{k-1},a_kright.right)) |
Частоты, (f_i) | (f_1) | (f_2) | … | (f_k) |
Здесь k – число интервалов, на которые разбивается ряд.
Размах вариации – это длина интервала, в пределах которой изменяется исследуемый признак: $$ F=x_{max}-x_{min} $$
Правило Стерджеса
Эмпирическое правило определения оптимального количества интервалов k, на которые следует разбить ряд из N чисел: $$ k=1+lfloorlog_2 Nrfloor $$ или, через десятичный логарифм: $$ k=1+lfloor 3,322cdotlg Nrfloor $$
Скобка (lfloor rfloor) означает целую часть (округление вниз до целого числа).
Шаг интервального ряда – это отношение размаха вариации к количеству интервалов, округленное вверх до определенной точности: $$ h=leftlceilfrac Rkrightrceil $$
Скобка (lceil rceil) означает округление вверх, в данном случае не обязательно до целого числа.
Алгоритм построения интервального ряда
На входе: все значения признака (left{x_jright}, j=overline{1,N})
Шаг 1. Найти размах вариации (R=x_{max}-x_{min})
Шаг 2. Найти оптимальное количество интервалов (k=1+lfloorlog_2 Nrfloor)
Шаг 3. Найти шаг интервального ряда (h=leftlceilfrac{R}{k}rightrceil)
Шаг 4. Найти узлы ряда: $$ a_0=x_{min}, a_i=1_0+ih, i=overline{1,k} $$ Шаг 5. Найти частоты (f_i) – число попаданий значений признака в каждый из интервалов (left.left[a_{i-1},a_iright.right)).
На выходе: интервальный ряд с интервалами (left.left[a_{i-1},a_iright.right)) и частотами (f_i, i=overline{1,k})
Заметим, что поскольку шаг h находится с округлением вверх, последний узел (a_kgeq x_{max}).
Например:
Проведено 100 измерений роста учеников старших классов.
Минимальный рост составляет 142 см, максимальный – 197 см.
Найдем узлы для построения соответствующего интервального ряда.
По условию: (N=100, x_{min}=142 см, x_{max}=197 см).
Размах вариации: (R=197-142=55) (см)
Оптимальное число интервалов: (k=1+lfloor 3,322cdotlg 100rfloor=1+lfloor 6,644rfloor=1+6=7)
Шаг интервального ряда: (h=lceilfrac{55}{5}rceil=lceil 7,85rceil=8) (см)
Получаем узлы ряда: $$ a_0=x_{min}=142, a_i=142+icdot 8, i=overline{1,7} $$
(left.left[a_{i-1},a_iright.right)) cм | (left.left[142;150right.right)) | (left.left[150;158right.right)) | (left.left[158;166right.right)) | (left.left[166;174right.right)) | (left.left[174;182right.right)) | (left.left[182;190right.right)) | (left[190;198right]) |
п.2. Гистограмма и полигон относительных частот, кумулята и эмпирическая функция распределения
Относительная частота интервала (left.left[a_{i-1},a_iright.right)) – это отношение частоты (f_i) к общему количеству исходов: $$ w_i=frac{f_i}{N}, i=overline{1,k} $$
Гистограмма относительных частот интервального ряда – это фигура, состоящая из прямоугольников, ширина которых равна шагу ряда, а высота – относительным частотам каждого из интервалов.
Площадь гистограммы равна 1 (с точностью до округлений), и она является эмпирическим законом распределения исследуемого признака.
Полигон относительных частот интервального ряда – это ломаная, соединяющая точки ((x_i,w_i)), где (x_i) – середины интервалов: (x_i=frac{a_{i-1}+a_i}{2}, i=overline{1,k}).
Накопленные относительные частоты – это суммы: $$ S_1=w_1, S_i=S_{i-1}+w_i, i=overline{2,k} $$ Ступенчатая кривая (F(x)), состоящая из прямоугольников, ширина которых равна шагу ряда, а высота – накопленным относительным частотам, является эмпирической функцией распределения исследуемого признака.
Кумулята – это ломаная, которая соединяет точки ((x_i,S_i)), где (x_i) – середины интервалов.
Например:
Продолжим анализ распределения учеников по росту.
Выше мы уже нашли узлы интервалов. Пусть, после распределения всех 100 измерений по этим интервалам, мы получили следующий интервальный ряд:
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
(left.left[a_{i-1},a_iright.right)) cм | (left.left[142;150right.right)) | (left.left[150;158right.right)) | (left.left[158;166right.right)) | (left.left[166;174right.right)) | (left.left[174;182right.right)) | (left.left[182;190right.right)) | (left[190;198right]) |
(f_i) | 4 | 7 | 11 | 34 | 33 | 8 | 3 |
Найдем середины интервалов, относительные частоты и накопленные относительные частоты:
(x_i) | 146 | 154 | 162 | 170 | 178 | 186 | 194 |
(w_i) | 0,04 | 0,07 | 0,11 | 0,34 | 0,33 | 0,08 | 0,03 |
(S_i) | 0,04 | 0,11 | 0,22 | 0,56 | 0,89 | 0,97 | 1 |
Построим гистограмму и полигон:
Построим кумуляту и эмпирическую функцию распределения:
Эмпирическая функция распределения (относительно середин интервалов): $$ F(x)= begin{cases} 0, xleq 146\ 0,04, 146lt xleq 154\ 0,11, 154lt xleq 162\ 0,22, 162lt xleq 170\ 0,56, 170lt xleq 178\ 0,89, 178lt xleq 186\ 0,97, 186lt xleq 194\ 1, xgt 194 end{cases} $$
п.3. Выборочная средняя, мода и медиана. Симметрия ряда
Выборочная средняя интервального вариационного ряда определяется как средняя взвешенная по частотам: $$ X_{cp}=frac{x_1f_1+x_2f_2+…+x_kf_k}{N}=frac1Nsum_{i=1}^k x_if_i $$ где (x_i) – середины интервалов: (x_i=frac{a_{i-1}+a_i}{2}, i=overline{1,k}).
Или, через относительные частоты: $$ X_{cp}=sum_{i=1}^k x_iw_i $$
Модальным интервалом называют интервал с максимальной частотой: $$ f_m=max f_i $$ Мода интервального вариационного ряда определяется по формуле: $$ M_o=x_o+frac{f_m-f_{m-1}}{(f_m-f_{m-1})+(f_m+f_{m+1})}h $$ где
(h) – шаг интервального ряда;
(x_o) – нижняя граница модального интервала;
(f_m,f_{m-1},f_{m+1}) – соответственно, частоты модального интервала, интервала слева от модального и интервала справа.
Медианным интервалом называют первый интервал слева, на котором кумулята превысила значение 0,5. Медиана интервального вариационного ряда определяется по формуле: $$ M_e=x_o+frac{0,5-S_{me-1}}{w_{me}}h $$ где
(h) – шаг интервального ряда;
(x_o) – нижняя граница медианного интервала;
(S_{me-1}) накопленная относительная частота для интервала слева от медианного;
(w_{me}) относительная частота медианного интервала.
Расположение выборочной средней, моды и медианы в зависимости от симметрии ряда аналогично их расположению в дискретном ряду (см. §65 данного справочника).
Например:
Для распределения учеников по росту получаем:
(x_i) | 146 | 154 | 162 | 170 | 178 | 186 | 194 | ∑ |
(w_i) | 0,04 | 0,07 | 0,11 | 0,34 | 0,33 | 0,08 | 0,03 | 1 |
(x_iw_i) | 5,84 | 10,78 | 17,82 | 57,80 | 58,74 | 14,88 | 5,82 | 171,68 |
$$ X_{cp}=sum_{i=1}^k x_iw_i=171,68approx 171,7 text{(см)} $$ На гистограмме (или полигоне) относительных частот максимальная частота приходится на 4й интервал [166;174). Это модальный интервал.
Данные для расчета моды: begin{gather*} x_o=166, f_m=34, f_{m-1}=11, f_{m+1}=33, h=8\ M_o=x_o+frac{f_m-f_{m-1}}{(f_m-f_{m-1})+(f_m+f_{m+1})}h=\ =166+frac{34-11}{(34-11)+(34-33)}cdot 8approx 173,7 text{(см)} end{gather*} На кумуляте значение 0,5 пересекается на 4м интервале. Это – медианный интервал.
Данные для расчета медианы: begin{gather*} x_o=166, w_m=0,34, S_{me-1}=0,22, h=8\ \ M_e=x_o+frac{0,5-S_{me-1}}{w_me}h=166+frac{0,5-0,22}{0,34}cdot 8approx 172,6 text{(см)} end{gather*} begin{gather*} \ X_{cp}=171,7; M_o=173,7; M_e=172,6\ X_{cp}lt M_elt M_o end{gather*} Ряд асимметричный с левосторонней асимметрией.
При этом (frac{|M_o-X_{cp}|}{|M_e-X_{cp}|}=frac{2,0}{0,9}approx 2,2lt 3), т.е. распределение умеренно асимметрично.
п.4. Выборочная дисперсия и СКО
Выборочная дисперсия интервального вариационного ряда определяется как средняя взвешенная для квадрата отклонения от средней: begin{gather*} D=frac1Nsum_{i=1}^k(x_i-X_{cp})^2 f_i=frac1Nsum_{i=1}^k x_i^2 f_i-X_{cp}^2 end{gather*} где (x_i) – середины интервалов: (x_i=frac{a_{i-1}+a_i}{2}, i=overline{1,k}).
Или, через относительные частоты: $$ D=sum_{i=1}^k(x_i-X_{cp})^2 w_i=sum_{i=1}^k x_i^2 w_i-X_{cp}^2 $$
Выборочное среднее квадратичное отклонение (СКО) определяется как корень квадратный из выборочной дисперсии: $$ sigma=sqrt{D} $$
Например:
Для распределения учеников по росту получаем:
$x_i$ | 146 | 154 | 162 | 170 | 178 | 186 | 194 | ∑ |
(w_i) | 0,04 | 0,07 | 0,11 | 0,34 | 0,33 | 0,08 | 0,03 | 1 |
(x_iw_i) | 5,84 | 10,78 | 17,82 | 57,80 | 58,74 | 14,88 | 5,82 | 171,68 |
(x_i^2w_i) – результат | 852,64 | 1660,12 | 2886,84 | 9826 | 10455,72 | 2767,68 | 1129,08 | 29578,08 |
$$ D=sum_{i=1}^k x_i^2 w_i-X_{cp}^2=29578,08-171,7^2approx 104,1 $$ $$ sigma=sqrt{D}approx 10,2 $$
п.5. Исправленная выборочная дисперсия, стандартное отклонение выборки и коэффициент вариации
Исправленная выборочная дисперсия интервального вариационного ряда определяется как: begin{gather*} S^2=frac{N}{N-1}D end{gather*}
Стандартное отклонение выборки определяется как корень квадратный из исправленной выборочной дисперсии: $$ s=sqrt{S^2} $$
Коэффициент вариации это отношение стандартного отклонения выборки к выборочной средней, выраженное в процентах: $$ V=frac{s}{X_{cp}}cdot 100text{%} $$
Подробней о том, почему и когда нужно «исправлять» дисперсию, и для чего использовать коэффициент вариации – см. §65 данного справочника.
Например:
Для распределения учеников по росту получаем: begin{gather*} S^2=frac{100}{99}cdot 104,1approx 105,1\ sapprox 10,3 end{gather*} Коэффициент вариации: $$ V=frac{10,3}{171,7}cdot 100text{%}approx 6,0text{%}lt 33text{%} $$ Выборка однородна. Найденное значение среднего роста (X_{cp})=171,7 см можно распространить на всю генеральную совокупность (старшеклассников из других школ).
п.6. Алгоритм исследования интервального вариационного ряда
На входе: все значения признака (left{x_jright}, j=overline{1,N})
Шаг 1. Построить интервальный ряд с интервалами (left.right[a_{i-1}, a_ileft.right)) и частотами (f_i, i=overline{1,k}) (см. алгоритм выше).
Шаг 2. Составить расчетную таблицу. Найти (x_i,w_i,S_i,x_iw_i,x_i^2w_i)
Шаг 3. Построить гистограмму (и/или полигон) относительных частот, эмпирическую функцию распределения (и/или кумуляту). Записать эмпирическую функцию распределения.
Шаг 4. Найти выборочную среднюю, моду и медиану. Проанализировать симметрию распределения.
Шаг 5. Найти выборочную дисперсию и СКО.
Шаг 6. Найти исправленную выборочную дисперсию, стандартное отклонение и коэффициент вариации. Сделать вывод об однородности выборки.
п.7. Примеры
Пример 1. При изучении возраста пользователей коворкинга выбрали 30 человек.
Получили следующий набор данных:
18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29
Постройте интервальный ряд и исследуйте его.
1) Построим интервальный ряд. В наборе данных: $$ x_{min}=18, x_{max}=38, N=30 $$ Размах вариации: (R=38-18=20)
Оптимальное число интервалов: (k=1+lfloorlog_2 30rfloor=1+4=5)
Шаг интервального ряда: (h=lceilfrac{20}{5}rceil=4)
Получаем узлы ряда: $$ a_0=x_{min}=18, a_i=18+icdot 4, i=overline{1,5} $$
(left.left[a_{i-1},a_iright.right)) лет | (left.left[18;22right.right)) | (left.left[22;26right.right)) | (left.left[26;30right.right)) | (left.left[30;34right.right)) | (left.left[34;38right.right)) |
Считаем частоты для каждого интервала. Получаем интервальный ряд:
(left.left[a_{i-1},a_iright.right)) лет | (left.left[18;22right.right)) | (left.left[22;26right.right)) | (left.left[26;30right.right)) | (left.left[30;34right.right)) | (left.left[34;38right.right)) |
(f_i) | 1 | 7 | 12 | 6 | 4 |
2) Составляем расчетную таблицу:
(x_i) | 20 | 24 | 28 | 32 | 36 | ∑ |
(f_i) | 1 | 7 | 12 | 6 | 4 | 30 |
(w_i) | 0,033 | 0,233 | 0,4 | 0,2 | 0,133 | 1 |
(S_i) | 0,033 | 0,267 | 0,667 | 0,867 | 1 | – |
(x_iw_i) | 0,667 | 5,6 | 11,2 | 6,4 | 4,8 | 28,67 |
(x_i^2w_i) | 13,333 | 134,4 | 313,6 | 204,8 | 172,8 | 838,93 |
3) Строим полигон и кумуляту
Эмпирическая функция распределения: $$ F(x)= begin{cases} 0, xleq 20\ 0,033, 20lt xleq 24\ 0,267, 24lt xleq 28\ 0,667, 28lt xleq 32\ 0,867, 32lt xleq 36\ 1, xgt 36 end{cases} $$ 4) Находим выборочную среднюю, моду и медиану $$ X_{cp}=sum_{i=1}^k x_iw_iapprox 28,7 text{(лет)} $$ На полигоне модальным является 3й интервал (самая высокая точка).
Данные для расчета моды: begin{gather*} x_0=26, f_m=12, f_{m-1}=7, f_{m+1}=6, h=4\ M_o=x_o+frac{f_m-f_{m-1}}{(f_m-f_{m-1})+(f_m+f_{m+1})}h=\ =26+frac{12-7}{(12-7)+(12-6)}cdot 4approx 27,8 text{(лет)} end{gather*}
На кумуляте медианным является 3й интервал (преодолевает уровень 0,5).
Данные для расчета медианы: begin{gather*} x_0=26, w_m=0,4, S_{me-1}=0,267, h=4\ M_e=x_o+frac{0,5-S_{me-1}}{w_{me}}h=26+frac{0,5-0,4}{0,267}cdot 4approx 28,3 text{(лет)} end{gather*} Получаем: begin{gather*} X_{cp}=28,7; M_o=27,8; M_e=28,6\ X_{cp}gt M_egt M_0 end{gather*} Ряд асимметричный с правосторонней асимметрией.
При этом (frac{|M_o-X_{cp}|}{|M_e-X_{cp}|} =frac{0,9}{0,1}=9gt 3), т.е. распределение сильно асимметрично.
5) Находим выборочную дисперсию и СКО: begin{gather*} D=sum_{i=1}^k x_i^2w_i-X_{cp}^2=838,93-28,7^2approx 17,2\ sigma=sqrt{D}approx 4,1 end{gather*}
6) Исправленная выборочная дисперсия: $$ S^2=frac{N}{N-1}D=frac{30}{29}cdot 17,2approx 17,7 $$ Стандартное отклонение (s=sqrt{S^2}approx 4,2)
Коэффициент вариации: (V=frac{4,2}{28,7}cdot 100text{%}approx 14,7text{%}lt 33text{%})
Выборка однородна. Найденное значение среднего возраста (X_{cp}=28,7) лет можно распространить на всю генеральную совокупность (пользователей коворкинга).
При
большом
объеме выборки
работа с
вариационными рядами представляет
определенные неудобства, и тогда
наблюдаемые данные группируют.
Группировка
должна наиболее
полно выявлять существенные свойства
распределения. Существуют формулы для
определения оптимального количества
интервалов, но в психологии
считается, что следует брать от
5 до 15 интервалов.
Первый способ
построения интервального ряда.
Если
у исследователя нет предварительной
информации о характере распределения
признака, то лучше задавать равные
интервалы,
при этом длина
интервала
определяется по формуле
,
где– количество выбранных интервалов (числоокругляется до целого значения).
Начало
первого интервала равно
,
а конец(это будет одновременно и началом второго
интервала). Условимся все интервалы
считать соткрытым
правым концом:
.
Построение интервалов заканчивается,
если в интервал попало наибольшее
значение признака.
Далее
подсчитывают число
значений признака, попавших в каждый
интервал (с учетом открытого правого
конца). Получается таблица, называемаяинтервальным
вариационным рядом.
-
Интервалы
…
Сумма
Частоты,
…
Относительные
частоты,
1
Второй
способ построения интервального ряда.
Весь
диапазон значений признака от
доразбивается на равныеинтервалы,
называемые также классами.
Затем все варианты совокупности
распределяются
по этим интервалам.
Порядок действий:
-
Определяется
число классов по формуле Стэрджеса
. -
Затем
определяется размах выборки
. -
Находим
ширину интервала
по формуле. -
Находим
нижнюю границу первого интервала:
. -
Начальные
и конечные значения всех последующих
интервалов можно вычислить путем
последовательного прибавления величины
интервала к значениям конца предыдущего
интервала:
,и так далее.
Пример
построения интервального вариационного
ряда.
Пусть измерен
некоторый показатель для 30 испытуемых:
23,
29, 35, 7, 11, 18, 23, 30, 36, 18, 11, 8, 13, 20, 25,
27,
14, 30, 20, 20, 24, 19, 21, 26, 22, 16, 26, 25, 33, 27.
Это
статистический
ряд.
Расставим
экспериментальные данные в возрастающем
порядке, то есть построим вариационный
ряд:
7,
8,
11,
11,
13,
14,
16,
18,
18,
19, 20,
20,
20,
21,
22,
23,
23,
24,
25,
25,
26,
26,
27,
27,
29,
30,
30,
33,
35,
36.
Число
классов (интервалов) для
:
.
Минимальное
и максимальное значения:
,.
Вариационный
размах:
.
Величина
интервала:
.
Находим границы
интервалов:
;
;
;
;
;
;
.
Построим
интервальный
вариационный ряд.
-
Номера
интерваловИнтервалы
Серединные
значения интерваловЧастоты
1
4
– 107
2
2
10
– 1613
4
3
16
– 2219
8
4
22
– 2825
10
5
28
– 3431
4
6
34
– 4037
2
5. Гистограмма
Вариационные
ряды изображают графически с помощью
полигона и гистограммы.
с1с2с3с4 с5с6с7с8с9
Гистограммой
называется графическое изображение
интервального
вариационного
ряда. На оси
абсцисс откладываются отрезки,
изображающие интервалы значений
варьирующего признака, а затем на этих
отрезках, как на основаниях, строятся
прямоугольники, площади
которых пропорциональны частотам (или
относительным частотам).
Полигон
частот для
дискретного вариационного ряда – это
ломаная, отрезки которой соединяют
точки с координатами
.
Полигон
частот признака
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #