Расчет квартилей для интервального ряда:
Для
расчета квартилей для интервального
ряда
-
Определяем номер квартиля по тем же
формулам, что и для дискретного ряда, -
Определяем квартильный интервал по
накопленной частоте. Это
первый интервал, для которого накопленная
частота будет больше или равна номеру
квартиля. -
Рассчитываем квартиль по формуле:
Где:
J
– номер квартиля,
–
нижняя граница интервала, содержащего
квартиль. Интервал определяется по
накопленной частоте интервалов,
–
ширина интервала, содержащего квартиль,
–
накопленная частота интервала,
предшествующего интервалу, содержащему
квартиль,
–
частота интервала, содержащего квартиль.
Пример.
Найти первый квартиль для интервального
ряда.
Возрастные |
Число |
Накопленная |
До |
346 |
346 |
20 |
872 |
1218 |
25 |
1054 |
2272 |
30 |
781 |
3053 |
35 |
212 |
3265 |
40 |
121 |
3386 |
45 |
76 |
3462 |
Итого |
3462 |
Решение:
-
Определяем номер первого квартиля по
формуле
-
Первый квартиль находится в возрастной
группе 20-25 лет, так как это первый
интервал, для которого накопленная
частота больше (или равна) номера
квартиля (346<865,75; 1218>865,75). -
Определяем первый квартиль по формуле
-
Это значит, что четверть студентов
младше 22,98 лет.
-
Децили
Децили –
значения признака, делящие ранжированный
ряд на десять равных частей.
Первый
дециль отсекает 1/10 часть совокупности,
а девятый дециль отсекает 9/10 частей.
Таким образом, различают 9 децилей.
Рассчитываются
децили аналогично квартилям.
Расчет децилей для дискретного ряда
-
Определяем номер
дециля по формуле:
, -
Если номер дециля
– целое число,
то значение дециля будет равно величине
элемента ряда, которое обладает
накопленной частотой равной номеру
дециля. Например, если номер дециля
равен 20, его значение будет равно
значению признака с S =20 (накопленной
частотой равной 20).
Если номер дециля
– нецелое число,
то дециль попадает между двумя
наблюдениями. Значением дециля будет
сумма, состоящая из значения элемента,
для которого накопленная частота равна
целому значению номера дециля, и указанной
части (нецелая часть номера дециля)
разности между значением этого элемента
и значением следующего элемента.
Например, если номер
дециля равна 20,25, дециль попадает между
20-м и 21-м наблюдениями, и его значение
будет равно значению 20-го наблюдения
плюс 1/4 разности между значением 20-го и
21-го наблюдений.
Расчет децилей для интервального ряда
-
Определяем номер
дециля по формуле:
, -
Определяем децильный
интервал. Это первый интервал, для
которого накопленная частота будет
больше или равна номеру дециля. -
Рассчитываем дециль
по формуле:
где
– значение j-го дециля,
– нижняя граница децильного интервала;
– ширина децильного интервала;
–
сумма всех частот,
-накопленная
частота интервала, предшествующего
децильному;
–
частота децильного интервала.
Пример.
Найти 9-ый дециль D9
Заработная |
бригада |
|
, число |
, накопленная частота |
|
15 |
20 |
20 |
18 |
37 |
57 |
20 |
14 |
71 |
25 |
4 |
75 |
Итого: |
75 |
-
Определяем номер 9-го дециля
для первой бригады
;
-
Номер дециля – нецелое число. Для
определения дециля нужны значения двух
элементов – х68и х69. Значение
дециля находится между ними.
Определяем
их значение с помощью самой первой
накопленной частоты большей или равной
порядковым номерам элементов (68 и 69).
Х68= 20, х69= 20.
Теперь
определяем значение 9-го дециля:D7=x68+ (х69–
х68)×0,4=20 + (20 – 20)×0,2 =20тыс.руб.
Это значит, что заработная плата90%
рабочих бригады не превышает 18 тыс.руб.
Пример.
Найти седьмой дециль D7
для интервального ряда.
Возрастные |
Число |
Накопленная |
До |
346 |
346 |
20 |
872 |
1218 |
25 |
1054 |
2272 |
30 |
781 |
3053 |
35 |
212 |
3265 |
40 |
121 |
3386 |
45 |
76 |
3462 |
Итого |
3462 |
Решение:
-
Определяем номер седьмого дециля по
формуле
7× -
Седьмой дециль находится в возрастной
группе 30-35 лет, так как это первый
интервал, для которого накопленная
частота больше (или равна) номера дециля
(2272<2424,1; 3053>2424,1). -
Определяем седьмой дециль по формуле
-
Это значит, что 70% студентов младше 30,97
лет.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Структурные средние – мода, медиана, квантиль, дециль
Краткая теория
Наиболее широкое применение в статистике имеют структурные
средние, к числу которых относятся мода и медиана (непараметрические средние).
Мода – величина признака (варианта), которая
встречается в ряду распределения с наибольшей частотой (весом). К моде (Мо)
прибегают для выявления величины признака, имеющей наибольшее распространение
(цена на рынке, по которой было совершено наибольшее число продаж данного
товара, номер обуви, который пользуется наибольшим спросом у покупателей и т.
д.). Мода используется только в совокупностях большой численности. В дискретном
ряду мода находится как варианта, имеющая наибольшую частоту. В интервальном
ряду сначала находится модальный интервал, то есть интервал, обладающий наибольшей частотой, а
затем – приближенное значение модальной величины признака по формуле:
– нижняя граница модального интервала
– величина модального интервала
– частота интервала, предшествующего
модальному
– частота модального интервала
– частота интервала, следующего за модальным
Квантили –
величины, разделяющие совокупность на определенной количество равных по
численности элементов частей. Самый известный квантиль – медиана, делящая совокупность на две равные части. Кроме медианы часто используются квартили, делящие ранжированный ряд на 4 равные части, децили -10 частей и перцентили – на 100
частей.
Медиана –
величина признака у единицы, находящейся в середине ранжированного
(упорядоченного) ряда. Если ряд распределения представлен конкретными
значениями признака, то медиана (Me) находится как
серединное значение признака.
Если ряд распределения дискретный, то медиана находится как
серединное значение признака (например, если число значений нечетное – 45, то
соответствует 23 значению признака в ряду
значений, расположенных в порядке возрастания, если число значений четное – 44,
то медиана соответствует полусумме 22 и 23 значений
признака).
Если ряд распределения интервальный, то первоначально
находят медианный интервал, который содержит единицу, находящуюся в середине
ранжированного ряда. Для определения этого интервала сумму частот
делят пополам и на основании последовательного накопления (суммирования)
частот интервалов, начиная с первого, находят интервал, где расположена
медиана. Значение медианы в интервальном ряду вычисляют по формуле:
– нижняя граница медианного интервала
– величина медианного интервала
– сумма
частот ряда
– сумма накопленных частот в интервалах,
предшествующих медианному
– частота медианного интервала
Квартили – это значения
признака в ранжированном ряду, выбранные таким образом, что 25% единиц
совокупности будут меньше величины
, 25% единиц будут заключены между
и
; 25% –
между
и
,
остальные 25% превосходят
. Квартили определяются по формулам,
аналогичным формуле для расчета медианы. Для интервального ряда:
Децилем
называется структурная переменная, делящая распределение на 10 равных частей по
числу единиц в совокупности. Децилей 9, а децильных
групп 10. Децили определяются по формулам, аналогичным формуле для расчета
медианы и квартилей.
В целом общая формула для расчета квантилей в интервальном
ряду такова:
– порядковый номер квантиля
– размерность квантиля (на сколько частей эти
квартили делят совокупность)
– нижняя граница квантильного
интервала
– ширина квантильного
интервала
– накопленная частота предквантильного
интервала
Для дискретного ряда номер квантиля можно
найти по формуле:
Примеры решения задач
Задача 1
(дискретный ранжированный ряд)
В
результате исследований установлен среднемесячный доход жильцов одного
подъезда:
1.5 |
1.8 |
2 |
2.5 |
2.8 |
2.8 |
2.8 |
3.0 |
3.6 |
3.8 |
3.9 |
4 |
5.8 |
5.9 |
6 |
6 |
6 |
6.8 |
7 |
7 |
Определите:
Модальный
и медианный доход, квартили и децили дохода.
Решение
Имеем уже ранжированный ряд – значения дохода жильцов распределены по возрастанию.
Мода
– наиболее часто встречающееся значение. В данном случае имеем ряд с двумя
модами.
и
Медиана
– такое значение признака, которое делит упорядоченное множество данных
пополам.
Квартили
– значения признака в ранжированном ряду, выбранные таким образом, что 25%
единиц совокупности будут меньше величины
; 25% единиц будут
заключены между
и
; 25% – между
и
; остальные 25%
превосходят
.
Дицили делят ряд на 10 равных частей:
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 2
(интервальный ряд)
Для
определения среднего размера вклада в кредитном учреждении были получены
следующие данные:
Размер вклада, тыс.р. | до 10.0 | 10.0-16.0 | 16.0-22.0 | 22.0-28.0 | 28.0-34.0 | Свыше 34.0 |
Удельный вес вкладов, % |
5.0 | 8.0 | 15.0 | 22.0 | 30.0 | 20.0 |
Рассчитайте
структурные средние (моду, медиану,
квартили).
Решение
Вычислим моду размера вклада:
Мода – варианта, которой соответствует наибольшая частота.
Мода вычисляется по формуле:
–
начало модального интервала
–
величина интервала
–
частота модального интервала
–
частота интервала, предшествующего модальному
–
частота интервала, следующего за модальным
Таким образом, наибольшее
количество вкладов имеют размер 30,7 тыс.р.
Медиана – варианта, находящаяся в середине ряда распределения.
Расчет медианы производится по формуле:
-начало
(нижняя граница) медианного интервала
-величина интервала
-сумма всех частот ряда
-частота медианного интервала
-сумма накопленных частот вариантов до
медианного
Таким образом, половина вкладов имеет размер до 28 тыс.р.,
другая половина – более 28 тыс.р.
Вычислим квартили:
Таким
образом 25% вкладов меньше 20,8 тыс.р., 25% вкладов
лежат в интервале от 20,8 тыс.р. до 28 тыс.р., 25% лежат в интервале от 28 тыс.р.
до 33 тыс.р., 25% больше величины в 33 тыс.р.
Задача 3
Постройте
графики для вариационного ряда. На графике покажите моду, медиану, среднюю, квартили.
Возраст детей (лет) | Число детей (доли) |
0-3 | 0.15 |
3-6 | 0.2 |
6-9 | 0.4 |
9-12 | 0.2 |
12-15 | 0.05 |
Решение
Вычислим
среднюю
: Для этого просуммируем
произведения середин интервалов и соответствующих частот, и полученную сумму
разделим на сумму частот.
Вычисление моды интервального ряда на графике
Построим
гистограмму.
Мода определяется по
гистограмме распределения. Для этого выбирается самый высокий прямоугольник,
который в данном случае является модальным. Затем правую вершину модального
прямоугольника соединяют с правым верхним углом предыдущего прямоугольника. А
левую вершину модального прямоугольника – с левым верхним углом последующего
прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось
абсцисс.
Абсцисса точки пересечения
этих прямых и будет модой распределения
Гистограмма
По
гистограмме получаем, что
Вычисление медианы и квартилей интервального ряда на графике
Построим
кумулятивную кривую частот (график накопленных частот)
Кумулятивная кривая частот
На получившимся графике
накопленных частот из последней получившейся точки (в нашем примере) проведем
линию перпендикулярную к оси
она так же
является максимальной высотой. Поделим ее на 4 части. Через полученные точки
строим параллельную оси
линии которая должна пересекать высоту к оси
и кумуляту. От
места пересечения кумуляты опускаем перпендикуляры. Получившиеся точки есть квартили
и медиана (квартиль при
).
Вывод к задаче
Таким образом
средний возраст детей 6,9 лет. Наибольшее количество детей имеют возраст 7,5
лет. Четверть детей младше 4,5 лет, а самая старшая четверть детей старше 9,1
лет. Половина детей имеет возраст менее 7,3 лет, другая половина – более 7,3
лет.
From Wikipedia, the free encyclopedia
In statistics, a quartile is a type of quantile which divides the number of data points into four parts, or quarters, of more-or-less equal size. The data must be ordered from smallest to largest to compute quartiles; as such, quartiles are a form of order statistic. The three main quartiles are as follows:
- The first quartile (Q1) is defined as the middle number between the smallest number (minimum) and the median of the data set. It is also known as the lower or 25th empirical quartile, as 25% of the data is below this point.
- The second quartile (Q2) is the median of a data set; thus 50% of the data lies below this point.
- The third quartile (Q3) is the middle value between the median and the highest value (maximum) of the data set. It is known as the upper or 75th empirical quartile, as 75% of the data lies below this point.[1]
Along with the minimum and maximum of the data (which are also quartiles), the three quartiles described above provide a five-number summary of the data. This summary is important in statistics because it provides information about both the center and the spread of the data. Knowing the lower and upper quartile provides information on how big the spread is and if the dataset is skewed toward one side. Since quartiles divide the number of data points evenly, the range is not the same between quartiles (i.e., Q3–Q2 ≠ Q2–Q1) and is instead known as the interquartile range (IQR). While the maximum and minimum also show the spread of the data, the upper and lower quartiles can provide more detailed information on the location of specific data points, the presence of outliers in the data, and the difference in spread between the middle 50% of the data and the outer data points.[2]
Definitions[edit]
Symbol | Names | Definition |
---|---|---|
Q1 |
|
splits off the lowest 25% of data from the highest 75% |
Q2 |
|
cuts data set in half |
Q3 |
|
splits off the highest 25% of data from the lowest 75% |
Computing methods[edit]
Discrete distributions[edit]
For discrete distributions, there is no universal agreement on selecting the quartile values.[3]
Method 1[edit]
- Use the median to divide the ordered data set into two-halves.
- If there is an odd number of data points in the original ordered data set, do not include the median (the central value in the ordered list) in either half.
- If there is an even number of data points in the original ordered data set, split this data set exactly in half.
- The lower quartile value is the median of the lower half of the data. The upper quartile value is the median of the upper half of the data.
This rule is employed by the TI-83 calculator boxplot and “1-Var Stats” functions.
Method 2[edit]
- Use the median to divide the ordered data set into two-halves.
- If there are an odd number of data points in the original ordered data set, include the median (the central value in the ordered list) in both halves.
- If there are an even number of data points in the original ordered data set, split this data set exactly in half.
- The lower quartile value is the median of the lower half of the data. The upper quartile value is the median of the upper half of the data.
The values found by this method are also known as “Tukey’s hinges”;[4] see also midhinge.
Method 3[edit]
- If there are even numbers of data points, then Method 3 starts off the same as Method 1 or Method 2 above and you can choose to include or not include the median as a datapoint. If you choose to include the median as a new datapoint, proceed to step 2 or 3 of Method 3 because you now have an odd number of datapoints.
- If there are (4n+1) data points, then the lower quartile is 25% of the nth data value plus 75% of the (n+1)th data value; the upper quartile is 75% of the (3n+1)th data point plus 25% of the (3n+2)th data point.
- If there are (4n+3) data points, then the lower quartile is 75% of the (n+1)th data value plus 25% of the (n+2)th data value; the upper quartile is 25% of the (3n+2)th data point plus 75% of the (3n+3)th data point.
Method 4[edit]
If we have an ordered dataset , we can interpolate between data points to find the th empirical quantile if is in the quantile. If we denote the integer part of a number by , then the empirical quantile function is given by,
,
where and .[1]
To find the first, second, and third quartiles of the dataset we would evaluate , , and respectively.
Example 1[edit]
Ordered Data Set: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49
Method 1 | Method 2 | Method 3 | Method 4 | |
---|---|---|---|---|
Q1 | 15 | 25.5 | 20.25 | 15 |
Q2 | 40 | 40 | 40 | 40 |
Q3 | 43 | 42.5 | 42.75 | 43 |
Example 2[edit]
Ordered Data Set: 7, 15, 36, 39, 40, 41
As there are an even number of data points, the first three methods all give the same results.
Method 1 | Method 2 | Method 3 | Method 4 | |
---|---|---|---|---|
Q1 | 15 | 15 | 15 | 13 |
Q2 | 37.5 | 37.5 | 37.5 | 37.5 |
Q3 | 40 | 40 | 40 | 40.25 |
Continuous probability distributions[edit]
Quartiles on a cumulative distribution function of a normal distribution
If we define a continuous probability distributions as where is a real valued random variable, its cumulative distribution function (CDF) is given by,
.[1]
The CDF gives the probability that the random variable is less than the value . Therefore, the first quartile is the value of when , the second quartile is when , and the third quartile is when .[5] The values of can be found with the quantile function where for the first quartile, for the second quartile, and for the third quartile. The quantile function is the inverse of the cumulative distribution function if the cumulative distribution function is monotonically increasing.
Outliers[edit]
There are methods by which to check for outliers in the discipline of statistics and statistical analysis. Outliers could be a result from a shift in the location (mean) or in the scale (variability) of the process of interest.[6] Outliers could also be evidence of a sample population that has a non-normal distribution or of a contaminated population data set. Consequently, as is the basic idea of descriptive statistics, when encountering an outlier, we have to explain this value by further analysis of the cause or origin of the outlier. In cases of extreme observations, which are not an infrequent occurrence, the typical values must be analyzed. In the case of quartiles, the Interquartile Range (IQR) may be used to characterize the data when there may be extremities that skew the data; the interquartile range is a relatively robust statistic (also sometimes called “resistance”) compared to the range and standard deviation. There is also a mathematical method to check for outliers and determining “fences”, upper and lower limits from which to check for outliers.
After determining the first and third quartiles and the interquartile range as outlined above, then fences are calculated using the following formula:
-
Boxplot Diagram with Outliers
where Q1 and Q3 are the first and third quartiles, respectively. The lower fence is the “lower limit” and the upper fence is the “upper limit” of data, and any data lying outside these defined bounds can be considered an outlier. Anything below the Lower fence or above the Upper fence can be considered such a case. The fences provide a guideline by which to define an outlier, which may be defined in other ways. The fences define a “range” outside which an outlier exists; a way to picture this is a boundary of a fence, outside which are “outsiders” as opposed to outliers. It is common for the lower and upper fences along with the outliers to be represented by a boxplot. For a boxplot, only the vertical heights correspond to the visualized data set while horizontal width of the box is irrelevant. Outliers located outside the fences in a boxplot can be marked as any choice of symbol, such as an “x” or “o”. The fences are sometimes also referred to as “whiskers” while the entire plot visual is called a “box-and-whisker” plot.
When spotting an outlier in the data set by calculating the interquartile ranges and boxplot features, it might be simple to mistakenly view it as evidence that the population is non-normal or that the sample is contaminated. However, this method should not take place of a hypothesis test for determining normality of the population. The significance of the outliers vary depending on the sample size. If the sample is small, then it is more probable to get interquartile ranges that are unrepresentatively small, leading to narrower fences. Therefore, it would be more likely to find data that are marked as outliers.[7]
Computer software for quartiles[edit]
Environment | Function | Quartile Method |
---|---|---|
Microsoft Excel | QUARTILE.EXC | Method 4 |
Microsoft Excel | QUARTILE.INC | Method 3 |
TI-8X series calculators | 1-Var Stats | Method 1 |
R | fivenum | Method 2 |
Python | numpy.percentile | Method 3 |
Python | pandas.DataFrame.describe | Method 3 |
Excel:
The Excel function QUARTILE(array, quart) provides the desired quartile value for a given array of data, using Method 3 from above. In the Quartile function, array is the dataset of numbers that is being analyzed and quart is any of the following 5 values depending on which quartile is being calculated. [8]
Quart | Output QUARTILE Value |
---|---|
0 | Minimum value |
1 | Lower Quartile (25th percentile) |
2 | Median |
3 | Upper Quartile (75th percentile) |
4 | Maximum value |
MATLAB:
In order to calculate quartiles in Matlab, the function quantile(A,p) can be used. Where A is the vector of data being analyzed and p is the percentage that relates to the quartiles as stated below. [9]
p | Output QUARTILE Value |
---|---|
0 | Minimum value |
0.25 | Lower Quartile (25th percentile) |
0.5 | Median |
0.75 | Upper Quartile (75th percentile) |
1 | Maximum value |
See also[edit]
- Five-number summary
- Range
- Box plot
- Interquartile range
- Summary statistics
- Quantile
References[edit]
- ^ a b c A modern introduction to probability and statistics: understanding why and how. Dekking, Michel, 1946–. London: Springer. 2005. pp. 236-238. ISBN 978-1-85233-896-1. OCLC 262680588.
{{cite book}}
: CS1 maint: others (link) - ^ Knoch, Jessica (February 23, 2018). “How are Quartiles Used in Statistics?”. Magoosh. Archived from the original on December 10, 2019. Retrieved February 24, 2023.
- ^ Hyndman, Rob J; Fan, Yanan (November 1996). “Sample quantiles in statistical packages”. American Statistician. 50 (4): 361–365. doi:10.2307/2684934. JSTOR 2684934.
- ^ Tukey, John Wilder (1977). Exploratory Data Analysis. ISBN 978-0-201-07616-5.
- ^ “6. Distribution and Quantile Functions” (PDF). math.bme.hu.
- ^ Walfish, Steven (November 2006). “A Review of Statistical Outlier Method”. Pharmaceutical Technology.
- ^ Dawson, Robert (July 1, 2011). “How Significant is a Boxplot Outlier?”. Journal of Statistics Education. 19 (2). doi:10.1080/10691898.2011.11889610.
- ^ “How to use the Excel QUARTILE function | Exceljet”. exceljet.net. Retrieved December 11, 2019.
- ^ “Quantiles of a data set – MATLAB quantile”. www.mathworks.com. Retrieved December 11, 2019.
External links[edit]
- Quartile – from MathWorld Includes references and compares various methods to compute quartiles
- Quartiles – From MathForum.org
- Quartiles calculator – simple quartiles calculator
- Quartiles – An example how to calculate it
Загрузить PDF
Загрузить PDF
Квартили — это числа, которые делят набор данных на четыре равные части (четверти).[1]
Верхний (третий) квартиль включает 25% наибольших чисел в наборе (75-й процентиль). Верхний квартиль вычисляется через определение медианы верхней половины набора данных (эта половина включает наибольшие числа).[2]
Верхний квартиль можно вычислить вручную или в редакторе электронных таблиц, например, в MS Excel.
-
1
Упорядочьте числа в наборе данных по возрастанию. То есть запишите их, начиная с наименьшего числа и заканчивая наибольшим. Не забудьте записать все числа, даже если они повторяются.[3]
- Например, дан набор данных [3, 4, 5, 11, 3, 12, 21, 10, 8, 7]. Запишите числа следующим образом: [3, 3, 4, 5, 7 , 8, 10, 11, 12, 21].
-
2
Определите количество чисел в наборе данных. Для этого просто посчитайте числа, которые входят в набор. Не забудьте посчитать повторяющиеся числа.
- Например, набор данных [3, 3, 4, 5, 7, 8, 10, 11, 12, 21] состоит из 10 чисел.
-
3
Запишите формулу для вычисления верхнего квартиля. Формула имеет вид: , где — верхний квартиль, — количество чисел в наборе данных.[4]
Реклама
-
1
-
2
Решите выражение в скобках. Согласно правильному порядку выполнения математических операций, вычисления начинают с выражения в скобках. В данном случае к количеству чисел в наборе данных прибавьте 1.
-
3
Полученную сумму умножьте на . Также сумму можно умножить на . Вы найдете позицию числа в наборе данных, которая на три четверти (75%) отдалена от начала набора, то есть позицию, где набор данных разделяется на верхний квартиль и нижние квартили. Но вы не найдете сам верхний квартиль.[5]
-
4
Найдите число, которое определяет верхний квартиль. Если номер найденной позиции равен целому значению, просто найдите соответствующее число в наборе данных.
- Например, если вы вычислили, что номер позиции равен 12, число, определяющее верхний квартиль, находится на 12-й позиции в наборе данных.
-
5
Вычислите верхний квартиль (если нужно). В большинстве случаев номер позиции равен обыкновенной или десятичной дроби. В этом случае найдите числа, которые в наборе данных расположены на предшествующей и последующей позициях, а затем вычислите среднее арифметическое этих чисел (то есть разделите сумму чисел на 2). Получится верхний квартиль набора данных.[6]
- Например, если вы вычислили, что верхний квартиль находится на позиции , то искомое число расположено между числами на 8-й и 9-й позициях. В наборе данных [3, 3, 4, 5, 7, 8, 10, 11, 12, 21] на 8-й и 9-й позициях находятся числа 11 и 12. Вычислите среднее арифметическое этих чисел:
Таким образом, верхний квартиль набора данных равен 11,5.
Реклама
- Например, если вы вычислили, что верхний квартиль находится на позиции , то искомое число расположено между числами на 8-й и 9-й позициях. В наборе данных [3, 3, 4, 5, 7, 8, 10, 11, 12, 21] на 8-й и 9-й позициях находятся числа 11 и 12. Вычислите среднее арифметическое этих чисел:
-
1
Введите данные в таблицу Excel. Каждое число введите в отдельную ячейку. Не забудьте ввести повторяющиеся числа. Данные можно вводить в любом столбце или строке таблицы.
- Например, введите набор данных [3, 3, 4, 5, 7, 8, 10, 11, 12, 21] в ячейки с A1 по A10.
-
2
В пустой ячейке введите функции квартиля. Функция квартиля имеет вид: =(КВАРТИЛЬ(AX:AY;Q)), где AX и AY — начальная и конечная ячейки с данными, Q — квартиль.[7]
Начните вводить эту функцию, а затем дважды щелкните по ней в открывшемся меню, чтобы вставить в ячейку. -
3
Выберите ячейки с данными. Щелкните по первой ячейке, а затем щелкните по последней ячейке, чтобы указать диапазон данных.
-
4
Вместо Q введите 3, чтобы указать на верхний квартиль. После диапазона данных введите точку с запятой, а в конце функции — две закрывающие скобки.
- Например, если нужно найти верхний квартиль данных в ячейках с A1 по A10, функция будет выглядеть следующим образом: =(КВАРТИЛЬ (A1:A10;3)).
-
5
Отобразите верхний квартиль. Для этого в ячейке с функцией нажмите Enter. Отобразится квартиль, а не его позиция в наборе данных.
Реклама
Советы
- Иногда можно столкнуться с понятием «межквартильного размаха». Это диапазон между нижним и верхним квартилями, который равен разности между третьим и первым квартилями.
Реклама
Об этой статье
Эту страницу просматривали 62 995 раз.
Была ли эта статья полезной?
Квартили в статистике
Интервалы |
Диапазон по продолжительности жизни |
Число стран (частота), f |
Накопленная частота, f |
1 |
60,8 — 63,53 |
6 |
6 |
2 |
63,53 – 66,25 |
13 |
19 |
3 |
66,25 – 68,98 |
12 |
31 |
4 |
68,98 – 71,70 |
18 |
49 |
5 |
71,70 — 74,43 |
37 |
86 |
6 |
74,43 — 77,15 |
22 |
108 |
7 |
77,15 — 79,88 |
27 |
135 |
8 |
79,88 — 82,60 |
15 |
150 |
Аналогично определению медианы вычисляются значения признака, делящие совокупность на 4 равные по численности части – квартили, которые обозначаются заглавной латинской буквой Q с подписным значком номера квартиля. Для первого и третьего квартилей приводим формулы и расчет:
Первый квартиль
Значение квартиля Q1 находится в интервале 68,98 – 71,70, соответствующего частоте fQ1 = 150:4 = 37,5
Третий квартиль
Значение квартиля находится в интервале 68,98 – 71,70, соответствующего частоте fQ3 = (3*150):4 = 112,5
Материалы сайта
Обращаем Ваше внимание на то, что все материалы опубликованы для образовательных целей.