Как найти квартиль в выборке

Расчет квартилей для интервального ряда:

Для
расчета квартилей для интервального
ряда

  1. Определяем номер квартиля по тем же
    формулам, что и для дискретного ряда,

  2. Определяем квартильный интервал по
    накопленной частоте. Это
    первый интервал, для которого накопленная
    частота будет больше или равна номеру
    квартиля.

  3. Рассчитываем квартиль по формуле:

Где:

J
– номер квартиля,


нижняя граница интервала, содержащего
квартиль. Интервал определяется по
накопленной частоте интервалов,


ширина интервала, содержащего квартиль,


накопленная частота интервала,
предшествующего интервалу, содержащему
квартиль,


частота интервала, содержащего квартиль.

Пример.
Найти первый квартиль для интервального
ряда.

Возрастные
группы

Число
студентовf

Накопленная
частота S

До
20 лет

346

346

20
— 25

872

1218

25
— 30

1054

2272

30
— 35

781

3053

35
— 40

212

3265

40
— 45

121

3386

45
лет и более

76

3462

Итого

3462

Решение:

  1. Определяем номер первого квартиля по
    формуле

  2. Первый квартиль находится в возрастной
    группе 20-25 лет, так как это первый
    интервал, для которого накопленная
    частота больше (или равна) номера
    квартиля (346<865,75; 1218>865,75).

  3. Определяем первый квартиль по формуле

Это значит, что четверть студентов
младше 22,98 лет.

  1. Децили

Децили 
значения признака, делящие ранжированный
ряд на десять равных частей.

Первый
дециль отсекает 1/10 часть совокупности,
а девятый дециль отсекает 9/10 частей.
Таким образом, различают 9 децилей.

Рассчитываются
децили аналогично квартилям.

Расчет децилей для дискретного ряда

  1. Определяем номер
    дециля по формуле:
    ,

  2. Если номер дециля
    – целое число
    ,
    то значение дециля будет равно величине
    элемента ряда, которое обладает
    накопленной частотой равной номеру
    дециля. Например, если номер дециля
    равен 20, его значение будет равно
    значению признака с S =20 (накопленной
    частотой равной 20).

Если номер дециля
– нецелое число
,
то дециль попадает между двумя
наблюдениями. Значением дециля будет
сумма, состоящая из значения элемента,
для которого накопленная частота равна
целому значению номера дециля, и указанной
части (нецелая часть номера дециля)
разности между значением этого элемента
и значением следующего элемента.

Например, если номер
дециля равна 20,25, дециль попадает между
20-м и 21-м наблюдениями, и его значение
будет равно значению 20-го наблюдения
плюс 1/4 разности между значением 20-го и
21-го наблюдений.

Расчет децилей для интервального ряда

  1. Определяем номер
    дециля по формуле:
    ,

  2. Определяем децильный
    интервал. Это первый интервал, для
    которого накопленная частота будет
    больше или равна номеру дециля.

  3. Рассчитываем дециль
    по формуле:

где
– значение j-го дециля,


– нижняя граница децильного интервала;


– ширина децильного интервала;


сумма всех частот,

-накопленная
частота интервала, предшествующего
децильному;


частота децильного интервала.

Пример.
 Найти 9-ый дециль D9

Заработная
плата
рабочего, тыс.руб;

бригада
1

,

число
рабочих

,

накопленная

частота

15

20

20

18

37

57

20

14

71

25

4

75

Итого:

75

  1. Определяем номер 9-го дециля

для первой бригады
;

  1. Номер дециля – нецелое число. Для
    определения дециля нужны значения двух
    элементов – х68и х69. Значение
    дециля находится между ними.
    Определяем
    их значение с помощью самой первой
    накопленной частоты большей или равной
    порядковым номерам элементов (68 и 69).
    Х68= 20, х69= 20.
    Теперь
    определяем значение 9-го дециля:D7=x68+ (х69
    х68)×0,4=20 + (20 – 20)×0,2 =20тыс.руб.

Это значит, что заработная плата90%
рабочих бригады не превышает 18 тыс.руб.

Пример.
Найти
седьмой дециль D7
для интервального ряда.

Возрастные
группы

Число
студентовf

Накопленная
частота S

До
20 лет

346

346

20
— 25

872

1218

25
— 30

1054

2272

30
— 35

781

3053

35
— 40

212

3265

40
— 45

121

3386

45
лет и более

76

3462

Итого

3462

Решение:

  1. Определяем номер седьмого дециля по
    формуле

  2. Седьмой дециль находится в возрастной
    группе 30-35 лет, так как это первый
    интервал, для которого накопленная
    частота больше (или равна) номера дециля
    (2272<2424,1; 3053>2424,1).

  3. Определяем седьмой дециль по формуле

Это значит, что 70% студентов младше 30,97
лет.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Функция КВАРТИЛЬ в Excel используется для расчета квартиля диапазона числовых данных и возвращает соответствующее числовое значение.

Функция КВАРТИЛЬ.ВКЛ вычисляет на основе указанной процентили в качестве второго аргумента функции. Полностью соответствует первой функции. Последняя используется в Excel 2007 и более ранних версиях и оставлена для совместимости.

Функция КВАРТИЛЬ.ИСКЛ используется для расчета квартили диапазона числовых значений на основе известной процентили, за исключением граничных значений (минимального и максимального значения в диапазоне).

Квартили используются для распределения диапазона чисел на четыре равные части:

  1. Первый квартиль является числом из диапазона исследуемых значений, которое делит данный диапазон на две части так, что около 25% данного диапазона являются числами, которые меньше первого квартиля, а остальные (75%) – больше. Рассматриваемые функции могут возвращать результат интерполяции двух соседних значений из диапазона.
  2. Второй квартиль эквивалентен медиане выборки (исследуемого числового диапазона), то есть числовому значению, которое делит диапазон на две части: 50% чисел меньше медианы, остальные 50% чисел больше медианы. Так, запись =КВАРТИЛЬ.ВКЛ(A1:A10;2) возвращает значение, эквивалентное результату вычисления функции =МЕДИАНА(A1:A10), при условии, что ячейки из диапазона A1:A10 содержат числовые значения.
  3. Третий квартиль – числовое значение, делящее диапазон на две части, в первой из которой содержатся 75% чисел диапазона, которые меньше полученного значения, а во второй (25%) – больше.

Функция КВАРТИЛЬ.ВКЛ может быть использована не только для определения медианы выборки (второго квартиля), а и нахождения минимального и максимального значений соответственно. При работе с большими диапазонами чисел для подобных расчетов рекомендуется использовать функции МИН и МАКС соответственно.

Существует несколько алгоритмов расчета квартилей. Все рассмотренные функции используют следующую формулу:

Qp=(1-(x-i)∙Ai+(x-i)∙A(i+1), где:

  • Qp – p-й квантиль (является частным случаем квантиля);
  • x – индекс квантиля;
  • i – индекс элемента из выборки;
  • A1,A2…Ai – элементы выборки, отсортированной по возрастанию значений.

Для расчета индекса квантиля (x) функция КВАРТИЛЬ.ВКЛ используют формулу:

x=(n-1)p, где n – количество элементов в диапазоне.

Функция КВАРТИЛЬ.ИСКЛ использует формулу x=(n+1)p.

В Excel принято так, что первые выше указанные 2 функции используют метод N-1-интерполяцию, а третья функция – N+1-интерполяцию.



Примеры использования функций КВАРТИЛЬ в Excel

Пример 1. В столбце таблицы содержится числовая последовательность. Определить число, которое делит последовательность на 2 части, 25% первой – числа меньше полученного значения, а 75% – больше. Использовать N+1-интерполяцию.

Вид таблицы данных:

Пример 1.

Для определения 1-го квартиля используем функцию:

КВАРТИЛЬ.ИСКЛ.

Описание аргументов:

  • A2:A15 – диапазон ячеек с исследуемыми числами;
  • 1 – номер вычисляемого квартиля.

Полученный результат:

определения 1-го квартиля.

Проверим утверждение о том, что второй квартиль соответствует медиане выборке. Определим 2-й по формуле:

2-й квартиль.

Вычислим медиану:

=МЕДИАНА(A2:A15)

Полученные значения совпадают:

МЕДИАНА.

В результате расчетов мы получили первый, второй квартили и медиану для исходного диапазона чисел.

Статистический анализ роста доли дохода в Excel за период

Пример 2. В таблице приведены данные о доходах предпринимателя за год. Доказать, что примерно 75% значений меньше, чем третий квартиль доходов.

Вид исходной таблицы:

Пример 2.

Определим 3-й по формуле:

КВАРТИЛЬ.ВКЛ.
Определим 3-й квартиль.

Определим соотношение чисел, меньше полученного числа, к общему количеству значений по формуле:

=СЧЁТЕСЛИ(B2:B13;”<“&B15)/СЧЁТ(B2:B13)

Полученные результаты:

СЧЁТЕСЛИ.

Анализ статистики случайно сгенерированных чисел в Excel

Пример 3. Имеется диапазон случайных чисел, отсортированный в порядке возрастания. Определить соотношение суммы чисел, которые меньше 1-го квартиля, к сумме чисел, которые превышают значение 1-го квартиля.

Чтобы сгенерировать случайное число в Excel воспользуемся функцией:

=СЛУЧМЕЖДУ(0;1000)

После генерации отсортируем случайно сгенерированные числа по возрастанию. Вид исходной таблицы данных со случайными числами:

Пример 3.

Формула для расчета имеет следующий вид (формула массива CTRL+SHIFT+ENTER):

Функции СУММ с вложенными функциями ЕСЛИ выполняют расчет суммы только тех чисел, которые меньше и больше соответственно значения, возвращаемого функцией для исследуемого диапазона. Из полученных значений вычисляется частное. Результат расчетов:

Анализ статистики.

Общая сумма чисел исследуемого диапазона, которые меньше 1-го квартиля, составляет всего 8,57% от общей суммы чисел, которые больше 1-го квартиля.

Особенности использования функций расчета квартиля в Excel

Все рассматриваемые функции имеют одни и те же аргументы:

=КВАРТИЛЬ(массив;часть)

Описание аргументов:

  • массив – обязательный аргумент, принимающий константу массива или ссылку на диапазон ячеек с числовыми значениями, для которых будет рассчитан требуемый квартиль;
  • часть – обязательный аргумент, принимающий числовые значения, указывающие номер возвращаемого квартиля. В зависимости от используемой функции, может принимать числа из диапазонов:
  1. От 0 до 4 (КВАРТИЛЬ.ВКЛ), при этом числа 0 и 1 характеризуют минимальное и максимальное значения из исследуемого диапазона соответственно. Число 1 соответствует 1-й квартили, 2 – медиане, 3 – 3-й квартили.
  2. От 1 до 3 (функция КВАРТИЛЬ.ИСКЛ), соответствующие 1-й, 2-й и 3-й квартилям.

Примечания:

  1. Все рассматриваемые функции не учитывают имена и текстовые строки, которые не могут быть преобразованы к числам, логические значения и пустые ячейки. Ячейки, содержащие значение 0 (нуль), в расчет включаются.
  2. Если в качестве первого аргумента функций передан пустой массив или ссылка на диапазон пустых значений, все функции вернут код ошибки #ЧИСЛО!.
  3. Если в качестве второго аргумента функций было передано нецелое число из диапазона допустимых значений, дробная часть будет усечена.
  4. Если второй аргумент задан числом, взятым из вне диапазона допустимых значений, в результате вычислений будет возвращен код ошибки #ЧИСЛО!.

From Wikipedia, the free encyclopedia

In statistics, a quartile is a type of quantile which divides the number of data points into four parts, or quarters, of more-or-less equal size. The data must be ordered from smallest to largest to compute quartiles; as such, quartiles are a form of order statistic. The three main quartiles are as follows:

  • The first quartile (Q1) is defined as the middle number between the smallest number (minimum) and the median of the data set. It is also known as the lower or 25th empirical quartile, as 25% of the data is below this point.
  • The second quartile (Q2) is the median of a data set; thus 50% of the data lies below this point.
  • The third quartile (Q3) is the middle value between the median and the highest value (maximum) of the data set. It is known as the upper or 75th empirical quartile, as 75% of the data lies below this point.[1]

Along with the minimum and maximum of the data (which are also quartiles), the three quartiles described above provide a five-number summary of the data. This summary is important in statistics because it provides information about both the center and the spread of the data. Knowing the lower and upper quartile provides information on how big the spread is and if the dataset is skewed toward one side. Since quartiles divide the number of data points evenly, the range is not the same between quartiles (i.e., Q3Q2Q2Q1) and is instead known as the interquartile range (IQR). While the maximum and minimum also show the spread of the data, the upper and lower quartiles can provide more detailed information on the location of specific data points, the presence of outliers in the data, and the difference in spread between the middle 50% of the data and the outer data points.[2]

Definitions[edit]

Symbol Names Definition
Q1
  • first quartile
  • lower quartile
  • 25th percentile
splits off the lowest 25% of data from the highest 75%
Q2
  • second quartile
  • median
  • 50th percentile
cuts data set in half
Q3
  • third quartile
  • upper quartile
  • 75th percentile
splits off the highest 25% of data from the lowest 75%

Computing methods[edit]

Discrete distributions[edit]

For discrete distributions, there is no universal agreement on selecting the quartile values.[3]

Method 1[edit]

  1. Use the median to divide the ordered data set into two-halves.
    • If there is an odd number of data points in the original ordered data set, do not include the median (the central value in the ordered list) in either half.
    • If there is an even number of data points in the original ordered data set, split this data set exactly in half.
  2. The lower quartile value is the median of the lower half of the data. The upper quartile value is the median of the upper half of the data.

This rule is employed by the TI-83 calculator boxplot and “1-Var Stats” functions.

Method 2[edit]

  1. Use the median to divide the ordered data set into two-halves.
    • If there are an odd number of data points in the original ordered data set, include the median (the central value in the ordered list) in both halves.
    • If there are an even number of data points in the original ordered data set, split this data set exactly in half.
  2. The lower quartile value is the median of the lower half of the data. The upper quartile value is the median of the upper half of the data.

The values found by this method are also known as “Tukey’s hinges”;[4] see also midhinge.

Method 3[edit]

  1. If there are even numbers of data points, then Method 3 starts off the same as Method 1 or Method 2 above and you can choose to include or not include the median as a datapoint. If you choose to include the median as a new datapoint, proceed to step 2 or 3 of Method 3 because you now have an odd number of datapoints.
  2. If there are (4n+1) data points, then the lower quartile is 25% of the nth data value plus 75% of the (n+1)th data value; the upper quartile is 75% of the (3n+1)th data point plus 25% of the (3n+2)th data point.
  3. If there are (4n+3) data points, then the lower quartile is 75% of the (n+1)th data value plus 25% of the (n+2)th data value; the upper quartile is 25% of the (3n+2)th data point plus 75% of the (3n+3)th data point.

Method 4[edit]

If we have an ordered dataset x_{1},x_{2},...,x_{n}, we can interpolate between data points to find the pth empirical quantile if x_{i} is in the {displaystyle i/(n+1)} quantile. If we denote the integer part of a number a by lfloor arfloor , then the empirical quantile function is given by,

{displaystyle q(p/4)=x_{k}+alpha (x_{k+1}-x_{k})},

where {displaystyle k=lfloor p(n+1)/4rfloor } and {displaystyle alpha =p(n+1)/4-lfloor p(n+1)/4rfloor }.[1]

To find the first, second, and third quartiles of the dataset we would evaluate {displaystyle q(0.25)}, {displaystyle q(0.5)}, and {displaystyle q(0.75)} respectively.

Example 1[edit]

Ordered Data Set: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

Method 1 Method 2 Method 3 Method 4
Q1 15 25.5 20.25 15
Q2 40 40 40 40
Q3 43 42.5 42.75 43

Example 2[edit]

Ordered Data Set: 7, 15, 36, 39, 40, 41

As there are an even number of data points, the first three methods all give the same results.

Method 1 Method 2 Method 3 Method 4
Q1 15 15 15 13
Q2 37.5 37.5 37.5 37.5
Q3 40 40 40 40.25

Continuous probability distributions[edit]

Quartiles on a cumulative distribution function of a normal distribution

If we define a continuous probability distributions as P(X) where X is a real valued random variable, its cumulative distribution function (CDF) is given by,

{displaystyle F_{X}(x)=P(Xleq x)}.[1]

The CDF gives the probability that the random variable X is less than the value x. Therefore, the first quartile is the value of x when {displaystyle F_{X}(x)=0.25}, the second quartile is x when {displaystyle F_{X}(x)=0.5}, and the third quartile is x when {displaystyle F_{X}(x)=0.75}.[5] The values of x can be found with the quantile function Q(p) where {displaystyle p=0.25} for the first quartile, p=0.5 for the second quartile, and {displaystyle p=0.75} for the third quartile. The quantile function is the inverse of the cumulative distribution function if the cumulative distribution function is monotonically increasing.

Outliers[edit]

There are methods by which to check for outliers in the discipline of statistics and statistical analysis. Outliers could be a result from a shift in the location (mean) or in the scale (variability) of the process of interest.[6] Outliers could also be evidence of a sample population that has a non-normal distribution or of a contaminated population data set. Consequently, as is the basic idea of descriptive statistics, when encountering an outlier, we have to explain this value by further analysis of the cause or origin of the outlier. In cases of extreme observations, which are not an infrequent occurrence, the typical values must be analyzed. In the case of quartiles, the Interquartile Range (IQR) may be used to characterize the data when there may be extremities that skew the data; the interquartile range is a relatively robust statistic (also sometimes called “resistance”) compared to the range and standard deviation. There is also a mathematical method to check for outliers and determining “fences”, upper and lower limits from which to check for outliers.

After determining the first and third quartiles and the interquartile range as outlined above, then fences are calculated using the following formula:

{text{Lower fence}}=Q_{1}-1.5({mathrm  {IQR}}),
{text{Upper fence}}=Q_{3}+1.5({mathrm  {IQR}}),,

Boxplot Diagram with Outliers

where Q1 and Q3 are the first and third quartiles, respectively. The lower fence is the “lower limit” and the upper fence is the “upper limit” of data, and any data lying outside these defined bounds can be considered an outlier. Anything below the Lower fence or above the Upper fence can be considered such a case. The fences provide a guideline by which to define an outlier, which may be defined in other ways. The fences define a “range” outside which an outlier exists; a way to picture this is a boundary of a fence, outside which are “outsiders” as opposed to outliers. It is common for the lower and upper fences along with the outliers to be represented by a boxplot. For a boxplot, only the vertical heights correspond to the visualized data set while horizontal width of the box is irrelevant. Outliers located outside the fences in a boxplot can be marked as any choice of symbol, such as an “x” or “o”. The fences are sometimes also referred to as “whiskers” while the entire plot visual is called a “box-and-whisker” plot.

When spotting an outlier in the data set by calculating the interquartile ranges and boxplot features, it might be simple to mistakenly view it as evidence that the population is non-normal or that the sample is contaminated. However, this method should not take place of a hypothesis test for determining normality of the population. The significance of the outliers vary depending on the sample size. If the sample is small, then it is more probable to get interquartile ranges that are unrepresentatively small, leading to narrower fences. Therefore, it would be more likely to find data that are marked as outliers.[7]

Computer software for quartiles[edit]

Environment Function Quartile Method
Microsoft Excel QUARTILE.EXC Method 4
Microsoft Excel QUARTILE.INC Method 3
TI-8X series calculators 1-Var Stats Method 1
R fivenum Method 2
Python numpy.percentile Method 3
Python pandas.DataFrame.describe Method 3

Excel:

The Excel function QUARTILE(array, quart) provides the desired quartile value for a given array of data, using Method 3 from above. In the Quartile function, array is the dataset of numbers that is being analyzed and quart is any of the following 5 values depending on which quartile is being calculated. [8]

Quart Output QUARTILE Value
0 Minimum value
1 Lower Quartile (25th percentile)
2 Median
3 Upper Quartile (75th percentile)
4 Maximum value

MATLAB:

In order to calculate quartiles in Matlab, the function quantile(A,p) can be used. Where A is the vector of data being analyzed and p is the percentage that relates to the quartiles as stated below. [9]

p Output QUARTILE Value
0 Minimum value
0.25 Lower Quartile (25th percentile)
0.5 Median
0.75 Upper Quartile (75th percentile)
1 Maximum value

See also[edit]

  • Five-number summary
  • Range
  • Box plot
  • Interquartile range
  • Summary statistics
  • Quantile

References[edit]

  1. ^ a b c A modern introduction to probability and statistics: understanding why and how. Dekking, Michel, 1946–. London: Springer. 2005. pp. 236-238. ISBN 978-1-85233-896-1. OCLC 262680588.{{cite book}}: CS1 maint: others (link)
  2. ^ Knoch, Jessica (February 23, 2018). “How are Quartiles Used in Statistics?”. Magoosh. Archived from the original on December 10, 2019. Retrieved February 24, 2023.
  3. ^ Hyndman, Rob J; Fan, Yanan (November 1996). “Sample quantiles in statistical packages”. American Statistician. 50 (4): 361–365. doi:10.2307/2684934. JSTOR 2684934.
  4. ^ Tukey, John Wilder (1977). Exploratory Data Analysis. ISBN 978-0-201-07616-5.
  5. ^ “6. Distribution and Quantile Functions” (PDF). math.bme.hu.
  6. ^ Walfish, Steven (November 2006). “A Review of Statistical Outlier Method”. Pharmaceutical Technology.
  7. ^ Dawson, Robert (July 1, 2011). “How Significant is a Boxplot Outlier?”. Journal of Statistics Education. 19 (2). doi:10.1080/10691898.2011.11889610.
  8. ^ “How to use the Excel QUARTILE function | Exceljet”. exceljet.net. Retrieved December 11, 2019.
  9. ^ “Quantiles of a data set – MATLAB quantile”. www.mathworks.com. Retrieved December 11, 2019.

External links[edit]

  • Quartile – from MathWorld Includes references and compares various methods to compute quartiles
  • Quartiles – From MathForum.org
  • Quartiles calculator – simple quartiles calculator
  • Quartiles – An example how to calculate it


Загрузить PDF


Загрузить PDF

Квартили — это числа, которые делят набор данных на четыре равные части (четверти).[1]
Верхний (третий) квартиль включает 25% наибольших чисел в наборе (75-й процентиль). Верхний квартиль вычисляется через определение медианы верхней половины набора данных (эта половина включает наибольшие числа).[2]
Верхний квартиль можно вычислить вручную или в редакторе электронных таблиц, например, в MS Excel.

  1. Изображение с названием Calculate the Upper Quartile Step 1

    1

    Упорядочьте числа в наборе данных по возрастанию. То есть запишите их, начиная с наименьшего числа и заканчивая наибольшим. Не забудьте записать все числа, даже если они повторяются.[3]

    • Например, дан набор данных [3, 4, 5, 11, 3, 12, 21, 10, 8, 7]. Запишите числа следующим образом: [3, 3, 4, 5, 7 , 8, 10, 11, 12, 21].
  2. Изображение с названием Calculate the Upper Quartile Step 2

    2

    Определите количество чисел в наборе данных. Для этого просто посчитайте числа, которые входят в набор. Не забудьте посчитать повторяющиеся числа.

    • Например, набор данных [3, 3, 4, 5, 7, 8, 10, 11, 12, 21] состоит из 10 чисел.
  3. Изображение с названием Calculate the Upper Quartile Step 3

    3

    Запишите формулу для вычисления верхнего квартиля. Формула имеет вид: Q_{{3}}={frac  {3}{4}}(n+1), где Q_{{3}} — верхний квартиль, n — количество чисел в наборе данных.[4]

    Реклама

  1. 1

  2. 2

    Решите выражение в скобках. Согласно правильному порядку выполнения математических операций, вычисления начинают с выражения в скобках. В данном случае к количеству чисел в наборе данных прибавьте 1.

  3. 3

    Полученную сумму умножьте на {frac  {3}{4}}. Также сумму можно умножить на 0,75. Вы найдете позицию числа в наборе данных, которая на три четверти (75%) отдалена от начала набора, то есть позицию, где набор данных разделяется на верхний квартиль и нижние квартили. Но вы не найдете сам верхний квартиль.[5]

  4. 4

    Найдите число, которое определяет верхний квартиль. Если номер найденной позиции равен целому значению, просто найдите соответствующее число в наборе данных.

    • Например, если вы вычислили, что номер позиции равен 12, число, определяющее верхний квартиль, находится на 12-й позиции в наборе данных.
  5. 5

    Вычислите верхний квартиль (если нужно). В большинстве случаев номер позиции равен обыкновенной или десятичной дроби. В этом случае найдите числа, которые в наборе данных расположены на предшествующей и последующей позициях, а затем вычислите среднее арифметическое этих чисел (то есть разделите сумму чисел на 2). Получится верхний квартиль набора данных.[6]

    • Например, если вы вычислили, что верхний квартиль находится на позиции 8{frac  {1}{4}}, то искомое число расположено между числами на 8-й и 9-й позициях. В наборе данных [3, 3, 4, 5, 7, 8, 10, 11, 12, 21] на 8-й и 9-й позициях находятся числа 11 и 12. Вычислите среднее арифметическое этих чисел:
      {frac  {11+12}{2}}
      ={frac  {23}{2}}
      =11,5
      Таким образом, верхний квартиль набора данных равен 11,5.

    Реклама

  1. 1

    Введите данные в таблицу Excel. Каждое число введите в отдельную ячейку. Не забудьте ввести повторяющиеся числа. Данные можно вводить в любом столбце или строке таблицы.

    • Например, введите набор данных [3, 3, 4, 5, 7, 8, 10, 11, 12, 21] в ячейки с A1 по A10.
  2. 2

    В пустой ячейке введите функции квартиля. Функция квартиля имеет вид: =(КВАРТИЛЬ(AX:AY;Q)), где AX и AY — начальная и конечная ячейки с данными, Q — квартиль.[7]
    Начните вводить эту функцию, а затем дважды щелкните по ней в открывшемся меню, чтобы вставить в ячейку.

  3. 3

    Выберите ячейки с данными. Щелкните по первой ячейке, а затем щелкните по последней ячейке, чтобы указать диапазон данных.

  4. 4

    Вместо Q введите 3, чтобы указать на верхний квартиль. После диапазона данных введите точку с запятой, а в конце функции — две закрывающие скобки.

    • Например, если нужно найти верхний квартиль данных в ячейках с A1 по A10, функция будет выглядеть следующим образом: =(КВАРТИЛЬ (A1:A10;3)).
  5. 5

    Отобразите верхний квартиль. Для этого в ячейке с функцией нажмите Enter. Отобразится квартиль, а не его позиция в наборе данных.

    Реклама

Советы

  • Иногда можно столкнуться с понятием «межквартильного размаха». Это диапазон между нижним и верхним квартилями, который равен разности между третьим и первым квартилями.

Реклама

Об этой статье

Эту страницу просматривали 62 950 раз.

Была ли эта статья полезной?

Содержание

Спрятать

  1. Что такое квартиль?
  2. Как работают квартили
  3. Какова цель квартилей?
  4. Как найти квартили в Excel
    1. №1. Сортируйте свои числа
    2. № 2. Выполнить задание
  5. Советы по использованию функции квартиля в Excel
    1. №1. Ценности следует пересмотреть.
    2. № 2. Определить различные кварты
    3. №3. Вручную проверьте точность.
  6. Что такое квартильный пример?
    1. #Шаг 1: подсчитайте количество наблюдений в наборе данных
    2. #Шаг 2: Отсортируйте наблюдения по возрастанию
    3. #Шаг 3: Найдите первый квартиль
    4. #Шаг 4: Найдите второй квартиль
    5. #Шаг 5: Найдите третий квартиль
  7. Как интерпретировать квартили
    1. №1. Сравнение наблюдений
    2. № 2. медиана
    3. №3. Межквартильный размах (IQR)
  8. Формулы квартилей
    1. №1. Для первого квартиля, сокращенно Q1.
    2. № 2. Для второго квартиля, сокращенно Q2.
    3. №3. Для третьего квартиля, сокращенно Q3.
    4. № 4. Для межквартильного диапазона.
  9. Как рассчитывается квартиль?
    1. №1. Пример Квартиль 1
    2. № 2. Пример 2 квартили
  10. Почему он называется квартилем?
  11. Как разделить данные на 4 квартили?
  12. Что такое 25-процентный квартиль?
  13. Что такое 5 квартилей?
  14. Каковы шаги, чтобы найти первый квартиль?
  15. Для чего используется формула квартилей?
  16. Как мы используем квартиль?
  17. Заключение
  18. Статьи по теме
  19. Рекомендации

Компании часто используют Excel для организации статистики, чтобы лучше понимать свои данные. Функция квартилей, которая делит данные на четыре категории в диапазоне, — это одна из функций, которую некоторые люди могут использовать в своих электронных таблицах. Понимание квартилей может помочь вам решить, может ли этот расчет дать новое понимание ваших числовых данных. В этой статье мы объясним, что такое квартиль, на упрощенном примере, как он рассчитывается и его цель среди других основных фактов, которые вам необходимо знать. Давайте продолжим!

Что такое квартиль?

Квартиль — это статистический термин, который относится к разделению наблюдений на четыре определенных интервала на основе значений данных и того, как они соотносятся со всем набором наблюдений.

Квартили — это значения Excel, которые делят числовые значения на четыре части. Люди предпочитают квартили процентилям, например 25% самых высокооплачиваемых клиентов. Четыре квартили следующие:

  • Первый квартиль: Первый квартиль включает самые низкие 25% диапазона данных.
  • Второй квартиль: Второй квартиль включает следующую низшую группу чисел. В эту группу входят числа через медиану набора данных.
  • Третий квартиль: Третий квартиль – это вторая по величине группа чисел выше медианы.
  • Четвертый квартиль: четвертый квартиль включает 25% самых высоких чисел в диапазоне данных.

Например, если данные колеблются от одного до восьми, каждый попадает в один из следующих квартилей:

  • Первый квартиль: 1 и 2
  • Второй квартиль: 3 и 4
  • Третий квартиль: 5 и 6
  • Четвертая квартиль: 7 и 8

Как работают квартили

Quartiles делит данные на четверти, так что 25% измерений меньше нижнего квартиля, 50% меньше медианы и 75% меньше верхнего квартиля, точно так же, как медиана делит данные пополам, так что 50% измерений ниже медианы и 50% выше ее.

Набор данных разделен на четыре диапазона, каждый из которых содержит 25% точек данных, с использованием трех квартильных значений: нижнего, медианного и верхнего. Нижний квартиль, или первый квартиль, обозначается как Q1 и представляет собой среднее число между наименьшим и медианным значениями набора данных. Медиана также находится во втором квартиле, Q2. Верхний или третий квартиль, обозначаемый как Q3, является центральной точкой распределения, лежащей между медианой и наибольшим числом.

Теперь мы можем наметить четыре группы, образованные квартилями. Первый набор значений включает наименьшее число до Q1; второй набор включает Q1 в медиану; третий набор включает медиану для Q3; и четвертая категория включает Q3 до самой высокой точки данных во всем наборе.

Какова цель квартилей?

Квартили удивительно полезны и могут служить цели в различных контекстах. Одна из хороших целей квартилей заключается в том, что они могут помочь вам понять основную тенденцию и изменчивость вашего набора данных и даже помочь вам найти выбросы. Отображение их в виде диаграммы может помочь вам понять распределение ваших данных.

Q2 — это медиана, и она делит набор данных пополам. Для асимметричных распределений это полезная мера центральной тенденции. Межквартильный размах (IQR) является мерой изменчивости. Интервал между первым и третьим квартилями.

IQR = Q3 – Q1

Большие IQR указывают на более широкий диапазон значений. Независимо от формы распределения половина наблюдений попадает в межквартильный диапазон.

Медиана и межквартильный размах являются более надежными показателями, чем более привычные среднее значение и стандартное отклонение. Выбросы мало влияют на любую статистику, потому что они не зависят от каждого значения. Кроме того, межквартильный диапазон идеально подходит для асимметричных распределений, таких как медиана.

Еще одно полезное назначение квартилей заключается в том, что они также могут помочь вам найти выбросы.

Как найти квартили в Excel

При поиске квартилей в Excel у вас есть несколько вариантов:

№1. Сортируйте свои числа

Вы можете получить свои квартили, упорядочив числа в диапазоне данных от самого низкого до самого высокого. В электронной таблице вы можете отсортировать их по столбцу. Например, ваши числа могут быть:

A B
1 9 1
2 1 3
3 3 3
4 5 5
5 7 6
6 6 7
7 2 9

Формула квартилей требует двух основных значений: квартили и массивы. Каждый квартиль представляет собой отдельный набор значений. Они пронумерованы от 0 до 4:

  • 0: наименьшее значение в диапазоне чисел.
  • 1: Это первый квартиль или 25-й процентиль.
  • 2: Это второй или медианный квартиль или 50-й процентиль.
  • 3: Это 75-й процентиль или третий квартиль.
  • 4: это самое высокое значение в диапазоне.

№ 2. Выполнить задание

В Excel функция квартиля возвращает квартиль для любого набора данных. В Excel для расчета квартилей используется следующая формула:

= КВАРТИЛЬ (массив; кварта) 

Где:

  • Наблюдения и советы этой статьи мы подготовили на основании опыта команды массив представляет весь диапазон значений, для которых вы хотите найти квартили.
  • кварта какой квартиль вы хотите найти.

Советы по использованию функции квартиля в Excel

Вот несколько советов по использованию функции квартилей Excel:

№1. Ценности следует пересмотреть.

Перед запуском функции квартиля дважды проверьте, чтобы ваши числа были в порядке возрастания в одном столбце и были правильными. Функция генерирует сообщение об ошибке, если какая-либо из ячеек пуста или содержит текст или специальные символы. Если значение кварты в вашей команде меньше нуля или больше четырех, вы можете получить сообщение об ошибке.

№ 2. Определить различные кварты

Каждая кварта может предоставить вам уникальные данные, которые вы можете использовать. Например, вам может быть интересно узнать, сколько покупатель тратит в самом низком процентиле покупок, а также в верхних квартилях. Это может помочь вам определить, как создавать конкретные бизнес-цели для определенных групп. Вычисление каждого квартиля для широкого диапазона данных может показать вам больше, чем среднее значение или медиану, поскольку оно показывает изменение в наборе данных.

№3. Вручную проверьте точность.

Чтобы проверить ваши данные, вы можете вручную рассчитать квартили, используя следующие формулы:

  • Нижний квартиль = (N+1) x 1/4
  • Средний квартиль = (N+1) x 2/4
  • Верхний квартиль = (N+1) x 3/4

Число N обозначает количество целых чисел в вашем наборе данных. Результат указывает, какой квартиль представляет каждая позиция. Например, если формула нижнего квартиля дает результат шесть, шестое число в вашей последовательности является нижним квартилем. Формулы для расчета четвертого квартиля не существует, поскольку это максимальное значение в диапазоне.

Что такое квартильный пример?

Рассмотрите возможность проведения небольшого исследования развития речи у детей в возрасте 1–6 лет. Вы пишете статью об исследовании и хотите включить возрастные квартили детей.

Age (years) 1 2 3 4 5 6
частота 2 3 4 1 2 2

#Шаг 1: Подсчитайте количество наблюдений в наборе данных.

= 2 + 3 + 4 + 1 + 2 + 2 = 14

#Шаг 2: Сортировка наблюдений в порядке возрастания

1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 5, 5, 6, 6

#Шаг 3: найти первый квартиль

* (1/4) = 14 * (1/4) = 3.5
3.5 не является целым числом, поэтому Q1 — это число в позиции 4.
1, 1, 2, 22, 3, 3, 3, 3, 4, 5, 5, 6, 6
Q1 = 2 года

#Шаг 4: найти второй квартиль

* (2/4) = 14 * (2/4) = 7
7 — целое число, поэтому Q2 — это среднее чисел в позициях 7 и 8.
1, 1, 2, 2, 2, 3, 333, 4, 5, 5, 6, 6
Q2 = (3 + 3) / 2
Q2 = 3 года

#Шаг 5: найти третий квартиль

* (3/4) = 14 * (3/4) = 10.5
10.5 не является целым числом, поэтому Q3 — это число в позиции 11.
1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 55, 6, 6
Q3 = 5 года

Как интерпретировать квартили

Квартили могут предоставить полезную информацию о конкретном наблюдении или наборе данных.

№1. Сравнение наблюдений

Квартили могут помочь вам понять наблюдение по отношению к остальной части выборки или генеральной совокупности. Вы можете определить, находится ли наблюдение в нижних 25 %, средних 50 % или верхних 25 %, сравнив его с квартилями.

№ 2. медиана

Медиана, или второй квартиль, является мерой центральной тенденции. Это среднее число является хорошим индикатором среднего или наиболее центрального значения данных, особенно для асимметричных распределений или распределений с выбросами.

№3. Межквартильный размах (IQR)

Межквартильный размах (IQR) является мерой изменчивости. Это расстояние между первой и третьей квартилями. Он представляет собой распределение средних 50% данных.

IQR = Q3 – Q1

IQR является превосходной мерой изменчивости для асимметричных или заполненных выбросами распределений. Поскольку IQR включает только средние 50% данных, на него не влияют экстремальные значения, в отличие от диапазона.

  • Асимметрия: Расстояние между квартилями может указывать на то, является ли распределение асимметричным или симметричным.
  • Выявление выбросов: Выбросы можно определить с помощью межквартильного диапазона (IQR). Выбросы — это наблюдения, которые либо чрезвычайно высоки, либо чрезвычайно низки. Выброс определяется как любое наблюдение, которое более чем на 1.5 IQR отличается от первого или третьего квартиля.

Формулы квартилей

Существуют четыре основные формулы квартилей, используемые для определения первого, второго, третьего и интерквартилей.

№1. Для первого квартиля, сокращенно Q1.

Первый квартиль = Q1 = ((n + 1) / 4)-й член

№ 2. Для второго квартиля, сокращенно Q2.

Второй квартиль = Q2 = ((n + 1) / 2)-й член

№3. Для третьего квартиля, сокращенно Q3.

Третий квартиль = Q3 = (3(n + 1)/4)-й член

№ 4. Для межквартильного диапазона.

Межквартильный = Q3 – Q1 = (3(n + 1)/4) й член – ((n + 1)/4) й термин

Мы можем написать общую формулу для расчета квартиля, используя три приведенные выше формулы для первого, второго и третьего квартилей.

Как рассчитывается квартиль?

Квартили можно легко рассчитать с помощью формул.

№1. Пример Квартиль 1

Оценить все квартильные части данного набора данных, 2, 9, 7, 29, 34, 61, 25, 19, 16?

Решения

  • Шаг 1: Начните с заданного набора чисел.

2, 9, 7, 29, 34, 61, 25, 19, 16

  • Шаг 2: Отсортируйте заданный набор чисел в порядке возрастания.

2, 7, 9, 16, 19, 25, 29, 34, 61

  • Шаг 3: Подсчитайте данный набор чисел и умножьте на n.

N = 9

  • Шаг 4: Используя общую формулу квартилей, определите первый, второй и третий квартиль.

Qk = k (n + 1) / 4)-й член

  • Шаг 5: Подставьте k = 1, 2, 3 вместо первого, второго и третьего квартилей.

Для к = 1

Q1 = 1 (9 + 1) / 4)-й член

Q1 = 1 (10) / 4)-й член

Q1 = (10) / 4)-й член

Q1 = (5) / 2)-й член

Q1 = 2.5-й срок

Для к = 2

Q2 = 2 (9 + 1) / 4)-й член

Q2 = 2 (10) / 4)-й член

Q2 = (10/2)-й член

Q2 = 5-й срок

Для к = 3

Q3 = 3 (9 + 1) / 4)-й член

Q3 = 3 (10) / 4)-й член

Q3 = (30/4)-й член

Q3 = (15/2)-й член

Q3 = 7.5-й срок

  • Шаг 6: Возьмите рассчитанные значения из организованного набора данных квартилей.

Для Q1

Q1 = 2.5-й срок

Q1 = 2-й срок + 3-й срок / 2

Q1 = 7 + 9/2

Q1 = 16/2

Q1 = 8

Для Q2

Q2 = 5-й срок

Q2 = 19

Для Q3

Q3 = 7.5-й срок

Q3 = 7-й + 8-й / 2

Q3 = 29 + 34 / 2

Q3 = 63/2

Q3 = 31.5

  • Шаг 7: Примените общую формулу для расчета межквартильного диапазона и введите значения.

межквартильный = Q3 – Q1

межквартильный = 31.5 – 8

межквартильный = 23.5

В результате квартили данного множества равны Q1 = 8. Q2 = 19, Q3 = 31.5 и интерквартиль = 23.5.

№ 2. Пример 2 квартили

Найдите интерквартиль следующего набора данных: 23, 19, 3, 12, 22, 18, 11?

Решения

  • Шаг 1: Начните с заданного набора чисел.

23, 19, 3, 12, 22, 18, 11

  • Шаг 2: Отсортируйте заданный набор чисел в порядке возрастания.

3, 11, 12, 18, 19, 22, 23

  • Шаг 3: Подсчитайте данный набор чисел и умножьте на n.

N = 7

  • Шаг 4: Теперь применим общую интерквартильную формулу.

Межквартильный диапазон = Q3 – Q1

  • Шаг 5: Определите первый и третий квартили.

Для Q1

Q1 = (n + 1) / 4)-й член

Q1 = (7 + 1) / 4)-й член

Q1 = (8) / 4)-й член

Q1 = 2-й срок

Для Q3

Q3 = 3(n + 1) / 4)-й член

Q3 = 3(7 + 1) / 4)-й член

Q3 = 3(8) / 4)-й срок

Q3 = (24/4)-й член

Q3 = 6-й срок

  • Шаг 6: введите результаты третьего и первого квартилей в формулу межквартили.

межквартильный = 6-й срок – 2-й срок

межквартильный = 22 – 11

межквартильный = 11

Почему он называется квартилем?

Квартиль — это тип квантиля в статистике, который делит количество точек данных на четыре части или четверти примерно одинакового размера. Для вычисления квартилей данные должны быть упорядочены от наименьшего к наибольшему; таким образом, квартили являются разновидностью порядковой статистики.

Как разделить данные на 4 квартили?

Щелкните пустую ячейку где-нибудь на листе в Excel. Например, выберите ячейку B1. Введите «= КВАРТИЛЬ (A1: A10,1)» после ввода.

Что такое 25-процентный квартиль?

25-й процентиль также называют первым или нижним квартилем. 25-й процентиль — это значение, при котором 25% ответов находятся ниже него, а 75% ответов — выше него.

Что такое 5 квартилей?

Сводка состоит из пяти значений: самых экстремальных значений набора данных (максимальное и минимальное значения), нижнего и верхнего квартилей и медианы. Эти значения представлены в следующем порядке: минимальное значение, нижний квартиль (Q1), медианное значение (Q2), верхний квартиль (Q3) и максимальное значение.

Каковы шаги, чтобы найти первый квартиль?

Мы используем следующие шаги для определения первого квартиля:

  • Не забудьте расположить точки данных в порядке от наименьшей до наибольшей важности.
  • Найдите медиану всего набора данных и разделите его на две равные части.
  • Возьмите медиану нижней половины набора данных.

Для чего используется формула квартилей?

Набор наблюдений делится на четыре равные части по формуле квартилей. Первый квартиль расположен между первым членом и медианой. Медиана представляет второй квартиль. Третий квартиль — это значение, которое находится между медианой и последним членом.

Как мы используем квартиль?

Квартили часто используются в данных о продажах и опросах для классификации населения. Например, КВАРТИЛЬ можно использовать для определения 25% самых высоких доходов населения.

Заключение

Теперь вы можете понять все основные понятия, связанные с квартилем, просто прочитав эту статью. В этом руководстве подробно и последовательно объясняется цель и все, что вам нужно знать о квартиле, включая пример и способ его расчета. Пожалуйста, оставьте вопрос в разделе комментариев, если вам нужна дополнительная помощь.

Статьи по теме

  • СРЕДНЯЯ СТОИМОСТЬ СТРАХОВАНИЯ ДОМА: лучшие практики и тарифы Великобритании на 2023 год (обновлено)
  • Список компаний на триллион долларов 2019/2020
  • 5 кредитных историй: почему они важны? (+ Подробное руководство для начинающих)
  • YOY: годовой анализ, расчеты роста и инвестиций, формулы и примеры
  • СКОЛЬКО СТОИТ ДОМ В США В 2023 ГОДУ.
  • САМООЦЕНКА: Подробное объяснение и все, что вы должны знать

Рекомендации

  • scribbr
  • Финансовая
  • р-блогеры
  • В самом деле

Добавить комментарий