Как найти среднее отклонение от медианы

Расчет среднего абсолютного отклонения

На чтение 6 мин. Просмотров 1.3k. Опубликовано 27.07.2021

Статистические данные позволяют измерить разброс или разброс. Хотя чаще всего используются диапазон и стандартное отклонение, есть и другие способы количественной оценки дисперсии. Мы посмотрим, как рассчитать среднее абсолютное отклонение для набора данных.

Содержание

  1. Определение
  2. Варианты
  3. Пример: Среднее абсолютное отклонение относительно среднего
  4. Пример: Среднее абсолютное отклонение от среднего
  5. Пример: среднее абсолютное отклонение относительно медианы
  6. Пример: Среднее абсолютное отклонение от медианы
  7. Быстрые факты
  8. Распространенное использование

Определение

Начнем с определения среднего абсолютного отклонения, которое также называется средним абсолютным отклонением. Формула, отображаемая в этой статье, является формальным определением среднего абсолютного отклонения. Возможно, имеет смысл рассматривать эту формулу как процесс или серию шагов, которые мы можем использовать для получения нашей статистики.

  1. Мы начинаем со среднего значения или измерения центра набора данных, которое мы обозначим m.
  2. Затем мы находим, насколько каждый из значения данных отклоняются от m. Это означает, что мы берем разницу между каждым из значений данных и m.
  3. После этого мы берем абсолютное значение каждого отличия от предыдущего шага. Другими словами, мы отбрасываем любые отрицательные знаки для любых различий. Причина в том, что есть положительные и отрицательные отклонения от m. Если мы не найдем способ устранить отрицательные знаки, все отклонения нейтрализуют друг друга, если мы сложим их вместе.
  4. Теперь мы сложим все эти абсолютные значений.
  5. Наконец, мы делим эту сумму на n , которое представляет собой общее количество значений данных. Результат – среднее абсолютное отклонение.

Варианты

Существует несколько вариантов описанного выше процесса. Обратите внимание, что мы не указали точно, что такое m . Причина этого в том, что мы можем использовать различные статистические данные для m. Обычно это центр нашего набора данных, поэтому можно использовать любое из измерений центральной тенденции.

Наиболее распространенными статистическими измерениями центра набора данных являются среднее значение, медиана и мода. Таким образом, любой из них может использоваться как m при вычислении среднего абсолютного отклонения. Вот почему принято относиться к среднему абсолютному отклонению относительно среднего или среднему абсолютному отклонению от медианы. Мы увидим несколько примеров этого.

Пример: Среднее абсолютное отклонение относительно среднего

Предположим, что мы начнем со следующего набор данных:

1, 2, 2, 3, 5, 7, 7, 7, 7, 9.

Среднее значение этого набора данных равно 5. Следующая таблица организует нашу работу по вычислению среднего абсолютного отклонения от среднего..

Значение данных Отклонение от среднего Абсолютное значение отклонения
1 1-5 = -4 | -4 | = 4
2 2 – 5 = -3 | -3 | = 3
2 2 – 5 = -3 | -3 | = 3
3 3-5 = -2 | -2 | = 2
5 5 – 5 = 0 | 0 | = 0
7 7 – 5 = 2 | 2 | = 2
7 7 – 5 = 2 | 2 | = 2
7 7 – 5 = 2 | 2 | = 2
7 7 – 5 = 2 | 2 | = 2
9 9 – 5 = 4 | 4 | = 4
Сумма абсолютных отклонений: 24

Теперь разделим эту сумму на 10, поскольку всего имеется десять значений данных. Среднее абсолютное отклонение от среднего составляет 24/10 = 2,4.

Пример: Среднее абсолютное отклонение от среднего

Теперь мы начинаем с другого набора данных:

1, 1, 4, 5, 5, 5, 5, 7, 7, 10.

Как и в предыдущем наборе данных, среднее значение этого набора данных равно 5.

Значение данных Отклонение от среднего Абсолютное значение отклонения
1 1-5 = -4 | -4 | = 4
1 1-5 = -4 | -4 | = 4
4 4-5 = -1 | -1 | = 1
5 5 – 5 = 0 | 0 | = 0
5 5 – 5 = 0 | 0 | = 0
5 5 – 5 = 0 | 0 | = 0
5 5 – 5 = 0 | 0 | = 0
7 7 – 5 = 2 | 2 | = 2
7 7 – 5 = 2 | 2 | = 2
10 10 – 5 = 5 | 5 | = 5
Сумма абсолютных отклонений: 18

Таким образом, среднее абсолютное отклонение от среднего составляет 18/10 = 1,8. Сравним этот результат с первым примером. Хотя среднее значение было одинаковым для каждого из этих примеров, данные в первом примере были более разбросанными. Из этих двух примеров видно, что среднее абсолютное отклонение от первого примера больше, чем среднее абсолютное отклонение от второго примера. Чем больше среднее абсолютное отклонение, тем больше разброс наших данных.

Пример: среднее абсолютное отклонение относительно медианы

Начните с того же набора данных, что и в первом примере:

1, 2, 2, 3, 5, 7, 7, 7, 7, 9.

Медиана набора данных равна 6. В следующей таблице мы показываем детали расчета среднего абсолютного отклонения от медианы.

Значение данных Отклонение от медианы Абсолютное значение отклонения
1 1-6 = -5 | -5 | = 5
2 2-6 = -4 | -4 | = 4
2 2-6 = -4 | -4 | = 4
3 3-6 = -3 | -3 | = 3
5 5-6 = -1 | -1 | = 1
7 7 – 6 = 1 | 1 | = 1
7 7 – 6 = 1 | 1 | = 1
7 7 – 6 = 1 | 1 | = 1
7 7 – 6 = 1 | 1 | = 1
9 9 – 6 = 3 | 3 | = 3
Сумма абсолютных отклонений: 24

Снова делим сумму на 10 и получить среднее среднее отклонение от медианы как 24/10 = 2,4.

Пример: Среднее абсолютное отклонение от медианы

Начните с того же набора данных, что и раньше:

1, 2, 2, 3, 5, 7, 7, 7, 7, 9.

На этот раз мы обнаруживаем, что режим этого набора данных равен 7. В следующей таблице мы показываем детали вычисления среднего абсолютного отклонения для режима.

Данные Отклонение от режима Абсолютное значение отклонения
1 1-7 = -6 | -5 | = 6
2 2-7 = -5 | -5 | = 5
2 2-7 = -5 | -5 | = 5
3 3-7 = -4 | -4 | = 4
5 5-7 = -2 | -2 | = 2
7 7-7 = 0 | 0 | = 0
7 7-7 = 0 | 0 | = 0
7 7-7 = 0 | 0 | = 0
7 7-7 = 0 | 0 | = 0
9 9-7 = 2 | 2 | = 2
Сумма абсолютных отклонений: 22

Делим сумму абсолютных отклонений и видим, что у нас есть среднее абсолютное отклонение о режиме 22/10 = 2.2.

Быстрые факты

Есть несколько основных свойств, касающихся средних абсолютных отклонений

  • Среднее абсолютное отклонение от медианы всегда меньше или равно среднему абсолютному отклонению около значение.
  • Стандартное отклонение больше или равно среднему абсолютному отклонению относительно среднего.
  • Среднее абсолютное отклонение иногда сокращается до MAD. К сожалению, это может быть неоднозначным, поскольку MAD может альтернативно относиться к среднему абсолютному отклонению.
  • Среднее абсолютное отклонение для нормального распределения примерно в 0,8 раза превышает размер стандартного отклонения.

Распространенное использование

Среднее абсолютное отклонение имеет несколько применений. Первое применение состоит в том, что эту статистику можно использовать для обучения некоторым идеям, лежащим в основе стандартного отклонения. Среднее абсолютное отклонение относительно среднего намного легче вычислить, чем стандартное отклонение. Это не требует, чтобы мы возводили отклонения в квадрат, и нам не нужно находить квадратный корень в конце нашего расчета. Кроме того, среднее абсолютное отклонение более интуитивно связано с разбросом набора данных, чем стандартное отклонение. Вот почему иногда сначала изучают среднее абсолютное отклонение, прежде чем вводить стандартное отклонение.

Некоторые зашли так далеко, что утверждают, что стандартное отклонение должно быть заменено средним абсолютным отклонением. Хотя стандартное отклонение важно для научных и математических приложений, оно не так интуитивно понятно, как среднее абсолютное отклонение. Для повседневных приложений среднее абсолютное отклонение – более ощутимый способ измерить разброс данных.

  • Различия между стандартными отклонениями для совокупности и выборки

  • Как рассчитать образец стандарта Отклонение

  • Эмпирическая взаимосвязь между средним, медианным и модой

  • Разница между средним и медианным значением и Режим

  • Что такое диапазон в статистике?

  • Когда стандартное отклонение равно нулю?

  • Разница между описательной и выводимой статистикой

  • Как определяются выбросы в статистике?

  • Как рассчитать стандарт населения Отклонение

  • Что такое первый и третий квартили?

  • Расчет Коэффициент корреляции

  • Пример доверительного интервала для дисперсии совокупности

  • Что такое моменты в статистике?

  • Дисперсия и стандартное отклонение

  • Ярлык формулы суммы квадратов

From Wikipedia, the free encyclopedia

The average absolute deviation (AAD) of a data set is the average of the absolute deviations from a central point. It is a summary statistic of statistical dispersion or variability. In the general form, the central point can be a mean, median, mode, or the result of any other measure of central tendency or any reference value related to the given data set.
AAD includes the mean absolute deviation and the median absolute deviation (both abbreviated as MAD).

Measures of dispersion[edit]

Several measures of statistical dispersion are defined in terms of the absolute deviation.
The term “average absolute deviation” does not uniquely identify a measure of statistical dispersion, as there are several measures that can be used to measure absolute deviations, and there are several measures of central tendency that can be used as well. Thus, to uniquely identify the absolute deviation it is necessary to specify both the measure of deviation and the measure of central tendency. Unfortunately, the statistical literature has not yet adopted a standard notation, as both the mean absolute deviation around the mean and the median absolute deviation around the median have been denoted by their initials “MAD” in the literature, which may lead to confusion, since in general, they may have values considerably different from each other.

Mean absolute deviation around a central point[edit]

For paired differences (also known as mean absolute deviation), see Mean absolute error.

The mean absolute deviation of a set {x1, x2, …, xn} is

{displaystyle {frac {1}{n}}sum _{i=1}^{n}|x_{i}-m(X)|.}

The choice of measure of central tendency, m(X), has a marked effect on the value of the mean deviation. For example, for the data set {2, 2, 3, 4, 14}:

Measure of central tendency m(X) Mean absolute deviation
Arithmetic Mean = 5 frac{|2 - 5| + |2 - 5| + |3 - 5| + |4 - 5| + |14 - 5|}{5} = 3.6
Median = 3 frac{|2 - 3| + |2 - 3| + |3 - 3| + |4 - 3| + |14 - 3|}{5} = 2.8
Mode = 2 frac{|2 - 2| + |2 - 2| + |3 - 2| + |4 - 2| + |14 - 2|}{5} = 3.0

Mean absolute deviation around the mean[edit]

The mean absolute deviation (MAD), also referred to as the “mean deviation” or sometimes “average absolute deviation”, is the mean of the data’s absolute deviations around the data’s mean: the average (absolute) distance from the mean. “Average absolute deviation” can refer to either this usage, or to the general form with respect to a specified central point (see above).

MAD has been proposed to be used in place of standard deviation since it corresponds better to real life.[1] Because the MAD is a simpler measure of variability than the standard deviation, it can be useful in school teaching.[2][3]

This method’s forecast accuracy is very closely related to the mean squared error (MSE) method which is just the average squared error of the forecasts. Although these methods are very closely related, MAD is more commonly used because it is both easier to compute (avoiding the need for squaring)[4] and easier to understand.[5]

For the normal distribution, the ratio of mean absolute deviation from the mean to standard deviation is {textstyle {sqrt {2/pi }}=0.79788456ldots }. Thus if X is a normally distributed random variable with expected value 0 then, see Geary (1935):[6]

{displaystyle w={frac {E|X|}{sqrt {E(X^{2})}}}={sqrt {frac {2}{pi }}}.}

In other words, for a normal distribution, mean absolute deviation is about 0.8 times the standard deviation.
However, in-sample measurements deliver values of the ratio of mean average deviation / standard deviation for a given Gaussian sample n with the following bounds:  w_n in [0,1] , with a bias for small n.[7]

The mean absolute deviation from the mean is less than or equal to the standard deviation; one way of proving this relies on Jensen’s inequality.

Mean absolute deviation around the median[edit]

The median is the point about which the mean deviation is minimized. The MAD median offers a direct measure of the scale of a random variable around its median

{displaystyle D_{text{med}}=E|X-{text{median}}|}

This is the maximum likelihood estimator of the scale parameter b of the Laplace distribution.

Since the median minimizes the average absolute distance, we have {displaystyle D_{text{med}}leq D_{text{mean}}}.
The mean absolute deviation from the median is less than or equal to the mean absolute deviation from the mean. In fact, the mean absolute deviation from the median is always less than or equal to the mean absolute deviation from any other fixed number.

By using the general dispersion function, Habib (2011) defined MAD about median as

{displaystyle D_{text{med}}=E|X-{text{median}}|=2operatorname {Cov} (X,I_{O})}

where the indicator function is

{displaystyle mathbf {I} _{O}:={begin{cases}1&{text{if }}x>{text{median}},\0&{text{otherwise}}.end{cases}}}

This representation allows for obtaining MAD median correlation coefficients.[citation needed]

Median absolute deviation around a central point[edit]

While in principle the mean or any other central point could be taken as the central point for the median absolute deviation, most often the median value is taken instead.

Median absolute deviation around the median[edit]

The median absolute deviation (also MAD) is the median of the absolute deviation from the median. It is a robust estimator of dispersion.

For the example {2, 2, 3, 4, 14}: 3 is the median, so the absolute deviations from the median are {1, 1, 0, 1, 11} (reordered as {0, 1, 1, 1, 11}) with a median of 1, in this case unaffected by the value of the outlier 14, so the median absolute deviation is 1.

For a symmetric distribution, the median absolute deviation is equal to half the interquartile range.

Maximum absolute deviation[edit]

The maximum absolute deviation around an arbitrary point is the maximum of the absolute deviations of a sample from that point. While not strictly a measure of central tendency, the maximum absolute deviation can be found using the formula for the average absolute deviation as above with m(X)=max(X), where max(X) is the sample maximum.

Minimization[edit]

The measures of statistical dispersion derived from absolute deviation characterize various measures of central tendency as minimizing dispersion:
The median is the measure of central tendency most associated with the absolute deviation. Some location parameters can be compared as follows:

  • L2 norm statistics: the mean minimizes the mean squared error
  • L1 norm statistics: the median minimizes average absolute deviation,
  • L norm statistics: the mid-range minimizes the maximum absolute deviation
  • trimmed L norm statistics: for example, the midhinge (average of first and third quartiles) which minimizes the median absolute deviation of the whole distribution, also minimizes the maximum absolute deviation of the distribution after the top and bottom 25% have been trimmed off.

Estimation[edit]

[icon]

This section needs expansion. You can help by adding to it. (March 2009)

Graph 01.jpg

The mean absolute deviation of a sample is a biased estimator of the mean absolute deviation of the population.
In order for the absolute deviation to be an unbiased estimator, the expected value (average) of all the sample absolute deviations must equal the population absolute deviation. However, it does not. For the population 1,2,3 both the population absolute deviation about the median and the population absolute deviation about the mean are 2/3. The average of all the sample absolute deviations about the mean of size 3 that can be drawn from the population is 44/81, while the average of all the sample absolute deviations about the median is 4/9. Therefore, the absolute deviation is a biased estimator.

However, this argument is based on the notion of mean-unbiasedness. Each measure of location has its own form of unbiasedness (see entry on biased estimator). The relevant form of unbiasedness here is median unbiasedness.

Graph 02.jpg

See also[edit]

Chart 01.jpg

  • Deviation (statistics)
    • Median absolute deviation
    • Squared deviations
    • Least absolute deviations
  • Errors
    • Mean absolute error
    • Mean absolute percentage error
    • Probable error
  • Mean absolute difference
  • Average rectified value

References[edit]

  1. ^ Taleb, Nassim Nicholas (2014). “What scientific idea is ready for retirement?”. Edge. Archived from the original on 2014-01-16. Retrieved 2014-01-16.{{cite web}}: CS1 maint: bot: original URL status unknown (link)
  2. ^ Kader, Gary (March 1999). “Means and MADS”. Mathematics Teaching in the Middle School. 4 (6): 398–403. Archived from the original on 2013-05-18. Retrieved 20 February 2013.
  3. ^ Franklin, Christine, Gary Kader, Denise Mewborn, Jerry Moreno, Roxy Peck, Mike Perry, and Richard Scheaffer (2007). Guidelines for Assessment and Instruction in Statistics Education (PDF). American Statistical Association. ISBN 978-0-9791747-1-1. Archived (PDF) from the original on 2013-03-07. Retrieved 2013-02-20.
  4. ^ Nahmias, Steven; Olsen, Tava Lennon (2015), Production and Operations Analysis (7th ed.), Waveland Press, p. 62, ISBN 9781478628248, MAD is often the preferred method of measuring the forecast error because it does not require squaring.
  5. ^ Stadtler, Hartmut; Kilger, Christoph; Meyr, Herbert, eds. (2014), Supply Chain Management and Advanced Planning: Concepts, Models, Software, and Case Studies, Springer Texts in Business and Economics (5th ed.), Springer, p. 143, ISBN 9783642553097, the meaning of the MAD is easier to interpret.
  6. ^ Geary, R. C. (1935). The ratio of the mean deviation to the standard deviation as a test of normality. Biometrika, 27(3/4), 310–332.
  7. ^ See also Geary’s 1936 and 1946 papers: Geary, R. C. (1936). Moments of the ratio of the mean deviation to the standard deviation for normal samples. Biometrika, 28(3/4), 295–307 and Geary, R. C. (1947). Testing for normality. Biometrika, 34(3/4), 209–242.

External links[edit]

  • Advantages of the mean absolute deviation

Вычисление среднего отклонения может быть эффективным способом анализа изменчивости в наборе данных. Независимо от точного характера собранных данных, знание их среднего отклонения может помочь вам в их интерпретации. Знание того, как рассчитать среднее отклонение – ценный навык, но он требует изучения и практики. В этой статье мы обсудим, что такое среднее отклонение, как его рассчитать, а также различия между абсолютным и средним отклонением, средним средним и средним отклонением от среднего и стандартным отклонением в сравнении со средним отклонением.

Что такое среднее отклонение?

Среднее отклонение набора данных – это среднее значение всех отклонений от заданной центральной точки. Это статистический инструмент для измерения расстояния от среднего значения или медианы, где среднее значение – это среднее значение всех чисел в наборе данных, а медиана – это точное среднее число, когда мы упорядочиваем набор данных от самого низкого до самого высокого числа. Среднее отклонение набора данных также называется средним абсолютным отклонением (MAD) или средним абсолютным отклонением.

Хотя при работе с относительно небольшими наборами данных вы можете рассчитать среднее отклонение вручную, для больших наборов данных обычно требуется специальное программное обеспечение, которое выполняет расчеты за вас после ввода исходных данных.

Как рассчитать среднее отклонение

Рассмотрим эти шаги при расчете среднего отклонения набора данных:

1. Рассчитать среднюю медиану

Первый шаг – вычисление среднего значения. Вы можете сделать это, сложив все значения в наборе данных и разделив полученную сумму на общее количество значений.

Также можно вычислить медиану, если вы хотите использовать ее вместо среднего значения. Расположите все числа в числовом порядке и подсчитайте, сколько их всего. Затем, если общее число нечетное, разделите его на два и округлите, чтобы найти положение медианы. Если общее число четное, разделите его на два и сделайте среднее между числом в этой позиции и числом в следующей более высокой позиции.

2. Рассчитайте отклонение от среднего значения

После расчета среднего значения можно рассчитать отклонение от среднего для каждого значения в наборе данных. Вычислите разницу между ранее рассчитанным средним и каждым значением в наборе данных и запишите абсолютное значение получившихся чисел. Абсолютное значение числа – это его модуль или неотрицательное значение. Поскольку направление каждого отклонения не имеет значения при расчете среднего отклонения, все результирующие числа положительны.

3. Вычислите сумму всех отклонений

После вычисления отклонения от среднего значения для каждого значения в наборе данных необходимо сложить их вместе. Поскольку это операция с абсолютным значением, каждое значение должно быть положительным числом.

4. Вычислить среднее отклонение

Наконец, рассчитайте среднее отклонение вашего набора данных, разделив ранее рассчитанную сумму всех отклонений на общее количество отклонений, которые вы сложили вместе. Полученное число – это среднее отклонение от среднего.

Пример

Рассмотрите этот пример при расчете среднего отклонения от среднего значения.

Баскетболист сыграл 5 игр в этом сезоне. Числа очков в каждой игре: 23, 30, 31, 15 и 46.

Первый шаг – вычисление среднего значения. Вы делаете это, складывая очки и деля результат на пять игр.

23+30+31+15+46=145

1455=29

Теперь, когда вы определили, что игрок набирал в среднем 29 очков за игру, вам нужно рассчитать отклонение от среднего значения для каждой игры.

23-29=6

30-29=1

31-29=2

15-29=14

46-29=17

Далее необходимо вычислить сумму всех вариаций.

6+1+2+14+17=40

Среднее отклонение – это сумма всех отклонений, деленная на общее количество записей.

Среднее отклонение=405=8

Среднее отклонение от среднего значения по очкам, набранным в первых пяти играх сезона, составляет 8.

Абсолютное отклонение vs. среднее отклонение

Вычисление абсолютного отклонения является важным шагом для определения среднего отклонения. Абсолютное отклонение – это разница между средним значением набора данных и каждым значением в соответствующем наборе данных. Название абсолютного отклонения происходит от того, что все полученные числа записываются как абсолютные числа. Мера выражает расстояние между средним и каждым значением, поэтому отрицательное или положительное число не имеет значения.

После расчета абсолютного отклонения для каждого значения в наборе данных можно рассчитать среднее отклонение, сложив их все вместе и разделив на общее количество значений в наборе данных.

Среднее значение против. среднее отклонение от среднего

Вычисление среднего значения также является важным шагом для определения среднего отклонения от среднего значения. Среднее среднее – это просто сумма всех значений, включенных в набор данных, деленная на общее количество значений. Вычисление среднего значения помогает определить отклонение от среднего путем вычисления разницы между средним и каждым значением. Далее разделите сумму всех ранее рассчитанных значений на количество отклонений, сложенных вместе, и в результате получите среднее отклонение от среднего.

Стандартное отклонение против. среднее отклонение

Стандартное отклонение также является мерой изменчивости в наборе данных, так как оно показывает размер отклонения между всеми значениями в наборе данных. Основное различие между ними заключается в том, что значения, полученные в результате вычитания среднего из значения каждой точки данных, записываются как абсолютные только при вычислении среднего отклонения. Чтобы рассчитать стандартное отклонение, полученные значения записываются не в абсолютных величинах, а в квадрате. Затем необходимо вычислить среднее арифметическое всех квадратных значений. Квадратный корень из этого среднего значения является стандартным средним значением.

Стандартное отклонение чаще всего используется для измерения изменчивости, являясь очень популярным инструментом для расчета волатильности финансовых инструментов и потенциальной инвестиционной доходности. Более высокая волатильность обычно означает, что существует повышенный риск того, что инвестиции принесут убытки. Это означает, что инвестор, который берет на себя риск высоковолатильной ценной бумаги, обычно ожидает от нее высокой доходности. Среднее отклонение также используется в качестве финансового инструмента, но, как правило, реже, чем стандартное отклонение.

Среднее абсолютное отклонение от медианы является надежной мерой дисперсии в описательной статистики и указывает на то, как далеко образец «в среднем» отклоняется от медианы . В зависимости от определения рассчитывается либо среднее арифметическое, либо медиана абсолютных отклонений.

определение

Дан образец

{ displaystyle x = (x_ {1}, x_ {2},  dots, x_ {n})}

с элементами. Пусть это будет медиана выборки.
п{ tilde x}

Среднее абсолютное отклонение теперь определяется как среднее арифметическое абсолютных отклонений (англ. Mean absolute deviation , для краткости MAD):

{ displaystyle { tilde {d}} _ {0 {,} 5} = { frac {1} {n}}  sum _ {i = 1} ^ {n} | x_ {i} - { tilde {x}} |}

Или как медиана абсолютных отклонений (также: среднее отклонение , среднее абсолютное отклонение в английском языке , для краткости MAD или MedAD):

{ displaystyle { tilde {d}} _ {med} = { text {median}} (| x_ {i} - { tilde {x}} |)}

пример

Образец дан

{ Displaystyle х = (10; 9; 13; 15; 16)},

так оно и есть . В качестве отсортированного образца вы получите
{ displaystyle n = 5}

{ displaystyle x _ { text {sort}} = (9,10,13,15,16)},

таким образом, медиана

{ displaystyle { tilde {x}} = 13}.

Из этого следует

{ displaystyle { begin {align} { tilde {d}} _ {0 {,} 5} & = { frac {1} {5}}  left (| 10-13 | + | 9-13 | + | 13-13 | + | 15-13 | + | 16-13 |  right) \ & = { frac {1} {5}}  left (| -3 | + | -4 | +0+ | 2 | + | 3 |  right) \ & = { frac {1} {5}} (3 + 4 + 2 + 3) \ & = { frac {12} {5}} = 2 { ,} 4  end {выровнено}}}
{ displaystyle { begin {align} { tilde {d}} _ { text {med}} & = { text {median}}  left (| 10-13 |, | 9-13 |, | 13 -13 |, | 15-13 |, | 16-13 |  справа) \ & = { text {median}}  left (3,4,0,2,3  right) \ & = { текст {median}}  left (0,2,3,3,4  right) \ & = 3  end {align}}}

В частности, два значения среднего абсолютного отклонения от медианы почти всегда отличаются от среднего абсолютного отклонения от среднего арифметического . Это дает значение
для того же образца

{ displaystyle d _ { overline {x}} = 2 {,} 48}.

свойства

Глядя на среднее абсолютное отклонение от любого значения , то есть
м

{ displaystyle A (m) = { frac {1} {n}}  sum _ {i = 1} ^ {n} | x_ {i} -m |},

так минимально тогда и только тогда, когда есть медиана. Аналогичный результат также относится к среднеквадратичного отклонения от значения : оно становится минимальным , когда именно среднее арифметическое есть. В этом смысле среднее абсолютное отклонение является естественным разбросом вокруг медианы, так же как среднеквадратичное отклонение является естественным разбросом вокруг среднего арифметического.
В)ммм

Среднее абсолютное отклонение является надежной мерой дисперсии, поэтому оно значительно менее чувствительно к выбросам, чем , например, стандартное отклонение . Это связано с использованием надежной медианы. Это особенно актуально, когда необходимо найти правило удаления выбросов из набора данных: обычная процедура удаления всех значений, которые составляют более трех стандартных отклонений от среднего арифметического, проблематична, поскольку стандартное отклонение и среднее могут даже быть искаженным выбросами. Гораздо менее чувствительным методом было бы удаление всех значений, которые отклоняются от медианы более чем в k раз, чем MedAD, где k – коэффициент, который зависит от распределения вероятностей.

Индивидуальные доказательства

  1. Хельге Тутенбург, Кристиан Хойманн: Описательная статистика . 6-е издание. Springer-Verlag, Берлин / Гейдельберг 2008, ISBN 978-3-540-77787-8 , стр. 74 , DOI : 10.1007 / 978-3-540-77788-5 .
  2. ^ Томас Клефф: описательная статистика и исследовательский анализ данных . Компьютерное введение в Excel, SPSS и STATA. 3-е, переработанное и дополненное издание. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5 , DOI : 10.1007 / 978-3-8349-4748-2 .
  3. Норберт Хенце: Стохастик для начинающих . Знакомство с увлекательным миром случайностей. 10-е издание. Springer Spectrum, Висбаден 2013, ISBN 978-3-658-03076-6 , стр. 32 , DOI : 10.1007 / 978-3-658-03077-3 .
  4. Эрхард Берендс: Элементарный стохастик . Учебное пособие – совместно разработанное студентами. Springer Spectrum, Висбаден 2013, ISBN 978-3-8348-1939-0 , стр. 275 , DOI : 10.1007 / 978-3-8348-2331-1 .
  5. Leys, C., et al: Обнаружение выбросов: не используйте стандартное отклонение вокруг среднего, используйте абсолютное отклонение вокруг медианы . В: Журнал экспериментальной социальной психологии . лента 49 , нет. 4 , 2013, с. 764-766 , DOI : 10.1016 / j.jesp.2013.03.013 (английский, ulb.ac.be [PDF]).

Среднее
линейное отклонение рассчитывается
из отклонений в первой степени, дисперсия
и среднее квадратическое – из отклонений
во второй степени. Так как алгебраическая
сумма отклонений индивидуальных
значений признака от средней арифметической
(согласно нулевому свойству) всегда
равна нулю, то для расчета среднего
линейного отклонения используется
арифметическая сумма отклонений, т.е.
суммируются абсолютные значения
индивидуальных отклонений значений
признака независимо от знака.

Среднее
линейное отклонение
вычисляется
по следующим формулам:

для
несгруппированных данных

для
сгруппированных данных (вариационного
ряда)

28.Дисперсия и стандартное отклонение как мера вариации значений признака, свойство минимальности относительно средней арифметической.

Средним
линейном отклонением
вариационного
ряда называются средняя арифметическая
абсолютных величин отклонении вариантов
от их средней арифметической
.

Дисперсией
s2
вариационного
ряда
называется
средняя арифметическая квадратов
отклонений вариантов от их средней
арифметической:
.Основные
св-ва дисперсии:1)
дисперсия
постоянной равна нулю.
2)
если все
варианты увеличить(уменьшить) в одно
и то же число k
раз,то дисперсия увеличится(уменьшится)
в k2
раз:
3)
если все
варианты увелич(уменьшить) на одно и
то же число,то дисперсия не изменится:

4) дисперсия
равна разности между средней арифметической
квадратов вариантов и квадратом средней
арифметической:
5)если
ряд состоит из нескольких групп
инаблюдений,то общая дисперсия равна
сумме средней арифметической группировок
дисперсий и межгрупповой дисперсии:
,где
-общая
дисперсия(дисперсии всего ряда),
-средняя
арифметическая групповых дисперсий,
-межгрупповая
дисперсия

29.Точечные оценки параметров генеральной совокупности, критерии их качества.

Точечное
оценивание предполагает получение
приблизительного значения параметра
в виде одного числа. Например, средний
доход респондентов из выборки
рассматривается в качестве оценки
среднего дохода лиц, составляющих
генеральную совокупность. Основными
методами точечного оценивания являются
метод моментов, метод максимального
правдоподобия, метод оценивания по
минимуму χ², метод наименьших квадратов.
Например, если для переменной “время,
затрачиваемое на дорогу от дома до
работы” среднее арифметическое по
выборке составило 40 минут, то точечная
оценка методом моментов будет заключаться
в утверждении, что по генеральной
совокупности среднее время на дорогу
также составляет приблизительно 40
минут.Поскольку точечные оценки заведомо
не являются точными, их желательными
качествами являются несмещенность,
эффективность, состоятельность,
робастность.Несмещенность предполагает
отсутствие систематического смещения
значения выборочной статистики по
отношению к истинному значению параметра
генеральной совокупности, которое
могло бы привести к завышению или
занижению оценки этого параметра.Понятие
эффективности связано с тем, что иногда
для параметра можно найти несколько
несмещенных оценок. Лучшей из них
представляется та, которая при
использовании разных выборок дала бы
наименьший разброс значений или, другими
словами, обладала бы наименьшей
дисперсией : чем меньше дисперсия, тем
выше эффективность оценки. Эффективной
называется несмещенная оценка с
минимальной дисперсией.Состоятельной
называется оценка, значение которой с
увеличением объема выборки приближается
к истинному значению параметра
генеральной совокупности.Робастность
оценки означает ее устойчивость к
наличию резко выделяющихся значений
(“выбросов”) или к нарушению
предположений, ограничивающих применение
соответствующего статистического
метода.Исследованиями несмещенности,
эффективности, состоятельности,
робастности и других свойств статистических
оценок занимается математическая
статистика.

Во
многих случаях мы располагаем информацией
о виде закона
распределения случайной
величины (нормальный, бернуллиевский,
равномерный
и т. п.), но не знаем параметров этого
распределения, таких
как
,
.
Для определения этих параметров
применяется выборочный
метод.
Пусть
выборка объема n представлена в виде
вариационного ряда.
Назовем выборочной
средней величину

Величина
называется
относительной частотой значения
признака
xi. Если значения признака,
полученные из выборки не группировать
и не
представлять в виде вариационного
ряда, то для вычисления выборочной
средней
нужно пользоваться формулой

.

Естественно
считать величину x выборочной оценкой
параметра
.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Добавить комментарий