Как найти среднеквадратическое отклонение по таблице


Загрузить PDF


Загрузить PDF

Вычислив среднеквадратическое отклонение, вы найдете разброс значений в выборке данных.[1]
Но сначала вам придется вычислить некоторые величины: среднее значение и дисперсию выборки. Дисперсия – мера разброса данных вокруг среднего значения.[2]
Среднеквадратическое отклонение равно квадратному корню из дисперсии выборки. Эта статья расскажет вам, как найти среднее значение, дисперсию и среднеквадратическое отклонение.

  1. Изображение с названием Calculate Standard Deviation Step 1

    1

    Возьмите наборе данных. Среднее значение – это важная величина в статистических расчетах.[3]

    • Определите количество чисел в наборе данных.
    • Числа в наборе сильно отличаются друг от друга или они очень близки (отличаются на дробные доли)?
    • Что представляют числа в наборе данных? Тестовые оценки, показания пульса, роста, веса и так далее.
    • Например, набор тестовых оценок: 10, 8, 10, 8, 8, 4.
  2. Изображение с названием Calculate Standard Deviation Step 2

    2

    Для вычисления среднего значения понадобятся все числа данного набора данных.[4]

    • Среднее значение – это усредненное значение всех чисел в наборе данных.
    • Для вычисления среднего значения сложите все числа вашего набора данных и разделите полученное значение на общее количество чисел в наборе (n).
    • В нашем примере (10, 8, 10, 8, 8, 4) n = 6.
  3. Изображение с названием Calculate Standard Deviation Step 3

    3

    Сложите все числа вашего набора данных.[5]

    • В нашем примере даны числа: 10, 8, 10, 8, 8 и 4.
    • 10 + 8 + 10 + 8 + 8 + 4 = 48. Это сумма всех чисел в наборе данных.
    • Сложите числа еще раз, чтобы проверить ответ.
  4. Изображение с названием Calculate Standard Deviation Step 4

    4

    Разделите сумму чисел на количество чисел (n) в выборке. Вы найдете среднее значение.[6]

    • В нашем примере (10, 8, 10, 8, 8 и 4) n = 6.
    • В нашем примере сумма чисел равна 48. Таким образом, разделите 48 на n.
    • 48/6 = 8
    • Среднее значение данной выборки равно 8.

    Реклама

  1. Изображение с названием Calculate Standard Deviation Step 5

    1

    Вычислите дисперсию. Это мера разброса данных вокруг среднего значения.[7]

    • Эта величина даст вам представление о том, как разбросаны данные выборки.
    • Выборка с малой дисперсией включает данные, которые ненамного отличаются от среднего значения.
    • Выборка с высокой дисперсией включает данные, которые сильно отличаются от среднего значения.
    • Дисперсию часто используют для того, чтобы сравнить распределение двух наборов данных.
  2. Изображение с названием Calculate Standard Deviation Step 6

    2

    Вычтите среднее значение из каждого числа в наборе данных. Вы узнаете, насколько каждая величина в наборе данных отличается от среднего значения.[8]

    • В нашем примере (10, 8, 10, 8, 8, 4) среднее значение равно 8.
    • 10 – 8 = 2; 8 – 8 = 0, 10 – 2 = 8, 8 – 8 = 0, 8 – 8 = 0, и 4 – 8 = -4.
    • Проделайте вычитания еще раз, чтобы проверить каждый ответ. Это очень важно, так как полученные значения понадобятся при вычислениях других величин.
  3. Изображение с названием Calculate Standard Deviation Step 7

    3

    Возведите в квадрат каждое значение, полученное вами в предыдущем шаге.[9]

    • При вычитании среднего значения (8) из каждого числа данной выборки (10, 8, 10, 8, 8 и 4) вы получили следующие значения: 2, 0, 2, 0, 0 и -4.
    • Возведите эти значения в квадрат: 22, 02, 22, 02, 02, и (-4)2 = 4, 0, 4, 0, 0, и 16.
    • Проверьте ответы, прежде чем приступить к следующему шагу.
  4. Изображение с названием Calculate Standard Deviation Step 8

    4

    Сложите квадраты значений, то есть найдите сумму квадратов.[10]

    • В нашем примере квадраты значений: 4, 0, 4, 0, 0 и 16.
    • Напомним, что значения получены путем вычитания среднего значения из каждого числа выборки: (10-8)^2 + (8-8)^2 + (10-2)^2 + (8-8)^2 + (8-8)^2 + (4-8)^2
    • 4 + 0 + 4 + 0 + 0 + 16 = 24.
    • Сумма квадратов равна 24.
  5. Изображение с названием Calculate Standard Deviation Step 9

    5

    Разделите сумму квадратов на (n-1). Помните, что n – это количество данных (чисел) в вашей выборке. Таким образом, вы получите дисперсию.[11]

    • В нашем примере (10, 8, 10, 8, 8, 4) n = 6.
    • n-1 = 5.
    • В нашем примере сумма квадратов равна 24.
    • 24/5 = 4,8
    • Дисперсия данной выборки равна 4,8.

    Реклама

  1. Изображение с названием Calculate Standard Deviation Step 10

    1

    Найдите дисперсию, чтобы вычислить среднеквадратическое отклонение.[12]

    • Помните, что дисперсия – это мера разброса данных вокруг среднего значения.
    • Среднеквадратическое отклонение – это аналогичная величина, описывающая характер распределения данных в выборке.
    • В нашем примере дисперсия равна 4,8.
  2. Изображение с названием Calculate Standard Deviation Step 11

    2

    Извлеките квадратный корень из дисперсии, чтобы найти среднеквадратическое отклонение.[13]

    • Как правило, 68% всех данных расположены в пределах одного среднеквадратического отклонения от среднего значения.
    • В нашем примере дисперсия равна 4,8.
    • √4,8 = 2,19. Среднеквадратическое отклонение данной выборки равно 2,19.
    • 5 из 6 чисел (83%) данной выборки (10, 8, 10, 8, 8, 4) находится в пределах одного среднеквадратического отклонения (2,19) от среднего значения (8).
  3. Изображение с названием Calculate Standard Deviation Step 12

    3

    Проверьте правильность вычисления среднего значения, дисперсии и среднеквадратического отклонения. Это позволит вам проверить ваш ответ.[14]

    • Обязательно записывайте вычисления.
    • Если в процессе проверки вычислений вы получили другое значение, проверьте все вычисления с самого начала.
    • Если вы не можете найти, где сделали ошибку, проделайте вычисления с самого начала.

    Реклама

Об этой статье

Эту страницу просматривали 64 482 раза.

Была ли эта статья полезной?

В данной статье я расскажу о том, как найти среднеквадратическое отклонение. Этот материал крайне важен для полноценного понимания математики, поэтому репетитор по математике должен посвятить его изучению отдельный урок или даже несколько. В этой статье вы найдёте ссылку на подробный и понятный видеоурок, в котором рассказано о том, что такое среднеквадратическое отклонение и как его найти.

Среднеквадратическое отклонение дает возможность оценить разброс значений, полученных в результате измерения какого-то параметра. Обозначается символом sigma (греческая буква «сигма»).

Формула для расчета sigma довольно проста. Чтобы найти среднеквадратическое отклонение, нужно взять квадратный корень из дисперсии. Так что теперь вы должны спросить: “А что же такое дисперсия?”

Что такое дисперсия

Определение дисперсии звучит так. Дисперсия — это среднее арифметическое от квадратов отклонений значений от среднего.

Чтобы найти дисперсию последовательно проведите следующие вычисления:

  • Определите среднее (простое среднее арифметическое ряда значений).
  • Затем от каждого из значений отнимите среднее и возведите полученную разность в квадрат (получили квадрат разности).
  • Следующим шагом будет вычисление среднего арифметического полученных квадратов разностей (Почему именно квадратов вы сможете узнать ниже).

Рассмотрим на примере. Допустим, вы с друзьями решили измерить рост ваших собак (в миллиметрах). В результате измерений вы получили следующие данные измерений роста (в холке): 600 мм, 470 мм, 170 мм, 430 мм и 300 мм.

Порода собаки Рост в миллиметрах
Ротвейлер 600
Бульдог 470
Такса 170
Пудель 430
Мопс 300

Вычислим среднее значение, дисперсию и среднеквадратическое отклонение.

Сперва найдём среднее значение. Как вы уже знаете, для этого нужно сложить все измеренные значения и поделить на количество измерений. Ход вычислений:

Среднее  =frac{600+470+170+430+300}{5} = 394 мм.

Итак, среднее (среднеарифметическое) составляет 394 мм.

Теперь нужно определить отклонение роста каждой из собак от среднего:

    [ begin{array}{l} 1: 600-394 = 206 \ 2: 470-394 = 76 \ 3: 170-394 = -224\ 4: 430-394 = 36\ 5: 300-394 = -94 end{array} ]

Наконец, чтобы вычислить дисперсию, каждую из полученных разностей возводим в квадрат, а затем находим среднее арифметическое от полученных результатов:

Дисперсия = frac{206^2+76^2+(-224)^2+36^2+(-94)^2}{5} = 21704 мм2.

Таким образом, дисперсия составляет 21704 мм2.

Как найти среднеквадратическое отклонение

Так как же теперь вычислить среднеквадратическое отклонение, зная дисперсию? Как мы помним, взять из нее квадратный корень. То есть среднеквадратическое отклонение равно:

sigma = sqrt{21704} approx 147 мм (округлено до ближайшего целого значения в мм).

Применив данный метод, мы выяснили, что некоторые собаки (например, ротвейлеры) – очень большие собаки. Но есть и очень маленькие собаки (например, таксы, только говорить им этого не стоит).

Самое интересное, что среднеквадратическое отклонение несет в себе полезную информацию. Теперь мы можем показать, какие из полученных результатов измерения роста находятся в пределах интервала, который мы получим, если отложим от среднего (в обе стороны от него) среднеквадратическое отклонение.

То есть с помощью среднеквадратического отклонения мы получаем “стандартный” метод, который позволяет узнать, какое из значений является нормальным (среднестатистическим), а какое экстраординарно большим или, наоборот, малым.

Что такое стандартное отклонение

Но… все будет немного иначе, если мы будем анализировать выборку данных. В нашем примере мы рассматривали генеральную совокупность. То есть наши 5 собак были единственными в мире собаками, которые нас интересовали.

Но если данные являются выборкой (значениями, которые выбрали из большой генеральной совокупности), тогда вычисления нужно вести иначе.

Если есть N значений, то:

Все остальные расчеты производятся аналогично, в том числе и определение среднего.

Например, если наших пять собак – только выборка из генеральной совокупности собак (всех собак на планете), мы должны делить на 4, а не на 5, а именно:

Дисперсия выборки = frac{108520}{4}=27130 мм2.

При этом стандартное отклонение по выборке равно sqrt{27130} = 165 мм (округлено до ближайшего целого значения).

Можно сказать, что мы произвели некоторую “коррекцию” в случае, когда наши значения являются всего лишь небольшой выборкой.

Примечание. Почему именно квадраты разностей?

Но почему при вычислении дисперсии мы берём именно квадраты разностей? Допустим при измерении какого-то параметра, вы получили следующий набор значений: 4; 4; -4; -4. Если мы просто сложим абсолютные отклонения от среднего (разности) между собой … отрицательные значения взаимно уничтожатся с положительными:

frac{4+4-4-4}{4}=0.

Получается, этот вариант бесполезен. Тогда, может, стоит попробовать абсолютные значения отклонений (то есть модули этих значений)?

frac{4+4+|-4|+|-4|}{4} = frac{4+4+4+4}{4}=4.

На первый взгляд получается неплохо (полученная величина, кстати, называется средним абсолютным отклонением), но не во всех случаях. Попробуем другой пример. Пусть в результате измерения получился следующий набор значений: 7; 1; -6; -2. Тогда среднее абсолютное отклонение равно:

frac{7+1+|-6|+|-2|}{4} = frac{7+1+6+2}{4}=4.

Вот это да! Снова получили результат 4, хотя разности имеют гораздо больший разброс.

А теперь посмотрим, что получится, если возвести разности в квадрат (и взять потом квадратный корень из их суммы).

Для первого примера получится:

sqrt{frac{4^2+4^2+(-4)^2+(-4)^2}{4}}=4.

Для второго примера получится:

sqrt{frac{7^2+1^2+(-6)^2+(-2)^2}{4}}=4.74.

Теперь – совсем другое дело! Среднеквадратическое отклонение получается тем большим, чем больший разброс имеют разности … к чему мы и стремились.

Фактически в данном методе использована та же идея, что и при вычислении расстояния между точками, только примененная иным способом.

И с математической точки зрения использование квадратов и квадратных корней дает больше пользы, чем мы могли бы получить на основании абсолютных значений отклонений, благодаря чему среднеквадратическое отклонение применимо и для других математических задач.

О том, как найти среднеквадратическое отклонение, вам рассказал репетитор по математике в Москве, Сергей Валерьевич

Расчет дисперсии и среднего квадратического отклонения по индивидуальным данным и в рядах распределения.

Основными
обобщающими показателями вариации в
статистике являются дисперсии и среднее
квадратическое отклонение.

Дисперсия
– это средняя арифметическая квадратов
отклонений каждого значения признака
от общей средней. Дисперсия обычно
называется средним квадратом отклонений
и обозначается
.
В зависимости от исходных данных
дисперсия может вычисляться по средней
арифметической простой или взвешенной:

—дисперсия
невзвешенная (простая);

—дисперсия
взвешенная.

Среднее
квадратическое отклонение представляет
собой корень квадратный из дисперсии
и обозначается S:

—среднее
квадратическое отклонение невзвешенное;

—среднее
квадратическое отклонение взвешенное.

Среднее
квадратическое отклонение

– это обобщающая характеристика абсолютных
размеров вариации признака в совокупности.
Выражается оно в тех же единицах
измерения, что и признак (в метрах,
тоннах, процентах, гектарах и т.д.).

Среднее
квадратическое отклонение является
мерилом надежности средней. Чем меньше
среднее квадратическое отклонение, тем
лучше средняя арифметическая отражает
собой всю представляемую совокупность.

Вычислению
среднего квадратического отклонения
предшествует расчет дисперсии.

Порядок
расчета дисперсии взвешенную
:

1)
определяют среднюю арифметическую
взвешенную

;

2)
определяются отклонения вариант от
средней
;

3)
возводят в квадрат отклонение каждой
варианты от средней
;

4)
умножают квадраты отклонений на веса
(частоты)
;

5)
суммируют полученные произведения

;

6)
Полученную сумму делят на сумму весов

.

Пример
3.

Таблица
6.3.

Произведено
продукции одним рабочим, шт.

(
варианта)

Число
рабочих,

8

7

56

-2

4

28

9

10

90

-1

1

10

10

15

150

0

0

0

11

12

132

1

1

12

12

6

72

2

4

24

ИТОГО

50

500

74

Исчислим
среднюю арифметическую взвешенную:

шт.

Значения
отклонений от средней и их квадратов
представлены в таблице 6.3. Определим
дисперсию:

=1,48

Среднее
квадратическое отклонение будет равно:

шт.

Если
исходные данные представлены в виде
интервального ряда распределения, то
сначала надо определить дискретное
значение признака, а далее применить
тот же метод, что изложен выше.

Пример
4.

Покажем
расчет дисперсии для интервального
ряда на данных о распределении посевной
площади колхоза по урожайности пшеницы:

Таблица
6.4

Урожайность
пшеницы, ц/га

Посевная
площадь, га

14
– 16

100

15

1500

-3,4

11,56

1156

16
– 18

300

17

5100

-1,4

1,96

588

18
– 20

400

19

7600

0,6

0,36

144

20
– 22

200

21

4200

2,6

6,76

1352

ИТОГО

1000

18400

3240

Средняя
арифметическая равна:

ц с
1га.

Исчислим
дисперсию:

Расчет дисперсии по формуле по индивидуальным данным и в рядах распределения.

Техника
вычисления дисперсии сложна, а при
больших значениях вариант и частот
может быть громоздкой. Расчеты можно
упростить, используя свойства дисперсии.

Свойства
дисперсии
.

  1. Уменьшение
    или увеличение весов (частот) варьирующего
    признака в определенное число раз
    дисперсии не изменяет.

  2. Уменьшение
    или увеличение каждого значения признака
    на одну и ту же постоянную величину А
    дисперсии не изменяет.

  3. Уменьшение
    или увеличение каждого значения признака
    в какое-то число раз к соответственно
    уменьшает или увеличивает дисперсию
    в

    раз, а среднее квадратическое отклонение
    – в к раз.

  4. Дисперсия
    признака относительно произвольной
    величины всегда больше дисперсии
    относительно средней арифметической
    на квадрат разности между средней и
    произвольной величиной:
    .
    Если А равна нулю, то приходим к
    следующему равенству:
    ,
    т.е. дисперсия признака равна разности
    между средним квадратом значений
    признака и квадратом средней.

Каждое
свойство при расчете дисперсии может
быть применено самостоятельно или в
сочетании с другими.

Порядок
расчета дисперсии простой
:

1)
определяют среднюю арифметическую
;

2)
возводят в квадрат среднюю арифметическую;

3)
возводят в квадрат каждую варианту ряда

;

4)
находим сумму квадратов вариант
;

5)
делят сумму квадратов вариант на их
число, т.е. определяют средний квадрат

;

6)
определяют разность между средним
квадратом признака и квадратом средней

.

Пример
5.

Имеются
следующие данные о производительности
труда рабочих:

Таблица
6.4

Табельный
номер рабочего

Произведено
продукции, шт.

1

8

64

2

9

81

3

10

100

4

11

121

5

12

144

ИТОГО

50

510

Произведем
следующие расчеты:

шт.

Пример
6.

Определить
дисперсию в дискретном ряду распределения,
используя табл. 6.5.

Таблица
6.5.

Произведено
продукции 1 рабочим, шт. (х)

Число
рабочих, n

8

7

56

64

448

9

10

90

81

810

10

15

150

100

1500

11

12

132

121

1452

12

6

72

144

864

ИТОГО

50

500

510

5074

Получим
тот же результат, что в табл. 6.3.

Рассмотрим
расчет дисперсии в интервальном ряду
распределения.

Порядок
расчета дисперсии взвешенной (по формуле

):

  1. определяют
    среднюю арифметическую
    ;

  2. возводят
    в квадрат полученную среднюю
    ;

  3. возводят
    в квадрат каждую варианту ряда
    ;

  4. умножают
    квадраты вариант на частоты
    ;

  5. суммируют
    полученные произведения
    ;

  6. делят
    полученную сумму на сумму весов и
    получают средний квадрат признака
    ;

  7. определяют
    разность между средним значением
    квадратов и квадратом средней
    арифметической, т.е. дисперсию
    .

Пример
7.

Имеются
следующие данные о распределении
посевной площади колхоза по урожайности
пшеницы:

Таблица
6.6

Урожайность
пшеницы, ц/га

Посевная
площадь, га

14
– 16

100

15

1500

225

22500

16
– 18

300

17

5100

289

36700

18
– 20

400

19

7600

361

144400

20
– 22

200

21

4200

441

88200

ИТОГО

1000

18400

341200

В
подобных примерах прежде всего
определяется дискретное значение
признака в каждом интервале, а затем
применяется метод расчета, указанный
выше:

Средняя
величина отражает тенденцию развития,
т.е. действие главных причин. Среднее
квадратическое отклонение измеряет
силу воздействия прочих факторов.

Соседние файлы в папке statistica

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Из предыдущей статьи мы узнали о таких показателях, как размах вариации, межквартильный размах и среднее линейное отклонение. В этой статье изучим дисперсию, среднеквадратичное отклонение и коэффициент вариации.

Дисперсия

Дисперсия случайной величины – это один из основных показателей в статистике. Он отражает меру разброса данных вокруг средней арифметической.

Сейчас небольшой экскурс в теорию вероятностей, которая лежит в основе математической статистики. Как и матожидание, дисперсия является важной характеристикой случайной величины. Если матожидание отражает центр случайной величины, то дисперсия дает характеристику разброса данных вокруг центра.

Формула дисперсии в теории вероятностей имеет вид:

Формула дисперсии в теории вероятностей

То есть дисперсия — это математическое ожидание отклонений от математического ожидания.

На практике при анализе выборок математическое ожидание, как правило, не известно. Поэтому вместо него используют оценку – среднее арифметическое. Расчет дисперсии производят по формуле:

Дисперсия во выборке

где

s2 – выборочная дисперсия, рассчитанная по данным наблюдений,

X – отдельные значения,

– среднее арифметическое по выборке.

Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. Однако при увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной.

Простыми словами дисперсия – это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Теперь вы знаете, как найти дисперсию.

Генеральную и выборочную дисперсии легко рассчитать в Excel. Есть специальные функции: ДИСП.Г и ДИСП.В соответственно.

Функции Excel для расчета дисперсии

В чистом виде дисперсия не используется. Это вспомогательный показатель, который нужен в других расчетах. Например, в проверке статистических гипотез или расчете коэффициентов корреляции. Отсюда неплохо бы знать математические свойства дисперсии.

Свойства дисперсии

Свойство 1. Дисперсия постоянной величины A равна 0 (нулю).

D(A) = 0

Свойство 2. Если случайную величину умножить на постоянную А, то дисперсия этой случайной величины увеличится в А2 раз. Другими словами, постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат.

D(AX) = А2 D(X)

Свойство 3. Если к случайной величине добавить (или отнять) постоянную А, то дисперсия останется неизменной.

D(A + X) = D(X)

Свойство 4. Если случайные величины X и Y независимы, то дисперсия их суммы равна сумме их дисперсий.

D(X+Y) = D(X) + D(Y)

Свойство 5. Если случайные величины X и Y независимы, то дисперсия их разницы также равна сумме дисперсий.

D(X-Y) = D(X) + D(Y)

Среднеквадратичное (стандартное) отклонение

Если из дисперсии извлечь квадратный корень, получится среднеквадратичное (стандартное) отклонение (сокращенно СКО). Встречается название среднее квадратичное отклонение и сигма (от названия греческой буквы). Общая формула стандартного отклонения в математике следующая:

Среднеквадратичное отклонение

На практике формула стандартного отклонения следующая:

Среднеквадратичное отклонение по генеральной совокупности

Как и с дисперсией, есть и немного другой вариант расчета. Но с ростом выборки разница исчезает.

Расчет cреднеквадратичного (стандартного) отклонения в Excel

Для расчета стандартного отклонения достаточно из дисперсии извлечь квадратный корень. Но в Excel есть и готовые функции: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В (по генеральной и выборочной совокупности соответственно).

Среднеквадратичное (стандартное) отклонение в Excel

Среднеквадратичное отклонение имеет те же единицы измерения, что и анализируемый показатель, поэтому является сопоставимым с исходными данными.

Коэффициент вариации

Значение стандартного отклонения зависит от масштаба самих данных, что не позволяет сравнивать вариабельность разных выборках. Чтобы устранить влияние масштаба, необходимо рассчитать коэффициент вариации по формуле:

Формула коэффициента вариации

По нему можно сравнивать однородность явлений даже с разным масштабом данных. В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной. В реальности, если коэффициент вариации превышает 33%, то специально ничего делать по этому поводу не нужно. Это информация для общего представления. В общем коэффициент вариации используют для оценки относительного разброса данных в выборке.

Расчет коэффициента вариации в Excel

Расчет коэффициента вариации в Excel также производится делением стандартного отклонения на среднее арифметическое:

=СТАНДОТКЛОН.В()/СРЗНАЧ()

Коэффициент вариации обычно выражается в процентах, поэтому ячейке с формулой можно присвоить процентный формат:

Процентный формат

Коэффициент осцилляции

Еще один показатель разброса данных на сегодня – коэффициент осцилляции. Это соотношение размаха вариации (разницы между максимальным и минимальным значением) к средней. Готовой формулы Excel нет, поэтому придется скомпоновать три функции: МАКС, МИН, СРЗНАЧ.

Коэффициент осцилляции в Excel

Коэффициент осцилляции показывает степень размаха вариации относительно средней, что также можно использовать для сравнения различных наборов данных.

Таким образом, в статистическом анализе существует система показателей, отражающих разброс или однородность данных. 

Ниже видео о том, как посчитать коэффициент вариации, дисперсию, стандартное (среднеквадратичное) отклонение и другие показатели вариации в Excel.

Поделиться в социальных сетях:

Среднее арифметическое – один из самых популярных статистических методов, который рассчитывается повсеместно. Но сам по себе он абсолютно ненадежный. Многие знают поговорку, что один человек ест капусту, другой – мясо, а в среднем они оба едят голубцы. На примере средней зарплаты очень легко это изобразить. Несколько процентов людей, которые зарабатываются миллионы, не сильно повлияют на статистику, но способны значительно испортить ее объективность, завышая показатель на несколько десятков процентов.

Чем ниже разброс между значениями, тем больше можно доверять этому статистическому показателю. Поэтому настоятельно рекомендуется всегда вместе со средним арифметическим рассчитывать и стандартное отклонение. Сегодня мы разберемся, как правильно это делать средствами Microsoft Excel.

Содержание

  1. Среднеквадратичное отклонение — что это
  2. Расчет среднеквадратичного отклонения в Excel
  3. Метод 1. Ручной ввод формулы
  4. Метод 2. Вкладка «Формулы»
  5. Метод 3. Мастер функций
  6. Заключение

Среднеквадратичное отклонение — что это

Стандартное (или среднеквадратичное) отклонение – это квадратный корень из дисперсии. В свою очередь, под последним термином подразумевается степень разброса значений. Для получения дисперсии, и, как следствие, ее производного в виде стандартного отклонения, существует специальная формула, которая, впрочем, нам не так важна. Она довольно сложная по своей структуре, но при этом ее можно полностью автоматизировать средствами Excel. Главное – знать, какие параметры нужно передавать функции. В целом как для вычисления дисперсии, так и стандартного отклонения, аргументы используются одинаковые.

  1. Сначала мы получаем среднее арифметическое.
  2. После этого каждое исходное значение сопоставляется со средним и определяется разница между ними.
  3. После этого каждая разница возводится во вторую степень, после чего получившиеся результаты складываются между собой.
  4. Наконец, финальный шаг – деление получившегося значения на общее количество элементов в данной выборке.

Получив разницу между одним значением и средним арифметическим всей выборки, мы можем узнать расстояние к нему от определенной точки на координатной прямой. Начинающему человеку вся логика понятна равно до третьего шага. Зачем возводить значение в квадрат? Дело в том, что иногда разница может быть отрицательной, а нам нужно получить положительное число. И, как известно, минус на минус дает плюс. А далее нам нужно определить среднее арифметическое из получившихся значений. Дисперсия имеет несколько свойств:

  1. Если выводить дисперсию из одного числа, то она всегда будет равняться нулю.
  2. Если случайное число умножить на константу А, то дисперсия увеличится в количество раз, равное А в квадрате. Проще говоря, константу можно вынести за знак дисперсии и возвести его во вторую степень.
  3. Если к произвольному числу добавить константу А или же отнять ее, то дисперсия от этого не поменяется.
  4. Если два случайных числа, обозначаемых, к примеру переменными X и Y не зависят друг от друга, то в таком случае для них справедлива формула. D(X+Y) = D(X) + D(Y)
  5. Если же в предыдущую формулу внести изменения и пытаться определить дисперсию разницы этих значений, то она также будет составлять сумму этих дисперсий.

Среднеквадратическое отклонение – это математический термин, являющийся производным от дисперси. Получить его очень просто: достаточно извлечь квадратный корень из дисперсии.

Разница между дисперсией и стандартным отклонением находится сугубо в плоскости единиц измерения, если можно так выразиться. Стандартное отклонение является значительно более простым для считывания показателем, поскольку оно показывается не в квадратах числа, а непосредственно в значениях. Простыми словами, если в числовой последовательности 1,2,3,4,5 средним арифметическим является 3, то соответственно, стандартным отклонением будет число 1,58. Это говорит о том, что в среднем одно число отклоняется от среднего числа (которым является тройка в нашем примере), на 1,58.

Дисперсия же будет тем же самым числом, только возведенным в квадрат. В нашем примере – чуть меньше, чем 2,5. В принципе, можно использовать как дисперсию, так и стандартное отклонение для статистических расчетов, только надо четко знать, с каким именно показателем пользователь работает.

Расчет среднеквадратичного отклонения в Excel

У нас есть два главных варианта формулы. Первый рассчитывается по выборочной совокупности. Второй – по генеральной. Чтобы рассчитать стандартное отклонения по выборочной совокупности, необходимо использовать функцию СТАНДОТКЛОН.В. Если же необходимо осуществить расчет по генеральной совокупности, то надо пользоваться функцией СТАНДОТКЛОН.Г.

Отличие выборочной совокупности от генеральной заключается в том, что в первом случае идет обработка непосредственно тех данных, на основе которых рассчитывается среднее арифметическое и среднеквадратическое отклонение. Если же мы говорим про генеральную совокупность, то это весь набор количественных данных, связанных с исследуемым явлением. В идеале выборка должна быть полностью репрезентативной. То есть, в исследовании должны участвовать люди, которых можно соотнести с генеральной совокупностью в равных пропорциях. Например, если в условной стране 50% мужчин и 50% женщин, то такие же пропорции должны быть у выборки.

Следовательно, стандартное отклонение для генеральной совокупности может несколько отличаться от выборочной, поскольку во втором случае исходные цифры меньше. Но в целом, обе функции работают одинаково. Сейчас мы распишем, что нужно сделать для того, чтобы их вызвать. А сделать это можно сразу тремя способами.

Метод 1. Ручной ввод формулы

Ручной ввод – довольно сложный метод, на первый взгляд. Тем не менее, каждый должен им владеть, если хочет быть профессиональным пользователем Excel. Его преимущество в том, что не нужно вообще вызывать окно ввода аргументов. Если хорошо потренироваться, это будет значительно быстрее, чем пользоваться двумя остальными способами. Главное – чтобы пальцы были тренированные. В идеале каждый пользователь Excel должен владеть слепым методом, чтобы быстро вводить формулы и функции.

  1. Делаем левый клик мышью по той ячейке, в которой будет записываться формула для получения стандартного отклонения. Также можно ее вводить в качестве аргумента любой другой из функций. В таком случае нужно кликнуть по строке ввода формул, а потом начать ввод в том аргументе, куда результат должен выводиться.
  2. Общая формула следующая: =СТАНДОТКЛОН.Г(число1(адрес_ячейки1); число2(адрес_ячейки2);…). Если мы используем второй вариант, то все осуществляется в точности так же, только буква Г в названии функции меняется на В. Максимальное количество поддерживаемых аргументов – 255. Среднеквадратичное отклонение в Excel
  3. После того, как ввод формулы будет закончен, подтверждаем свои действия. Для этого нужно нажать клавишу ввода. Среднеквадратичное отклонение в Excel

Таким образом, для вычисления стандартного отклонения нам нужно использовать те же аргументы, что и для получения среднего арифметического. Все остальное программа сможет сделать самостоятельно. Также в качестве аргумента можно использовать целый диапазон значений, на основе которых будет осуществляться расчет среднеквадратического отклонения. Теперь давайте рассмотрим другие методы, которые будут более понятными для начинающего пользователя Excel. Но в долгосрочной перспективе от них нужно будет отказаться, поскольку:

  1. Ручной ввод формулы способен значительно сэкономить время. Пользователь Excel, который помнит формулу и ее синтаксис, имеет существенное преимущество перед тем человеком, который только начинает и долго ищет нужную функцию в перечне в мастере функций или на ленте. Кроме этого, сам по себе ввод с клавиатуры является гораздо более быстрым, чем использование мыши.
  2. Меньше устают глаза. Не нужно постоянно переключать фокус внимания с таблицы на окно, потом на еще одно окно, потом на клавиатуру, а потом снова на таблицу. Это же помогает существенно сэкономить время и силы, которые потом можно тратить на обработку реальной информации, а не техническое обслуживание формул.
  3. Ручной ввод формул гораздо более гибкий по сравнению с использованием двух следующих методов. Пользователь может сразу указать нужные ячейки диапазона, не выделяя его непосредственно или сразу посмотреть на всю таблицу, избегая риска, что ее перекроет диалоговое окно.
  4. Использование формул вручную является своеобразным мостиком к написанию макросов. Конечно, это не поможет выучить язык VBA, но зато формирует правильные привычки. Если человек привык давать команды компьютеру с помощью клавиатуры, ему будет значительно проще освоить любой другой язык программирования, в том числе, и для разработки макросов для электронных таблиц.

Но конечно, да. Использование других методов значительно лучше, если вы новичок, и только начинаете. Поэтому переходим к рассмотрению иных способов, как можно рассчитать стандартное отклонение.

Метод 2. Вкладка «Формулы»

Еще один метод, доступный пользователю, желающему получить стандартное отклонение из диапазона – воспользоваться вкладкой «Формулы» в главном меню. Давайте более подробно распишем, что нужно сделать для этого:

  1. Выделить ту ячейку, в которую мы хотим записывать результат.
  2. После этого находим на ленте вкладку «Формулы» и переходим в нее. Среднеквадратичное отклонение в Excel
  3. Воспользуемся блоком «Библиотека функций». Там есть кнопка «Другие функции». В перечне, который будет, мы найдем пункт «Статистические». После этого выбираем, какую разновидность формулы мы собираемся использовать. Среднеквадратичное отклонение в Excel
  4. После этого появляется окно ввода аргументов. В нем указываем все числа, ссылки на ячейки или диапазоны, которые будут принимать участие в расчетах. После того, как закончим, нажимаем кнопку «ОК».

Преимущества этого метода:

  1. Скорость. Данный способ довольно быстрый и позволяет ввести нужную формулу буквально в несколько кликов.
  2. Точность. Нет риска случайно написать не ту ячейку или написать не ту букву, а потом тратить время на переделку.

Можно сказать, что это способ номер два по хорошести после ручного ввода. НО третий метод также полезен в некоторых ситуациях.

Метод 3. Мастер функций

Мастер функций – еще один удобный метод ввода формул для новичков, которые еще не запомнили названия и синтаксис функций. Кнопка для запуска мастера функций находится возле строки ввода формул. Его главное преимущество для новичка на фоне предыдущих способов заключается в детальных подсказках программы, какая функция за что отвечает и какие аргументы вводить в какой последовательности. Она являет собой две буквы – fx. Нажимаем на нее. Среднеквадратичное отклонение в Excel

После этого появится перечень функций. Можно как попытаться найти в полном алфавитном перечне, так и открыть категорию «Статистические», где также можно найти этот оператор.

Среднеквадратичное отклонение в Excel

Мы можем увидеть в списке, что функция СТАНДОТКЛОН все еще присутствует. Это сделано для того, чтобы сделать старые файлы совместимыми с новой версией Excel. При этом настоятельно рекомендуется пользоваться новыми функциями, приведенными выше, потому что в один момент эта устаревшая функция может перестать поддерживаться.

После того, как мы нажмем «ОК», у нас будет возможность открыть окно аргументов. Каждый аргумент являет собой отдельное число, адрес на ячейку (если в ней содержится числовое значение) или диапазоны значений, которые будут использоваться для среднего арифметического и получения стандартного отклонения. После того, как мы введем все аргументы, нажимаем на кнопку «ОК». Данные будут занесены в ту ячейку, в которой мы вводили формулу.

Среднеквадратичное отклонение в Excel

Заключение

Таким образом, вычислить стандартное отклонение средствами Excel несложно. Да и сама функция является основой статистических расчетов, которая является интуитивно понятной. Ведь очевидно, что важно не только среднее значение, но и разброс значений, из которых выводится среднее арифметическое. Ведь если половина народа богатая, а половина – бедная, то среднего класса по факту и не будет. Но при этом если вывести среднее арифметическое, то окажется, что среднестатистический гражданин как раз и является представителем среднего класса. Но это звучит, как минимум, странно. В общем, успехов в использовании этой функции.

Оцените качество статьи. Нам важно ваше мнение:

Добавить комментарий