Как найти среднее значение за год

Средняя зарплата… Средняя продолжительность жизни… Практически каждый день мы с вами слышим эти словосочетания, используемые для описания множества одним единственным числом. Но как ни странно, «среднее значение» — достаточно коварное понятие, часто вводящее в заблуждение обычного, неискушенного в математической статистике, человека.

В чем проблема?

Под средним значением чаще всего подразумевается среднее арифметическое, которое очень сильно варьируется под воздействием единичных фактов или событий. И вы не получите реального представления о том, как именно распределены значения, которые вы изучаете.

Давайте обратимся к классическому примеру со средней зарплатой.

В какой-то абстрактной компании работает десять сотрудников. Девять из них получают зарплату около 50 000 рублей, а один 1 500 000 рублей (по странному совпадению он же является генеральным директором этой компании).

Выборка зарплат

Средним значением в данном случае будет 195 150 рублей, что согласитесь, неправильно.

Какие способы вычисления среднего бывают?

Первым способом является вычисление уже упомянутого среднего арифметического, являющегося суммой всех значений, деленной на их количество.

Формула:

  • x – среднее арифметическое;
  • x– конкретное значение;
  • n – количество значений.

Плюсы:

  • Хорошо работает при нормальном распределении значений в выборке;
  • Легко вычислить;
  • Интуитивно понятно.

Минусы:

  • Не дает реального представления о распределении значений;
  • Неустойчивая величина легко поддающаяся выбросам (как в случае с генеральным директором).

Вторым способом является вычисление моды, то есть наиболее часто встречающегося значения.

Формула:

  • M– мода;
  • x– нижняя граница интервала, который содержит моду;
  • n – величина интервала;
  • fm– частота (сколько раз в ряду встречается то или иное значение);
  • fm-1 – частота интервала предшествующего модальному;
  • fm+1 – частота интервала следующего за модальным.

Плюсы:

  • Прекрасно подходит для получения представления об общественном мнении;
  • Хорошо подходит для нечисловых данных (цвета сезона, хиты продаж, рейтинги);
  • Проста для понимания.

Минусы:

  • Моды может просто не быть (нет повторов);
  • Мод может быть несколько (многомодальное распределение).

Третий способ — это вычисление медианы, то есть значения, которое делит упорядоченную выборку на две половины и находится между ними. А если такого значения нет, то за медиану принимается среднее арифметическое между границами половин выборки.

Формула:

Медиана формула

  • Me – медиана;
  • x– нижняя граница интервала, который содержит медиану;
  • h – величина интервала;
  • f – частота (сколько раз в ряду встречается то или иное значение);
  • Sm-1 – сумма частот интервалов предшествующих медианному;
  • fm – число значений в медианном интервале (его частота).

Плюсы:

  • Дает самую реалистичную и репрезентативную оценку;
  • Устойчива к выбросам.

Минусы:

  • Сложнее вычислить, так как перед вычислением выборку нужно упорядочить.

Мы рассмотрели основные методы нахождения среднего значения, называющиеся мерами центральной тенденции (на самом деле их больше, но это наиболее популярные).

А теперь давайте вернемся к нашему примеру и посчитаем все три варианта среднего при помощи специальных функций Excel:

  • СРЗНАЧ(число1;[число2];…) — функция для определения среднего арифметического;
  • МОДА.ОДН(число1;[число2];...) — функция моды (в более старых версиях Excel использовалась МОДА(число1;[число2];...));
  • МЕДИАНА(число1;[число2];...) — функция для поиска медианы.

И вот какие значения у нас получились:

Расчет среднего арифметического, моды и медианы

В данном случае мода и медиана гораздо лучше характеризуют среднюю зарплату в компании.

Но что делать, когда в выборке не 10 значений, как в примере, а миллионы? В Excel это не посчитать, а вот в базе данных где хранятся ваши данные, без проблем.

Вычисляем среднее арифметическое на SQL

Тут все достаточно просто, так как в SQL предусмотрена специальная агрегатная функция AVG.

И чтобы ее использовать достаточно написать вот такой запрос:

/* Здесь и далее salary - столбец с зарплатами, а employees - таблица сотрудников в нашей базе данных */

SELECT AVG(salary) AS 'Средняя зарплата'
FROM employees

Вычисляем моду на SQL

В SQL нет отдельной функции для нахождения моды, но ее легко и быстро можно написать самостоятельно. Для этого нам необходимо узнать, какая из зарплат чаще всего повторяется и выбрать наиболее популярную.

Напишем запрос:

/* WITH TIES необходимо добавлять к TOP() если множество многомодально, то есть у множества несколько мод */
SELECT TOP(1) WITH TIES salary AS 'Мода зарплаты'
FROM employees
GROUP BY salary
ORDER BY COUNT(*) DESC

Вычисляем медиану на SQL

Как и в случае с модой, в SQL нет встроенной функции для вычисления медианы, зато есть универсальная функция для вычисления процентилей PERCENTILE_CONT.

Выглядит все это так:

/* В данном случае процентиль 0.5 и будет являться медианой */

SELECT TOP(1) PERCENTILE_CONT(0.5)
       WITHIN GROUP (ORDER BY salary)
       OVER() AS 'Медианная зарплата'
FROM employees

Подробнее о работе функции PERCENTILE_CONT лучше почитать в справке Microsoft и Google BigQuery.

Какой способ все-таки использовать?

Из сказанного выше следует, что медиана лучший способ для вычисления среднего значения.

Но это не всегда так. Если вы работаете со средним, то остерегайтесь многомодального распределения:

Бимодальное распределение

На графике представлено бимодальное распределение с двумя пиками. Такая ситуация может возникнуть, например, при голосовании на выборах.

В данном случае среднее арифметическое и медиана — это значения, находящиеся где-то посередине и они ничего не скажут о том, что происходит на самом деле и лучше сразу признать, что вы имеете дело с бимодальным распределением, сообщив о двух модах.

А еще лучше разделить выборку на две группы и собрать статистические данные для каждой.

Вывод:

При выборе метода нахождения среднего нужно учитывать наличие выбросов, а также нормальность распределения значений в выборке.

Окончательный выбор меры центральной тенденции всегда лежит на аналитике.

Полезные ссылки:

  • SQL и теория вероятностей (YouTube)
  • Анализ нормальности распределения данных (YouTube)
  • Меры центральной тенденции
  • Об авторе
  • Свежие записи

Среднее арифметическое — статистический показатель, который демонстрирует среднее значение заданного массива данных. Такой показатель рассчитывается как дробь, в числителе которой стоит сумма всех значений массива, а в знаменателе — их количество. Среднее арифметическое — важный коэффициент, который находит применение в бытовых расчетах.

Смысл коэффициента

Среднее арифметическое — элементарный показатель для сравнения данных и подсчета приемлемого значения. К примеру, в разных магазинах продается банка пива конкретного производителя. Но в одном магазине она стоит 67 рублей, в другом — 70 рублей, в третьем — 65 рублей, а в последнем — 62 рубля. Довольно большой разбег цен, поэтому покупателю будет интересна средняя стоимость банки, чтобы при покупке товара он мог сравнить свои расходы. В среднем банка пива по городу имеет цену:

Средняя цена = (67 + 70 + 65 + 62) / 4 = 66 рублей.

Зная среднюю цену, легко определить где выгодно покупать товар, а где придется переплатить.

Среднее арифметические постоянно используется в статистических расчетах в случаях, если анализируется однородный набор данных. В примере выше — это цена банки пива одной марки. Однако мы не можем сравнить цену на пиво разных производителей или цены на пиво и лимонад, так как в этом случае разброс значений будет больше, средняя цена будет смазана и недостоверна, а сам смысл расчетов исказится до карикатурного «средняя температура по больнице». Для расчета разнородных массивов данных используется среднее арифметическое взвешенное, когда каждое значение получает свой весовой коэффициент.

Подсчет среднего арифметического

Формула для вычислений предельно проста:

P = (a1 + a2 + … an) / n,

где an – значение величины, n – общее количество значений.

Для чего может использоваться данный показатель? Первое и очевидное его применение — это статистика. Практически в каждом статистическом исследовании используется показатель среднего арифметического. Это может быть средний возраст вступления в брак в России, средняя оценка по предмету у школьника или средние траты на продукты в день. Как уже говорилось выше, без учета весов подсчет средних значений может давать странные или абсурдные значения.

К примеру, президент Российской Федерации сделал заявление, что по статистике, средняя зарплата россиянина составляет 27 000 рублей. Для большинства жителей России такой уровень зарплаты показался абсурдным. Не мудрено, если при расчете учитывать размер доходов олигархов, руководителей промышленных предприятий, крупных банкиров с одной стороны и зарплаты учителей, уборщиков и продавцов с другой. Даже средние зарплаты по одной специальности, например, бухгалтера, будут иметь серьезные отличия в Москве, Костроме и Екатеринбурге.

Как считать средние для разнородных данных

В ситуациях с подсчетом заработной платы важно учитывать вес каждого значения. Это означает, что зарплаты олигархов и банкиров получили бы вес, например, 0,00001, а зарплаты продавцов — 0,12. Это цифры с потолка, но они приблизительно иллюстрируют распространенность олигархов и продавцов в российском обществе.

Таким образом, для подсчета среднего средних или среднего значения в разнородном массиве данных, требуется использовать среднее арифметическое взвешенное. Иначе вы получите среднюю зарплату по России на уровне 27 000 рублей. Если же вы хотите узнать свою среднюю оценку по математике или среднее количество забитых шайб выбранного хоккеиста, то вам подойдет калькулятор среднего арифметического.

Наша программа представляет собой простой и удобный калькулятор для расчета среднего арифметического. Для выполнения расчетов вам понадобится ввести только значения параметров.

Рассмотрим пару примеров

Расчет средней оценки

Многие учителя используют метод среднего арифметического для определения годовой оценки по предмету. Давайте представим, что ребенок получил следующие четвертные отметки по математике: 3, 3, 5, 4. Какую годовую оценку ему поставит учитель? Воспользуемся калькулятором и посчитаем среднее арифметическое. Для начала выберете соответствующее количество полей и введите значения оценок в появившиеся ячейки:

(3 + 3 + 5 + 4) / 4 = 3,75

Учитель округлит значение в пользу ученика, и школьник получит за год твердую четверку.

Расчет съеденных конфет

Давайте проиллюстрируем некоторую абсурдность среднего арифметического. Представим, что у Маши и Вовы было 10 конфет. Маша съела 8 конфет, а Вова — всего 2. Сколько конфет в среднем съел каждый ребенок? При помощи калькулятора легко вычислить, что в среднем дети съели по 5 конфет, что совершенно не соответствует действительности и здравому смыслу. Этот пример показывает, что показатель среднего арифметического важно считать для осмысленных наборов данных.

Заключение

Расчет среднего арифметического широко используется во многих научных сферах. Этот показатель популярен не только в статистических расчетах, но и в физике, механике, экономике, медицине или финансах. Используйте наши калькуляторы в качестве помощника для решения задач на вычисление среднего арифметического.

В поисках средних значений: разбираемся со средним арифметическим, медианой и модой

В поисках средних значений: разбираемся со средним арифметическим, медианой и модой

как считать среднее арифметическое чисел

Иногда при работе с данными нужно описать множество значений каким-то одним числом. Например, при исследовании эффективности сотрудников, уровня вовлеченности в аккаунте, KPI или времени ответа на сообщения клиентов. В таких случаях используют меры центральной тенденции. Их можно называть проще — средние значения.

Но в зависимости от вводных данных, находить среднее значение нужно по-разному. Основной набор задач закрывается с использованием среднего арифметического, медианы и моды. Но если выбрать неверный способ — выводы будут необъективны, а результаты исследования нельзя будет признать действительными. Чтобы не допустить ошибку, нужно понимать особенности разных способов нахождения средних значений.

Cтратег, аналитик и контент-продюсер. Работает с агентством «Палиндром».

Как считать среднее арифметическое

Использовать среднее арифметическое стоит тогда, когда множество значений распределяются нормально ― это значит, что значения расположены симметрично относительно центра. Как выглядит нормальное распределение на графике и в таблице, можно посмотреть на примере:

 использование чужих публикаций

Если данные распределяются как в примерах — вам повезло. Можно без лишних заморочек считать среднее арифметическое и быть уверенным, что выводы будут объективны. Однако, нормальное распределение на практике встречается крайне редко, поэтому среднее арифметическое в большинстве случаев лучше не использовать.

Как рассчитать

Сумму значений нужно поделить на их количество. Например, вы хотите узнать средний ER за 4 дня при нормальном распределении значений и без аномальных выбросов. Для этого считаем среднее арифметическое: складываем ER всех дней и делим полученное число на количество дней.

курирование контента

Если хотите автоматизировать вычисления и узнать среднее арифметическое для большого числа показателей — используйте Google Таблицы:

  1. Заполните таблицу данными.
  2. Щелкните по пустой ячейке, в которую хотите записать среднее арифметическое.
  3. Введите «=AVERAGE(» и выделите ряд чисел, для которых нужно вычислить среднее арифметическое. Нажмите «Enter» после ввода формулы.

курирование контента

Когда можно не использовать

Если данные распределены ненормально, то наши расчеты не будут отражать реальную картину. На ненормальность распределения указывают:

  • Отсутствие симметрии в расположении значений.
  • Наличие ярко выраженных выбросов.

Как пример ненормального распределения (с выбросами) можно рассматривать среднее время ответа на комментарии по неделям:

курирование контента

Если посчитать среднее значение для такого набора данных с помощью среднего арифметического, то получится завышенное число. В итоге наши выводы будут более позитивными, чем реальное положение дел. Еще стоит учитывать, что выбросы могут не только завышать среднее значение, но и занижать его. В таком случае вы получите более скромный показатель, который не будет соответствовать реальности.

Например, в группе «Золотое Яблоко» во ВКонтакте иногда публикуют конкурсные посты. Они набирают более высокие показатели вовлеченности чем обычные публикации. Если посчитать средний ER с учетом конкурсов, мы получим 0,37%, а без учета конкурсов — только 0,29%. Аналогичная ситуация с числом комментариев. С конкурсами в среднем получаем 917 комментариев, а без конкурсов — всего лишь 503. Очевидно, что из-за розыгрышей средние показатели вовлеченности завышаются. В этом случае конкурсные посты следует исключить из анализа, чтобы объективно оценить эффективность контента в группе.

курирование контента

Еще часто бывает так, что данных очень много, заметны явные выбросы, но на их обработку и исключение аномальных значений не хватит ни времени, ни терпения. Тем более нет гарантий, что исключив выбросы, вы получите нормальное распределение. В таком случае лучше подсчитать средние значения, используя медиану.

Как найти медиану и когда ее применять

Если вы имеете дело с ненормальным распределением или замечаете значительные выбросы — используйте медиану. Так можно получить более адекватное среднее значение, чем при использовании среднего арифметического. Чтобы понять, как работать с медианой, рассмотрим аналогичный пример с ненормальным распределением времени ответов на комментарии.

курирование контента

Ниже в таблице уже введены данные из графика и рассчитано среднее время ответа с помощью среднего арифметического и медианы. Из расчетов видна наглядная разница между средним арифметическим и медианой ― она составляет 17 минут. Такое различие появляется из-за низкого темпа работы на выходных и в нестандартных ситуациях, когда к ответу на сообщения нужно относиться с особой ответственностью (события конца февраля). Подобные выбросы сильно завышают среднее арифметическое, а вот на медиану они практически не влияют. Поэтому если хотите посчитать среднее значение избегая влияния выбросов, — используйте медиану. Такие данные будут без искажений.

курирование контента

Как рассчитать

Разберем на примере. В аккаунте опубликовали семь постов и они набрали разное количество комментариев: 35, 105, 2, 15, 2, 31, 1. Чтобы вычислить медиану, нужно пройти два этапа:

  • Расположите числа в порядке возрастания. Итоговый ряд будет выглядеть так: 1, 2, 2, 15, 31, 35, 105.
  • Найдите середину сформированного ряда. В центре стоит число 15 — его и нужно считать медианой.

Немного сложнее найти медиану, если вы работаете с четным количеством чисел. Например, вы собрали количество лайков на последних шести постах: 32, 48, 36, 201, 52, 12. Чтобы найти медиану, выполните три действия:

  • Расставьте числа по возрастанию: 12, 32, 36, 48, 52, 201.
  • Возьмите два из них, наиболее близких к центру. В нашем случае — это 36 и 48.
  • Сложите два этих числа и разделите на два: (36 + 48) / 2 = 42. Результат и есть медиана.

Чтобы вычислять медиану быстрее и обрабатывать большие объемы данных — используйте Google Таблицы:

  • Внесите данные в таблицу.
  • Щелкните по свободной ячейке, в которую хотите записать медиану.
  • Введите формулу «=MEDIAN(» и выделите ряд чисел, для которых нужно рассчитать медиану. Нажмите «Enter», чтобы все посчиталось.

курирование контента

Когда можно не использовать

Если данные распределены нормально и вы не видите заметных выбросов — медиану можно не использовать. В этом случае значение среднего арифметического будет очень близким к медиане. Можете выбрать любой способ нахождения среднего, с которым вам работать проще. Результат от этого сильно не изменится.

Что такое мода и где ее использовать

Мода ― это самое популярное/часто встречающееся значение. Например, стоит задача узнать, сколько комментариев чаще всего набирают посты в аккаунте. В этом случае можно не высчитывать среднее арифметическое или медиану ― лучше и проще использовать моду.

Еще пример. Нужно узнать, в какое время аудитория чаще всего взаимодействует с публикациями. Для этого можно посчитать данные вручную или использовать готовую таблицу из LiveDune (вкладка «Вовлеченность» ― таблица «Лучшее время для поста»). По ее данным ― больше всего реакций пользователи оставляют в среду в 16 часов. Это время и есть мода. Таким образом, если вам нужно найти самое популярное значение, а не классическое среднее — проще использовать моду.

курирование контента

Как рассчитать

Чтобы найти наиболее часто встречающееся значение в наборе данных, нужно посмотреть, какое число встречается в ряду чаще всех. Например, для ряда 5, 4, 2, 4, 7 ― модой будет число 4.

Иногда в ряде значений встречается несколько мод. Например, ряду 7, 7, 21, 2, 5, 5 свойственны две моды — 7 и 5. В этом случае совокупность чисел называется мультимодальной. Также поиск моды можно упростить с помощью Google Таблиц:

  • Внесите значения в таблицу.
  • Щелкните по ячейке, в которую хотите записать моду.
  • Введите формулу «=MODE(» и выделите ряд чисел, для которых нужно вычислить моду. Нажмите «Enter».

курирование контента

Однако важно иметь в виду, что табличная функция выдает только самую меньшую моду. Поэтому будьте внимательны — можно упустить из виду несколько мод.

Когда использовать не стоит

Моду нет смысла использовать, если вас не просят найти самое популярное значение. Там, где надо найти классическое среднее значение, про моду лучше забыть.

Памятка по использованию

Среднее арифметическое

Как находим: сумма чисел / количество чисел.
Используем: если данные распределены нормально и нет ярких выбросов.
Не используем: если видим явные выбросы или ненормальное распределение.

Медиана

Как находим: располагаем числа в порядке возрастания и находим середину сформированного ряда.
Используем: если работаем с ненормальным распределением или видим выбросы.
Не используем: если выбросов нет и распределение нормальное.

Мода

Как находим: определяем значение, которое чаще всего встречается в ряду чисел.
Используем: если нужно найти не среднее, а самое популярное значение.
Не используем: если нужно найти классическое среднее значение.

Только важные новости в ежемесячной рассылке

Нажимая на кнопку, вы даете согласие на обработку персональных данных.

Подписывайся сейчас и получи гайд аудита Instagram аккаунта

Маркетинговые продукты LiveDune — 7 дней бесплатно

Наши продукты помогают оптимизировать работу в соцсетях и улучшать аккаунты с помощью глубокой аналитики

Анализ своих и чужих аккаунтов по 50+ метрикам в 6 соцсетях.

Оптимизация обработки сообщений: операторы, статистика, теги и др.

Автоматические отчеты по 6 соцсетям. Выгрузка в PDF, Excel, Google Slides.

Контроль за прогрессом выполнения KPI для аккаунтов Инстаграм.

Аудит Инстаграм аккаунтов с понятными выводами и советами.

Поможем отобрать «чистых» блогеров для эффективного сотрудничества.

Среднее арифметическое

Онлайн калькулятор поможет найти среднее арифметическое чисел. Среднее арифметическое множества чисел (ряда чисел) — число, равное сумме всех чисел множества, делённой на их количество.

Программа вычисляет среднее арифметическое элементов массива, среднее арифметическое натуральных чисел, целых чисел, набора дробных чисел.

Формула которая используется для расчета среднего арифметического значения:
формула для нахождения средней арифметической величины

Приведём примеры нахождения среднего арифметического ряда чисел:
Среднее арифметическое двух чисел: (2+5)/2=3.5;
Среднее арифметическое трёх чисел: (2+5+7)/3=4.66667;
Среднее арифметическое 4 чисел: (2+5+7+2)/4=4;

Найти выборочное среднее (математические ожидание):
Среднее арифметическое 5 чисел: (2+5+7+2+3)/5=3.8;
Среднее арифметическое 6 чисел: (2+5+7+2+3+4)/6=3.833;
Среднее арифметическое 7 чисел: (2+5+7+2+3+4+8)/7=4.42857;
Среднее арифметическое 8 чисел: (2+5+7+2+3+4+8+5)/8=4.5;
Среднее арифметическое 10 чисел: (2+5+7+2+3+4+8+5+9+1)/10=4.6;

×

Пожалуйста напишите с чем связна такая низкая оценка:

×

Для установки калькулятора на iPhone – просто добавьте страницу
«На главный экран»

Для установки калькулятора на Android – просто добавьте страницу
«На главный экран»

Смотрите также

Yearly averages, the average taken over two or more years, is often used for investment analysis. Knowing the yearly average return on your investments lets you make decisions about making different investments. Combined with other annual averages, such as the average return on different types of investments, you can find out how your investments compare with other investments.

    Obtain data for a yearly average. Use investment data for a period of five years for this example. Assume in 2005 your investments returned $1,000, in 2006 they returned $1,500, in 2007 they returned $2,000, in 2008 they returned $1,250 and in 2009 they returned $1,750.

    Total the quantities for each year. Conclude that for this example the total dollars, the sum of the quantities, is $7,500 since 1,000 plus 1,500 plus 2,000 plus 1,250 plus 1,750 is 7,500.

    Divide the total of the quantities by the number of years used in the average. Conclude that the yearly average for this example is $1,500 since $7,500 divided by the number of years, 5, is $1,500.

    Tips

    • The average is sometimes called the mean or arithmetic mean. There are different types of mean, such as the geometric mean. The geometric mean however is not calculated the same as the arithmetic mean.

      The sum of a group of numbers is sometimes denoted with the Greek letter sigma. Sometimes the formula for the arithmetic mean is expressed using sigma notation.

    Warnings

    • Although a yearly average will give you a good idea of what average return to expect over a number of years, it is often not useful for predicting what will occur for any one year. For example, if an investment returned $10,000 in one year and lost $9,000 the next year, the yearly average would be $500. For this investment it would not be probable that you would return $500 the year after you made the investment. On the other hand, the data used to calculate the average suggest that you would have a 50 percent chance of making $10,000 and a 50 percent chance of losing $9,000.

Добавить комментарий