Как найти экстремальное среднее

Excel для Microsoft 365 Excel для Microsoft 365 для Mac Excel для Интернета Excel 2021 Excel 2021 для Mac Excel 2019 Excel 2019 для Mac Excel 2016 Excel 2016 для Mac Excel 2013 Excel 2010 Excel 2007 Excel для Mac 2011 Excel Starter 2010 Еще…Меньше

В этой статье описаны синтаксис формулы и использование функции УРЕЗСРЕДНЕЕ в Microsoft Excel.

Описание

Возвращает среднее внутренности множества данных. УРЕЗСРЕДНЕЕ вычисляет среднее, отбрасывания заданный процент данных с экстремальными значениями. Можно использовать эту функцию, чтобы исключить из анализа выбросы.

Синтаксис

УРЕЗСРЕДНЕЕ(массив;доля)

Аргументы функции УРЕЗСРЕДНЕЕ описаны ниже.

  • Массив    Обязательный. Массив или диапазон усекаемых и усредняемых значений.

  • Доля    Обязательный. Доля точек данных, исключаемых из вычислений. Например, если доля = 0,2, то из набора данных, содержащего 20 точек, исключаются 4 точки (20 x 0,2): 2 точки с наибольшими значениями и 2 точки с наименьшими значениями.

Замечания

  • Если процент < 0 или > 1, то #NUM! значение ошибки #ЗНАЧ!.

  • УРЕЗМН округит количество исключаемых точек данных до ближайшего числа, кратного 2. Если процент = 0,1, то 10 процентов из 30 точек данных равняется 3 пунктам. Для симметрии УРЕЗСИМВ исключает одно значение в верхней и нижней части набора данных.

Пример

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу ВВОД. При необходимости измените ширину столбцов, чтобы видеть все данные.

Данные

4

5

6

7

2

3

4

5

1

2

3

Формула

Описание

Результат

=УРЕЗСРЕДНЕЕ(A2:A12;0,2)

Среднее внутренней части множества данных, содержащихся в диапазоне А2:А12, с исключением 20 процентов данных из вычислений.

3,778

Нужна дополнительная помощь?

Нужны дополнительные параметры?

Изучите преимущества подписки, просмотрите учебные курсы, узнайте, как защитить свое устройство и т. д.

В сообществах можно задавать вопросы и отвечать на них, отправлять отзывы и консультироваться с экспертами разных профилей.

Определение усеченного среднего

Усеченное среднее — это метод нахождения более реалистичного среднего значения путем избавления от некоторых ошибочных наблюдений. В соответствии с этим методом процент самых высоких и самых низких значений вырезается из обоих крайних значений перед вычислением среднего значения. Это исключение перед вычислением приводит к более надежному среднему значению.

  • Усеченное среднее — это статистическая мера, которая избавляет от процента наблюдений из заданного списка перед выполнением вычислений среднего. Искоренение значений происходит с нижнего и верхнего конца данного набора наблюдений.
  • Его также называют усеченным средним, он обеспечивает более надежное среднее статистическое значение за счет уменьшения стандартных ошибок. Другими словами, это мера дисперсии среднего значения выборки, относящаяся к среднему значению генеральной совокупности, а не стандартное отклонение. Читать далее, вызванное выбросами или экстремальными вариациями.
  • Усеченное среднее применяется для определения уровня инфляции, результатов Олимпийских игр и экономических данных, которые требуют незначительных колебаний.
  • Наименьшая обрезка составляет 0%, то же самое, что и среднее арифметическое.

Оглавление

  • Определение усеченного среднего
    • Объяснение усеченного среднего
      • #1 – 5% усеченного среднего
      • # 2 — 10% усеченного среднего
      • #3 – 20% усеченного среднего
    • Формула усеченного среднего
    • Пример усеченного среднего с пошаговым расчетом
    • Часто задаваемые вопросы (FAQ)
    • Рекомендуемые статьи

Объяснение усеченного среднего

Усеченное среднее

Усеченное среднее — это усеченный сегмент среднего арифметического. Среднее арифметическое Среднее арифметическое обозначает среднее значение всех наблюдений ряда данных. Это совокупность всех значений в наборе данных, деленная на общее количество наблюдений. Подробнее используется в статистике. Поэтому его также называют усеченным средним. Процент сокращается с обоих концов ряда наблюдений, исключая самые высокие и самые низкие значения. В этом ряду наблюдения располагаются в порядке возрастания. Существует три обычно применяемых процента обрезки, т. е. 5%, 10% и 20%.

Усеченное среднее широко применяется для уменьшения колебаний выборки. На Олимпийских играх с помощью этого метода избегают доминирования крайних точек данных. При расчете темпов инфляции усеченное среднее помогает исключить резкие изменения цен. Резервный банк Австралиикак и многие центральные банки, использует усеченные средние значения для определения темпов инфляции.

Обоснование усеченного среднего заключается в том, что иногда происходят существенные изменения цен на определенные товары, которые существенно влияют на обычное среднее всех изменений цен. Иногда комплексное среднее значение совершенно не отражает изменения цен на другие товары и услуги. Обрезка приходит на помощь в таких случаях, чтобы получить более реалистичное значение. Ниже приведены характеристики определенных процентов усеченного среднего.

#1 – 5% усеченного среднего

Общее 5% усеченное среднее обычно эффективно в случае обширных данных. 2,5% наблюдений исключены из нижнего и верхнего концов. Следовательно, 95% наблюдений в серии остаются нетронутыми. Усеченное на 5 % значение self будет отражать применение отдельной обрезки на 5 % для самых низких и самых высоких значений. Следуя этой логике, важно понимать, что при подстройке 0% не будут исключаться какие-либо значения, и будет выполняться среднее значение с учетом каждого наблюдения. Таким образом, получится среднее арифметическое.

# 2 — 10% усеченного среднего

В общей сложности 10% усеченного среднего используется очень часто. На Олимпийских играх этот метод часто используется для устранения традиционных смещений средних значений, вызванных экстремальными значениями. Таким образом, 5% наименьшего и наибольшего значений удаляются перед вычислением среднего значения с каждого конца. Следовательно, 90% наблюдений в серии остаются нетронутыми.

#3 – 20% усеченного среднего

Усечение на 20% аналогично другим процентам обрезки. Здесь 10% значений удаляются с обоих концов. Следовательно, остаток используется для расчета 20% усеченного среднего. Кроме того, сокращение на 5, 10 или 20 процентов от предлагаемого конца списка потребует выполнения расчета только для данной части. Следовательно, усечение на 10% для самого высокого значения потребует только удаления наблюдений из более высокого конца.

Формула усеченного среднего

Следующие шаги включаются в формулу усеченного среднего:

  1. Пройдите процент обрезки. Это может быть 10%, 20%, 30% и т.
  2. Умножьте процент на количество наблюдений, чтобы получить количество значений, вычтенных из каждого конца.
  3. Удалите самые высокие и самые низкие числа с обоих концов.
  4. Сократите общее количество наблюдений, вычитая количество наблюдений, которые были вырезаны.
  5. Применить стандартное среднее или формулу среднего. Формула среднего. Среднее значение — это значение, которое используется для представления набора значений данных, как среднее значение, рассчитанное из всех данных, и эта формула рассчитывается путем сложения всех значений заданного набора, обозначаемого суммированием X и разделив его на количество значений, заданных в наборе, обозначенном N. подробнее к остальным наблюдениям, который выглядит следующим образом: Сумма наблюдений/количество наблюдений
  6. После применения формулы среднего можно было бы получить усеченное среднее.

Пример усеченного среднего с пошаговым расчетом

В следующей числовой задаче показано ручное применение концепции усеченного среднего и пошаговые вычисления.

Проблема:

Толкатель ядра записывает следующие результаты: 16,8 м, 16,9 м, 17,1 м, 17,2 м, 17,8 м, 17,9 м, 18,2 м, 18,3 м, 18,3 м, 18,5 м. Найдите 10% усеченное среднее.

Решение:

Ниже приведен процесс вычисления усеченного среднего:

Шаг 1 Подсчитайте количество наблюдений, т.е.

Количество наблюдений = 10

Шаг 2 Расположите ряды наблюдений в порядке возрастания, т. е. от наименьшего значения к наибольшему.

Баллы расположены в порядке возрастания:

16,8 м, 16,9 м, 17,1 м, 17,2 м, 17,8 м, 17,9 м, 18,2 м, 18,3 м, 18,3 м, 18,5 м

Шаг 3 Вычислите процент сокращения на каждом конце серии наблюдений.

Процент = 10%

Количество наблюдений, которые нужно обрезать с обоих концов = 10% * 10 = 1

Таким образом, нам нужно удалить два числа из набора наблюдений.

Шаг № 4 – Удалим наибольшее и наименьшее число с обоих концов. Это дает нам

16,9 м, 17,1 м, 17,2 м, 17,8 м, 17,9 м, 18,2 м, 18,3 м, 18,3 м,

Шаг № 5 Применим стандартную формулу среднего или среднего для расчета среднего из оставшихся восьми значений.

16,9, 17,1, 17,2, 17,8, 17,9, 18,2, 18,3, 18,3/8

Усеченное среднее = 17,71

Для реальных приложений определение процента сокращения имеет решающее значение. Опыт, знания и практика помогают пользователям выбрать подходящий процент, который нужно вырезать из среднего арифметического. Этот процент варьируется в зависимости от ситуации, проблемы и ниши, где он применяется.

Часто задаваемые вопросы (FAQ)

Что такое 10% обрезки означает?

10% усеченное среднее значение является центральной мерой тенденции в статистике. Таким образом, мы будем обрезать 10% наблюдений с обоих концов. Предположим, что всего имеется 10 наблюдений. Обрезка на 10% будет равна 10% x 10 = 1. Мы удалим самое высокое и самое низкое значение с обоих концов. После этого мы вычисляем среднее значение оставшихся 8 значений. На Олимпийских играх этот метод часто используется для устранения традиционных смещений средних значений, вызванных экстремальными значениями.

В чем смысл усеченного среднего?

Усеченное среднее — это метод нахождения более надежного среднего, чтобы оно было ближе к фактическому результату, путем обрезки процента наблюдений по обоим крайним значениям. Это сокращение самых высоких и самых низких значений приводит к более надежному среднему значению за счет избавления от выбросов.

Как найти усеченное среднее?

Усеченное среднее может быть найдено путем вычисления среднего арифметического после сокращения процента наблюдений от обоих крайних значений. Затем к оставшимся наблюдениям мы применяем формулу стандартного среднего.

Рекомендуемые статьи

Это было руководство по усеченному среднему и его статистическому определению. Здесь мы обсуждаем пример с пошаговым расчетом вместе с формулой. Вы можете узнать больше о финансировании из следующих статей –

  • Среднее геометрическое
  • Формула гармонического среднего
  • Формула средней численности населения
  • Формула взвешенного среднего

Выдают
информацию о самом большом или самом
маленьком из списка значений.

МАКС()
и МИН()

МАКС(число1,
число 2,…) – только для числовых значений.

МАКСА(число1,
число 2,…) – для диапазонов, содержащих
текстовые или логические значения.

МИН(число1,
число 2,…) – только для числовых значений.

МИНА(число1,
число 2,…) – для диапазонов, содержащих
текстовые или логические значения.

НАИБОЛЬШИЙ()
и НАИМЕНЬШИЙ() –
для
работы с k-м максимальным или минимальным
значением.

НАИБОЛЬШИЙ(массив;
k).

НАИМЕНЬШИЙ(массив;
k).

K
– позиция в массиве (в порядке убывания
чисел), которую необходимо получить.
Если k=1,
то функция возвращает то же значение,
что и функция МАКС().

4. Вычисление взвешенного среднего

В
некоторых наборах данных одно значение
может быть важнее, чем остальные.

Взвешенное
среднее значение

– это арифметическое среднее значение,
где каждое из значений взвешено в
соответствии с его важностью в наборе
данных.

Процедура,
выполняемая для вычисления взвешенного
среднего:

  1. Умножить
    каждое значение на соответствующий
    ему вес.

  2. Просуммировать
    полученные в шаге 1 результаты.

  3. Просуммировать
    веса.

  4. Разделить
    сумму из шага 2 на сумму из шага 3.

5. Вычисление дисперсии

При
вычислении вариации по набору значений
можно применить простой подход: вычислить
сначала отклонение каждого из значений
от среднего, сложить эти разности и
разделить полученную сумму на количество
значений в выборке, чтобы получить
некоторое «среднее отклонение». Однако,
этот подход не дает никаких результатов:
по определению сумма отклонений значений
от среднего дает результат 0. Чтобы
решить эту проблему, необходимо сложить
абсолютные значения отклонений, после
чего разделить их на размер выборки.
Этот показатель в статистике называют
средним, или линейным отклонением. Но
и этот простой подход имеет недостаток
– задействованы модули чисел и поэтому
выполнять его сложно. Чтобы обойти эту
проблему, вместо модуля (абсолютного
значения) используется квадрат отклонения
от среднего, который всегда равен
неотрицательному числу. После этого
квадраты отклонений суммируют и делят
на количество значений в выборке –
результат называют дисперсией.
Результат измеряется не в единицах
измерения выборки, а в единицах в
квадрате. Дисперсия используется для
вычисления стандартного отклонения.

ДИСП(число
1, число 2,…) – применяется для наборов
данных, представляющих собой выборку
из генеральной совокупности.

ДИСПР(число
1, число 2,…) – используется в тех случаях,
когда набор данных представляет собой
всю генеральную совокупность (например,
количество единиц бракованной продукции).

ДИСПА(число
1, число 2,…) – для диапазона данных,
включающих текстовые или логические
значения.

ДИСПРА(число
1, число 2,…) – для тех случаев, когда
набор данных представляет собой всю
генеральную совокупность и включает
текстовые и логические значения.

6. Регрессия и метод наименьших квадратов

Наиболее
часто статистические методы используются
для обработки и графического представления
данных. Например, на практике часто
возможно задание достаточно большого
числа узловых точек аппроксимируемой
функции. Так, в физических экспериментах
для этого достаточно порой повторить
цикл измерений несколько раз. Если
подвергнуть такие данные хотя бы
простейшей статистической обработке,
то можно заметно уменьшить стандартное
отклонение результата измерения.

Это
и реализуется в задачах регрессии. Можно
рассмотреть задачу, при которой
аппроксимирующая функция подбирается
так, чтобы ее график проходил в облаке
узловых точек исходной функции, и чтобы
суммарная среднеквадратичная погрешность
для всех точек была минимальной. Таким
образом, реализуется метод наименьших
квадратов.

Вопросы
для самопроверки по разделу 4

  1. Перечислите
    основные статистические функции.

  2. Порядок
    подсчета элементов в диапазоне.

  3. Перечислите
    типы усредняющих показателей.

  4. Что
    такое медиана?

  5. Определение
    медианы статистического массива.

  6. Что
    такое мода в наборе данных?

  7. Определение
    моды статистических данных.

  8. Порядок
    определения экстремальных значений в
    наборе данных.

  9. Что
    такое взвешенное среднее значение?

10.
Процедура вычисления взвешенного
среднего.

11.
Порядок вычисления дисперсии.

12.
В чем заключается суть метода регрессии?

13.
Порядок построения аппроксимирующей
функции.

14.
В чем заключается метод наименьших
квадратов?

В статистике , то в середине диапазон или средние экстремальный является мерой центральной тенденции в виде образца (статистика) определяется как средние арифметической максимальными и минимальными значения набора данных :

M = { frac { max x +  min x} {2}}.

Средний диапазон тесно связан с диапазоном , мерой статистической дисперсии, определяемой как разница между максимальным и минимальным значениями. Эти две меры дополняют друг друга в том смысле, что, зная средний и диапазон значений, можно найти максимальное и минимальное значения выборки.

Средний диапазон редко используется в практическом статистическом анализе, поскольку ему не хватает эффективности в качестве средства оценки для большинства представляющих интерес распределений, потому что он игнорирует все промежуточные точки, и ему не хватает устойчивости , поскольку выбросы значительно его изменяют. Действительно, это одна из наименее эффективных и наименее надежных статистических данных. Тем не менее, он находит некоторое применение в особых случаях: это максимально эффективный оценщик для центра равномерного распределения, усеченная устойчивость адреса в среднем диапазоне, и как L-оценщик его просто понять и вычислить.

Надежность

Средний диапазон очень чувствителен к выбросам и игнорирует все, кроме двух точек данных. Следовательно, это очень ненадежная статистика , имеющая точку разбивки 0, что означает, что одно наблюдение может изменить ее произвольно. Кроме того, на него сильно влияют выбросы: увеличение максимума выборки или уменьшение минимума выборки на x изменяет средний диапазон на, в то время как оно изменяет среднее значение выборки, которое также имеет точку разбивки 0, только за счет этого. практическая статистика, если выбросы еще не обработаны.
х / 2,х / п.

Обрезается СЧ известен как
midsummary
– Theп% обрезается среднего уровня является средним значениемп% и (100-п)% процентили, и является более надежным, имеющийточку пробояпоп%. В середине находитсямидинге, составляющее 25% итоговой суммы. Медианныйможно интерпретировать как полностью отделан (50%) среднего диапазона; это согласуется с соглашением о том, что медиана четного числа точек является средним значением двух средних точек.

Эти обрезанные средние диапазоны также представляют интерес как описательная статистика или как L-оценки центрального положения или асимметрии : различия срединных значений, такие как середина минус медиана, дают меры асимметрии в разных точках хвоста.

Эффективность

Несмотря на все недостатки, в некоторых случаях бывает полезно: средние частоты является весьма эффективным оценки М, учитывая небольшой образец достаточно platykurtic распределения, но оно неэффективно для mesokurtic распределений, таких как нормальный.

Например, для непрерывного равномерного распределения с неизвестным максимумом и минимумом средний диапазон является оценкой UMVU для среднего. Образец максимального и образец минимального вместе с образцом размера, являются достаточной статистикой для максимального населения и минимума – распределение других образцов, обусловливающие данного максимума и минимума, это только равномерное распределение между максимальным и минимальным и , таким образом , добавить нет информации. См. Проблему с немецкими танками для дальнейшего обсуждения. Таким образом, средний диапазон, который является объективной и достаточной оценкой среднего генеральной совокупности, на самом деле является UMVU: использование выборочного среднего просто добавляет шум на основе неинформативного распределения точек в этом диапазоне.

И наоборот, для нормального распределения выборочное среднее является оценкой среднего UMVU. Таким образом, для платикуртических распределений, которые часто можно представить как между равномерным распределением и нормальным распределением, информативность средних точек выборки по сравнению со значениями экстремумов варьируется от «равной» для нормального до «неинформативного» для равномерного и для различных распределений. , один или другой (или некоторая их комбинация) могут быть наиболее эффективными. Надежным аналогом является trimean , который усредняет середину диапазона (25% усеченного среднего диапазона) и медианы.

Небольшие образцы

Для небольших размеров выборки ( n от 4 до 20), взятых из достаточно платикуртического распределения (отрицательный избыточный эксцесс , определяемый как γ 2 = (μ 4 / (μ 2 ) ²) – 3), средний диапазон является эффективной оценкой среднее μ . В следующей таблице приведены эмпирические данные, сравнивающие три оценки среднего для распределений различного эксцесса; модифицировано среднее является усеченным средним , где устраняются максимум и минимум.

Избыточный эксцесс (γ 2 ) Наиболее эффективная оценка μ
От −1,2 до −0,8 Средний диапазон
От -0,8 до 2,0 Иметь в виду
От 2,0 до 6,0 Модифицированное среднее

Для n = 1 или 2 средний диапазон и среднее значение равны (и совпадают с медианой) и являются наиболее эффективными для всех распределений. Для n = 3 модифицированное среднее – это медиана, а вместо этого среднее является наиболее эффективной мерой центральной тенденции для значений γ 2 от 2,0 до 6,0, а также от -0,8 до 2,0.

Свойства выборки

Для выборки размера n из стандартного нормального распределения средний диапазон M несмещен и имеет дисперсию, определяемую следующим образом:

 operatorname {var} (M) = { frac { pi ^ {2}} {24  ln (n)}}.

Для выборки размера n из стандартного распределения Лапласа средний диапазон M несмещен и имеет дисперсию, определяемую следующим образом:

 operatorname {var} (M) = { frac { pi ^ {2}} {12}}

и, в частности, дисперсия не уменьшается до нуля при увеличении размера выборки.

Для выборки размера n из равномерного распределения с нулевым центром , средний диапазон M несмещен, nM имеет асимптотическое распределение, которое является распределением Лапласа .

Отклонение

В то время как среднее значение набора значений минимизирует сумму квадратов отклонений, а медиана минимизирует среднее абсолютное отклонение , средний диапазон минимизирует максимальное отклонение (определяемое как ): это решение вариационной задачи.
 max  left | x_ {i} -m  right |

Смотрите также

  • Диапазон (статистика)
  • Midhinge

Рекомендации

  • Додж, Ю. (2003). Оксфордский словарь статистических терминов . Издательство Оксфордского университета. ISBN 0-19-920613-9.
  • Кендалл, MG; Стюарт, А. (1969). Расширенная теория статистики, Том 1 . Грифон. ISBN 0-85264-141-9.
  • Веллеман П.Ф .; Хоглин, округ Колумбия (1981). Приложения, основы и вычисления исследовательского анализа данных . ISBN 0-87150-409-X.

УДК 519.222

О НЕКОТОРЫХ ЭКСТРЕМАЛЬНЫХ СВОЙСТВАХ СРЕДНИХ ЗНАЧЕНИЙ И МАТЕМАТИЧЕСКИХ ОЖИДАНИЙ СЛУЧАЙНЫХ ВЕЛИЧИН

В.Л. Хацкевич

В работе выявлена связь между весовыми усреднениями и весовым методом наименьших квадратов. Установлено, что весовые усреднения минимизируют соответствующие весовые среднеквадратические уклонения. Исследован случай дискретных и непрерывных средних, а также математических ожиданий случайных величин. Показано, что координаты центров масс различных механических систем обладают характеристическим экстремальным свойством

Ключевые слова: экстремальное свойство, взвешенное среднее, взвешенное среднеквадратическое отклонение

Введение . Пусть х 1, х 2хп – заданные числа. Средняя арифметическая простая определяется равенством:

і n

■ = – Тxt .

n і =1

(і)

Если заданы веса (частоты повторения соответствующих признаков) р1,р2 ,… рп , причем

п

рк > 0 для к = 1, 2,…п и £Рк > 0, то средняя

к =1

арифметическая взвешенная определяется равенством:

_ = Р1х 1 +Р2х 2 + … + Рпхп (2)

р1 + р 2 + … + рп

Взвешенные средние применяются в статистике, а также при скользящем усреднении динамических рядов. Например, случай

рк =т -1(к = 1,2,…п),

где и е (0,1) соответствует экспоненциальному усреднению. При этом,

_ 1 -и п к -1

х = :—- Ти хк

1 -и к =1

(см., напр., [1], гл. 4). В случае рк = к (к = 1,2,…,п), величина

x=

т—лТ tet

i(n + і) і =1

соответствует усреднению Маркова – Гельфонда (см. [2]). Специальный случай усреднения с многоугольными числами рассмотрен в работе [3], откуда и возник интерес автора к этой проблематике.

Как известно (см., напр., [4] §5), имеет место следующее характеристическое свойство средних арифметических:

Сумма квадратов отклонений отдельных членов ряда от средней арифметической (простой) меньше суммы квадратов их отклонений от любой другой величины.

Мы заметили, что аналогичное утверждение справедливо и для средней арифметической взвешенной. А именно, рассмотрим взвешенное сред-

неквадратическое отклонение чисел x 1,x2,…,xn от некоторой величины x

d 2(x)= ТPt (хі -x) і =1

2

(З)

где р 1, р2,…рп – заданные положительные числа.

Теорема 1. Взвешенное среднеквадратическое отклонение (3) достигает минимума при х = х , определяемом формулой (2).

Доказательство этой теоремы элементарно. А именно, приравнивание производной от выражения (3) по х к нулю дает для критической точки значение (2). При этом вторая производная, равная

п

2ТРк , положительна. Так что выполнено доста-

к =1

точное условие минимума.

Весовой метод наименьших квадратов, характеризующийся в нашем случае формулой (3), находит широкое применение в различных разделах естествознания (см., напр., [5] гл.3). Однако, связь с весовыми средними, на сколько нам известно, ранее не отмечалась.

1. Скалярный дискретный случай. Рассмотрим дискретную случайную величину, принимающую значения Х1 < Х2 . < Хп С вероятностями Р1, Р2,.. .Рп соп

ответственно. Как известно, ТРк = 1. При этом

к =1

математическое ожидание случайной величины М (X ) и дисперсия В (X ) определяются формулами

М (X ) = ТРк.хк. , В (X ) = ТРк. (хк – а )2,

і =1

і =1

Хацкевич Владимир Львович – ВГТУ, д-р техн. наук, профессор, e-mail: vlkhats@mail.ru

где а = М (X ). Тогда теорема 1 влечет

Следствие 1. Для дискретной случайной величины Х выражение

П / 2

2 Рк (хк -а) к =1

достигает минимума по а при а = М (X ).

Этот результат совпадает с известным результатом теории оценивания (см., напр., [6] гл. 1) поскольку в терминах математического ожидания мы

находим минимум величины М (X – а )2 по а , равный В (х).

Рассмотрим дискретный вариационный ряд, в

x 1 + x 2 +… + x n

x

n

котором значение признака Хк принимается с частотой Пк (к=1,2,…,ш). Средней арифметической х и дисперсией В вариационного ряда называют соответственно величины

_ 1 т

х = — Т п1хк N к =1

1 т / _у

В = — Т(хк -х )

N к =1

объем совокупности.

х”‘ 2

где N = Т пк

к =1

Следствие 2. Величина

1 т ! 49

В = — Т(хк – а у

N к =1

как функция параметра а достигает минимума при а = х , т.е. в средней арифметической вариационного ряда.

Рассмотрим взвешенную среднюю гармоническую. В этом случае будем считать, что заданные числа х1, х2,… , х п положительны. Кроме того, рассмотрим положительные числа ®1,®2,…,®п . Взвешенная средняя гармоническая определяется формулой

гар.

)/

– +… + –

Положим р к = —^. В новых обозначениях х

хк

приобретает вид (2) взвешенной средней арифметической с весами р к . Поэтому теорема 1 влечет

Следствие 3. Средняя гармоническая минимизирует взвешенное среднее квадратическое отклонение

(хк -х )2.

к =1 х к

Рассмотрим среднюю степенную взвешенную

1р1 х т + р 2 х 2 + … + рпхтп

V р1 + р 2 + …рп

где т – натуральное число, все х к , р к > 0 (к

= 1,2,.,п) и Трк > 0 .

к =1

Поскольку т-я степень средней степенной является средней арифметической т-тых степеней отдельных членов данной совокупности, то справедливо

Следствие 4. Взвешенная сумма квадратов отклонений т-х степеней членов совокупность от т-той степени средней степенной меньше взвешенной суммы квадратов их отклонений от любой другой величины.

В частности, пусть дискретная случайная величина Х принимает значения х1 < х2< < хп с вероятностями Р1, Р2,. Рп соответственно. Выражение

Т Рк (хт – а}

а принимает минимальное значение,

к =1

когда а = Т Р к х кт – начальный момент ш-того по-

к =1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

рядка случайной величины Х.

Формула средней геометрической взвешенной

имеет вид

О = (хрх2р2…хр )р1+р2+…+рп .

При помощи логарифмирования получим

1оёС = р1 1°ё х 1 + р 2 х 2 + … + рп !о§ хп р1 + р 2 + … + рп

То-есть логарифм средней геометрической взвешенной равен взвешенной средней арифметической логарифмов отдельных членов ряда. Тогда имеет место

Следствие 5. Взвешенная сумма квадратов отклонений логарифмов отдельных членов ряда от логарифма средней геометрической меньше взвешенной суммы квадратов отклонений логарифмов отдельных членов от любой другой величины.

Отметим, что результаты следствий 3 – 5 распространяют известные в случае «простых» средних, т.е. когда р1 = р2 =… = рп = 1, результаты (см., напр., [4]) на случай взвешенных средних.

В теории вероятностей и математической статистике находят широкое применение средние случайных величин (закон больших чисел, выборочные средние и т. д.). Рассмотрим как выглядит экстремальное свойство средних (теорема 1) в этом случае. Пусть заданы положительные числа

1 2 п

р1,р2,…,рп и случайные величины X ,Х , .,Х с математическими ожиданиями М (к )= а к (к = 1,2,…,п). Поставим задачу: найти случайную величину X , обеспечивающую минимум выраже-

(4)

Тр1(м (х1-х)}.

1=1

Поскольку формула (4) может быть записана в

виде

Т р1(а1- М (X))2

)=1

то согласно теореме 1 и свойствам математического ожидания случайная величина X должна быть такова, чтобы

М (£ ) = Р 1а 1 + Р 2а 2 + … + Р пап Р 1 + р 2 + … + р п

В частности, X может быть представлена как взвешенная средняя арифметическая

^ = р 1^ 1 + р 2^ 2 + … + р п % п р 1 + р 2 + … + р п

Отметим, что если все случайные величины %1 имеют одинаковые математические ожидания а 1 = а 2 =.. = а п = а , то минимум среднеквадратического отклонения (4) равен нулю.

Это будет выполнено, например, в ситуации последовательности независимых испытаний, когда

случайные величины %к (к = 1,2,…,п) выражают число наступлений события А соответственно в к-том испытании. При этом веса р к могут выражать стоимость успеха в к-том испытании, а взвешенная

ю

2

+

х

х

2

п У

средняя – среднюю сумму выигрыша.

Ниже мы рассмотрим вместо выражения (4), содержащего квадраты математических ожиданий, аналогичное выражение, содержащее математические ожидания от квадратов.

2. Многомерный дискретный случай. Рассмотрим гильбертово пространство Н со скалярным произведением ( , ) и нормой ||. ||. Пусть

X ‘,X 2,…,X п заданные элементы этого простран-

ства а ръ р 2,…, Рп

заданные неотрицательные

числа, причем Т р к > 0 . Аналогично (2) средняя

к =1

арифметическая взвешенная имеет вид

^ = Р 1 ^ 1 + Р 2X 2 + … + р nX п (5)

р 1 + р 2 + … + р п

Для произвольного X е Н рассмотрим взвешенное среднеквадратическое отклонение

п2

ТРt\xk -X . (6)

к =1

Теорема 2. Взвешенное среднеквадратическое отклонение (6) принимает наименьшее значение, когда X совпадает со взвешенной средней арифметической X , определяемой формулой (5).

Доказательство. Пусть X – некоторый вектор. При любом к = 1,2,…, п справедливы соотношения X11 – X = (Xк – Г)+(Т – X).

Рассмотрим скалярное произведение

– (X

||хк -XII2 =(хк -X + X -X,Xк -X + X -X)=

= | X к – X +| X – X]] + 2^ – X , X*1 – X .

Умножая обе части этого равенства на рк , а затем суммируя по к найдем

п и , м2 п ц , _м2

ТРt\xk -X = тРt\xk -X +

к =1

к =1

+ | 2Рк IX -X ||2 + 2| X -X , 2рк

V к =1 0 V к

р (Xі -X)].

Здесь мы использовали известные свойства скалярного произведения. Заметим, что согласно (5)

2Рі(Xі -х)= 2РkXi -І2рк’]X=о.

к =1 к =1 V к =1 0

Тогда в силу предыдущего

п и , м2 п и , м2

2рt\хk -X = 2рt\хk -X +

к =1 к =1 +[Ьк 1||X – X ||2.

(7)

Откуда и следует высказанное утверждение.

В частном случае, когда Н = К – вещественная ось, теорема 2 совпадает с теоремой 1.

Замечание 1. Рассмотрим случай Н = К 2 или Н = К 3 . Пусть векторы X 1,X 2,…,X п характеризуют координаты материальных точек, в которых сосредоточены массы т 1 =р1, т 2 =р2,…, тп =рп.

Формула (5) в этом случае задает координаты центра масс (инерции) системы материальных точек (см., напр., [7]). Согласно теореме 2 вектор X , характеризующий координаты центра масс, минимизирует взвешенное среднеквадратическое отклоне-

п2

ние 2т к X – X .

к =1 11 11

Это утверждение можно было бы принять за определение центра масс.

Замечание 2. Рассмотрим задачу многокритериальной оптимизации

§1(х) ® тіп (і = 1,…,п) х є [а,Ь ] , где $і(х) заданные функции. Чтобы свести эту задачу к одному критерию, рассмотрим функцию

й (х) = 2 Рі&і( х)/2 р1

і=1 і=1

с заданными весами р1 > 0 (і = 1,…,п ). Будем трактовать эту задачу следующим образом. Пусть Н = L 2 (а, Ь) – гильбертово пространство со скаляр-

Ь

ным произведением (I , й ) = 11 (х ) й (х )і (х).

а

Согласно теореме 2 функция g минимизирует по | соотношение

п Ь

2Р,(I (х)-йі(х)) йх .

1=1 а

Результат теоремы 2 допускает следующую трактовку. Заметим, что взвешенная средняя арифметическая, определяемая формулой (5), является выпуклой комбинацией векторов X 1,X 2,…,хп. Пусть X – элемент выпуклой оболочки векторов

п

X ,X ,…,хп , т.е. X = 2«,х ) , где « ■> 0 и

)-1

п

2а, = 1. Рассмотрим весовое среднеквадратиче-

‘ ]

} =1

ское отклонение

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8 2(а)-.= 8 2 (а1,а 2,…,а п) = 2 Р < IX ‘ – X |Г.

■ 2

)=1

Согласно теореме 2 минимум этого выражения по всем X из выпуклой оболочки элементов

1 2 п

X ,X ,…,X” (т.е. по а > 0, таким что Та , = 1)

)=1

достигается при

а =Р} 2 р, (1 = Ъ.^п). / к -1

Следовательно, на средней арифметической взвешенной X .

Можно дать независимое доказательство этого факта. Рассмотрим частные производные

д

да і

(X -Xі) = хк (“1 = 1,…,п ;”к = 1,..,п). Тогда

8

да

= 2 2р і (X – X

к 1=1

да

-(X – X’)) =

= 2(X , 2р:(х -х >)).

і=1

2

д

По определению X

д8 2 и п п

= 2(х ,X 2р, – 2р,х>) =

отсюда

имеем

да

1=1

1=1

= 2(хк, 2 р, 2а,х> – 2 р]х>).

г

г =1 1=1

1=1

Здесь, правая часть скалярного произведения обращается в ноль при а , определенных выше.

При этом а ■ > 0(“1 = 1,…,п), 2а, = 1.

=1

Отметим, что матрица из вторых частных производных функции 82 (а) (матрица Гессе) с точностью до сомножителя совпадает с матрицей Грамма системы векторов X 1,X 2,…,хп.

В самом деле, согласно предыдущему для любых к,т = 1,…,п имеем

д2 82

датдак

– = 2-

да

д и п

(хк, 2 р, (X – X’)) =

= 2(хк, 2 р

1=1

1=1 ‘ да т

(X -X1)) = 2(хк, 2р,хт ) =

=1

= 2( Т Р))( Xk, Xm ).

=1

Укажем приложения теоремы 2 к случайным величинам. Пусть Н = L2 (О,) – гильбертово пространство случайных величин с конечным вторым моментом. Для случайных величин X ,! е Н полагают

(X,!) = М X7! , где М – математическое ожидание.

1

При этом норма 1X1 = ^^Э2. Пусть X1,X2,…,X” -заданные случайные величины, а р1, р2,…рп – заданные положительные числа.

Рассмотрим среднее квадратическое отклонение

п

ТРкМ (Xк -X)2,

к =1

где X – некоторая случайная величина. Из теоремы 2 вытекает, что минимум этого выражения по X достигается при

X= р 1%1+р 2%2+…+ р п %п.

р 1 + р 2 + … + р п

В качестве примера рассмотрим опять слу-

1 2 п

чайные величины X X ,…,X , выражающие количество наступлений события А в каждом из п независимых испытаний при условии, что события наступают с вероятностью Р в каждом испытании. В этом случае средняя арифметическая

— 1 п к

X = — ТX является частостью наступления собы-

п к =1

тия А в п независимых испытаниях. Рассмотрим каково минимальное значение среднего квадратического отклонения, равного, в соответствии с тео-

‘У & ‘У

ремой 2, величине § = Т М (X -X ) . Как извест-

к =1

но [6], м (Xк -X)2 = в(Xк -X)+М (Xк -X)?,

где символ В обозначает дисперсию. При этом как

отмечено выше М Поскольку

(м (Xк -х ))2= о (“к = 1,…,п).

в(Xк -х) = в(Xк)+в(X),

то

М (Xк -X )2 = В (Xк) + В (X) = Рд + ^ .

п

Таким образом, §2 =(п +1)Рд .

3. Непрерывный случай. Пусть переменная х изменяется в пределах от а до Ь, а р(х) > 0 является функцией частот. Предположим, что функция

р(х) непрерывна

Ь

(суммируема) и | р(х )ёх > 0. То

гда средняя арифметическая взвешенная определяется формулой

_ Ь 1ь

х = 1 р(х ‘)хйх 11 р(х )ёх . (8)

а /а

Теорема 3. Непрерывная взвешенная средняя арифметическая (8) минимизирует по х * е (а, Ь ) величину взвешенного среднего квадратического

отклонения

| (х – х *) р (х )йх .

а

Доказательство. Равенство (х – х * )2 = (х – х )2 +(т – х *) + 2(х – х )(г – х *) умножим на р(х) и проинтегрируем от а до Ь.

Тогда

| (х – х *) р(х )ёх = | (х – х)2 р (х )ёх +

а а

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ (г – х *) | р(х )х + 2 (г – х *) (х – х )р (х У1х

аа

Так как по определению х выполнено

Ь Ь Ь

| (х – Т )р(х )ёх = | х р(х )ёх – х | р(х )ёх = 0 ,

а а а

то,

| (х – х * )2 р (х )ёх = | (х – х )2 р(х )ёх +(т – х *) | р(х )ёх .

а а а

Это и влечет высказанное утверждение. Замечание 3. Как известно формула (8) характеризует координату центра равновесия (масс) отрезка [ а , Ь ] горизонтальной оси, вдоль которого масса распределена с плотностью р (х). Поэтому теорему 3 можно рассматривать как характеристическое свойство центра масс в случае отрезка.

Взвешенная средняя гармоническая непрерывная определяется равенством _ Ь

х = ) р(х )ёх /1 р( ) ёх .

х

Положим д (х) = Р (х) . Тогда х будет взве-

х

шенной средней арифметической с весом д ( х ) . Поэтому теорема 3 влечет

Следствие 6 Взвешенная средняя гармоническая непрерывная минимизирует по г величину

) Р^х! (, _, )2- *.

ах

Взвешенная средняя степенная непрерывная определяется равенством

– (Ь

х = I | р(х )хт ёх I I 1 р(х )а

Следствие 7. Степень т-того порядка от взвешенной средней степенной непрерывной минимизирует по г величину

| р (х ‘)хт – г ) аХ .

а

Пусть X непрерывная случайная величина с плотностью вероятности (р(х). Математическое ожидание и дисперсия такой случайной величины определяются формулами

¥ ¥

М (X ) = | х (р(х )ёх , В (X ) = | (х – а )2 р (х )аХ ,

-¥ -¥

где а = М (X ).

Следствие 8. Значение

¥

| х р(х )ёх = а

минимизирует по параметру г величину

¥

| (х – г) р(х )Х .

Доказательство этого следствия повторяет доказательство теоремы 3 с учетом равенства

си

| р (х )ёх = 1.

Согласно следствию 8 математическое ожидание непрерывной случайной величины обеспечивает минимум среднего квадратического отклонения, равный дисперсии.

Обобщением теоремы 3 является следующее утверждение.

Теорема 4. Пусть функция / (х) квадратично суммируема на промежутке [а,Ь ] и

/ = 1 р(х) / (х )ё (х) /1 р(х )ёх

аа

ее взвешенное среднее значение. Тогда величина / минимизирует по 0 среднее квадратическое отклонение

Ь

§ 2(0) = 1Р (х)(/ (х)-о )2ёх .

а

В самом деле, приравнивая производную

д§ 2(о) до

к нулю, найдем корень 0 = / . При этом

д 2§ 2(о) *

вторая производная —-—2— = 2] р (х )ах

д о

положительна. Так что выполнено достаточное условие минимума.

Приведем обобщение теоремы 2. Заметим, что рассуждения теоремы 2 сохраняются, если считать все р к непрерывными функциями от х е [а, Ь ]. Тогда, интегрируя соотношение (7) по х от а до Ь , установим

Следствие 9. Взвешенное среднее квадратическое отклонение

Т1 Рк (х)

к =1 а

Xк – X (х )||2 а,

достигает минимума при X (х), определяемом формулой (5) с переменными рк (х) (к = 1,2,…,п).

Остановимся несколько подробнее на характеристическом экстремальном свойстве центров масс. В частности, рассмотрим плоскую фигуру, расположенную в замкнутой области Б плоскости, с поверхностной плотностью равной ] (х, у). Координаты центра масс такой фигуры имеют вид (см. напр., [7] гл.9)

Хс = М х/М и Ус = Му/М ,

где

м х = 11Г (х, У )хёхёу , Му = 11у (х, у )уёхёу

В В

– статические моменты плоской фигуры Б, а

М = 11 у (х, у )ёхёу

В

– величина массы рассматриваемой фигуры.

Теорема 5. Координаты центра масс хс, ус минимизируют по X и ц взвешенное среднее квадратическое отклонение

§ 2 = 11У (х, У)[(х -X )2 + (У -ц)2]аХаУ .

В

Действительно, приравнивая нулю частную

производную от §2 по X получим

0 = 2Цу (х, У )(х – X )ёхёу = 2М х + 2XM . СледоВ

вательно, X = хс . Аналогично из соотношения

д§2 дц

д2§ 2

= 0 получим ц = У с . Кроме того,

д 2§2

дX’

= 2М

– = 2М . При этом

д 2§2

= 0 . Так что выполне-

дц2 * дX дц

но достаточное условие минимума

§XX §ц -§ц > 0,§| > 0.

Аналогичным характеристическим свойством обладают координаты центров масс пространственных фигур, а также плоских и пространственных кривых. Теорема 5 является частным случаем более общего утверждения.

Теорема 6. Пусть заданы замкнутая область О п-мерного пространства Кп и функция п-переменных F (х 1,х2,…,хп). Тогда координаты

со

x> =

JxiF (xj,xxn )dx 1dx 2…dx n

}__________________________’

JF (xj;x2,…,xn )dx jdx 2…dx n

(i = 1,2,…, и )

обеспечивают минимум по x 1,x 2,…,x П среднего квадратического отклонения

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

П 2

ZJ ^ -xi) F (x 1, x 2,…, xn )dx jdx 2…dx„ .

i=lW

Доказательство проводится по схеме доказательства теоремы 3.

Известная задача теории оценивания состоит в том, чтобы по значениям наблюдаемой случайной величины x оценить ненаблюдаемую случайную величину h . Можно показать (см., напр., [6], гл. 2), что лучшей оценкой h по x является функция j *(x) = M(h |x), равная условному математическому ожиданию h по x . Она минимизирует величину среднеквадратической ошибки M (h – j (x ))2. А именно,

M (h-jW = inf M (h-j(x))2, (9)

где inf берется по классу всех борелевских функций j (x) .

Рассмотрим обобщенную постановку этой задачи. Пусть имеется n наблюдаемых случайных

^ 1 w 2 р n

величин x ,x , . ,x характеризующих значения ненаблюдаемой величины h . Какова в этом случае

будет лучшая оценка h по x = (fj,x 2,…,xn).

Теорема 7. Пусть M (h 2) < ¥. Тогда в качестве оптимальной оценки j* = j*(^) может быть взята средняя

* 1 П I ,

j (x) — ZM (hxk).

n k =1 1

(10)

Доказательство. Будем рассматривать такие оценки Р (X ), для которых М (р2 (X )) < ¥ . Пусть

р(X) такая оценка, а р*(X) определяется формулой (10). Тогда

м [ц -р(X)]2 = м [(ц -р*а))+(р*а)-р(X))]2 =

= М [ц -р*а)? + м [рx)-р(X)]2 +

+ 2М [(ц -рX ))(р*(X) -р(X))].

Покажем, что последнее слагаемое равно нулю. Откуда и будет следовать утверждение теоремы.

Подставляя вместо р (X) выражение (10), получим

м (ц -р*(X))(р*(X)-р(X)) =

1 п I I *

= м (ц — ТМ цк )(р (X)-р(X))) = (11)

п к =1 1

1 п I I *

= -Т М (ц – м цк )(р (X) -р(X)).

п к =1 1

По свойствам условного математического

ожидания правая часть формулы (11) равна

1 Тм М [(ц -М (ц Xк )(р ’X) -р(X ))]|^к }=

п к =1 1 1

=1 Тм {;р*(X)-р(X))М (ц -м цк ))|хк} п к =1 II-‘

При этом п.н. для “к = 1,2,…, п имеем

М (ц – М цк ^к) = М цк) – ММ цк )|хк) =

=М цк) – М цк) = 0.

Таким образом, каждое слагаемое в правой части (11) равно нулю.

Этот результат естественен в контексте закона больших чисел. А именно, среднее результатов наблюдений лучше всего характеризуют изучаемый процесс. Близкие результаты, связанные с усреднением временных рядов, опубликованы в [8].

Литература

1. Федосеев В. В. и др. Экономико-математические методы и прикладные модели. М.: ЮНИТИ-ДАНА, 2005. 391 с.

2. Гельфонд А.О. Исчисление конечных разностей. М.: Наука, 2012. 376 с.

3. Агранович Ю.Я., Концевая Н.В., Хацкевич В.Л. Сглаживание временных рядов показателей финансовых рынков на основе многоугольных чисел // Прикладная эконометрика. 2010. № 3 (19) С. 3-8.

4. Джини К. Средние величины. М.: Статистика, 1970. 416 с.

5. Елисеева И.И. Эконометрика. М.: Финансы и статистика, 2002. 341 с.

6. Ширяев А.Н. Вероятность. М.: Наука, 1980.

576 с.

7. Тарг С.М. Краткий курс теоретической механики. М.: 1986. 478 с.

8. Скользящее усреднение на основе минимизации

невязки в формуле Эйлера-Маклорена / Ю.Я. Агранович, Н.В. Концевая, С.Л. Подвальный, В.Л. Хацкевич // Вестник Воронежского государственного технического университета. 2011. Т. 7. № 12.1. С. 4-6

Воронежский государственный технический университет

ABOUT SOME EXTREMAL PROPERTIES OF THE MEAN VALUES AND THE EXPECTATIONS OF RANDOM VARIBLES

V.L. Khatskevich

In this study an association between weight and the weight average of the least squares method was found. Found that the weighted average minimize the corresponding weighted standard deviations. The case of discrete and continuous medium was investigated, as well as the expectations of random variables. It is shown that the coordinates of the centers of masses of various mechanical systems have a characteristic extremal property

Key words: extremal property, weighted average, weighted mean square deviation

Добавить комментарий