Как найти мат ожидание эксель


Вычислим среднее значение выборки и математическое ожидание случайной величины в MS EXCEL.

Выборочное среднее


Среднее выборки

или

выборочное среднее

(sample average, mean) представляет собой

среднее

арифметическое

всех значений

выборки

.

В MS EXCEL для вычисления

среднего выборки

можно использовать функцию

СРЗНАЧ()

. В качестве аргументов функции нужно указать ссылку на диапазон, содержащий значения

выборки

.


Выборочное среднее

является «хорошей» (несмещенной и эффективной) точечной оценкой

математического ожидания

случайной величины (см.

ниже

), т.е.

среднего значения

исходного распределения, из которого взята

выборка

.


Примечание

: О вычислении

доверительных интервалов

при оценке

математического ожидания

можно прочитать, например, в статье

Доверительный интервал для оценки среднего (дисперсия известна) в MS EXCEL

.

Некоторые свойства

среднего арифметического

:

  • Сумма всех отклонений от

    среднего значения

    равна 0:

  • Если к каждому из значений x

    i

    прибавить одну и туже константу

    с

    , то

    среднее арифметическое

    увеличится на такую же константу;
  • Если каждое из значений x

    i

    умножить на одну и туже константу

    с

    , то

    среднее арифметическое

    умножится на такую же константу.

Математическое ожидание


Среднее значение

можно вычислить не только для выборки, но для случайной величины, если известно ее

распределение

. В этом случае

среднее значение

имеет специальное название –

Математическое ожидание.

Математическое ожидание

характеризует «центральное» или среднее значение случайной величины.


Примечание

: В англоязычной литературе имеется множество терминов для обозначения

математического ожидания

: expectation, mathematical expectation, EV (Expected Value), average, mean value, mean, E[X] или first moment M[X].

Если случайная величина имеет

дискретное распределение

, то

математическое ожидание

вычисляется по формуле:

где x

i

– значение, которое может принимать случайная величина, а р(x

i

) – вероятность, что случайная величина примет это значение.

Если случайная величина имеет

непрерывное распределение

, то

математическое ожидание

вычисляется по формуле:

где р(x) –

плотность вероятности

(именно

плотность вероятности

, а не вероятность, как в дискретном случае).

Для каждого распределения, из представленных в MS EXCEL,

Математическое ожидание

можно вычислить аналитически, как функцию от параметров распределения (см. соответствующие

статьи про распределения

). Например, для

Биномиального распределения

среднее значение

равно произведению его параметров: n*p (см.

файл примера

).

Свойства математического ожидания

E[a*X]=a*E[X], где а – const

E[X+a]=E[X]+a

E[a]=a

E[E[X]]=E[X] – т.к. величина E[X] – является const

E[X+Y]=E[X]+E[Y] – работает даже для случайных величин не являющихся независимыми.


СОВЕТ

: Про другие показатели распределения –

Дисперсию

и

Стандартное отклонение,

можно прочитать в статье

Дисперсия и стандартное отклонение в MS EXCEL

.

1.
Выборочная оценка математического
ожидания – выборочное среднее
в Excel
вычисляется с помощью
функция СРЗНАЧ,
при этом
реализуется формула
.

2.
Оценка дисперсии – несмещенная
(исправленная) выборочная дисперсияможет быть получена с помощью функцииДИСП.
В Excel
реализована формула
.

3.
Несмещенное выборочное средние
квадратические отклонения (стандартное
отклонение)
вычисляется
с помощью функции
СТАНДОТКЛОН
.
Вычисления
в Excel
выполнены по формуле

.

4.
Выборочная (смещенная) оценка дисперсии

вычисляется с помощью
функция ДИСПР.

Результат
вычисления выборочных оценок
,

,
и
показан на рис.1.

… … … …
… … …

Рис.
1. Фрагмент листа Excel
с исходными данными и выборочными
оценками параметров.

2. Описательная статистика.

Выполните
процедуру Описательная
статистика.

В
главном меню Excel
выбрать: Данные
→ Анализ данных → Описательная статистика
→ ОК
.

В
появившемся окне Описательная
статистика

ввести:

Входной
интервал

100 случайных чисел в ячейках $A$3:
$
A$102;

Группирование
– по столбцам;

Выходной
интервал

адрес ячейки, с которой начинается
таблица Описательная
статистика –
например,
$D$8;

Итоговая
статистика

– поставить галочку. ОК.

Рис.
2. Диалоговое окно Описательная
статистика

с заполненными полями ввода.

На
листе Excel
появится таблица – Столбец
1
. В
таблице даются все необходимые параметры,
кроме моды Mo(X).

Рис.
3. Таблица Описательная
статистика

Таблица содержит
описательные статистики, в частности:

Среднее
– оценка математического ожидания
;

Стандартное
отклонение

– оценка среднего квадратического
отклонения;

Дисперсия
– выборочная исправленная дисперсия
;

Эксцесс
и Асимметричность
– оценки эксцесса и асимметрии;

Медиана
– оценка
медианы;

Мода
– оценка
моды, #Н/Д – нет данных (наиболее часто
встречающееся значение случайной
величины в выборке).

Приблизительное
равенство нулю оценок эксцесса и
асимметрии, и приблизительное равенство
оценки среднего оценке медианы дает
предварительное основание выбрать в
качестве основной гипотезы
H0
распределения элементов генеральной
совокупности – нормальный закон.

Интервал
– размах выборки;

Минимум
– минимальное значение случайной
величины в выборке ;

Максимум
– максимальное значение случайной
величины в выборке .

Результаты
процедуры Описательная
статистика

потребуются в дальнейшем при построении
теоретического закона распределения.

3. Построение гистограммы

В
главном меню Excel
выбрать Данные
→ Анализ данных → Гистограмма → ОК
.

Далее
необходимо заполнить поля ввода в
диалоговом окне Гистограмма.

Входной
интервал:

100 случайных чисел в ячейках $A$3:
$
A$102;

Интервал
карманов:

не
заполнять;

Выходной
интервал:

адрес ячейки, с которой начинается вывод
результатов процедуры Гистограмма;

Вывод
графика

поставьте галочку.

Если
поле ввода Интервал
карманов
не
заполняется, то процедура вычисляет
число интервалов группировки k
и границы интервалов автоматически по
формуле.

,

где,
скобки
означают – округление до целой части
числа в меньшую сторону.

В
рассматриваемом варианте n
= 100
,
следовательно, k
= 11
.
Действительно:

Рис.
4. Диалоговое окно Гистограмма.

В
результате выполнения процедуры
Гистограмма
появляется таблица, содержащая границы
xi
интервалов
группировки (столбец – Карман)
и частоту попадания случайных величин
выборки mi
в i–ый
интервал (столбец

Частота
).

Справа от таблицы
– график гистограммы.

Рис.
5. Фрагмент листа Excel
с результатами процедуры Гистограмма.

По
виду гистограммы можно предположить
(принять гипотезу) о том, что выборка
случайных чисел подчиняется нормальному
закону распределения.

Далее,
для того чтобы убедиться в правильности
выбранной гипотезы (по крайней мере
визуально) надо, первое – построить
график гипотетического нормального
закона распределения, выбрав в качестве
параметров (математического ожидания
и среднего квадратического отклонении)
их оценки (среднее и стандартное
отклонение), и совместить график
гипотетического распределения с графиком
гистограммы.

И,
второе – используя критерий согласия
Пирсона установить справедливость
выбранной гипотезы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Не все явления измеряются в количественной шкале типа 1, 2, 3 … 100500 … Не всегда явление может принимать бесконечное или большое количество различных состояний. Например, пол у человека может быть либо М, либо Ж. Стрелок либо попадает в цель, либо не попадает. Голосовать можно либо «За», либо «Против» и т.д. и т.п. Другими словами, такие данные отражают состояние альтернативного признака – либо «да» (событие наступило), либо «нет» (событие не наступило). Наступившее событие (положительный исход) еще называют «успехом». 

Эксперименты с такими данными называются схемой Бернулли, в честь известного швейцарского математика, который установил, что при большом количестве испытаний соотношение положительных исходов и общего количества испытаний стремится к вероятности наступления этого события.

Переменная альтернативного признака

Для того, чтобы в анализе задействовать математический аппарат, результаты подобных наблюдений следует записать в числовом виде. Для этого положительному исходу присваивают число 1, отрицательному – 0. Другими словами, мы имеем дело с переменной, которая может принимать только два значения: 0 или 1.

Какую пользу отсюда можно извлечь? Вообще-то не меньшую, чем от обычных данных. Так, легко подсчитать количество положительных исходов – достаточно просуммировать все значения, т.е. все 1 (успехи). Можно пойти далее, но для этого потребуется ввести парочку обозначений.

Первым делом нужно отметить, что положительные исходы (которые равны 1) имеют некоторую вероятность появления. Например, выпадение орла при подбрасывании монеты равно ½ или 0,5. Такая вероятность традиционно обозначается латинской буквой p. Следовательно, вероятность наступления альтернативного события равна 1 — p, которую еще обозначают через q, то есть q = 1 – p. Указанные обозначения можно наглядно систематизировать в виде таблички распределения переменной X.

Распределение альтернативного признака

Мы получили перечень возможных значений и их вероятности. Можно рассчитать математическое ожидание и дисперсию. Матожидание – это сумма произведений всех возможных значений на соответствующие им вероятности:

Формула математического ожидания

Вычислим матожидание, используя обозначения в таблицы выше.

Математическое ожидание альтернативного признака

Получается, что математическое ожидание альтернативного признака равно вероятности этого события – p.

Теперь определим, что такое дисперсия альтернативного признака. Дисперсия – есть средний квадрат отклонений от математического ожидания. Общая формула (для дискретных данных) имеет вид:

Формула дисперсии для дискретных данных

Отсюда дисперсия альтернативного признака:

Дисперсия альтернативного признака

Нетрудно заметить, что эта дисперсия имеет максимум 0,25 (при p=0,5).

Стандартное отклонение – корень из дисперсии:

Среднее квадратическое отклонение альтернативного признака

Максимальное значение не превышает 0,5.

Как видно, и математическое ожидание, и дисперсия альтернативного признака имеют очень компактный вид.

Биномиальное распределение случайной величины

Рассмотрим ситуацию под другим углом. Действительно, кому интересно, что среднее выпадение орлов при одном бросании равно 0,5? Это даже невозможно представить. Интересней поставить вопрос о числе выпадения орлов при заданном количестве бросков.

Другими словами, исследователя часто интересует вероятность наступления некоторого числа успешных событий. Это может быть количество бракованных изделий в проверяемой партии (1- бракованная, 0 — годная) или количество выздоровлений (1 – здоров, 0 – больной) и т.д. Количество таких «успехов» будет равно сумме всех значений переменной X, т.е. количеству единичных исходов.

Биномиальная переменная

Случайная величина B называется биномиальной и принимает значения от 0 до n (при B = 0 – все детали годные, при B = n – все детали бракованные). Предполагается, что все значения x независимы между собой. Рассмотрим основные характеристики биномиальной переменной, то есть установим ее математическое ожидание, дисперсию и распределение.

Матожидание биномиальной переменной получить очень легко. Математическое ожидание суммы величин есть сумма математических ожиданий каждой складываемой величины, а оно у всех одинаковое, поэтому:

Математическое ожидание биномиальной переменной

Например, математическое ожидание количества выпавших орлов при 100 подбрасываниях равно 100 × 0,5 = 50.

Теперь выведем формулу дисперсии биномиальной переменной. Дисперсия суммы независимых случайных величин есть сумма дисперсий. Отсюда

Дисперсия биномиальной переменной

Стандартное отклонение, соответственно

Среднее квадратическое отклонение биномиальной переменной

Для 100 подбрасываний монеты стандартное отклонение количества орлов равно

Среднее квадратическое отклонение для 100 подкидываний монеты

И, наконец, рассмотрим распределение биномиальной величины, т.е. вероятности того, что случайная величина B будет принимать различные значения k, где 0≤ k ≤n. Для монеты эта задача может звучать так: какова вероятность выпадения 40 орлов при 100 бросках?

Чтобы понять метод расчета, представим, что монета подбрасывается всего 4 раза. Каждый раз может выпасть любая из сторон. Мы задаемся вопросом: какова вероятность выпадения 2 орлов из 4 бросков. Каждый бросок независим друг от друга. Значит, вероятность выпадения какой-либо комбинации будет равна произведению вероятностей заданного исхода для каждого отдельного броска. Пусть О – это орел, Р – решка. Тогда, к примеру, одна из устраивающих нас комбинаций может выглядеть как ООРР, то есть:

Комбинация выпадения 2 орлов при 4 выбрасываниях монеты

Вероятность такой комбинации равняется произведению двух вероятностей выпадения орла и еще двух вероятностей не выпадения орла (обратное событие, рассчитываемое как 1 — p), т.е. 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Такова вероятность одной из устраивающих нас комбинации. Но вопрос ведь стоял об общем количестве орлов, а не о каком-то определенном порядке. Тогда нужно сложить вероятности всех комбинаций, в которых присутствует ровно 2 орла. Ясно, все они одинаковы (от перемены мест множителей произведение не меняется). Поэтому нужно вычислить их количество, а затем умножить на вероятность любой такой комбинации. Подсчитаем все варианты сочетаний из 4 бросков по 2 орла: РРОО, РОРО, РООР, ОРРО, ОРОР, ООРР. Всего 6 вариантов.

6 варианта выпадения 2 орлов после 4 подбрасываний монеты

Следовательно, искомая вероятность выпадения 2 орлов после 4 бросков равна 6×0,0625=0,375.

Однако подсчет подобным образом утомителен. Уже для 10 монет методом перебора получить общее количество вариантов будет очень трудно. Поэтому умные люди давно изобрели формулу, с помощью которой рассчитывают количество различных сочетаний из n элементов по k, где n – общее количество элементов, k – количество элементов, варианты расположения которых и подсчитываются. Формула сочетания из n элементов по k такова:

Формула сочетания из n по k

Подобные вещи проходят в разделе комбинаторики. Всех желающих подтянуть знания отправляю туда. Отсюда, кстати, и название биномиального распределения (формула выше является коэффициентом в разложении бинома Ньютона).

Формулу для определения вероятности легко обобщить на любое количество n и k. В итоге формула биномиального распределения имеет следующий вид.

Формула биномиального распределения

Количество подходящих под условие комбинаций умножить на вероятность одной из них.

Для практического использования достаточно просто знать формулу биномиального распределения. А можно даже и не знать – ниже показано, как определить вероятность с помощью Excel. Но лучше все-таки знать.

Рассчитаем по этой формуле вероятность выпадения 40 орлов при 100 бросках:

Расчет 40 орлов

Или всего 1,08%. Для сравнения вероятность наступления математического ожидания этого эксперимента, то есть 50 орлов, равна 7,96%. Максимальная вероятность биномиальной величины принадлежит значению, соответствующему математическому ожиданию.

Расчет вероятностей биномиального распределения в Excel

Если использовать только бумагу и калькулятор, то расчеты по формуле биномиального распределения, несмотря на отсутствие интегралов, даются довольно тяжело. К примеру значение 100! – имеет более 150 знаков. Раньше, да и сейчас тоже, для вычисления подобных величин использовали приближенные формулы. В настоящий момент целесообразно использовать специальное ПО, типа MS Excel. Таким образом, любой пользователь (даже гуманитарий по образованию) вполне может вычислить вероятность значения биномиально распределенной случайной величины.

Для закрепления материала задействуем Excel пока в качестве обычного калькулятора, т.е. произведем поэтапное вычисление по формуле биномиального распределения. Рассчитаем, например, вероятность выпадения 50 орлов. Ниже приведена картинка с этапами вычислений и конечным результатом.

Расчет выпадения 40 орлов из 100 бросков монеты

Как видно, промежуточные результаты имеют такой масштаб, что не помещаются в ячейку, хотя везде и используются простые функции типа: ФАКТР (вычисление факториала), СТЕПЕНЬ (возведение числа в степень), а также операторы умножения и деления. Более того, этот расчет довольно громоздок, во всяком случаен не является компактным, т.к. задействовано много ячеек. Да и разобраться с ходу трудновато.

В общем в Excel предусмотрена готовая функция для вычисления вероятностей биномиального распределения. Функция называется БИНОМ.РАСП.

Функция биномиального распределения в Excel

Синтаксис функции состоит из 4 аргументов:

Заполнение параметров функции биномиального распределения

Поля имеют следующие назначения:

Число успехов – количество успешных испытаний. У нас их 50.

Число испытаний – количество бросков: 100 раз.

Вероятность успеха – вероятность выпадения орла при одном подбрасывании 0,5.

Интегральная – указывается либо 1, либо 0. Если 0, то рассчитается вероятность P(B=k); если 1, то рассчитается функция биномиального распределения, т.е. сумма всех вероятностей от B=0 до B=k включительно.

Нажимаем ОК и получаем тот же результат, что и выше, только все рассчиталось одной функцией.

Расчет выпадения 40 орлов функцией БИНОМ.РАСП.

Очень удобно. Эксперимента ради вместо последнего параметра 0 поставим 1. Получим 0,5398. Это значит, что при 100 подкидываниях монеты вероятность выпадения орлов в количестве от 0 до 50 равна почти 54%. А поначалу то казалось, что должно быть 50%. В общем, расчеты производятся легко и быстро.

Настоящий аналитик должен понимать, как ведет себя функция (каково ее распределение), поэтому произведем расчет вероятностей для всех значений от 0 до 100. То есть зададимся вопросом: какова вероятность, что не выпадет ни одного орла, что выпадет 1 орел, 2, 3, 50, 90 или 100. Расчет приведен в следующей картинке. Синяя линия – само биномиальное распределение, красная точка – вероятность для конкретного числа успехов k.

Расчет различных вероятностей биномиального распределения

Кто-то может спросить, а не похоже ли биномиальное распределение на… Да, очень похоже. Еще Муавр (в 1733 г.) говорил, что биномиальное распределение при больших выборках приближается к нормальному закону (не знаю, как это тогда называлось), но его никто не слушал. Только Гаусс, а затем и Лаплас через 60-70 лет вновь открыли и тщательно изучили нормальной закон распределения. На графике выше отлично видно, что максимальная вероятность приходится на математическое ожидание, а по мере отклонения от него, резко снижается. Также, как и у нормального закона.

Биномиальное распределение имеет большое практическое значение, встречается довольно часто. С помощью Excel расчеты проводятся легко и быстро.

Поделиться в социальных сетях:

Приветствую!

Прошу помочь студенту-первокурснику – необходимо найти (оценить с помощью приближенного интегрирования) математическое ожидание и дисперсию, найти точку максимума (моду) распределения в данной задаче (и, конечно, понять, как это делать в аналогичных задачах):

Построить на отрезке [0 ; 3] с шагом 0,1 график функции плотности вероятности Фишера со степенями свободы k1=5 и k2=9

Код

=10,7*A2^(($D$2-2)/2)*(1+($D$2/$E$2)*A2)^(-7)

Составить график не вызывает трудностей, однако я не могу разобраться, как найти ожидание, дисперсию и моду? Возможно, если мода – точка максимума, то ее находят просто путем нахождения точки максимума на графике через функцию “поиск решения”? Насчет ожидания и дисперсии: возможно, есть связь с оценкой по формуле правых/левых треугольников или трапеций? Но тогда как их здесь использовать? И какую именно формулу? Лишь формулу трапеций, для более точного результата?
Прилагаю составленный график.

Добавить комментарий