Как найти выборку если известна генеральная совокупность

Приступим к изучению элементов математической статистики, в которой разрабатываются научно обоснованные методы сбора статистических данных и их обработки.

Пусть требуется изучить множество однородных объектов (это множество называют статистической совокупностью) относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, если имеется партия деталей, то качественным признаком может служить соответствие детали стандартам, а количественным — контролируемый размер детали.

Лучше всего осуществить сплошное обследование, т. е. изучить каждый объект. Однако в большинстве случаев по разным причинам это сделать невозможно. Препятствовать сплошному обследованию может большое число объектов, их недоступность и т. п. Если, например, нужно знать среднюю глубину воронки при взрыве снаряда из опытной партии, то, проводя сплошное обследование, мы должны будем уничтожить всю партию.

Если сплошное обследование невозможно, то из всей совокупности выбирают для изучения часть объектов.

Статистическая совокупность, из которой отбирают часть объектов, называется генеральной совокупностью. Множество объектов, случайно отобранных из генеральной совокупности, называется выборкой.

Число объектов генеральной совокупности и выборки называется соответственно объемом генеральной совокупности и объемом выборки.

Пример. Плоды одного дерева (200 шт.) обследуют на наличие специфического для данного сорта вкуса. Для этого отбирают 10 шт. Здесь 200 —объем генеральной совокупности, а 10 —объем выборки.

Если выборку отбирают по одному объекту, который обследуют и снова возвращают в генеральную совокупность, то выборка называется повторной. Если объекты выборки уже не возвращаются в генеральную совокупность, то выборка называется бесповторной. На практике чаще используется бесповторная выборка. Если объем выборки составляет небольшую долю объема генеральной совокупности, то разница между повторной и бесповторной выборками незначительна

Свойства объектов выборки должны правильно отражать свойства объектов генеральной совокупности, или, как говорят, выборка должна быть репрезентативной (представительной). Считается, что выборка репрезентативна, если все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку, т. е. выбор осуществляется случайно. Например, для того чтобы оценить будущий урожай, можно сделать выборку из генеральной совокупности еще не созревших плодов и исследовать их характеристики (массу, качество и пр.). Если вся выборка будет взята с одного дерева, то она не будет репрезентативной. Репрезентативная выборка должна состоять из случайно выбранных плодов со случайно выбранных деревьев.

Статистическое распределение выборки. Полигон. Гистограмма

Пусть из генеральной совокупности извлечена выборка, причем Генеральная совокупность и выборка, наблюдалось Генеральная совокупностьраз, Генеральная совокупность раз, Генеральная совокупностьраз и Генеральная совокупность объем выборки. Наблюдаемые значения Генеральная совокупность называются вариантами, а последовательность вариант, записанная в возрастающем порядке,— вариационным рядом. Числа наблюдений Генеральная совокупность называют частотами, а их отношения к объему выборки Генеральная совокупностьГенеральная совокупностьотносительными частотами. Отметим, что сумма относительных частот равна единице:

Генеральная совокупность

Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот. Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (непрерывное распределение). В качестве частоты, соответствующей интервалу, принимают сумму частот вариант, попавших в этот интервал.

Заметим, что в теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике — соответствие между наблюдаемыми вариантами и их частотами или относительными частотами.

Пример:

Перейдем от частот к относительным частотам в следующем распределении выборки объема n = 20:

Генеральная совокупность

Найдем относительные частоты:

Генеральная совокупность

Поэтому получаем следующее распределение:

Генеральная совокупность

Для графического изображения статистического распределения используются полигоны и гистограммы.

Для построения полигона в декартовых координатах на оси Ох откладывают значения вариант Генеральная совокупность на оси Оу— значения частот Генеральная совокупность (относительных частот Генеральная совокупность).

Пример:

Рис. 14 представляет собой полигон следующего распределения:

Генеральная совокупность

Полигоном обычно пользуются в случае небольшого количества вариант. В случае большого количества вариант и в случае непрерывного распределения признака чаще строят гистограммы. Для этого интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов шириной h и находят для каждого частичного интервала Генеральная совокупность — сумму частот вариант, попавших в і-й интервал. Затем на этих интервалах как на основаниях строят прямоугольники с высотами Генеральная совокупность (или Генеральная совокупность, где n —объем выборки). Площадь i-го частичного прямоугольника равна Генеральная совокупность

Генеральная совокупность

Генеральная совокупность

(или Генеральная совокупность). Следовательно, площадь гистограммы равна сумме всех частот (или относительных частот), т. е. объему выборки (или единице).

Пример:

Рис. 15 показывает гистограмму непрерывного распределения объема n =100, заданного следующей таблицей:

Генеральная совокупность

Оценки параметров генеральной совокупности по ее выборке

Выборка как набор случайных величин

Пусть имеется некоторая генеральная совокупность, каждый объект которой наделен количественным признаком X. При случайном извлечении объекта из генеральной совокупности становится известным значение х признака X этого объекта. Таким образом, мы можем рассматривать извлечение объекта из генеральной совокупности как испытание, X—как случайную величину, а х —как одно из возможных значений X.

Допустим, что из теоретических соображений удалось установить, к какому типу распределений относится признак X. Естественно, возникает задача оценки (приближенного определения) параметров, которыми описывается это распределение. Например, если известно, что изучаемый признак распределен в генеральной совокупности нормально, то необходимо оценить, т. е. приближенно найти математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение.

Обычно в распоряжении исследователя имеются лишь данные выборки генеральной совокупности, например значения количественного признака Генеральная совокупность полученные в результате n наблюдений (здесь и далее наблюдения предполагаются независимыми). Через эти данные и выражают оцениваемый параметр.

Опытные значения признака X можно рассматривать и как значения разных случайных величин Генеральная совокупность с тем же распределением, что и X, и, следовательно, с теми же числовыми характеристиками, которые имеет X. Значит, Генеральная совокупность Величины Генеральная совокупность можно считать независимыми в силу независимости наблюдений. Значения Генеральная совокупность в этом случае называются реализациями случайных величин Генеральная совокупность Отсюда и из предыдущего следует, что найти оценку неизвестного параметра — это значит найти функцию от наблюдаемых случайных величин Генеральная совокупностьГенеральная совокупность которая и дает приближенное значение оцениваемого параметра.

Генеральная и выборочная средние. Методы их расчета

Пусть изучается дискретная генеральная совокупность объема N относительно количественного признака X.

Определение:

Генеральной средней Генеральная совокупность (или а) называется среднее арифметическое значений признака генеральной совокупности.

Если все значения Генеральная совокупность признака генеральной совокупности объема N различны, то

Генеральная совокупность

Если же значения признака Генеральная совокупность имеют соответственно частоты Генеральная совокупность причем Генеральная совокупность то

Генеральная совокупность

или

Генеральная совокупность

Как уже отмечалось (п. 1), извлечение объекта из генеральной совокупности есть наблюдение случайной величины X.

Пусть все значения Генеральная совокупность различны. Так как каждый объект может быть извлечен с одной и той же вероятностью 1/N, то

Генеральная совокупность

т. е.

Генеральная совокупность

Такой же итог следует, если значения Генеральная совокупность имеют соответственно частоты Генеральная совокупность

В случае непрерывного распределения признака X по определению полагают Генеральная совокупность

Пусть для изучения генеральной совокупности относительно количественного признака X произведена выборка объема n.

Определение:

Выборочной средней Генеральная совокупность, называется среднее арифметическое значений признака выборочной совокупности.

Если все значения Генеральная совокупность признака выборки объема n различны, то

Генеральная совокупность

Если же значения признака Генеральная совокупность имеют соответственно частоты Генеральная совокупность причем Генеральная совокупность, то

Генеральная совокупность

или

Генеральная совокупность

Пример:

Выборочным путем были получены следующие данные о массе 20 морских свинок при рождении (в г): 30, 30, 25, 32, 30, 25, 33, 32, 29, 28^27, 36, 31, 34, 30, 23, 28, 31, 36, 30. Найдем выборочную среднюю Генеральная совокупность

Согласно формуле (4.4), имеем:

Генеральная совокупность

Итак, Генеральная совокупность

Далее, не уменьшая общности рассуждений, будем считать значения Генеральная совокупность признака различными.

Разумеется, выборочная средняя для различных выборок того же объема n из той же генеральной совокупности будет получаться, вообще говоря, различной. И это не удивительно — ведь извлечение і-го по счету объекта есть наблюдение случайной величины Генеральная совокупность а их среднее арифметическое

Генеральная совокупность

есть тоже случайная величина.

Таким образом, всевозможные получающиеся выборочные средние есть возможные значения случайной величины Генеральная совокупность, которая называется выборочной средней случайной величиной.

Найдем Генеральная совокупность, пользуясь тем, что Генеральная совокупность (см. п. 1).

С учетом свойств математического ожидания (см. гл. II) получаем:

Генеральная совокупность

Итак, Генеральная совокупность (математическое ожидание выборочной средней) совпадает с а (генеральной средней).

Теперь найдем Генеральная совокупность Так как Генеральная совокупность (п. 1) и Генеральная совокупность независимы, то, согласно свойствам дисперсии (см. гл. II), получаем

Генеральная совокупность

T. e.

Генеральная совокупность

Наконец, отметим, что если варианты Генеральная совокупность—большие числа, то для облегчения вычисления выборочной средней применяют следующий прием. Пусть С — константа.

Так как

Генеральная совокупность

то формулу (4.3) можно преобразовать к виду

Генеральная совокупность

За константу С (так называемый ложный нуль) берут некоторое среднее значение между наименьшим и наибольшим значениями х, (і- 1, 2, …, n).

Пример:

Имеется выборка:

Генеральная совокупность

Требуется найти Генеральная совокупность

Возьмем С =72,00 и вычислим разности Генеральная совокупность

Генеральная совокупность

Их сумма: Генеральная совокупность их среднее арифметическоеГенеральная совокупность Выборочная средняя

Генеральная совокупность

Генеральная и выборочная дисперсии

Для того чтобы охарактеризовать рассеяние значений количественного признака X генеральной совокупности вокруг своего среднего значения, вводят следующую характеристику — генеральную дисперсию.

Определение:

Генеральной дисперсией D, называется среднее арифметическое квадратов отклонений значений признака X генеральной совокупности от генеральной средней Генеральная совокупность

Если все значения Генеральная совокупность признака генеральной совокупности объема N различны, то

Генеральная совокупность

Если же значения признака Генеральная совокупность имеют соответственно
частоты Генеральная совокупность причем Генеральная совокупность то

Генеральная совокупность

Пример:

Генеральная совокупность задана таблицей распределения:

Генеральная совокупность

Найдем генеральную дисперсию.

Согласно формулам (4.1) и (4.7), имеем:

Генеральная совокупность

Генеральным средним квадратическим отклонением (стандартом) называется Генеральная совокупность

Пусть все значения Генеральная совокупностьразличны.

Найдем дисперсию признака X, рассматриваемого как случайная величина:

Генеральная совокупность

Так как Генеральная совокупность(см. п. 2), то

Генеральная совокупность

т. е.

Генеральная совокупность

Таким образом, дисперсия D(X) равна Генеральная совокупность

Такой же итог можно получить, если значения Генеральная совокупность имеют соотвественно частоты Генеральная совокупность

В случае непрерывного распределения признака X по определению полагают

Генеральная совокупность

С учетом формулы (4.8) формула (4.5) (п. 2) перепишется в виде

Генеральная совокупность

откуда Генеральная совокупность или Генеральная совокупность Величина Генеральная совокупность называется средней квадратической ошибкой.

Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения Генеральная совокупность вводят выборочную дисперсию.

Определение:

Выборочной дисперсией Генеральная совокупность, называется среднее арифметическое квадратов отклонений наблюдаемых значений признака X от выборочной средней Генеральная совокупность

Если все значения Генеральная совокупностьпризнака выборки объема n различны, то

Генеральная совокупность

Если же значения признака Генеральная совокупность имеют соответственно частоты Генеральная совокупность причем Генеральная совокупность то

Генеральная совокупность

Пример:

Пусть выборочная совокупность задана таблицей распределения:

Генеральная совокупность

Найдем выборочную дисперсию. Согласно формулам (4.4) и (4.10), имеем:

Генеральная совокупность

Выборочным средним квадратическим отклонением (стандартом) называется квадратный корень из выборочной дисперсии:

Генеральная совокупность

В условиях примера 2 получаем, что Генеральная совокупность

Далее, не уменьшая общности рассуждений, будем считать значения Генеральная совокупностьпризнака различными.

Выборочную дисперсию, рассматриваемую нами как случайная величина, будем обозначать Генеральная совокупность

Генеральная совокупность

Теорема:

Математическое ожидание выборочной дисперсии равно Генеральная совокупность т.е.

Генеральная совокупность

Доказательство:

С учетом свойств математического ожидания (см. гл. II) получаем

Генеральная совокупность

Вычислим одно слагаемое Генеральная совокупность Имеем

Генеральная совокупность

Вычислим по отдельности эти математические ожидания.

Согласно свойству I дисперсии (см. гл. И) и формулам (4.2), (4.8) имеем

Генеральная совокупность

Далее, с учетом свойства 4 математического ожидания (см. гл. II)

Генеральная совокупность

но слагаемое этой суммы, у которого второй индекс равен і, т.е. Генеральная совокупность, равно Генеральная совокупность У всех остальных слагаемых Генеральная совокупность индексы разные. Поэтому в силу независимости Генеральная совокупность (см. гл. II)

Генеральная совокупность

Так как имеется n-1 таких слагаемых, то

Генеральная совокупность

В силу свойства 1 дисперсии (см. гл. П) получаем

Генеральная совокупность

Нами уже найден (см. пп. 2 и 3):

Генеральная совокупность

Поэтому

Генеральная совокупность

Таким образом,

Генеральная совокупность

и не зависит от индекса суммирования і. Поэтому

Генеральная совокупность

Что и требовалось доказать.

В заключение этого пункта отметим, что если варианты Генеральная совокупность— большие числа, то для облегчения вычисления выборочной дисперсии Генеральная совокупность, формулу (4.9) преобразуют к следующему виду:

Генеральная совокупность

где С—ложный нуль.

Действительно, с учетом формулы (4.3) имеем

Генеральная совокупность

откуда

Генеральная совокупность

Пример:

Для выборки, указанной в примере 2 из п. 2, найдем Генеральная совокупность (ложный нуль остается прежним С= 72,00)

Генеральная совокупность

Наконец, согласно формуле (4.11)

Генеральная совокупность

Оценки параметров распределения

Одной из задач статистики является оценка параметров распределения случайной величины X по данным выборки. При этом в теоретических рассуждениях считают, что генеральная совокупность бесконечна. Это делается для того, чтобы можно было переходить к пределу при Генеральная совокупность где n — объем выборки. Для оценки параметров распределения X из данных выборки составляют выражения, которые должны служить оценками неизвестных параметров. Например, Генеральная совокупность (см. п. 2) является оценкой генеральной средней, а Генеральная совокупность (см. п. 3) — оценкой генеральной дисперсии Генеральная совокупность Обозначим через Генеральная совокупность оцениваемый параметр, через Генеральная совокупность — оценку этого параметраГенеральная совокупность является выражением^ составленным из Генеральная совокупность (см. п. 1)]. Для того чтобы оценка Генеральная совокупность давала хорошее приближение, она должна удовлетворять определенным требованиям. Укажем эти требования.

Несмещенной называют оценку Генеральная совокупность математическое ожидание которой равно оцениваемому параметру Генеральная совокупность, т. е. Генеральная совокупность в противном случае оценка называется смещенной.

Пример:

Оценка Генеральная совокупность является несмещенной оценкой генеральной средней а, так как Генеральная совокупность (см. п. 2).

Пример:

Оценка Генеральная совокупность является смещенной оценкой генеральной дисперсии Генеральная совокупность так как, согласно установленной выше теореме (см. п. 3),

Генеральная совокупность

Пример:

Наряду с выборочной дисперсией Генеральная совокупность рассматривают еще так называемую исправленную дисперсию Генеральная совокупность которая является также оценкой генеральной дисперсии. Для Генеральная совокупность с учетом установленной выше теоремы (см. п. 3) имеем

Генеральная совокупность

Таким образом, оценка Генеральная совокупность в отличие от оценки Генеральная совокупность является несмещенной оценкой генеральной дисперсии. Явное выражение для Генеральная совокупность имеет вид

Генеральная совокупность

T. e.

Генеральная совокупность

Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки для того, чтобы не делать систематической ошибки в сторону завышения или занижения.

Состоятельной называют такую оценку Генеральная совокупность параметра Генеральная совокупность, что для любого наперед заданного числа Генеральная совокупность вероятность Генеральная совокупность при Генеральная совокупностьстремится к единице*. Это значит, что при достаточно больших n можно с вероятностью, близкой к единице, т. е. почти наверное, утверждать, что оценка Генеральная совокупность отличается от оцениваемого параметра Генеральная совокупность меньше, чем на Генеральная совокупность

Очевидно, такому требованию должна удовлетворять всякая оценка, пригодная для практического использования.

Заметим, что несмещенная оценка Генеральная совокупность будет состоятельной, если при Генеральная совокупность дисперсия стремится к нулю: Генеральная совокупность Это следует из неравенства Чебышева ((2.33) см. § 2.8, п. 1).

Пример:

Как было установлено (см. п. 3), Генеральная совокупность. Отсюда следует, что несмещенная оценка Генеральная совокупность является и состоятельной, так как

Генеральная совокупность

Можно показать, что несмещенная оценка Генеральная совокупность является также состоятельной. Поэтому в качестве оценки генеральной дисперсии принимают исправленную дисперсию. Заметим, что оценки Генеральная совокупность отличаются множителемГенеральная совокупность, который стремится к 1 при Генеральная совокупность. На практике Генеральная совокупность не различают при n > 30.

Для оценки генерального среднего квадратического отклонения используют исправленное среднее квадратическое отклонение, которое равно квадратному корню из исправленной дисперсии:

Генеральная совокупность

Левые части формул (4.12), (4.13), в которых случайные величины Генеральная совокупность заменены их реализациями Генеральная совокупностьвыборочной средней Генеральная совокупность будем обозначать соответственно через Генеральная совокупностьи s

Отметим, что если варианты Генеральная совокупность — большие числа, то для облегчения вычисления Генеральная совокупность формулу для Генеральная совокупность аналогично формуле (4.9) преобразуют к виду

Генеральная совокупность

где С—ложный нуль.

Оценки, обладающие свойствами несмещенности и состоятельности, при ограниченном числе опытов могут отличаться дисперсиями.

Ясно, что чем меньше дисперсия оценки, тем меньше вероятность грубой ошибки при определении приближенного значения параметра. Поэтому необходимо, чтобы дисперсия оценки была минимальной. Оценка, обладающая таким свойством, называется эффективной.

Из отмеченных требований, предъявляемых к оценке, наиболее важными являются требования несмещенности и состоятельности.

Пример:

С плодового дерева случайным образом отобрано 10 плодов. Их массы Генеральная совокупность (в граммах) записаны в первой колонке приведенной ниже таблицы. Обработаем статистические данные выборки. Для вычисления Генеральная совокупность и s пo формулам (4.6) и (4.14) введем ложный нуль С=250 и все необходимые при этом вычисления сведем в указанную таблицу:

Генеральная совокупность

Следовательно,

Генеральная совокупность

Генеральная совокупность

Отсюда Генеральная совокупность

Итак, оценка генеральной средней массы плода равна 243 г со средней квадратической ошибкой 9 г.

Оценка генерального среднего квадратического отклонения массы плода равна 28 г.

Пример:

Через каждый час измерялось напряжение в электросети. Результаты измерений (в вольтах) представлены в следующей таблице:

Генеральная совокупность

Найти оценки для математического ожидания и дисперсии результатов измерений. Оценки для математического ожидания и дисперсии найдем по формулам (6) и (14), положив С=220. Все необходимые вычисления приведены в нижеследующей таблице:

Генеральная совокупность

Следовательно,

Генеральная совокупность

Доверительные интервалы для параметров нормального распределения

Пусть Генеральная совокупность — оцениваемый параметр, Генеральная совокупность — его оценка, составленная из Генеральная совокупность

Если известно, что оценка Генеральная совокупность является несмещенной и состоятельной, то по данным выборки вычисляют значение Генеральная совокупность и считают его приближением истинного значения Генеральная совокупность. При этом среднее квадратическое отклонение (если его вообще вычисляют) оценивает порядок ошибки. Такие оценки называются точечными. Например, в предыдущем параграфе речь шла о точечных оценках генеральной средней и генеральной дисперсии. В общем случае, когда о распределении признака X ничего неизвестно, это уже немало.

Если же о распределении имеется какая-либо информация, то можно сделать больше.

Здесь речь будет идти об оценке параметров а и Генеральная совокупность случайной величины, имеющей нормальное распределение. Это очень важный случай. Например (см. § 2.7), результат измерения имеет нормальное распределение. В этом случае становится возможным применять так называемое интервальное оценивание, к изложению которого мы и переходим.

Пусть Генеральная совокупность — некоторое число. Если выполняется неравенство Генеральная совокупность что можно записать в виде Генеральная совокупностьГенеральная совокупность то говорят, что интервал Генеральная совокупность покрывает параметр Генеральная совокупность. Однако невозможно указать оценку Генеральная совокупность такую, чтобы событие Генеральная совокупность было достоверным, поэтому мы будем говорить о вероятности этого события. Число Генеральная совокупность называется точностью оценки Генеральная совокупность

Определение:

Надежностью (доверительной вероятностью) оценки Генеральная совокупность параметра Генеральная совокупность0 для заданного Генеральная совокупность называется вероятность Генеральная совокупность того, что интервал Генеральная совокупность покроет параметр Генеральная совокупность, т. е.

Генеральная совокупность

Заметим, что после того, как по данным выборки вычислена оценка Генеральная совокупность, событие Генеральная совокупность становится или достоверным, или невозможным, так как интервал Генеральная совокупность или покрывает Генеральная совокупность, или нет. Но дело в том, что параметр Генеральная совокупность нам неизвестен. Поэтому мы называем надежностью Генеральная совокупность уже вычисленной оценки Генеральная совокупность вероятность того, что интервал Генеральная совокупность, найденный для произвольной выборки, покроет Генеральная совокупность. Если мы сделаем много выборок объема n и для каждой из них построим интервал Генеральная совокупность, то доля тех выборок, чьи интервалы покроют Генеральная совокупность, равна Генеральная совокупность.

Иными словами, Генеральная совокупность есть мера нашего доверия вычисленной оценке Генеральная совокупность
Ясно, что, чем меньше число Генеральная совокупность, тем меньше надежность Генеральная совокупность.

Определение:

Доверительным интервалом называется найденный по данным выборки интервал Генеральная совокупность, который покрывает параметр Генеральная совокупность с заданной надежностью Генеральная совокупность.

Надежность Генеральная совокупность обычно принимают равной 0,95 или 0,99, или 0,999.

Конечно, нельзя категорически утверждать, что найденный доверительный интервал покрывает параметр Генеральная совокупность. Но в этом можно быть уверенным на 95% при Генеральная совокупность = 0,95, на 99% при Генеральная совокупность=0,99 и т. д. Это значит, что если сделать много выборок, то для 95% из них (если, например, Генеральная совокупность = 0,95) вычисленные доверительные интервалы действительно покроют Генеральная совокупность.

Доверительный интервал для математического ожидания при известном

Доверительный интервал для математического ожидания при известном Генеральная совокупность

В некоторых случаях среднее квадратическое отклонение о ошибки измерения (а вместе с нею и самого измерения) бывает известно. Например, если измерения осуществляются одним и тем же прибором при одних и тех же условиях.

Итак, пусть случайная величина X распределена нормально с параметрами а и Генеральная совокупность, причем Генеральная совокупность известно. Построим доверительный интервал, покрывающий неизвестный параметр а с заданной надежностью Генеральная совокупность. Данные выборки есть реализации случайных величин Генеральная совокупность имеющих нормальное распределение с параметрами а и Генеральная совокупность (§ 4.2, п. 1). Оказывается, что и выборочная средняя случайная величина Генеральная совокупность тоже имеет нормальное распределение (это мы примем без доказательства). При этом (см. § 4.2, пп. 2, 3)

Генеральная совокупность

Потребуем, чтобы выполнялось соотношение Генеральная совокупность где Генеральная совокупность—заданная надежность. Пользуясь формулой (2.27) (§ 2.7, п. 2), получим

Генеральная совокупность

или

Генеральная совокупность

где

Генеральная совокупность

Найдя из равенства (4.15) Генеральная совокупность можем написать

Генеральная совокупность

Так как Р задана и равна Генеральная совокупность, то окончательно имеем (для получения рабочей формулы выборочную среднюю заменяем на Генеральная совокупность):

Генеральная совокупность

Смысл полученного соотношения таков: с надежностью у можно утверждать, что доверительный интервал Генеральная совокупность покрывает неизвестный параметр а; точность оценки Генеральная совокупность. Здесь число t определяется из равенства Генеральная совокупность(оно следует из Генеральная совокупность по таблице приложения 3.

Как уже упоминалось, надежность Генеральная совокупность обычно принимают равной или 0,95 или 0,99, или 0,999.

Пример:

Признак X распределен в генеральной совокупности нормально с известным Генеральная совокупность = 0,40. Найдем по данным выборки доверительный интервал для а с надежностью Генеральная совокупность = 0,99, если n = 20, Генеральная совокупность = 6,34.

Для Генеральная совокупность находим по таблице приложения 3
t=2,58. Следовательно, Генеральная совокупность. Границы доверительного интервала 6,34 — 0,23 = 6,11 и 6,34 + 0,23 = 6,57. Итак, доверительный интервал (6,11; 6,57) покрывает а с надежностью 0,99.

Доверительный интервал для математического ожидания при неизвестном

Доверительный интервал для математического ожидания при неизвестном Генеральная совокупность.

Пусть случайная величина X имеет нормальное распределение с неизвестными нам параметрами а и Генеральная совокупность. Оказывается, что случайная величина (ее возможные значения будем обозначать через t)

Генеральная совокупность

где n —объем выборки; Генеральная совокупность — выборочная средняя; S—исправленное среднее квадратическое отклонение, имеет распределение, не зависящее от а и Генеральная совокупность. Оно называется распределением Стьюдента*.

Плотность вероятности распределения Стьюдента дается формулой

Генеральная совокупность

где коэффициент Генеральная совокупность зависит от объема выборки.

Потребуем, чтобы выполнялось соотношение

Генеральная совокупность

где Генеральная совокупность—заданная надежность.

Так как S(t, n) — четная функция от t, то, пользуясь формулой
(2.15) (см. § 2.5), получим

Генеральная совокупность

Отсюда

Генеральная совокупность

Следовательно, приходим к утверждению: с надежностью Генеральная совокупность можно утверждать, что доверительный интервал Генеральная совокупность покрывает неизвестный параметр а, точность оценки Генеральная совокупность-. Здесь случайные величины Генеральная совокупность и S заменены неслучайными величинами Генеральная совокупность и s, найденными по выборке.

В приложении 4 приведена таблица значений Генеральная совокупность для различных значений n и обычно задаваемых значений надежности.

Заметим, что при Генеральная совокупность распределение Стьюдента практически не отличается от нормированного нормального распределения
(см. § 2.7, п. 2). Это связано с тем, что Генеральная совокупность

Пример. Признак X распределен в генеральной совокупности нормально. Найдем доверительный интервал для Генеральная совокупность с надежностью Генеральная совокупность =0,99, если Генеральная совокупность Для надежности Генеральная совокупность =0,99 и n = 20 находим по таблице приложения 4 Генеральная совокупность Следовательно, Генеральная совокупность. Концы доверительного интервала 6,34-0,26 =
= 6,08 и 6,34 + 0,26 = 6,60. Итак, доверительный интервал (6,08; 6,60) покрывает Генеральная совокупность с надежностью 0,99.

Доверительный интервал для среднего квадратического отклонения

Для нахождения доверительного интервала для среднего квадратического отклонения Генеральная совокупность будем использовать следующее предложение, устанавливаемое аналогично двум предыдущим (пп. 2 и 3).

С надежностью Генеральная совокупность можно утверждать, что доверительный интервал Генеральная совокупность покрывает неизвестный параметр Генеральная совокупность; точность оценки Генеральная совокупность

В приложении 5 приведена таблица значений Генеральная совокупность для различных значений n и обычно задаваемых значений надежности Генеральная совокупность.

Пример:

Признак X распределен в генеральной совокупности нормально. Найдем доверительный интервал для Генеральная совокупность с надежностью Генеральная совокупность=0,95, если n = 20, s = 0,40.

Для надежности Генеральная совокупность=0,95 и n = 20 находим в таблице приложения 5 q = 0,37. Далее, sq = 0,40 0,37 = 0,15. Границы доверительного интервала 0,40-0,15 = 0,25 и 0,40 + 0,15 = 0,55. Итак, доверительный интервал (0,25; 0,55) покрывает Генеральная совокупность с надежностью 0,95.

Пример:

На ферме испытывалось влияние витаминов на прибавку в массе телят. С этой целью было осмотрено 20 телят одного возраста. Средняя масса их оказалась равной 340 кг, а «исправленное» среднее квадратическое отклонение — 20 кг.

Определим: 1) доверительный интервал для математического ожидания а с надежностью 0,95; 2) доверительный интервал для среднего квадратического отклонения с той же надежностью.

При решении задачи будем исходить из предположения, что данные пробы взяты из нормальной генеральной совокупности.

Решение:

1) Согласно условиям задачи, Генеральная совокупностьn = 20.

Пользуясь распределением Стьюдента, для надежности у=0,95 и n = 20 находим в таблице приложения 4 Генеральная совокупность Следовательно, Генеральная совокупность Границы доверительного интервала 340-9,4 =
= 330,6 и 340 + 9,4 = 349,4. Итак, доверительный интервал (330,6; 349,4) покрывает а с надежностью 0,95.

Можно считать, что в данном случае истинная масса измерена 9 4 достаточно точно (отклонение порядка Генеральная совокупность).

2) Для надежности у =0,95 и n = 20 находим в таблице приложения 5 q = 0,37. Далее, sq = 20 * 0,37 = 7,4. Границы доверительного интервала 20 — 7,4 = 12,6 и 20 + 7,4 = 27,4. Таким образом, 12,6 < Генеральная совокупность < 27,4, откуда можно заключить, что Генеральная совокупность определено неудовлетворительно (отклонение порядка Генеральная совокупность — почти половина!). Чтобы сузить доверительный интервал при той же надежности, необходимо увеличить число проб n.

Примечание. Выше предполагалось, что q<1. Если q> 1, то, учитывая, что Генеральная совокупность>0, получаем 0<Генеральная совокупность<s + sq. Значения q и в этом случае определяются по таблице приложения 5.

Пример:

Признак X генеральной совокупности распределен нормально. По выборке объема n = 10 найдено «исправленное» среднее квадратическое отклонение s = 0,16. Найдем доверительный интервал для Генеральная совокупность с надежностью 0,999.

Для надежности у = 0,999 и n= 10 по таблице приложения 5 находим q=1,80.

Следовательно, искомый доверительный интервал таков’

Генеральная совокупность

или

Генеральная совокупность

Оценка истинного значения измеряемой величины

Пусть проводится n независимых равноточных измерений* некоторой физической величины, истинное значение а которой неизвестно. Будем рассматривать результаты отдельных измерений как случайные величины Генеральная совокупность Эти величины независимы (измерения независимы), имеют одно и то же математическое ожидание а (истинное значение измеряемой величины), одинаковые дисперсии Генеральная совокупность (измерения равноточны) и распределены нормально (такое допущение подтверждается опытом). Таким образом, все предположения, которые были сделаны при выводе доверительных интервалов в пп. 2 и 3 настоящего параграфа, выполняются, следовательно, мы вправе использовать полученные в них предложения. Так как обычно Генеральная совокупность неизвестно, следует пользоваться предложением, найденным в п. 3 данного параграфа.

Пример:

По данным девяти независимых равноточных измерений физической величины найдены среднее арифметическое результатов отдельных измерений Генеральная совокупность и «исправленное» среднее квадратическое отклонение s = 5,0. Требуется оценить истинное значение а измеряемой величины с надежностью у = 0,99.

Истинное значение измеряемой величины равно ее математическому ожиданию. Поэтому задача сводится к оценке математического ожидания (при неизвестном Генеральная совокупность) при помощи доверительного интервала

Генеральная совокупность

покрывающего а с заданной надежностью у=0,99.

Пользуясь таблицей приложения 4 по у=0,99 и n = 9, находим Генеральная совокупность

Найдем точность оценки:

Генеральная совокупность

Границы доверительного интервала

Генеральная совокупность

и

Генеральная совокупность

Итак, с надежностью у=0,99 истинное значение измеренной величины а заключено в доверительном интервале 36,719<а< 47,919.

Оценка точности измерений

В теории ошибок принято точность измерений (точность прибора) характеризовать с помощью среднего квадратического отклонения Генеральная совокупность случайных ошибок измерений. Для оценки Генеральная совокупность используют «исправленное» среднее квадратическое отклонение s. Поскольку обычно результаты измерений независимы, имеют одно и то же математическое ожидание (истинное значение измеряемой величины) и одинаковую дисперсию (в случае равноточных измерений), то утверждение, приведенное в п. 4, применимо для оценки точности измерений.

Пример:

По 16 независимым равноточным измерениям найдено «исправленное» среднее квадратическое отклонение s=0,4. Найдем точность измерений с надежностью у = 0,99.

Как отмечено выше, точность измерений характеризуется средним квадратическим отклонением о случайных ошибок измерений. Поэтому задача сводится к отысканию доверительного интервалаГенеральная совокупность покрывающего Генеральная совокупность с заданной надежностью у=0,99 (см. п. 4). По таблице приложения 5 по у = 0,99 и n=16 найдем q = 0,70. Следовательно, искомый доверительный интервал таков:

Генеральная совокупность

или

Генеральная совокупность

Решение заданий и задач по предметам:

  • Теория вероятностей
  • Математическая статистика

Дополнительные лекции по теории вероятностей:

  1. Случайные события и их вероятности
  2. Случайные величины
  3. Функции случайных величин
  4. Числовые характеристики случайных величин
  5. Законы больших чисел
  6. Статистические оценки
  7. Статистическая проверка гипотез
  8. Статистическое исследование зависимостей
  9. Теории игр
  10. Вероятность события
  11. Теорема умножения вероятностей
  12. Формула полной вероятности
  13. Теорема о повторении опытов
  14. Нормальный закон распределения
  15. Определение законов распределения случайных величин на основе опытных данных
  16. Системы случайных величин
  17. Нормальный закон распределения для системы случайных величин
  18. Вероятностное пространство
  19. Классическое определение вероятности
  20. Геометрическая вероятность
  21. Условная вероятность
  22. Схема Бернулли
  23. Многомерные случайные величины
  24. Предельные теоремы теории вероятностей
  25. Оценки неизвестных параметров

Один из первых шагов при планировании количественного маркетингового исследования – определение объема выборки.

Калькулятор для расчета достаточного объема выборки
Калькулятор ошибки выборки для доли признака
Калькулятор ошибки выборки для среднего значения
Калькулятор значимости различий долей
Калькулятор значимости различий средних

1. Формула (даже две)

Бытует заблуждение, что чем больше объем генеральной совокупности, тем больше должен быть объем выборки маркетингового исследования. Это отчасти так, когда объем выборки сопоставим с размером генеральной совокупности. Например, при опросах организаций (B2B).

Если речь идет об исследовании жителей городов, то не важно, Москва это или Рязань – оптимальный объем выборки будет одинаков в обоих городах. Этот принцип следует из закона больших чисел и применим, только если выборка простая случайная.

На рис.1. пример выборки 15000 человек (!) при опросе в муниципальном районе. Возможно, от численности населения взяли 10%?
Размер выборки никогда не рассчитывается как процент от генеральной совокупности!

пример неправильного размера выборки, как опеределить размер выборки

Рис.1. Размер выборки 15000 человек, как реальный пример некомпетентности (или хуже).

В таких случаях для расчета объема выборки используется следующая формула:

SampleSize_formula_1.png

где 

n – объем выборки,
Z – коэффициент, зависящий от выбранного исследователем доверительного уровня,
p – доля респондентов с наличием исследуемого признака,
q = 1 – p – доля респондентов, у которых исследуемый признак отсутствует,
∆ – предельная ошибка выборки.

Доверительный уровень – это вероятность того, что реальная доля лежит в границах полученного доверительного интервала: выборочная доля (p) ± ошибка выборки (Δ). Доверительный уровень устанавливает сам исследователь в соответствии со своими требованиями к надежности полученных результатов. Чаще всего применяются доверительные уровни, равные 0,95 или 0,99. В маркетинговых исследованиях, как правило, выбирается доверительный уровень, равный 0,95. При этом уровне коэффициент Z равен 1,96.

Значения p и q чаще всего неизвестны до проведения исследования и принимаются за 0,5. При этом значении размер ошибки выборки максимален.

Допустимая предельная ошибка выборки выбирается исследователем в зависимости от целей исследования. Считается, что для принятия бизнес-решений ошибка выборки должна быть не больше 4%. Этому значению соответствует объем выборки 500-600 респондентов. Для важных стратегических решений целесообразно минимизировать ошибку выборки.

Рассмотрим кривую зависимости ошибки выборки от ее объема (Рис.2).

SampleSize_img1.png

Рис.2. Зависимость ошибки выборки от ее объема при 95% доверительном уровне

Как видно из диаграммы, с ростом объема выборки значение ошибки уменьшается все медленнее. Так, при объеме выборки 1500 человек предельная ошибка выборки составит ±2,5%, а при объеме 2000 человек – ±2,2%. То есть, при определенном объеме выборки дальнейшее его увеличение не дает значительного выигрыша в ее точности.

ШПАРГАЛКА (скопируйте  ссылку или текст)

Подходы к решению проблемы:


Случай 1. Генеральная совокупность значительно больше выборки:

SampleSize_formula_2.png

Случай 2. Генеральная совокупность сопоставима с объемом выборки: (см. раздел исследований B2B)

SampleSize_formula_3.png

где 
n – объем выборки,

N – объем генеральной совокупности, 


Z – коэффициент, зависящий от выбранного исследователем доверительного уровня,


p – доля респондентов с наличием исследуемого признака,


q = 1 – p – доля респондентов, у которых исследуемый признак отсутствует, (значения p и q обычно принимаются за 0,5, поскольку точно неизвестны до проведения исследования) 


∆ – предельная ошибка выборки.

Например,

рассчитаем ошибку выборки объемом 
1000 человек при 95% доверительном уровне, если генеральная совокупность значительно больше объема выборки: 

Ошибка выборки = 1,96 * КОРЕНЬ(0,5*0,5/1000) = 0,031 = ±3,1%

При расчете объема выборки следует также учитывать стоимость проведения исследования. Например, при цене за 1 анкету 200 рублей стоимость опроса 1000 человек составит 200 000 рублей, а опрос 1500 человек будет стоить 300 000 рублей. Увеличение затрат в полтора раза сократит ошибку выборки всего на 0,6%, что обычно неоправданно экономически.

2. Причины «раздувать» выборку

Анализ полученных данных обычно включает в себя и анализ подвыборок, объемы которых меньше основной выборки. Поэтому ошибка для выводов по подвыборкам больше, чем ошибка по выборке в целом. Если планируется анализ подгрупп / сегментов, объем выборки должен быть увеличен (в разумных пределах).

Рис.3 демонстрирует данную ситуацию. Если для исследования авиапассажиров используется выборка численностью 500 человек, то для выводов по выборке в целом ошибка составляет 4,4%, что вполне приемлемо для принятия бизнес-решений. Но при делении выборки на подгруппы в зависимости от цели поездки, выводы по каждой подгруппе уже недостаточно точны. Если мы захотим узнать какие-либо количественные характеристики группы пассажиров, совершающих бизнес-поездку и покупавших билет самостоятельно, ошибка полученных показателей будет достаточно велика. Даже увеличение выборки до 2000 человек не обеспечит приемлемой точности выводов по этой подвыборке.


Рис.3. Проектирование объема выборки с учетом необходимости анализа подвыборок

Другой пример – анализ подгрупп потребителей услуг торгово-развлекательного центра (Рис.4).


Рис.4. Потенциальный спрос на услуги торгово-развлекательного центра

При объеме выборки в 1000 человек выводы по каждой отдельной услуге (например, социально-демографический профиль, частота пользования, средний чек и др.) будут недостаточно точными для использования в бизнес планировании. Особенно это касается наименее популярных услуг (Таблица 1).

Таблица 1. Ошибка по подвыборкам потенциальных потребителей услуг торгово-развлекательного центра при выборке 1000 чел.

Чтобы ошибка в самой малочисленной подвыборке «Ночной клуб» составила меньше 5%, объем выборки исследования должен составлять около 4000 человек. Но это будет означать 4-кратное удорожание проекта. В таких случаях возможно компромиссное решение:

    • увеличение выборки до 1800 человек, что даст достаточную точность для 6 самых популярных видов услуг (от кинотеатра до парка аттракционов);
    • добор 200-300 пользователей менее популярных услуг с опросом по укороченной анкете (см. Таблицу 2).

Таблица 2. Разница в ошибке выборки по подвыборкам при разных объемах выборки.

При обсуждении с исследовательским агентством точности результатов планируемого исследования рекомендуется принимать во внимание бюджет, требования к точности результатов в целом по выборке и в разрезе подгрупп. Если бюджет не позволяет получить информацию с приемлемой ошибкой, лучше пока отложить проект (или поторговаться).


КАЛЬКУЛЯТОРЫ ДЛЯ РАСЧЕТА СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ И ОПРЕДЕЛЕНИЯ ЗНАЧИМОСТИ РАЗЛИЧИЙ:

КАЛЬКУЛЯТОР ДЛЯ РАСЧЕТА
ДОСТАТОЧНОГО ОБЪЁМА ВЫБОРКИ

Доверительный уровень:

Ошибка выборки (?):
%

Объём генеральной совокупности (N):
(можно пропустить, если больше 100 000)

РЕЗУЛЬТАТ

Один из важных вопросов, на которые нужно ответить при планировании исследования, — это оптимальный объем выборки. Слишком маленькая выборка не сможет обеспечить приемлемую точность результатов опроса, а слишком большая приведет к лишним расходам. 

Онлайн-калькулятор объема выборки поможет рассчитать оптимальный размер выборки, исходя из максимально приемлемого для исследователя размера ошибки выборки.

Все дальнейшие формулы и расчеты относятся только к простой случайной выборке!
Формулы для других типов выборки отличаются.

Объем выборки рассчитывается по следующим формулам

1) если объем выборки значительно меньше генеральной совокупности:

SampleSize_formula_1.png(в данной формуле не используется показатель объема генеральной совокупности N)

2) если объем выборки сопоставим с объемом генеральной совокупности:

SampleSize_formula_4.png

В приведенных формулах:

Z – коэффициент, зависящий от выбранного исследователем доверительного уровня. Доверительный уровень (или доверительная вероятность) – это вероятность того, что реальное значение измеряемого показателя (по всей генеральной совокупности) находится в пределах доверительного интервала, полученного в исследовании. Доверительный уровень выбирает сам исследователь, исходя из требований к надежности результатов исследования. В маркетинговых исследованиях обычно применяется 95%-й доверительный уровень. Ему соответствует значение Z = 1,96.

N – объем генеральной совокупности. Генеральная совокупность – это все люди, которые изучаются в исследовании (например, все покупатели соков и нектаров, постоянно проживающие в Москве и Московской области). Если генеральная совокупность значительно больше объема выборки (в сотни и более раз), ее размером можно пренебречь (формула 1).

p – доля респондентов с наличием исследуемого признака. Например, если 20% опрошенных заинтересованы в новом продукте, то p = 0,2.

q = 1 – p – доля респондентов, у которых исследуемый признак отсутствует. Значения p и q обычно принимаются за 0,5, поскольку точно неизвестны до проведения исследования. При этом значении размер ошибки выборки максимален. В данном калькуляторе значения p и q по умолчанию равны 0,5.

Δ– предельная ошибка выборки (для доли признака), приемлемая для исследователя. Считается, что для принятия бизнес-решений ошибка выборки не должна превышать 4%.

n – объем выборки. Объем выборки – это количество людей, которые опрашиваются в исследовании.

ПРИМЕР РАСЧЕТА ОБЪЕМА ВЫБОРКИ:

Допустим, мы хотим рассчитать объем выборки, предельная ошибка которой составит 4%. Мы принимаем доверительный уровень, равный 95%. Генеральная совокупность значительно больше выборки. Тогда объем выборки составит:

n = 1,96 * 1,96 * 0,5 * 0,5 / (0,04 * 0,04) = 600,25 ≈ 600 человек

Таким образом, если мы хотим получить результаты с предельной ошибкой 4%, нам нужно опросить 600 человек. 


КАЛЬКУЛЯТОР ОШИБКИ ВЫБОРКИ ДЛЯ ДОЛИ ПРИЗНАКА

Доверительный уровень:

Объём выборки (n):

Объём генеральной совокупности (N):
(можно пропустить, если больше 100 000)

Доля признака (p):
%

РЕЗУЛЬТАТ

Зная объем выборки исследования, можно рассчитать значение ошибки выборки (или, другими словами, погрешность выборки).

Если бы в ходе исследования мы могли опросить абсолютно всех интересующих нас людей, мы могли бы быть на 100% уверены в полученном результате. Но ввиду экономической нецелесообразности сплошного опроса применяют выборочный подход, когда опрашивается только часть генеральной совокупности. Выборочный метод не гарантирует 100%-й точности измерения, но, тем не менее, вероятность ошибки может быть сведена к приемлемому минимуму.

Все дальнейшие формулы и расчеты относятся только к простой случайной выборке! Формулы для других типов выборки отличаются.

Ошибка выборки для доли признака рассчитывается по следующим формулам.

1) если объем выборки значительно меньше генеральной совокупности:
SampleSize_formula_2.png

 (в данной формуле не используется показатель объема генеральной совокупности N)

2) если объем выборки сопоставим с объемом генеральной совокупности:

SampleSize_formula_3.png

В приведенных формулах:

Z – коэффициент, зависящий от выбранного исследователем доверительного уровня. Доверительный уровень (или доверительная вероятность) – это вероятность того, что реальное значение измеряемого показателя (по всей генеральной совокупности) находится в пределах доверительного интервала, полученного в исследовании. Доверительный уровень выбирает сам исследователь, исходя из требований к надежности результатов исследования. В маркетинговых исследованиях обычно применяется 95%-й доверительный уровень. Ему соответствует значение Z = 1,96.

N – объем генеральной совокупности. Генеральная совокупность – это все люди, которые изучаются в исследовании (например, все покупатели шоколада, постоянно проживающие в Москве). Если генеральная совокупность значительно больше объема выборки (в сотни и более раз), ее размером можно пренебречь (формула 1).

n – объем выборки. Объем выборки – это количество людей, которые опрашиваются в исследовании. Существует заблуждение, что чем больше объем генеральной совокупности, тем больше должен быть и объем выборки маркетингового исследования. Это отчасти так, когда объем выборки сопоставим с объемом генеральной совокупности. Например, при опросах организаций (B2B). Если же речь идет об исследовании жителей городов, то не важно, Москва это или Рязань – оптимальный объем выборки будет одинаков в обоих городах. Этот принцип следует из закона больших чисел и применим, только если выборка простая случайная. ВАЖНО: если предполагается сравнивать какие-то группы внутри города, например, жителей разных районов, то выборку следует рассчитывать для каждой такой группы.

p – доля респондентов с наличием исследуемого признака. Например, если 20% опрошенных заинтересованы в новом продукте, то p = 0,2.

q = 1 – p – доля респондентов, у которых исследуемый признак отсутствует. Значения p и q обычно принимаются за 0,5, поскольку точно неизвестны до проведения исследования. При этом значении размер ошибки выборки максимален.

Δ– предельная ошибка выборки.

Таким образом, зная объем выборки исследования, мы можем заранее оценить показатель ее ошибки.
А получив значение p, мы можем рассчитать доверительный интервал для доли признака: (p – ∆; p + ∆)

ПРИМЕР РАСЧЕТА ОШИБКИ ВЫБОРКИ ДЛЯ ДОЛИ ПРИЗНАКА:

Например, в ходе исследования были опрошены 1000 человек (n=1000). 20% из них заинтересовались новым продуктом (p=0,2). Рассчитаем показатель ошибки выборки по формуле 1 (выберем доверительный уровень, равный 95%):

∆ = 1,96 * КОРЕНЬ (0,2*0,8/1000) = 0,0248 = ±2,48%

Рассчитаем доверительный интервал:

(p – ∆; p + ∆) = (20% – 2,48%; 20% + 2,48%) = (17,52%; 22,48%)

Таким образом, с вероятностью 95% мы можем быть уверены, что реальная доля заинтересованных в новом продукте (среди всей генеральной совокупности) находится в пределах полученного диапазона (17,52%; 22,48%).

Если бы мы выбрали доверительный уровень, равный 99%, то для тех же значений p и n ошибка выборки была бы больше, а доверительный интервал – шире. Это логично, поскольку, если мы хотим быть более уверены в том, что наш доверительный интервал «накроет» реальное значение признака, то интервал должен быть более широким.


КАЛЬКУЛЯТОР ОШИБКИ ВЫБОРКИ ДЛЯ СРЕДНЕГО ЗНАЧЕНИЯ

Доверительный уровень:

Объём выборки (n):

Объём генеральной совокупности (N):
(можно пропустить, если больше 100 000)

Среднее значение (x̄):

Стандартное отклонение (s):

РЕЗУЛЬТАТ

Зная объем выборки исследования, можно рассчитать значение ошибки выборки (или, другими словами, погрешность выборки).

Если бы в ходе исследования мы могли опросить абсолютно всех интересующих нас людей, мы могли бы быть на 100% уверены в полученном результате. Но ввиду экономической нецелесообразности сплошного опроса применяют выборочный подход, когда опрашивается только часть генеральной совокупности. Выборочный метод не гарантирует 100%-й точности измерения, но, тем не менее, вероятность ошибки может быть сведена к приемлемому минимуму.

Все дальнейшие формулы и расчеты относятся только к простой случайной выборке! Формулы для других типов выборки отличаются.

Ошибка выборки для среднего значения рассчитывается по следующим формулам.

1) если объем выборки значительно меньше генеральной совокупности:

SampleSize_formula_5.png

(в данной формуле не используется показатель объема генеральной совокупности N)

2) если объем выборки сопоставим с объемом генеральной совокупности:

SampleSize_formula_6.png

В приведенных формулах:

Z – коэффициент, зависящий от выбранного исследователем доверительного уровня. Доверительный уровень (или доверительная вероятность) – это вероятность того, что реальное значение измеряемого показателя (по всей генеральной совокупности) находится в пределах доверительного интервала, полученного в исследовании. Доверительный уровень выбирает сам исследователь, исходя из требований к надежности результатов исследования. В маркетинговых исследованиях обычно применяется 95%-й доверительный уровень. Ему соответствует значение Z = 1,96

N – объем генеральной совокупности. Генеральная совокупность – это все люди, которые изучаются в исследовании (например, все покупатели мороженого, постоянно проживающие в Москве). Если генеральная совокупность значительно больше объема выборки (в сотни и более раз), ее размером можно пренебречь (формула 1).

n – объем выборки. Объем выборки – это количество людей, которые опрашиваются в исследовании. Существует заблуждение, что чем больше объем генеральной совокупности, тем больше должен быть и объем выборки маркетингового исследования. Это отчасти так, когда объем выборки сопоставим с объемом генеральной совокупности. Например, при опросах организаций (B2B). Если же речь идет об исследовании жителей городов, то не важно, Москва это или Рязань – оптимальный объем выборки будет одинаков в обоих городах. Этот принцип следует из закона больших чисел и применим, только если выборка простая случайная. ВАЖНО: если предполагается сравнивать какие-то группы внутри города, например, жителей разных районов, то выборку следует рассчитывать для каждой такой группы.

s – выборочное стандартное отклонение измеряемого показателя. В идеале на месте этого аргумента должно быть стандартное отклонение показателя в генеральной совокупности (σ), но так как обычно оно неизвестно, используется выборочное стандартное отклонение, рассчитываемое по следующей формуле:

SampleSize_formula_7.png

где, x ̅ – среднее арифметическое показателя, xi– значение i-го показателя, n – объем выборки

Δ– предельная ошибка выборки.

Зная среднее значение показателя x ̅ и ошибку ∆, мы можем рассчитать доверительный интервал для среднего значения:(x ̅ – ∆; x ̅ + ∆)

ПРИМЕР РАСЧЕТА ОШИБКИ ВЫБОРКИ ДЛЯ СРЕДНЕГО ЗНАЧЕНИЯ:

Например, в ходе исследования были опрошены 1000 человек (n=1000). Каждого из них попросили указать их примерную среднюю сумму покупки (средний чек) в известной сети магазинов. Среднее арифметическое всех ответов составило 500 руб. (x ̅=500), а стандартное отклонение составило 120 руб. (s=120). Рассчитаем показатель ошибки выборки по формуле 1 (выберем доверительный уровень, равный 95%):

∆ = 1,96 * 120 / КОРЕНЬ (1000) = 7,44

Рассчитаем доверительный интервал:

(x ̅ – ∆; x ̅ + ∆) = (500 – 7,44; 500 + 7,44) = (492,56; 507,44)

Таким образом, с вероятностью 95% мы можем быть уверены, что значение среднего чека по всей генеральной совокупности находится в границах полученного диапазона: от 492,56 руб. до 507,44 руб.


КАЛЬКУЛЯТОР ЗНАЧИМОСТИ РАЗЛИЧИЙ ДОЛЕЙ

Доверительный уровень:

Измерение 1 Измерение 2
Доля признака (p): % %
Объём выборки (n):

РЕЗУЛЬТАТ

Если в прошлогоднем исследовании вашу марку вспомнили 10% респондентов, а в исследовании текущего года – 15%, не спешите открывать шампанское, пока не воспользуетесь нашим онлайн-калькулятором для оценки статистической значимости различий.

Сравнивая два разных значения, полученные на двух независимых выборках, исследователь должен убедиться, что различия статистически значимы, прежде чем делать выводы.

Как известно, выборочные исследования не обеспечивают 100%-й точности измерения (для этого пришлось бы опрашивать всю целевую аудиторию поголовно, что слишком дорого). Тем не менее, благодаря методам математической статистики, мы можем оценить точность результатов любого количественного исследования и учесть ее в выводах.

В приведенном здесь калькуляторе используется двухвыборочный z-тест для долей. Для его применения должны соблюдаться следующие условия:

    • Обе выборки – простые случайные 
    • Выборки независимы (между значениями двух выборок нет закономерной связи) 
    • Генеральные совокупности значительно больше выборок 
    • Произведения n*p и n*(1-p), где n=размер выборки а p=доля признака, – не меньше 5.

В калькуляторе используются следующие вводные данные:

Доверительный уровень (или доверительная вероятность) – это вероятность того, что реальное значение измеряемого показателя (по всей генеральной совокупности) находится в пределах доверительного интервала, полученного в исследовании. Доверительный уровень выбирает сам исследователь, исходя из требований к надежности результатов исследования. В маркетинговых исследованиях обычно применяется 95%-й доверительный уровень.

Доля признака (p) – доля респондентов с наличием исследуемого признака. Например, если 20% опрошенных заинтересованы в новом продукте, то p = 0,2.

Объем выборки (n) – это количество людей, которые опрашиваются в исследовании.

Результат расчетов – вывод о статистической значимости или незначимости различий двух измерений.


КАЛЬКУЛЯТОР ЗНАЧИМОСТИ РАЗЛИЧИЙ СРЕДНИХ

Доверительный уровень:

Измерение 1 Измерение 2
Среднее значение (x̄):
Стандартное отклонение (s):
Объём выборки (n):

РЕЗУЛЬТАТ

 

Допустим, выборочный опрос посетителей двух разных ТРЦ показал, что средний чек в одном из них равен 1000 рублей, а в другом – 1200 рублей. Следует ли отсюда вывод, что суммы среднего чека в двух этих ТРЦ действительно отличаются?

Сравнивая два разных значения, полученные на двух независимых выборках, исследователь должен убедиться, что различия статистически значимы, прежде чем делать выводы.

Как известно, выборочные исследования не обеспечивают 100%-й точности измерения (для этого пришлось бы опрашивать всю целевую аудиторию поголовно, что слишком дорого). Тем не менее, благодаря методам математической статистики, мы можем оценить точность результатов любого количественного исследования и учесть ее в выводах.

В приведенном здесь калькуляторе используется двухвыборочный z-тест для средних значений. Для его применения должны соблюдаться следующие условия:

    • Обе выборки – простые случайные 
    • Выборки независимы (между значениями двух выборок нет закономерной связи)
    • Генеральные совокупности значительно больше выборок 
    • Распределения значений в выборках близки к нормальному распределению.

В калькуляторе используются следующие вводные данные:

Доверительный уровень (или доверительная вероятность) – это вероятность того, что реальное значение измеряемого показателя (по всей генеральной совокупности) находится в пределах доверительного интервала, полученного в исследовании. Доверительный уровень выбирает сам исследователь, исходя из требований к надежности результатов исследования. В маркетинговых исследованиях обычно применяется 95%-й доверительный уровень.

Среднее значение ( ̅x) – среднее арифметическое показателя.

Стандартное отклонение (s) – выборочное стандартное отклонение измеряемого показателя. В идеале на месте этого аргумента должно быть стандартное отклонение показателя в генеральной совокупности (σ), но так как обычно оно неизвестно, используется выборочное стандартное отклонение, рассчитываемое по следующей формуле:
SampleSize_formula_7.png
где, x ̅ – среднее арифметическое показателя, xi– значение i-го показателя, n – объем выборки

Объем выборки (n) – это количество людей, которые опрашиваются в исследовании.

Результат расчетов – вывод о статистической значимости или незначимости различий двух измерений.

Вы можете подписаться на уведомления о новых материалах СканМаркет

Генеральная совокупность 

Давайте разберемся, на что в первую очередь обращать внимание перед началом любой исследовательской или аналитической работы, какие вообще данные следует использовать,

Для начала нам нужно четко обозначить, для какого множества объектов мы хотели бы получить результаты экспериментов или исследований. То есть, что мы будем считать генеральной совокупностью нашего исследования.

Генеральная совокупность — это множество всех объектов, относительно которых предполагается делать выводы в рамках конкретного исследования. Генеральную совокупность составляют все объекты, которые отвечают всем заранее заданным параметрам.

Почему это важно? Разберем на конкретных примерах.

Пример 1

Хотим узнать средний рост у космонавтов, находившихся в космическом полете более 180 дней. 

Так как под такое описание подходит небольшая группа людей (а именно космонавты, которые пробыли в полете более 180 дней), мы можем провести исследование с участием всех представителей этого класса. Они и будут составлять генеральную совокупность нашего исследования.

Пример 2

Хотим изучить, какой мультфильм является самым любимым у детей до 5 лет, живущих в Москве.

В данной ситуации абсолютно все дети в возрасте до 5 лет, которые живут в Москве, будут представлять генеральную совокупность для нашего исследования. 

Очевидно, что в исследовании из Примера 1 мы можем измерить рост каждого космонавта и получить желаемый результат. 

В Примере 2 все становится несколько затруднительнее: теоретически мы, конечно, можем опросить каждого ребенка из Москвы в возрасте до 5 лет, но это сложно реализуемая затея. 

Что тогда делать? Можно взять только определенную часть генеральной совокупности, то есть сформировать выборку для исследования, а затем обобщить результаты, полученные на этой выборке, на всю генеральную совокупность. 

Выборка и репрезентативность

Собрать выборку можно бесконечным количеством способов. Если говорить о нашем «детском опросе», то можно опросить только четырёхлетних детей, которые посещают курсы японского языка. Однако понятно, что в таком случае мы получим результаты, которые маловероятно можно обобщить на генеральную совокупность.

Как же собрать «хорошую» выборку, то есть, такую выборку, чтобы она отражала все свойства нашей генеральной совокупности? В Примере 2 необходимо задать вопрос о любимом мультике представителям всех «категорий» нашей генеральной совокупности в равных пропорциях, то есть помнить про разный возраст, пол и другие характеристик детей. Точность и полнота признаков, которые можно извлечь из выборки, называют её репрезентативностью.

Репрезентативная выборка — это такая выборка, в которой все основные признаки генеральной совокупности, из которой извлечена данная выборка, представлены приблизительно в той же пропорции или с той же частотой, что и в этой генеральной совокупности.

Как выбирать?

Есть несколько способов собрать репрезентативную выборку.

Простая случайная выборка (simple random sample)

Случайным образом выбираем объекты нашей генеральной совокупности. При этом чем больше случайных объектов выбираем, тем лучше наша выборка отражает свойства генеральной совокупности

На Примере 2: Идем на детскую площадку и опрашиваем всех, кто там есть. В результате получится, что среди опрошенных будут дети разного пола и возраста в разной пропорции. Например, мы спросили о любимом мультфильме мальчика пяти лет, девочку трех лет, девочку четырех лет, мальчика двух лет и.т.д.

Стратифицированная выборка (stratified sample)

  1. Разделяем нашу генеральную совокупность на группы (страты) на основе определенного признака/признаков. 
  2. Чтобы эти группы были равновероятно представлены в выборке, берем случайным образом элементы из каждой группы с равной вероятностью.

На Примере 2: делим детей по возрасту и полу, «идем» в группу «мальчики 5 лет» , случайно опрашиваем представителя данной группы, потом идет ко множеству «девочки 3 лет», случайно опрашиваем представительницу этой группы и т.д.

В таблице суммируются принципиальные различия между случайной и стратифицированной выборками:

Простая случайная выборка Стратифицированная выборка
Выбираем элементы из генеральной совокупности случайным образом Выбираем элементы из каждой группы (страты)
Чем больше берем элементов из генеральной совокупности, тем лучше наша выборка отражает особенности генеральной совокупности  Мы уже на основе определенных признаков разделили нашу генеральную совокупность, добавляем в каждую подгруппу по примерно равному количеству элементов. Так наша выборка будет хорошо отражать особенности генеральной совокупности 

Групповая выборка (cluster sample)

  1. Делим нашу генеральную совокупность на группы, но эти группы должны быть относительно похожи между собой (в качестве примера можем взять районы Москвы и считать, что в них примерно одинаковое число жителей)
  2. Выбираем только некоторые группы, которые нас интересуют.
  3. Из выбранных групп выбираем случайным образом элементы.

Чтобы еще лучше понять, чем отличается стратифицированная выборка от групповой, рассмотрим таблицу:

Стратифицированная выборка Групповая выборка
Выбираем элементы из каждой группы (страты) Выбираем элементы только из выбранных групп (страт)
Внутри группы элементы однородны, а между группами элементы различаются В пределах группы элементы разнородны, но при этом все группы имеют схожесть
Схема выборки для всех групп одна Схема выборки нужна только для выбранных групп
Повышает точность Повышает эффективность выборки, уменьшая стоимость

Сбор репрезентативной выборки — это нетривиальная задача, которая включает в себя выбор метода сбора и параметров сбора (например, подбор страт). Аккуратно собранная выборка — обязательное условие для проведения дальнейшего исследования. Использование нерепрезентативных данных приводит к ложным или неполным выводам, поэтому крайне важно обращать внимание, на каких данных проводилось то или иное исследование.

Содержание:

Совокупность и выборка:

Основные понятия статистики и вероятности дают возможность более глубоко понять события, которые происходят в современном мире. В каждой из двух областей, как объект исследования выбирается совокупность, и выбранные из данной совокупности образцы, или коротко говоря, маленькая группа, называемая выборкой. Статистика, проводя исследование выбранных образцов формирует мнение о всей популяции.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Для проведения статистических исследований, как правило, образцы выбираются случайным образом. В этом случае, каждый образец в совокупности имеет равный шанс при выборке. Существуют различные техники случайной выборки.

  • Простая случайная выборка
  • Систематическая случайная выборка
  • Кластерная случайная выборка
  • Разноуровневая случайная выборка

Простая случайная выборка

Предположим, что в классе нужно выбрать группу из трёх человек. Для этого на карточках записываются имена всех учеников, затем эти карточки складываются в ящик, после чего, случайным образом, вытаскиваются три карточки. В этом случае каждый их трёх членов группы имеет одинаковый шанс выбора.

При простой случайной выборке каждый элемент Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Систематическая выборка

Предположим, что руководство большого торгового центра хочет собрать информацию о том, сколько времени покупатели проводят в торговом центре. Было установлено, что центр в течении дня посещают в среднем 2000 человек. Из них случайным образом было выбрано 5% (т.е. 100 человек). Как правильно сделать выборку? Можно опросить людей в день выбора следующим образом: из каждых 20 покупателей опросить каждого 16-го., затем 36-го, 56-го и т.д. Выборка такого вида называется систематической.

Если при систематической выборке предполагается сделать выбор в

Генеральная и выборочная совокупности - определение и вычисление с примерами решения – то используется каждый Генеральная и выборочная совокупности - определение и вычисление с примерами решения-ый элемент популяции.

Кластерная выборка

Пусть имеется 1000 ящиков по 15 деталей в каждом, и необходимо дать информацию об качестве деталей. Для этого принято решение проверить качество 300 (2%) деталей. Но для того, чтобы вытащить все детали из ящиков, перемешать их и случайно выбрать 300 штук, потребуется много времени и расходов. Из 1000 ящиков можно случайным образом выбрать 20 и проверив все детали из этих ящиков сформировать мнение о всех деталях. Здесь каждый ящик можно считать кластером. Такая выборка называется кластерной выборкой. Необходимо проверить все элементы находящиеся внутри кластера.

При кластерной выборке совокупность состоит из кластеров. Кластер выбирается случайным образом и рассматриваются все элементы кластера.

Разноуровневая выборка

Предположим, что в школе планируется провести опрос среди старшеклассников о том, хотели бы они после уроков заняться чтением художественной литературы в школьной библиотеке. Не желательно проводить опрос среди случайно выбранных учащихся в школьном дворе, так как они могут быть учениками одного и того же класса и т.д. Опрос должен быть проведён случайным образом среди учащихся разных возрастных групп.Такого рода случайная выборка называется разноуровневая(по слоям, по группам). Если в школе в этих классах учится 1265 учеников, из них 385 учится в 8-ом классе, 350 человек – в 9-ом, 280 человек – в 10-ом, 250 человек в 11-ом классе, то для того, чтобы узнать мнение 10 % случайно выбранных учащихся, надо узнать мнение 10% учеников каждого класса, т.е. желательно случайно выбрать 39 из 8-го, 35 из 9-го, 28 из 10-го, 25 из 11-го класса.

При разноуровневой выборке сначала совокупность делится на уровни, а затем проводится случайная выборка на каждом уровне.

При некоторых исследованиях невозможно бывает сделать случайную выборку. Например, диетологам приходится назначать диету не случайно выбранным людям, а тем кто сам захотел этого добровольно.

Верная или неверная выборка

Научно исследовательские институты, занимающиеся опросами не имеют материально технической базы для того, чтобы узнать мнения всех людей по каждому вопросу. Поэтому они ограничиваются изучением этого мнения на небольшой группе людей. Для этого большую роль играет умение правильно определить эти группы. Надёжность представленного на диаграмме исследования также зависит от того, насколько правильно определена группа. Например, невозможно сформировать правильное мнение о том, сколько раз в неделю все горожане занимаются спортом, изучив мнение только тех людей, которые посещают спортивный центр или, прогноз о том, выберут ли кого- то в депутаты парламента не даст правильных результатов, сформировав его, по мнению людей из коллектива, где он работает или живущих с ним в одном районе.

Пример №1

Администрация школы планирует определить связь между отметками учащихся по предметам математика и естественным наукам. В оценивании и по предмету математика, и по естественным наукам из 800 учащихся школы принимали участие 350 учеников. Из них, случайным образом, 70 человек планируется вовлечь в специальное оценивание. По таблице определите сколько из учащихся каждого класса будут выбраны случайным образом для специального оценивания.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Решение: Если количество выбранных учащихся в общем равно 70 человек, то выборка из каждого класса должна быть пропорциональна. Количество восьмиклассников должно быть: Генеральная и выборочная совокупности - определение и вычисление с примерами решения и т.д.

Представление информации

Статистическая информация по количественным и качественным характеристикам делится на два вида.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Информация количественного типа выражается в численном значении. Например, “сколько времени занимаются спортом” ,”чему равен рост” и т.д. Информация качественного вида подразделяется на категории и называется категориальной информацией. Например, “название партии”, “цвет глаз”, марка автомобиля” и т.д.

Количественная информация – числовая информация делится на два вида:

  1. дискретная, информация которая прерывается;
  2. непрерывная информация.

Дискретная числовая информация определяется путём подсчёта. Например, количество пассажиров в автобусе принимает значения 1,2,3 и т.д.

Непрерывная числовая информация принимает различные значения в определённом диапазоне, обычно формируется по результатам измерений. Например, рост, масса и т.д. новорожденных детей.

Для представления информации важно правильно выбрать соответствующую форму графика. Поэтому для представления категориальной и количественной информации выбирается соответствующий график.

Целесообразные формы представления категориальной информации

Пример:

Среди 200 учеников был проведён опрос о том, какой вид спорта они любят больше всего. Здесь информация типа вид спорта относится к категориальному виду. В школе имеются секции по следующим видам спорта. Для представления категориальной информации удобно пользоваться таблицей частот, барграфом, круговой диаграммой.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Определяет какую часть от общего (единичного блока) составляет каждая категория. Единичный блок делится на сегменты.

Целесообразные формы представления числовой информации

Дискретная числовая информация. Для представления ограниченного количества числовой дискретной информации используют такие формы как таблица частот, барграф, гистограмма и разветвляющееся дерево.

Пример №2

Среди 50 молодых семей провели опрос “Сколько детей в вашей семье?”. Ответы представлены ниже. Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Следующие данные показывают количество детей в каждой семье. В таблице это количество показано в столбце или в виде палочек, или в виде числа. По таблице, в одном столбце которой, количество показано палочками, а в другой-числами, задан столбец относительной частоты.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Группировка дискретной числовой информации. Гистограмма

Пример:

Ниже приведены результаты оценивания учащихся по предмету Азербайджанский язык в баллах (по 100 бальной системе).

52 66 75 80 52 48 95 85 84 68 86 82 63 78 75 64 79 81 66 53

76 75 69 65. Диапазон изменения числовой информации 48-95. Данную информацию можно сгруппировать в 6 классов размерностью 10 : 40-50, 50-60, 60-70, 70-80, 80-90, 90-100.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

“Ствол-листья”. Эту форму удобно применять при небольшом количестве данных. Представление числовой информации в виде ствола и листьев занимает немного времени и даёт возможность более ясно увидеть распределение информации. А форма распределения позволяет с лёгкостью находить ряд статистических величин (моду, медиану, среднее арифметическое, наибольшую разность и т.д. ).

Пример №3

Следующие данные отражают результаты оценивания учащихся. 32? 67, 81, 92, 87, 72, 63, 88, 96, 91, 72, 63, 85, 79, 70, 85, 64, 86, 98, 100, 77, 88, 81, 64, 41, 78, 95, 74, 97, 66. Постройте диаграмму “ствол-листья”, выполнив следующие шаги.

1.Разделите ствол и листья горизонтальной и вертикальной прямой.

2.Ведущая часть числовой информации – большой уровень (или уровни) принимается за ствол с ветками – показывает количество чисел. В данном случае ствол содержит ветки с числами 3, 4, 5, 6, 7, 8, 9, 10 и показывает количество десятков.

2.Следующие числа соответствуют листьям. Это цифры, выражающие значения единиц. На каждую “ветку” последовательно записываются листья . Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №4

Представьте в виде диаграммы “ствол-листья” возраст работников фирмы, 37, 33, 33, 32, 29, 28, 28, 23, 22, 22, 22, 21, 21, 21, 20, 20, 19, 19, 18, 18, 18, 18, 16, 15, 14, 14, 14, 12, 12, 9, 6 .

а) Найдите среднее арифметическое, моду и медиану;

б) Представьте информацию в виде таблицы частот.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Представление непрерывной числовой информации

Формы представления непрерывной числовой информации схожи с формами сгруппированной дискретной информацией. Некоторая непрерывная числовая информация принимается как дискретная (и наоборот). То есть границу между ними определить очень трудно.

Пример №5

В результате проведённых исследований стало известно, что масса молодых людей, занимающихся спортом в клубе колеблется от 40 кг до 90 кг. Более подробная информация представлена в виде таблицы и гистограммы. Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Маленький проект. В 2016 году в Баку впервые проходили соревнования Гран При Европы Формулы 1. Гоночный трек (длина одного оборота) в Баку, длиной приблизительно 6 км, проходил как через старую часть города, так и современную часть. Распределения первых 3 мест первого Гран При Европы Формулы 1 в Баку показаны в таблице.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Разложение бинома

Биномом называется двучлен. Рассмотрим различные степени бинома. В разложении квадрата и куба суммы существует определённая закономерность.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Так, показатель степени первого члена равен степени бинома, показатель каждого следующего первого члена а уменьшается на единицу, а второго члена b возрастает на единицу. Коэффициенты первого и последнего членов равны 1.

Последовательность степеней суммы а и b можно продолжить последовательно разлагая бином. Проследим по какому правилу производится разложение.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения можно записать как Генеральная и выборочная совокупности - определение и вычисление с примерами решения. Произведение каждого а или b равно сумме всех различных произведений четырех множителей. Рассмотрим последовательность из этих вариантов.

  • возьмём 0-ой множитель члена b и 4-ый множитель члена а.

Получим член а4 и такой 4Со или 1 возможный вариант, и коэффициент этого члена равен 1.

Разместим степени биномов, биномиальные разложения и коэффициенты членов в таблицу.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Как видно расположения коэффициентов обладают интересным математическим свойством и образуют треугольник Паскаля.

Подробное объяснение разложение бинома:

Для произвольных чисел а, b и числа Генеральная и выборочная совокупности - определение и вычисление с примерами решения справедливо равенство: Генеральная и выборочная совокупности - определение и вычисление с примерами решения

В более короткой форме эту формулу можно записать при помощи знака Генеральная и выборочная совокупности - определение и вычисление с примерами решения сигма.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

В разложении бинома Генеральная и выборочная совокупности - определение и вычисление с примерами решения существует Генеральная и выборочная совокупности - определение и вычисление с примерами решения член. Любой Генеральная и выборочная совокупности - определение и вычисление с примерами решения член имеет вид Генеральная и выборочная совокупности - определение и вычисление с примерами решения •в разложении бинома Генеральная и выборочная совокупности - определение и вычисление с примерами решения-ой степени присутствует Генеральная и выборочная совокупности - определение и вычисление с примерами решения + 1 член

•любой биномиальный член можно найти по формуле Генеральная и выборочная совокупности - определение и вычисление с примерами решения

•сумма степеней любых членов равна Генеральная и выборочная совокупности - определение и вычисление с примерами решения •сумма биномиальных коэффициентов равна Генеральная и выборочная совокупности - определение и вычисление с примерами решения.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Проверьте последнее равенство для Генеральная и выборочная совокупности - определение и вычисление с примерами решения.

При разложении степеней бинома коэффициенты слагаемых отличаются от биномиальных коэффициентов.

Пример №6

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Например, в данном разложении коэффициент третьего слагаемого равен 40, а его биномиальный коэффициент равен Генеральная и выборочная совокупности - определение и вычисление с примерами решения.

Пример №7

Найдём четвёртый член разложения бинома Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Решение: Здесь Генеральная и выборочная совокупности - определение и вычисление с примерами решениятогда

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Треугольник Паскаля

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Треугольник Паскаля назван в честь его создателя известного французского математика Блеза Паскаля, жившего в XVI веке. Вершиной треугольника является 1. Каждая строка, образующая треугольник, начинается и заканчивается с единицы. Каждое число в следующей строке, равно сумме двух соседних чисел предыдущей строки. Количество членов каждой строки больше предыдущей на одно число.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Проверим соответствует ли в действительности член Генеральная и выборочная совокупности - определение и вычисление с примерами решения пятой строке треугольника Паскаля.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Коэффициенты членов в разложении бинома являются последовательными числами треугольника Паскаля в соответствующей строке. Слева направо степень первого члена равна степени бинома, в каждом следующем члене разложения степень множителя а уменьшается на единицу, а степень множителя b на единицу увеличивается.

6-ая строка треугольника Паскаля формируется следующим образом. Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Можно записать общую форму для биномиального разложения.

Испытания Бернулли

Для того, чтобы понять схему Бернулли рассмотрим следующий пример. Если в игре вероятность выигрыша(появления зелёного шарика)Генеральная и выборочная совокупности - определение и вычисление с примерами решения равна Генеральная и выборочная совокупности - определение и вычисление с примерами решения , то вероятность проигрыша (появления красного шарика) равна Генеральная и выборочная совокупности - определение и вычисление с примерами решения . Вычислим вероятность изменения числа побед и поражений в 4 играх.

1)Р(вероятность выигрыша во всех 4 играх) Генеральная и выборочная совокупности - определение и вычисление с примерами решения

2)Р(вероятность проигрыша во всех 4 играх)Генеральная и выборочная совокупности - определение и вычисление с примерами решения

3)Найдём варианты выигрыша в 3 из 4 игр и соответствующую вероятность:

(В,В,В,П) Р(выигрыш во всех играх кроме 4)Генеральная и выборочная совокупности - определение и вычисление с примерами решения

(В,В,П,В) Р(выигрыш во всех играх кроме З)Генеральная и выборочная совокупности - определение и вычисление с примерами решения

(В,П,В,В) Р(выигрыш во всех играх кроме 2)Генеральная и выборочная совокупности - определение и вычисление с примерами решения

(П,В,В,В) Р(выигрыш во всех играх кроме 1)Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Количество вариантов победы игрока в 3 из 4 игр можно вычислить при помощи комбинезона Генеральная и выборочная совокупности - определение и вычисление с примерами решения.

Вероятность вариантов имеет равные возможности Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Тогда вероятность этого события можно вычислить так:

Р(выигрыш в 3 из 4 игр)Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Аналогичным образом исследуются другие ситуации.

4)Выигрыш в 2 играх из 4.

Количество возможных вариантов выигрыша в 2 играх из 4:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

То есть вероятность победы в каждом из 6 случаев Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Р(выигрыш в 2 из 4 игр) =Генеральная и выборочная совокупности - определение и вычисление с примерами решения

5)Вероятность победы в 1 из 4 игр.

Р(В,П,П,П) = Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Р(выигрыш в 1 из 4 игр) = Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Мы нашли вероятности выигрыша команды в 4, 3, 2, 1, 0 играх. Если эти вероятности вычислены верно, то их сумма должна равняться единице.

Р(4 выиг.) + Р(3 выиг.) + Р(2 выиг.)+ Р(1 выиг.)+ Р(0 выиг.) =1.

Выполним проверку: Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Представленная задача называется биномиальными испытаниями, так как в задачах такого типа в соответствии с ситуацией возможно использовать члены биномиального разложения. Например, задача выше соответствует разложению биномиальных членов Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения.

Иногда их называют испытаниями Бернулли. Для данной задачи введём переменные р (выигрыш) и q (проигрыш). При биномиальном разложении можно увидеть соответствие каждого члена реальной ситуации . Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Здесь p вероятность успеха (появление красного papa) и Генеральная и выборочная совокупности - определение и вычисление с примерами решения, q вероятность неудачи (появление зелёного шара)Генеральная и выборочная совокупности - определение и вычисление с примерами решения.

Испытания Бернулли и вероятность

Если для Генеральная и выборочная совокупности - определение и вычисление с примерами решения независимых испытаний вероятность успешного события р, тогда Генеральная и выборочная совокупности - определение и вычисление с примерами решения вероятность успеха, Генеральная и выборочная совокупности - определение и вычисление с примерами решения вероятность неудачи и Р(Генеральная и выборочная совокупности - определение и вычисление с примерами решения испытаний, Генеральная и выборочная совокупности - определение и вычисление с примерами решения успех) Генеральная и выборочная совокупности - определение и вычисление с примерами решения. Биномиальное распределение или испытания Бернулли справедливы только при следующих условиях.

  • У каждого испытания есть только два результата.
  • Известно количество испытаний.
  • Испытания независимы.
  • Все испытания равновероятны.

Исследуем испытания Бернулли схематично на следующем примере.

Пример №8

Колесо состоит из 4 одинаковых частей – 3 части красные и одна белая. При вращении колесо может остановиться или на красной части или на белой. На схеме представлены возможные положения колеса при трех вращениях. Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Также возможно увидеть связь с биномиальным разложением Генеральная и выборочная совокупности - определение и вычисление с примерами решения Здесь Генеральная и выборочная совокупности - определение и вычисление с примерами решения и Генеральная и выборочная совокупности - определение и вычисление с примерами решения . Для этих событий проверьте формулу Бернулли для Р(Генеральная и выборочная совокупности - определение и вычисление с примерами решения красн.) = Генеральная и выборочная совокупности - определение и вычисление с примерами решения при Генеральная и выборочная совокупности - определение и вычисление с примерами решения.

Пример №9

Для каждого из 5 вопросов существует 4 варианта ответа. Найдите вероятность того, что Наргиз ответила верно на 4 вопроса. Установите связь между вероятностью и биномиальным разложением.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Решение: Найдём возможные варианты, что Наргиз даст 5 верных или не верных ответов:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Из схемы видно, что существует 5 различных вариантов 4 верных ответов на 5 вопросов. Значит, вероятность этого события будет Генеральная и выборочная совокупности - определение и вычисление с примерами решения. Аналогичным образом можно увидеть связь между другой ситуацией и биномиальными членами.

Обобщим эту связь при помощи таблицы.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Найдём, случайным образом, вероятность 4 правильных и 1 неправильного ответов. Вероятность каждого правильного ответа Генеральная и выборочная совокупности - определение и вычисление с примерами решения,

вероятность Генеральная и выборочная совокупности - определение и вычисление с примерами решениянеправленого

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №10

Найдите вероятность того, что в одной из четырёх семей , в которых есть дети, есть 3 мальчика и 1 девочка.

Решение: Для каждого ребёнка существует два возможных варианта:

или мальчик или девочка. Вероятность каждого из двух равна Генеральная и выборочная совокупности - определение и вычисление с примерами решения .

Р(Генеральная и выборочная совокупности - определение и вычисление с примерами решения испытаний, Генеральная и выборочная совокупности - определение и вычисление с примерами решения успех) = Генеральная и выборочная совокупности - определение и вычисление с примерами решения;

Р(4 ребенка, 3 мальчика) =Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Значит, вероятность того, что из 4 детей 3 мальчики,

равна Генеральная и выборочная совокупности - определение и вычисление с примерами решения или 25%.

В биномиальном разложении член соответствующий ситуации показан красным цветом, Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №11

Фирма проводит акцию по продаже детского питания. В каждую коробку был положен купон так, что 3 из каждых 20 являются выигрышными. Какова вероятность того, что среди 5 коробок детского питания 2 окажутся с выигрышными купонами? При вычислениях можно использовать калькулятор.

Решение: успешным событием является наличие выигрышного купона:

Р(есть купон с выигрышем) = Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Неудачным событием, отсутствие купона с выигрышем:

Р( нет купона с выигрышем) = Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Р( 5 коробок 2 выигрыша) = Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №12

Монету подбросили 10 раз. Какова вероятность того, что как минимум 8 раз монета упадёт цифрой?

Решение: если событие, что монета упадёт как минимум 8 раз цифрой является успешным, значит, если цифра выпадет и 9 и 10 раз, то эти события также будут успешными. Найдём вероятности каждого события в отдельности и сложим их. Вероятность каждого события Генеральная и выборочная совокупности - определение и вычисление с примерами решения .

Р( как минимум 8 раз цифрой) = Р (8 цифрой) + Р (9 цифрой) + Р (10 цифрой) Р( как минимум 8 раз цифрой) = Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения.

Генеральная и выборочная совокупности

В материалах сегодняшней лекции мы рассмотрим генеральную и выборочную совокупности.

Математическая статистика занимается сбором, анализом и обработкой данных наблюдений. Эти данные относятся к массовым явлениям, на которые влияют случайные факторы.

Статистические методы используются для контроля массового производства, в области физики, в астрономии, экономике, биологии и т.п. Рассмотрим три основные задачи математической статистики:

  • 1)    упорядочение статистического материала, статистические законы распределения;
  • 2)    статистическое оценивание характеристик распределения;
  • 3)    статистическая проверка гипотез.

Статистическое описание результатов наблюдений

При изучении качественного или количественного признака, характеризующего совокупность однородных объектов, не всегда имеется возможность обследовать каждый объект изучаемой совокупности. Приведём такой пример. Электрическую лампочку условимся считать стандартной, если продолжительность её горения не менее 1200 ч, в противном случае она считается нестандартной. За качеством продукции

обязан следить завод-изготовитель. Исследовать каждую лампочку на продолжительность горения практически невозможно, да это и противоречит здравому смыслу. Как же получить представление о качестве изготовляемой продукции? Пусть заводу необходимо поставить потребителю партию готовых изделий. Вместо данных о качестве всех электрических лампочек партии достаточно получить точные сведения о качестве небольшой их части, отобранных случайно. По продолжительности горения отобранных лампочек можно судить о качестве всех лампочек партии. Практика подтверждает, что сделанные выводы бывают достаточно надёжными.

Совокупность всех возможных, иногда говорят, – всех мыслимых, значений исследуемой случайной величины называют генеральной совокупност ью.

Множество значений случайной величины, полученное в результате наблюдений над нею, называют случайной выборкой или просто выборкой.

Число объектов в генеральной совокупности и в выборке называют их объёмами. Генеральная совокупность может иметь как конечный, так и бесконечный объём.

Рассмотрим наблюдение за некоторым измеряемым признаком какого либо объекта, например, возраст людей, сортность изделий и др.

Значение признака генеральной совокупности – это: случайная величина X, связанная с испытанием (наблюдением). Эта случайная величина распределена по некоторому закону с неизвестными параметрами, который называется распределением генеральной совокупности.

Проведём n испытаний при одних и тех же условиях. Случайная величина X принимает значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Это множество значений называется выборкой объема n.

Элементы выборки, записанные в порядке их регистрации, труднообозримы и неудобны для дальнейшего анализа. Необходимо

получить такое описание выборки, которое позволяет выделить характерные особенности исходных данных, Для этого существуют различные способы группировки данных выборки.

Пусть выборка объёма n содержит m различных чисел. Изменив нумерацию, запишем их в видеГенеральная и выборочная совокупности - определение и вычисление с примерами решения причём Генеральная и выборочная совокупности - определение и вычисление с примерами решения. Число m называется размахом выборки.

Пусть значениеГенеральная и выборочная совокупности - определение и вычисление с примерами решения встречается в выборке Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз, Генеральная и выборочная совокупности - определение и вычисление с примерами решения. Число Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется Генеральная и выборочная совокупности - определение и вычисление с примерами решения, а число Генеральная и выборочная совокупности - определение и вычисление с примерами решения   – относительной
частотой
элементаГенеральная и выборочная совокупности - определение и вычисление с примерами решения

Таблица
Генеральная и выборочная совокупности - определение и вычисление с примерами решения

называется статистическим рядом.

При большом объёме выборки используется группированный статистический ряд. Для этого все элементы выборки распределяются по группам или интервалам группировки. Интервал, содержащий все элементы выборки, разбивается на k непересекающихся интервалов Генеральная и выборочная совокупности - определение и вычисление с примерами решения, не обязательно равных по длине.

ЕслиГенеральная и выборочная совокупности - определение и вычисление с примерами решения– число элементов выборки, попавших в интервал Генеральная и выборочная совокупности - определение и вычисление с примерами решения, а

Генеральная и выборочная совокупности - определение и вычисление с примерами решения их частота, то можно составить таблицу

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Эта таблица называется группированным статистическим рядом.

Если наблюдаемое значение попадает на границу соседних интервалов, то число его наблюдений относят к правому интервалу.

По данным выборки можно построить статистическую функцию распределения
Генеральная и выборочная совокупности - определение и вычисление с примерами решения
Для наглядного представления выборки используют гистограмму и полигон частот.

Гистограмма относительных частот строится по группированному статистическому ряду. Для этого находитсяГенеральная и выборочная совокупности - определение и вычисление с примерами решения (статистическая плотность) Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Гистограмма – это ступенчатая фигура, состоящая из прямоугольников с основаниямиГенеральная и выборочная совокупности - определение и вычисление с примерами решения и высотами Генеральная и выборочная совокупности - определение и вычисление с примерами решения (рис. 1).

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

При увеличении объёма выборки и уменьшении интервала группировки гистограмма относительных частот является статистическим аналогом плотности распределения f(X) генеральной совокупности.

Полигон относительных частот – это ломаная линия с вершинами Генеральная и выборочная совокупности - определение и вычисление с примерами решениявзятыми из статистического ряда (рис. 2).

Генеральная и выборочная совокупности - определение и вычисление с примерами решения
 

Заключение по лекции:

В лекции мы рассмотрели генеральную и выборочную совокупности.

Статистические оценки параметров генеральной совокупности

Определение статистической оценки:
Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Отсюда возникает задача оценки параметров, которыми определяется это распределение. Например, если известно, что изучаемый признак распределён в генеральной совокупности по нормальному закону, то необходимо оценить (приближённо найти) математическое ожидание и среднеквадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение. Если же имеются основания считать, что признак имеет распределение Пуассона, то необходимо оценить параметр Генеральная и выборочная совокупности - определение и вычисление с примерами решения , которым это распределение определяется.

Обычно в распределении исследователь имеет лишь данные выборки, например, значения количественного признака Генеральная и выборочная совокупности - определение и вычисление с примерами решения , полученные в результате n наблюдений (здесь и далее наблюдения предполагаются независимыми). Через эти данные и выражают оцениваемый параметр.

 Рассматривая Генеральная и выборочная совокупности - определение и вычисление с примерами решениякак значения независимых случайных величин Генеральная и выборочная совокупности - определение и вычисление с примерами решения можно сказать, что найти статистическую оценку неизвестногопараметра теоретического распределения означает найти функцию от наблюдаемых случайных величин, которая и даёт приближённое значение оцениваемого параметра. Например, как будет показано далее, для оценки математического ожидания нормального распределения служит функция (среднее арифметическое наблюдаемых значений признака):

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Итак, статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин. Статистическая оценка неизвестного параметра генеральной совокупности, записанная одним числом, называется точечной. Рассмотрим следующие точечные оценки: смещенные и несмещённые, эффективные и состоятельные.
Для того, чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определённым требованиям. Укажем эти требования.

Пусть Генеральная и выборочная совокупности - определение и вычисление с примерами решения есть статистическая оценка неизвестного параметра Генеральная и выборочная совокупности - определение и вычисление с примерами решениятеоретического распределения. Допустим, что при выборке объёма п найдена оценка Генеральная и выборочная совокупности - определение и вычисление с примерами решения Повторим опыт, то есть извлечём из генеральной совокупности другую выборку того же объёма и по её данным найдём оценку Генеральная и выборочная совокупности - определение и вычисление с примерами решения и т.д. Повторяя опыт многократно, получим числа  Генеральная и выборочная совокупности - определение и вычисление с примерами решения  которые, вообще говоря, будут различаться между собой. Таким образом, оценку Генеральная и выборочная совокупности - определение и вычисление с примерами решения можно рассматривать как случайную величину, а числа Генеральная и выборочная совокупности - определение и вычисление с примерами решения как возможные её значения.

Ясно, что если оценка Генеральная и выборочная совокупности - определение и вычисление с примерами решения даёт приближённое значение Генеральная и выборочная совокупности - определение и вычисление с примерами решения с избытком, то каждое найденное по данным выборок число Генеральная и выборочная совокупности - определение и вычисление с примерами решения будет больше истинного значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения. Следовательно, что в этом случае и математическое (среднее значение) случайной величины Генеральная и выборочная совокупности - определение и вычисление с примерами решения будет больше, чем Генеральная и выборочная совокупности - определение и вычисление с примерами решения, то естьГенеральная и выборочная совокупности - определение и вычисление с примерами решения Очевидно, что если Генеральная и выборочная совокупности - определение и вычисление с примерами решения даёт приближённое значение Генеральная и выборочная совокупности - определение и вычисление с примерами решения с недостатком, то Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Поэтому, использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приводит к систематическим (одного знака) ошибкам. По этой причине естественно потребовать, чтобы математическое ожидание оценки Генеральная и выборочная совокупности - определение и вычисление с примерами решения было равно оцениваемому параметру. Хотя соблюдение этого требования, в общем, не устранит ошибок (одни значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения больше, а другие меньше чем Генеральная и выборочная совокупности - определение и вычисление с примерами решения), ошибки разных знаков будут встречаться одинакова часто. Однако соблюдение требования Генеральная и выборочная совокупности - определение и вычисление с примерами решения гарантирует невозможность получения систематических ошибок, то есть устраняет систематические ошибки.

Несмещённой называют статистическую оценку (ошибку) Генеральная и выборочная совокупности - определение и вычисление с примерами решения, математическое ожидание которой равно оцениваемому параметру Генеральная и выборочная совокупности - определение и вычисление с примерами решения при любом объёме выборки, то есть Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Смещённой называют статистическую оценкуГенеральная и выборочная совокупности - определение и вычисление с примерами решенияматематическое ожидание которой не равно оцениваемому параметру Генеральная и выборочная совокупности - определение и вычисление с примерами решенияпри любом объёме выборки, то естьГенеральная и выборочная совокупности - определение и вычисление с примерами решения

Однако было бы ошибочным считать, что несмещённая оценка всегда даёт хорошее приближение оцениваемого параметра. Действительно, возможные значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения могут быть сильно рассеяны вокруг своего среднего значения, то есть дисперсия Генеральная и выборочная совокупности - определение и вычисление с примерами решения может быть значительной. В этом случае, найденная по данным одной выборки оценка, напримерГенеральная и выборочная совокупности - определение и вычисление с примерами решенияможет оказаться весьма удалённой от среднего значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения, а значит, и от самого оцениваемого параметраГенеральная и выборочная совокупности - определение и вычисление с примерами решения. Таким образом, принявГенеральная и выборочная совокупности - определение и вычисление с примерами решенияв качестве приближённого значенияГенеральная и выборочная совокупности - определение и вычисление с примерами решения. мы допустим большую ошибку. Если же потребовать, чтобы дисперсияГенеральная и выборочная совокупности - определение и вычисление с примерами решениябыла малой, то возможность допустить большую ошибку будет исключена. По этой причине к статистической оценке предъявляется требование эффективности.

Эффективной называют статистическую оценку, которая (при заданном объёме выборки п) имеет наименьшую возможную дисперсию.
Далее, при рассмотрении выборок большого объёма ( n достаточно велико!) к статистическим оценкам предъявляется требование состоятельности. Состоятельной называют статистическую оценку, которая при Генеральная и выборочная совокупности - определение и вычисление с примерами решения стремится по вероятности к оцениваемому параметру, то есть, справедливо равенство: Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Например, если дисперсия несмещённой оценки при Генеральная и выборочная совокупности - определение и вычисление с примерами решениястремится к нулю, то такая оценка оказывается также состоятельной.
Рассмотрим вопрос о том, какие выборочные характеристики лучше всего в смысле несмещённости, эффективности и состоятельности оценивают генеральную среднюю и дисперсию. Пусть изучается дискретная генеральная совокупность относительно некоторого количественного признака X .

Генеральной средней Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется среднее арифметическое значений признака генеральной совокупности. Она вычисляется по формуле:

Замечание: пусть генеральная совокупность объёма N содержит объекты с различными значениями Генеральная и выборочная совокупности - определение и вычисление с примерами решения признака X . Представим себе, что из этой совокупности наудачу извлекается один объект. Вероятность того, что будет извлечён объект со значением признака, например Генеральная и выборочная совокупности - определение и вычисление с примерами решения , очевидно, равна Генеральная и выборочная совокупности - определение и вычисление с примерами решенияС этой же вероятностью может быть извлечён и любой другой объект. Таким образом, величину признака X можно рассматривать как случайную величину, возможные значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения которой имеют одинаковые вероятности, равныеГенеральная и выборочная совокупности - определение и вычисление с примерами решения Нетрудно, в этом случае, найти математическое ожидание Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Итак, если рассматривать обследуемый признак X генеральной совокупности как случайную величину, то математическое ожидание признака равно генеральной средней этого признака:Генеральная и выборочная совокупности - определение и вычисление с примерами решения. Этот вывод мы получили, считая, что все объекты генеральной совокупности имеют различные значения признака. Такой же итог будет получен, если допустить, что генеральная совокупность содержит по несколько объектов с одинаковым значением признака. Обобщая полученный результат на генеральную совокупность с непрерывным
распределением признака X , определим генеральную среднюю как математическое ожидание признака: Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пусть для изучения генеральной совокупности относительно количественного признака X извлечена выборка объёма n.
Выборочной среднейГенеральная и выборочная совокупности - определение и вычисление с примерами решенияназывают среднее арифметическое значений признака выборочной совокупности. Она вычисляется по формуле:

Замечание: выборочная средняя, найденная по данным одной выборки есть, очевидно, определённое число. Если же извлекать другие выборки того же объёма из той же генеральной совокупности, то выборочная средняя будет изменяться от выборки к выборке. Таким образом, выборочную среднюю можно рассматривать как случайную величину, а следовательно, можно говорить о распределениях (теоретическом и эмпирическом) выборочной средней и о числовых характеристиках этого распределенияГенеральная и выборочная совокупности - определение и вычисление с примерами решения, в частности, о математическом ожидании и
дисперсии выборочного распределения.

Далее, если генеральная средняя неизвестна и требуется оценить её по данным выборки, то в качестве оценки генеральной средней принимают выборочную среднюю, которая является несмещённой и состоятельной оценкой (предлагаем это утверждение доказать самостоятельно). Из сказанного следует, что если по нескольким выборкам достаточно большого объёма из одной и той же генеральной совокупности будут найдены выборочные средние, то они будут приближённо равны между собой. В этом состоит свойство устойчивости выборочных средних. Отметим, что если дисперсии двух совокупностей одинаковы, то близость выборочных средних к генеральным не зависит от отношения объёма выборки к объёму генеральной совокупности. Она зависит от объёма выборки: чем объём выборки больше, тем меньше выборочная средняя отличается от генеральной. Например, если из одной совокупности отобран 1% объектов, а из другой совокупности отобрано 4% объектов, причём объём первой выборки оказался большим, чем второй, то первая выборочная средняя будет меньше отличаться от соответствующей генеральной средней, чем вторая.

Для того чтобы охарактеризовать рассеяние значений количественного признака X генеральной совокупности вокруг своего среднего значения, вводят сводную характеристику – генеральную дисперсию. Генеральной дисперсиейГенеральная и выборочная совокупности - определение и вычисление с примерами решения называется среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения, и вычисляется по формуле:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного выборки вокруг своего среднего значения, вводят сводную характеристику – выборочную дисперсию. Выборочной дисперсией в Генеральная и выборочная совокупности - определение и вычисление с примерами решенияназывается среднее арифметическое квадратов отклонений наблюдаемых значений признака выборочной совокупности от их среднего значения xв , и вычисляется по формуле:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Вычисление дисперсии, безразлично, выборочной или генеральной, можно упростить, если воспользоваться следующей теоремой: дисперсия равна среднему квадратов значений признака минус квадрат общей средней: Генеральная и выборочная совокупности - определение и вычисление с примерами решения Действительно, справедливость теоремы вытекает из преобразований:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Кроме дисперсии для характеристики рассеяния значений признака генеральной (выборочной) совокупности вокруг своего среднего значения используют сводную характеристику – среднее квадратическое отклонение. Генеральным (выборочным) средним квадратическим отклонением называют квадратный корень из генеральной (выборочной) дисперсии:

Генеральная и выборочная совокупности - определение и вычисление с примерами решенияДалее, пусть из генеральной совокупности в результате n независимых наблюдений над количественным признаком X извлечена повторная выборка объёма n:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Требуется по данным выборки оценить (приближённо найти) неизвестную генеральную дисперсиюГенеральная и выборочная совокупности - определение и вычисление с примерами решения . Если в качестве оценки генеральной дисперсии принять выборочную дисперсию, то эта оценка будет приводить к систематическим ошибкам, давая заниженное значение генеральной дисперсии. Объясняется это тем, что как можно доказать, выборочная дисперсия является смещённой оценкой генеральной дисперсииГенеральная и выборочная совокупности - определение и вычисление с примерами решения . Другими словами, математическое ожидание выборочной дисперсии не равно оцениваемой генеральной дисперсии, а равно

Генеральная и выборочная совокупности - определение и вычисление с примерами решенияЛегко «исправить» выборочную дисперсию так, чтобы её математическое ожидание было равно генеральной дисперсии. Для этого достаточно умножить в Генеральная и выборочная совокупности - определение и вычисление с примерами решения на дробь Генеральная и выборочная совокупности - определение и вычисление с примерами решенияСделав это, получим «исправленную дисперсию», которую обычно принято обозначать черезГенеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

«Исправленная дисперсия» является, конечно, несмещённой оценкой генеральной дисперсии. Действительно

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Итак, в качестве оценки генеральной дисперсии принимают «исправленную дисперсию»

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Для оценки же среднего квадратического отклонения генеральной совокупности используют соответственно «исправленное» среднее квадратическое отклонение, которое равно квадратному корню из «исправленной дисперсии»:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Подчеркнём, что s не является несмещённой оценкой; чтобы отразить этот факт мы написали и будем писать далее так: «исправленное» среднее квадратическое отклонение.
 

Замечание: сравнивая формулы

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

видим, что они отличаются лишь знаменателем. Очевидно, при достаточно больших значениях n объёма выборки, выборочная и «исправленная» дисперсии различаются мало.

Интервальные оценки

Все оценки, рассмотренные в предыдущей лекции – точечные. При выборке малого объёма точечная оценка может значительно отличаться от оцениваемого параметра, то есть приводит к грубым ошибкам. По этой причине наряду с точечным оцениванием статистическая теория оценивания параметров занимается вопросами интервального оценивания, которым следует пользоваться при небольшом объёме выборки. Задачу интервального оценивания можно сформулировать так:    по данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что внутри него находится оцениваемый параметр. Интервальное оценивание, ещё раз это отметим, особенно необходимо при малом количестве наблюдений, когда точечная оценка малонадёжна.

Интервальной называют оценку, которая определяется двумя числами -концами интервала. Интервальные оценки позволяют установить точность и надёжность оценок (смысл этих понятий выясним ниже).

Итак, пусть, найденная по данным выборки, статистическая характеристика Генеральная и выборочная совокупности - определение и вычисление с примерами решенияслужит оценкой неизвестного параметраГенеральная и выборочная совокупности - определение и вычисление с примерами решения. Будем считать Генеральная и выборочная совокупности - определение и вычисление с примерами решенияпостоянным числом Генеральная и выборочная совокупности - определение и вычисление с примерами решения может быть и случайной величиной). Ясно, чтоГенеральная и выборочная совокупности - определение и вычисление с примерами решения тем точнее определяет параметрГенеральная и выборочная совокупности - определение и вычисление с примерами решения чем меньше абсолютная величина разностиГенеральная и выборочная совокупности - определение и вычисление с примерами решения Другими словами, еслиГенеральная и выборочная совокупности - определение и вычисление с примерами решения, то, чем меньше Генеральная и выборочная совокупности - определение и вычисление с примерами решения, тем оценка точнее.

Таким образом, положительное число Генеральная и выборочная совокупности - определение и вычисление с примерами решения характеризует точность оценки. К сожалению статистические методы не позволяют категорически утверждать, что оценка Генеральная и выборочная совокупности - определение и вычисление с примерами решенияудовлетворяет неравенству ©-©* <5; можно лишь говорить о вероятности у , с которой это неравенство осуществляется.

Надёжностью (доверительной вероятностью) оценкиГенеральная и выборочная совокупности - определение и вычисление с примерами решенияназывают вероятность у , с которой осуществляется неравенство Генеральная и выборочная совокупности - определение и вычисление с примерами решениято есть Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Обычно, надёжность оценки задаётся наперёд, причём в качестве у берут число, близкое к единице. Выбор доверительной вероятности не является математической задачей, а определяется конкретной решаемой проблемой. Наиболее часто задают надёжность, равную 0,95; 0,99; 0,999.

Согласно определению

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Это соотношение следует понимать так: вероятность того, что интервал Генеральная и выборочная совокупности - определение и вычисление с примерами решения ; заключает в себе (покрываетГенеральная и выборочная совокупности - определение и вычисление с примерами решения) неизвестный параметр Генеральная и выборочная совокупности - определение и вычисление с примерами решения
Доверительным называют интервал Генеральная и выборочная совокупности - определение и вычисление с примерами решения  который покрывает неизвестный параметр с заданной надёжностью Генеральная и выборочная совокупности - определение и вычисление с примерами решения
Метод доверительных интервалов разработан американским статистиком
Ю.Нейманом, исходя из идей английского статистика Р.Фишера.
Доверительный интервал для генеральной средней при известном значении среднего квадратического отклонения и при условии, что случайная величина (количественный признак X ) распределена нормально, задаётся выражением:
Генеральная и выборочная совокупности - определение и вычисление с примерами решения
где Генеральная и выборочная совокупности - определение и вычисление с примерами решения – наперёд заданное число, близкое к единице,Генеральная и выборочная совокупности - определение и вычисление с примерами решения – функция Лапласа, значения которой приведены в соответствующей таблице, Генеральная и выборочная совокупности - определение и вычисление с примерами решения. Смысл полученного соотношения таков: с надёжностьюГенеральная и выборочная совокупности - определение и вычисление с примерами решения можно утверждать, что доверительный интервал Генеральная и выборочная совокупности - определение и вычисление с примерами решения ; в покрывает неизвестный параметр Генеральная и выборочная совокупности - определение и вычисление с примерами решения при точности оценкиГенеральная и выборочная совокупности - определение и вычисление с примерами решения . Заметим, что число t
определяется из равенства Генеральная и выборочная совокупности - определение и вычисление с примерами решения по таблице значений функции Лапласа находят аргумент t , которому соответствует значение равноеГенеральная и выборочная совокупности - определение и вычисление с примерами решения
 

Замечание: оценку Генеральная и выборочная совокупности - определение и вычисление с примерами решения называют классической. Из формулыГенеральная и выборочная совокупности - определение и вычисление с примерами решения, определяющей точность классической оценки, моно сделать следующие выводы:
– при возрастании n– объёма выборки число Генеральная и выборочная совокупности - определение и вычисление с примерами решения убывает и, следовательно, точность оценки увеличивается;
– увеличение надёжности Генеральная и выборочная совокупности - определение и вычисление с примерами решения приводит к увеличению t (так как функция Генеральная и выборочная совокупности - определение и вычисление с примерами решения является возрастающей), а следовательно, и к возрастанию Генеральная и выборочная совокупности - определение и вычисление с примерами решения . Другими словами, увеличение надёжности классической оценки влечёт за собой уменьшение её точности.

Интервал Генеральная и выборочная совокупности - определение и вычисление с примерами решения ; имеет случайные концы (их называют доверительными границами). Действительно, в разных выборках получаются различные значения  . Следовательно от выборки к выборке будут изменяться и концы доверительного интервала, то есть доверительные
границы сами являются случайными величинами – функциями от Генеральная и выборочная совокупности - определение и вычисление с примерами решения . Так как случайной величиной является не оцениваемый параметр Генеральная и выборочная совокупности - определение и вычисление с примерами решения , а доверительный интервал, то более правильно говорить не о вероятности попадания Генеральная и выборочная совокупности - определение и вычисление с примерами решения в доверительный интервал, а о вероятности того, что доверительный интервал покроетГенеральная и выборочная совокупности - определение и вычисление с примерами решения 

Пример №13

Случайная величина X имеет нормальное распределение с известным средним квадратическим отклонением  Генеральная и выборочная совокупности - определение и вычисление с примерами решения. Найти доверительные интервалы для оценки неизвестного математического ожидания a (или, что тоже самое, для оценки неизвестной генеральной средней Генеральная и выборочная совокупности - определение и вычисление с примерами решения) по выборочным среднимГенеральная и выборочная совокупности - определение и вычисление с примерами решения, если объём выборки n =36 и задана надёжность оценкиГенеральная и выборочная совокупности - определение и вычисление с примерами решения
 

Решение. Найдём, прежде всего, t . Из соотношения Генеральная и выборочная совокупности - определение и вычисление с примерами решения получим Генеральная и выборочная совокупности - определение и вычисление с примерами решенияДалее, по таблице находим t =1,96 . Теперь, найдём точность оценки:
Генеральная и выборочная совокупности - определение и вычисление с примерами решения
Доверительные интервалы таковы:Генеральная и выборочная совокупности - определение и вычисление с примерами решения. Например, еслиГенеральная и выборочная совокупности - определение и вычисление с примерами решения то доверительный интервал имеет следующие доверительные границы:
Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Таким образом, значения неизвестного параметра Генеральная и выборочная совокупности - определение и вычисление с примерами решениясогласующиеся с данными выборки находятся в интервале  3,12; 5,08 .

Подчеркнём, что было бы ошибочным написать: Генеральная и выборочная совокупности - определение и вычисление с примерами решения Действительно, так как a – постоянная величина, то либо она заключена в найденном интервале (тогда событиеГенеральная и выборочная совокупности - определение и вычисление с примерами решения достоверно и его вероятность равна единице), либо в нём не заключена (в этом случае событие Генеральная и выборочная совокупности - определение и вычисление с примерами решения невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было сказано, изменяются от выборки к выборке.

Поясним смысл, который имеет заданная надёжность. НадёжностьГенеральная и выборочная совокупности - определение и вычисление с примерами решения указывает, что если произведено достаточно большое число выборок, то 95% из них определяет такие доверительные интервалы, в которых параметр Генеральная и выборочная совокупности - определение и вычисление с примерами решения действительно заключён; лишь в 5% случаев он может выйти за границы доверительного интервала.
 

Замечание: если требуется оценить математическое ожидание (генеральную среднюю) с наперёд заданной точностью Генеральная и выборочная совокупности - определение и вычисление с примерами решения и надёжностьюГенеральная и выборочная совокупности - определение и вычисление с примерами решениято минимальный объём выборки, который обеспечит эту точность, находят по формуле:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Нетрудно показать, что доверительный интервал для генеральной средней Генеральная и выборочная совокупности - определение и вычисление с примерами решения (математического ожидания a ) нормально распределённого признака при неизвестном значении среднего квадратического отклонения задаётся выражением:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

где s – «исправленное» среднее квадратическое отклонение, параметрГенеральная и выборочная совокупности - определение и вычисление с примерами решения находят по заданным значения Генеральная и выборочная совокупности - определение и вычисление с примерами решенияиз соответствующих таблиц (и наоборот, по заданнымГенеральная и выборочная совокупности - определение и вычисление с примерами решения находят вероятностьГенеральная и выборочная совокупности - определение и вычисление с примерами решения). Отсюда следует, что с надёжностью Генеральная и выборочная совокупности - определение и вычисление с примерами решения можно утверждать, что доверительный интервал Генеральная и выборочная совокупности - определение и вычисление с примерами решенияпокрывает неизвестный параметр Генеральная и выборочная совокупности - определение и вычисление с примерами решения
 

Пример №14

Количественный признак X генеральной совокупности распределён нормально. По выборке объёма n =16 найдены выборочная средняяГенеральная и выборочная совокупности - определение и вычисление с примерами решения и «исправленное» среднее квадратическое отклонение s = 0,8. Оценить неизвестную генеральную среднюю Генеральная и выборочная совокупности - определение и вычисление с примерами решения с помощью доверительного интервала с надёжностью Генеральная и выборочная совокупности - определение и вычисление с примерами решения
 

Решение. Пользуясь таблицей (см. приложения), по известным значениямГенеральная и выборочная совокупности - определение и вычисление с примерами решения находимГенеральная и выборочная совокупности - определение и вычисление с примерами решения. Тогда, доверительные границы:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Итак, с надёжностью   неизвестный параметр Генеральная и выборочная совокупности - определение и вычисление с примерами решения , заключён в доверительном интервале ( 19,774; 20,626 ).
 

Понятие статистической гипотезы. Общая постановка задачи проверки гипотез

Проверка статистических гипотез тесно связана с теорией оценивания  параметров. В естествознании, технике экономике для вычисления того или иного случайного факта часто прибегают к высказыванию гипотез, которые можно проверить статистически (то есть, опираясь на результаты наблюдений в случайной выборке). Под статистическими подразумевают такие гипотезы, которые относятся или к виду, или к отдельным параметрам распределения случайной величины. Например, статистической является гипотеза о том, что распределение  производительности труда рабочих, выполняющих одинаковую работу в одинаковых условиях, имеет нормальный закон распределения. Статистической будет также гипотеза о том, что средние размеры деталей, производимых на однотипных, параллельно работающих станках, не различаются.

Статистическая гипотеза называется простой, если она однозначно определяет распределение случайной величины АГ, в противном случае гипотеза называется сложной. Например, простой гипотезой является предположение о том, что случайная величина X распределена по нормальному закону с математическим ожиданием, равным нулю, и дисперсией равной единице. Если высказывается предположение, что случайная величина X имеет нормальное распределение с дисперсией, равной единице, а математическое ожидание – число из отрезка Генеральная и выборочная совокупности - определение и вычисление с примерами решения то это сложная гипотеза. Другим примером сложной гипотезы является предположение о том, что непрерывная случайная величина X с вероятностьюГенеральная и выборочная совокупности - определение и вычисление с примерами решения принимает значение из интервала (1; 5 ), в этом случае распределение случайной величины X может быть любым из класса непрерывных распределений.

Часто распределение величины X известно, и по выборке наблюдений необходимо проверить предположения о значении параметров этого распределения. Такие гипотезы называются параметрическими.

Проверяемая гипотеза называется пулевой и обозначается Генеральная и выборочная совокупности - определение и вычисление с примерами решения. Наряду с гипотезой Генеральная и выборочная совокупности - определение и вычисление с примерами решения рассматривают одну из альтернативных (конкурирующих) гипотезГенеральная и выборочная совокупности - определение и вычисление с примерами решения. Например, если проверяется гипотеза о равенстве параметра Генеральная и выборочная совокупности - определение и вычисление с примерами решения некоторому заданному значению Генеральная и выборочная совокупности - определение и вычисление с примерами решения  то в качестве альтернативной гипотезы можно рассматривать одну из следующих гипотез: Генеральная и выборочная совокупности - определение и вычисление с примерами решения– заданное значение, причёмГенеральная и выборочная совокупности - определение и вычисление с примерами решенияВыбор альтернативной гипотезы определяется конкретной формулировкой задачи.

Правило, по которому принимается решение принять или отклонить гипотезу Генеральная и выборочная совокупности - определение и вычисление с примерами решенияназывается критерием и обозначается К. Так как решение принимается на основе выборки наблюдений случайной величины X, необходимо выбрать подходящую статистику, называемую в этом случае статистикой Z критерия К. При проверке простой параметрической гипотезы Генеральная и выборочная совокупности - определение и вычисление с примерами решения в качестве статистики критерия выбирают ту же статистику, что и для оценки параметра  Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Проверка статистической гипотезы основывается на принципе, в соответствии с которым маловероятные события считаются невозможными, а события, имеющие большую вероятность,- достоверными. Этот принцип можно реализовать следующим образом. Перед анализом выборки фиксируется некоторая малая вероятность а, называемая уровнем значимости. Пусть V- множество значений статистики Генеральная и выборочная совокупности - определение и вычисление с примерами решения– такое подмножество, что при условии истинности гипотезы Генеральная и выборочная совокупности - определение и вычисление с примерами решения вероятность попадания статистики Z критерия вГенеральная и выборочная совокупности - определение и вычисление с примерами решения, то Генеральная и выборочная совокупности - определение и вычисление с примерами решения

ОбозначимГенеральная и выборочная совокупности - определение и вычисление с примерами решения выборочное значение статистики Z, вычисленное по выборке наблюдений. Критерий формулируется так: отклонить гипотезу Генеральная и выборочная совокупности - определение и вычисление с примерами решения принять гипотезуГенеральная и выборочная совокупности - определение и вычисление с примерами решения Критерий, основанный на использовании заранее заданного уровня значимости, называется критерием значимости. Множество Генеральная и выборочная совокупности - определение и вычисление с примерами решениявсех значений статистики Z критерия, при которых принимается решение отклонить гипотезу Генеральная и выборочная совокупности - определение и вычисление с примерами решения, называется критической областью; область Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется областью принятия гипотезыГенеральная и выборочная совокупности - определение и вычисление с примерами решения

Уровень значимости а определяет размер критической области  Генеральная и выборочная совокупности - определение и вычисление с примерами решения Положение критической области на множестве значений статистики Z зависит    от    формулировки альтернативной гипотезы  Генеральная и выборочная совокупности - определение и вычисление с примерами решения Например, если проверяется гипотеза Генеральная и выборочная совокупности - определение и вычисление с примерами решения причём альтернативная

гипотеза формулируется    как Генеральная и выборочная совокупности - определение и вычисление с примерами решения то критическая область размещается на правом (левом) «хвосте» распределения статистики Z, то есть имеет вид неравенства Генеральная и выборочная совокупности - определение и вычисление с примерами решениягде Генеральная и выборочная совокупности - определение и вычисление с примерами решениязначения статистики Z, которые    принимаются    с вероятностями Генеральная и выборочная совокупности - определение и вычисление с примерами решения при условии, что верна гипотеза Генеральная и выборочная совокупности - определение и вычисление с примерами решения. В этом случае критерий называется односторонним (соответственно -правосторонним и левосторонним). Если альтернативная гипотеза формулируется как Генеральная и выборочная совокупности - определение и вычисление с примерами решения то критическая область размещается на обеих «хвостах» распределения статистики Z, то есть определяется совокупностью неравенств.Генеральная и выборочная совокупности - определение и вычисление с примерами решенияВ этом случае критерий называется двусторонним.
 

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Расположение критической области Генеральная и выборочная совокупности - определение и вычисление с примерами решения для различных альтернативных гипотез показано рисунках, приведённых    выше, где   Генеральная и выборочная совокупности - определение и вычисление с примерами решенияплотность распределения статистики Z критерия    при    условии, что верна гипотеза   Генеральная и выборочная совокупности - определение и вычисление с примерами решенияГенеральная и выборочная совокупности - определение и вычисление с примерами решенияобласть принятия гипотезы,

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Проверку параметрической статистической гипотезы с помощью критерия значимости можно разбить на этапы:

  1. сформулировать проверяемуюГенеральная и выборочная совокупности - определение и вычисление с примерами решения и альтернативнуюГенеральная и выборочная совокупности - определение и вычисление с примерами решениягипотезы;
  2. назначить уровень значимости а;
  3. 3) выбрать статистику Z критерия для проверки гипотезы Генеральная и выборочная совокупности - определение и вычисление с примерами решения
  4. определить выборочное распределение статистики Z при условии, что верна гипотеза Генеральная и выборочная совокупности - определение и вычисление с примерами решения
  5. в зависимости от формулировки альтернативной гипотезы определить критическую областьГенеральная и выборочная совокупности - определение и вычисление с примерами решения одним    из    неравенств    Генеральная и выборочная совокупности - определение и вычисление с примерами решения или совокупностью неравенств Генеральная и выборочная совокупности - определение и вычисление с примерами решения
  6. получить выборку наблюдений и вычислить выборочные значенияГенеральная и выборочная совокупности - определение и вычисление с примерами решения статистики критерия;
  7. принять статистическое решение: если Генеральная и выборочная совокупности - определение и вычисление с примерами решения , то отклонить гипотезу Генеральная и выборочная совокупности - определение и вычисление с примерами решения как не согласующуюся с результатами наблюдений; если Генеральная и выборочная совокупности - определение и вычисление с примерами решениято принять гипотезу Генеральная и выборочная совокупности - определение и вычисление с примерами решения то есть считать, что гипотеза Генеральная и выборочная совокупности - определение и вычисление с примерами решения не противоречит результатам наблюденийГенеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №15

По паспортным данным автомобильного двигателя расход топлива на 100км пробега составляет Юл. В результате изменения конструкции двигателя ожидается, что расход топлива уменьшится. Для проверки проводятся испытания 25-и случайно отобранных автомобилей с модернизированным двигателем. Выборочное среднее расходов топлива на 100км пробега по результатам испытаний составило 9,3л. Предположим, что выборка расходов топлива получена из нормально распределённой генеральной совокупности со среднимГенеральная и выборочная совокупности - определение и вычисление с примерами решения  и дисперсией Генеральная и выборочная совокупности - определение и вычисление с примерами решенияИспользуя критерий значимости, проверить гипотезу, утверждающую, что изменение конструкции двигателя не повлияло на расход топлива.

Решение. Проверим гипотезу о среднем т нормально распределённой генеральной совокупности. Проверку проведём по этапам:

1) проверяемая гипотезаГенеральная и выборочная совокупности - определение и вычисление с примерами решения альтернативная гипотезаГенеральная и выборочная совокупности - определение и вычисление с примерами решения

2) уровень значимости Генеральная и выборочная совокупности - определение и вычисление с примерами решения

3) в качестве статистики Z критерия используем статистику математического ожидания – выборочное среднее Генеральная и выборочная совокупности - определение и вычисление с примерами решения

31 Обычно при выполнении пп. 4-7 используют статистику с нормальным распределением, статистику Стьюдента, Фишера.

32 То есть – с математическим ожиданием.

4) так как выборка получена из нормально распределённой генеральной совокупности, выборочное среднее также имеет нормальное распределение с дисперсией Генеральная и выборочная совокупности - определение и вычисление с примерами решения При условии, что верна гипотезаГенеральная и выборочная совокупности - определение и вычисление с примерами решения, математическое ожидание этого распределения равно 10. Нормированная статистика Генеральная и выборочная совокупности - определение и вычисление с примерами решения имеет нормальное распределение;

5) альтернативная гипотеза :Генеральная и выборочная совокупности - определение и вычисление с примерами решенияпредполагает уменьшение расхода топлива, следовательно, нужно использовать односторонний критерий. Критическая область определяется неравенствомГенеральная и выборочная совокупности - определение и вычисление с примерами решения По таблице (см. приложение) находим Генеральная и выборочная совокупности - определение и вычисление с примерами решения

6) выборочное значение нормированной статистики критерия Генеральная и выборочная совокупности - определение и вычисление с примерами решения

7) статистическое решение: так как выборочное значение статистики критерия принадлежит критической области, гипотеза Генеральная и выборочная совокупности - определение и вычисление с примерами решенияотклоняется. Следует считать, что изменение конструкции двигателя привело к уменьшению расхода топлива. ГраницуГенеральная и выборочная совокупности - определение и вычисление с примерами решениякритической области для исходной статистики Z критерия можно получить из соотношения Генеральная и выборочная совокупности - определение и вычисление с примерами решенияоткуда Генеральная и выборочная совокупности - определение и вычисление с примерами решенияТаким образом, критическая область для статистики Z определяется неравенством Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Решение, принимаемое на основе критерия значимости, может быть ошибочным. Пусть выборочное значение статистики критерия попадает в критическую область, и гипотеза Генеральная и выборочная совокупности - определение и вычисление с примерами решения отклоняется в соответствии с критерием. Если, тем не менее, гипотеза Генеральная и выборочная совокупности - определение и вычисление с примерами решения верна, то принимаемое решение неверно. Ошибка, совершаемая при отклонении правильной гипотезы Генеральная и выборочная совокупности - определение и вычисление с примерами решения , называется ошибкой первого рода. Вероятность ошибки первого рода равна вероятности попадания статистики критерия в критическую область при условии, что верна гипотеза Генеральная и выборочная совокупности - определение и вычисление с примерами решения, то
есть равна уровню значимости Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Ошибка второго рода происходит тогда, когда гипотеза Генеральная и выборочная совокупности - определение и вычисление с примерами решения принимается, но в действительности верна гипотезаГенеральная и выборочная совокупности - определение и вычисление с примерами решения . Вероятность Генеральная и выборочная совокупности - определение и вычисление с примерами решения ошибки второго рода вычисляется по формуле: Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №16

В условиях примера 3 предположим, что наряду с гипотезой Генеральная и выборочная совокупности - определение и вычисление с примерами решениярассматривается альтернативная гипотеза :Генеральная и выборочная совокупности - определение и вычисление с примерами решения . В качестве статистики критерия снова возьмём выборочное среднее Генеральная и выборочная совокупности - определение и вычисление с примерами решения . Предположим, что критическая область задана неравенством Генеральная и выборочная совокупности - определение и вычисление с примерами решения Найти вероятность ошибок первого и второго рода для критерия с такой критической областью.
 

Решение. Найдём вероятность ошибки первого рода. Статистика X критерия при условии, что верна гипотеза : Генеральная и выборочная совокупности - определение и вычисление с примерами решения , имеет нормальное распределение с математическим ожиданием, равным 10, и дисперсией, равной Генеральная и выборочная совокупности - определение и вычисление с примерами решенияиспользуя таблицу (см. приложение), по формуле Генеральная и выборочная совокупности - определение и вычисление с примерами решениянаходим Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Это означает, что принятый критерий классифицирует примерно 8% автомобилей, имеющих расход 10л на 100км пробега, как автомобили, имеющие меньший расход топлива.
При условии, что верна гипотеза Генеральная и выборочная совокупности - определение и вычисление с примерами решениястатистика Генеральная и выборочная совокупности - определение и вычисление с примерами решенияимеет нормальное распределение с математическим ожиданием, равным 9Б и дисперсией, равной Генеральная и выборочная совокупности - определение и вычисление с примерами решенияНетрудно в этом случае найти вероятность ошибки второго рода, воспользовавшись формулой Генеральная и выборочная совокупности - определение и вычисление с примерами решенияГенеральная и выборочная совокупности - определение и вычисление с примерами решения

Следовательно, в соответствии с принятым критерием 13,6% автомобилей, имеющих расход топлива 9л на 100км пробега, классифицируются как автомобили, имеющие расход топлива 10л.
 

Теоретические и эмпирические частоты. Критерии согласия

Эмпирические частоты получают в результате опыта (наблюдения). Теоретические частоты рассчитывают по формулам. Для нормального закона распределения их можно найти следующим образом:Генеральная и выборочная совокупности - определение и вычисление с примерами решениягде Генеральная и выборочная совокупности - определение и вычисление с примерами решения– сумма  эмпирических (наблюдаемых) частот; h разность между двумя соседними вариантами (то есть длина частичного интервала); Генеральная и выборочная совокупности - определение и вычисление с примерами решения-выборочное среднее квадратическое отклонение;Генеральная и выборочная совокупности - определение и вычисление с примерами решения выборочная средняя арифметическая;Генеральная и выборочная совокупности - определение и вычисление с примерами решения– середина Генеральная и выборочная совокупности - определение и вычисление с примерами решения частичного интервала; значения функции Генеральная и выборочная совокупности - определение и вычисление с примерами решениянаходят по таблице (см. приложения). 

Обычно эмпирические и теоретические частоты различаются. Возможно, что расхождение случайно и связано с ограниченным количеством наблюдений; возможно, что расхождение неслучайно и объясняется тем, что для вычисления теоретических частот выдвинута статистическая гипотеза о том, что генеральная совокупность распределена нормально, а в действительности это е так. Распределение генеральной совокупности, которое она имеет в силу выдвинутой гипотезы, называют теоретическим.

Возникает необходимость установить правило (критерий), которое позволяло бы судить, является ли расхождение между эмпирическим и теоретическим распределениями случайным или значимым. Если расхождение окажется случайным, то считают, что данные наблюдений (выборки) согласуются с выдвинутой гипотезой о законе распределения генеральной совокупности и, следовательно, гипотезу принимают. Если же расхождение окажется значимым, то данные наблюдений не согласуются с выдвинутой гипотезой, и её отвергают.

Критерием согласия называют критерий, который позволяет установить, является ли расхождение эмпирического и теоретического распределений случайным или значимым, то есть согласуются ли данные наблюдений с выдвинутой статистической гипотезой или не согласуются.

Имеются несколько критериев согласия: критерийГенеральная и выборочная совокупности - определение и вычисление с примерами решения (Пирсона), критерий Колмогорова, критерий Романовского и др. Ограничимся описанием того, как критерий Генеральная и выборочная совокупности - определение и вычисление с примерами решения применяется к проверке гипотезы о нормальном распределенииГенеральная и выборочная совокупности - определение и вычисление с примерами решения Генеральной совокупности (предлагаем студентам написать рефераты по различным критериям согласия н их применению).

Допустим, что в результате п наблюдений получена выборка:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Выдвинем статистическую гипотезу: генеральная совокупность, из которой извлечена данная выборка, имеет нормальное распределение. Требуется установить, согласуется ли эмпирическое распределение с этой гипотезой. Предположим, что по

33 Критерий применяется аналогично и для других распределений

формуле (*) вычислены теоретические частотыГенеральная и выборочная совокупности - определение и вычисление с примерами решения. Обозначим Генеральная и выборочная совокупности - определение и вычисление с примерами решениясреднее арифметическое квадратов разностей между эмпирическими и теоретическим частотами, взвешенное по обратным величинам теоретических частот:
Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Чем больше согласуются эмпирическое и теоретическое распределения, тем меньше различаются эмпирические и теоретические частоты и тем меньше значение Генеральная и выборочная совокупности - определение и вычисление с примерами решенияОтсюда следует, что Генеральная и выборочная совокупности - определение и вычисление с примерами решенияхарактеризует близость эмпирического и теоретического распределений. В разных опытах Генеральная и выборочная совокупности - определение и вычисление с примерами решенияпринимает различные, заранее неизвестные значения, то есть является случайной величиной.

Плотность вероятности этого распределения (для выборки достаточно большого объёма) не зависит от проверяемого закона распределения, а зависит от параметра к, называемого числом степеней свободы. Так при проверке гипотезы о нормальном распределении генеральной совокупности k=s- 3, где s- число групп, на которые разбиты данные наблюдений. Существуют таблицы (см. приложения), в которых указана вероятность того, что в результате влияния случайных факторов величинаГенеральная и выборочная совокупности - определение и вычисление с примерами решения примет значение не меньше вычисленного по данным выборки Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Для определённости примем уровень значимости 0,01. Если вероятность, найденная по таблицам, окажется меньше 0,01, то это означает, что в результате влияния случайных причин наступило событие, которое практически невозможно.

Таким образом, тот факт, чтоГенеральная и выборочная совокупности - определение и вычисление с примерами решения приняло значение Генеральная и выборочная совокупности - определение и вычисление с примерами решения   нельзя объяснить случайными причинами; его можно объяснить тем, что генеральная совокупность не распределена нормально и, значит, выдвинутая гипотеза о нормальном распределении генеральной совокупности должна быть отвергнута. Если вероятность, найденная по таблицам, превышает 0,01, то гипотеза о нормальном распределении генеральной совокупности согласуется с данными наблюдений и поэтому может быть принята. Полученные выводы распространяются и на другие уровни значимости.

На практике надо, чтобы объём выборки был достаточно большимГенеральная и выборочная совокупности - определение и вычисление с примерами решения и чтобы каждая группа содержала 5-8 значений признака.

Для проверки гипотезы о нормальном распределении генеральной совокупности нужно:

  1. вычислить теоретические частоты по формуле (*);
  2. вычислить Генеральная и выборочная совокупности - определение и вычисление с примерами решения   соответственно    частоты эмпирические и теоретические;
  3. вычислить число степеней свободы к = s- 3, где s- число групп, на которые разбита выборка;
  4. выбрать уровень значимости;
     
  5. найти по таблице (см. приложения) по найденным Генеральная и выборочная совокупности - определение и вычисление с примерами решениявероятностьГенеральная и выборочная совокупности - определение и вычисление с примерами решенияпричём, если эта вероятность меньше принятого уровня значимости, то гипотезу о нормальном распределении генеральной совокупности отвергают; если же вероятность больше уровня значимости, то гипотезу принимают.

Пример №17

Проверить, согласуются ли данные выборки со статистической гипотезой о нормальном распределении генеральной совокупности, из которой извлечена выборка:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Решение. Вычислим выборочное среднее и выборочную дисперсию:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Далее, вычислим теоретические частоты по формуле (*):

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Найдем Генеральная и выборочная совокупности - определение и вычисление с примерами решенияВычислим число степеней свободы, учитывая, что число групп выборки Генеральная и выборочная совокупности - определение и вычисление с примерами решенияУровень значимости примем равным 0,01. По таблице (см. приложения) при Генеральная и выборочная совокупности - определение и вычисление с примерами решениянаходим вероятность Генеральная и выборочная совокупности - определение и вычисление с примерами решенияИспользуя линейную интерполяцию, получаем приближённое значение искомой вероятности 0,16 > 0,01.Следовательно, данные наблюдений согласуются с гипотезой о нормально распределении генеральной совокупности.

Понятие о статистике

«Статистика знает все», — утверждали И. Ильф и Е. Петров в своем знаменитом романе «Двенадцать стульев» и продолжали: «Известно, сколько какой пищи съедает в год средний гражданин республики… Известно, сколько в стране охотников, балерин, станков, собак всех пород, велосипедов, памятников, девушек, маяков и швейных машинок… Как много жизни, полной пыла, страстей и мысли, глядит на нас из статистических таблиц!»

Это ироничное описание дает достаточно точное представление о статистике (от латинского status — состояние) — науке, изучающей, обрабатывающей и анализирующей количественные данные о разнообразнейших массовых явлениях в жизни.

Экономическая статистика изучает изменение цен, спроса и предложения товаров, прогнозирует рост и падение производства и потребления. Медицинская статистика изучает эффективность разных лекарств и методов лечения, вероятность возникновения некоторых заболеваний в зависимости от возраста, пола, наследственности, условий жизни, вредных привычек, прогнозирует распространение эпидемий. Демографическая статистика изучает рождаемость, численность населения, его состав (возрастной, национальный, профессиональный). А есть еще статистика финансовая, налоговая, биологическая, метеорологическая…

Статистика имеет многовековую историю. Уже в Древнем мире вели статистический учет населения. Однако случайное толкование статистических данных, отсутствие строгой научной базы статистических прогнозов даже в середине XIX в. еще не позволяли говорить о статистике как науке. Только в XX в. появилась математическая статистика — наука, опирающаяся на законы теории вероятностей. Выяснилось, что статистические методы обработки данных из самых разных областей жизни имеют много общего. Это позволило создать универсальные научно обоснованные методы статистических исследований и проверки статистических гипотез.

Таким образом, математическая статистика — это раздел математики, изучающий математические методы обработки и использования статистических данных для научных и практических выводов.

В математической статистике рассматриваются методы, которые дают возможность по результатам экспериментов (статистическим данным) делать определенные выводы вероятностного характера.

Основные задачи математической статистики

Среди основных задач математической статистики можно отметить следующие:

  1. Оценка вероятности. Пусть некоторое случайное событие имеет вероятность р > 0, но ее значение нам неизвестно. Требуется оценить эту вероятность по результатам экспериментов, то есть решить задачу об оценке вероятности через частоту.
  2. Оценка закона распределения. Исследуется некоторая случайная величина, точное выражение для закона распределения которой нам неизвестно. Необходимо по результатам экспериментов найти приближенное выражение для функции, задающей закон распределения.
  3. Оценка числовых характеристик случайной величины (математического ожидания, дисперсии — см. п. 20.2 и 20.3).
  4. Проверка статистических гипотез (предположений). Исследуется некоторая случайная величина. Исходя из определенных рассуждений, выдвигается, например, гипотеза, что распределение этой случайной величины близко к нормальному (см. п. 20.4). Необходимо по результатам экспериментов принять или отклонить эту гипотезу. Результаты исследований, проводимых методами математической статистики, применяются для принятия решений. В частности, при планировании и организации производства, при контроле качества продукции, при выборе оптимального времени наладки или замены действующей аппаратуры (например, при определении времени замены двигателя самолета, отдельных частей станков и т. д.).

Как и в каждой науке, в статистике используются свои специфические термины и понятия. Некоторые из них приведены в таблице 33 на с. 318. Запоминать их определения необязательно, достаточно понимать их смысл.

Генеральная совокупность и выборка

Для изучения различных массовых явлений проводятся специальные статистические исследования. Любое статистическое исследование начинается с целенаправленного сбора информации об изучаемом явлении или процессе. Этот этап называют этапом статистических наблюдений. Для получения статистических данных в результате наблюдений похожие элементы некоторой совокупности сравнивают по разным признакам. Как мы уже видели в задачах предыдущего параграфа, учащихся 11 классов можно сравнивать, например, по росту, размеру одежды, успеваимости и т. д. Болты можно сравнивать по длине, диаметру, массе, материалу и т. д. Практически любой признак или непосредственно измеряется, или может получить условную числовую характеристику. Таким образом, некоторый признак элементов совокупности можно рассматривать как случайную величину, принимающую те или иные числовые значения.

Часто употребляемый термин Смысл термина Научный термин Определение
Общий ряд данных То, откуда выбирают Генеральная совокупность Множество всех возможных результатов наблюдения (измерения)
Выборка То, что выбирают

Статистическая

выборка, статистический ряд

Множество результатов, реально полученных в данном наблюдении (измерении)
Варианта Значение одного из результатов наблюдения (измерения) Варианта Одно из значений элементов выборки
Ряд данных Значения всех результатов наблюдения (измерения) Вариационный ряд Упорядоченное множество всех вариант

При изучении реальных явлений часто бывает невозможно обследовать все элементы совокупности. Например, практически невозможно выяснить размеры обуви у всех людей планеты. А проверить, например, наличие листов некачественной фотобумаги в большой партии хотя и реально, но бессмысленно, потому что полная проверка приведет к уничтожению всей партии бумаги. В подобных случаях вместо изучения всех элементов совокупности, называемой генеральной совокупностью, обследуют ее значительную часть, выбранную случайным образом. Эту часть называют выборкой.

Если в выборке присутствуют все значения случайной величины в тех же пропорциях, что и в генеральной совокупности, то эту выборку называют репрезентативной (от французского representatif— показательный).

Например, если менеджер швейной фабрики большого города хочет выяснить, в каком количестве необходимо сшить одежду тех или иных размеров, он должен составить репрезентативную выборку людей этого города. Объем ее может быть и не очень большим (например, 1000 человек), но в такую выборку нельзя, например, брать только детей детского сада или только рабочих одного завода. Очевидно, микромоделью города может служить совокупность жителей многоквартирного дома (или нескольких домов), в котором приблизительно в тех же пропорциях, что и в самом городе, проживают люди разного возраста и разных комплекций.

 Пусть S — объем генеральной совокупности, Генеральная и выборочная совокупности - определение и вычисление с примерами решения— объем репрезентативной выборки, в которой Генеральная и выборочная совокупности - определение и вычисление с примерами решения значений исследуемых признаков распределены по частотам Генеральная и выборочная совокупности - определение и вычисление с примерами решения Тогда в генеральной совокупности частотам Генеральная и выборочная совокупности - определение и вычисление с примерами решениябудут соответствовать частоты Генеральная и выборочная совокупности - определение и вычисление с примерами решения тех же значений признака, что и в выборкеГенеральная и выборочная совокупности - определение и вычисление с примерами решенияПо определению репрезентативной выборки получаем: Генеральная и выборочная совокупности - определение и вычисление с примерами решения гдеГенеральная и выборочная совокупности - определение и вычисление с примерами решения — порядковый номер значения признакаГенеральная и выборочная совокупности - определение и вычисление с примерами решения Из этого соотношения находим Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №18

Обувной цех должен выпустить 1000 пар кроссовок молодежного фасона. Для определения того, сколько кроссовок и какого размера необходимо выпустить, были выявлены размеры обуви у 50 случайным образом выбранных подростков. Распределение размеров обуви по частотам представлено в таблице:

  • Размер (X) 36 37 38 39 40 41 42 43 44
  • Частота (М) 2 5 6 12 11 7 4 2 1

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Сколько кроссовок разного размера будет изготавливать фабрика?

Решение:

Будем считать рассмотренную выборку объемом Генеральная и выборочная совокупности - определение и вычисление с примерами решения подростков репрезентативной. Тогда в генеральной совокупности (объемом S = 1000) количество кроссовок каждого размера пропорционально количеству кроссовок соответствующего размера в выборке (и для каждого размера находится по формуле (1)). Результаты расчетов будем записывать в таблицу: Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Ответ. Генеральная и выборочная совокупности - определение и вычисление с примерами решения

В промышленности и сельском хозяйстве для определения количественного соотношения изделий разного сорта пользуются так называемым выборочным методом. Суть этого метода будет ясна из описания следующего опыта, теоретическую основу которого составляет закон больших чисел.

В коробке тщательно перемешан горох двух сортов: зеленый и желтый. Небольшой емкостью, например ложкой, вынимают из разных мест коробки порции гороха. В каждой порции подсчитывают число желтых горошин М и число всех горошин Генеральная и выборочная совокупности - определение и вычисление с примерами решения Для каждой порции находят относительную частоту появления желтой горошины Генеральная и выборочная совокупности - определение и вычисление с примерами решения Так делают Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз (на практике обычно берутГенеральная и выборочная совокупности - определение и вычисление с примерами решения и каждый раз вычисляют относительную частоту. В качестве статистической вероятности извлечения желтой горошины из коробки принимают среднее арифметическое полученных относительных частот Генеральная и выборочная совокупности - определение и вычисление с примерами решенияГенеральная и выборочная совокупности - определение и вычисление с примерами решения

Статистические характеристики рядов данных. Математическое ожидание случайной величины

Ранжирование ряда данных

Определение:

Под ранжированием ряда данных понимают расположение элементов этого ряда в порядке возрастания (имеется в виду, что каждое следующее число или больше, или не меньше предыдущего).

Пример:

Если ряд данных выборки имеет вид 5, 3, 7, 4, 6, 4, 6, 9, 4, то после ранжирования он превращается в ряд 3,4,4,4,5,6,6,7,9. (*)

Размах выборки Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Размах выборки — это разность между наибольшим и наименьшим значениями случайной величины в выборке.

Для ряда (*) размах выборки: R= 9-3 = 6.

МодаГенеральная и выборочная совокупности - определение и вычисление с примерами решения

Мода — это значение случайной величины, встречающееся чаще остальных.

В ряду (*) значение 4 встречается чаще всего, итак, Мо = 4.

Медиана (Me)

Медиана — это так называемое серединное значение упорядоченного ряда значений случайной величины:

  • если количество чисел в ряду нечетное, то медиана — это число, записанное посередине;
  • — если количество чисел в ряду четное, то медиана — это среднее арифметическое двух чисел, стоящих посередине.

Для ряда (*), в котором 9 членов, медиана — это среднее (то есть пятое) число 5: Ме = 5.

Если рассмотреть ряд 3,3,4,4,4,5,6,6,7,9, в котором 10 членов, то медиана — это среднее арифметическое пятого и шестого членов: Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Среднее значениеГенеральная и выборочная совокупности - определение и вычисление с примерами решенияслучайной величины X

Средним значением случайной величины X называется среднее арифметическое всех ее значений. Если случайная величина X принимает Генеральная и выборочная совокупности - определение и вычисление с примерами решения значений Генеральная и выборочная совокупности - определение и вычисление с примерами решениято Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Если случайная величина X принимает значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения соответственно с частотами Генеральная и выборочная совокупности - определение и вычисление с примерами решения (тогда Генеральная и выборочная совокупности - определение и вычисление с примерами решения то среднее арифметическое можно вычислить по формуле Генеральная и выборочная совокупности - определение и вычисление с примерами решения Пусть случайная величина X задана таблицей распределения по частотам М:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Тогда по формуле (**)

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Математическое ожидание (MX) случайной величины X

Пусть случайная величина X принимает значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения соответственно с вероятностями Генеральная и выборочная совокупности - определение и вычисление с примерами решенияГенеральная и выборочная совокупности - определение и вычисление с примерами решения то есть имеет закон распределения:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Сумма произведений всех значений случайной величины на соответствующие вероятности называется математическим ожиданием величины X:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения Пусть закон распределения случайной величины X задан таблицей: Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Математическое ожидание показывает, какое среднее значение случайной величины X можно ожидать в результате эксперимента (при значительном количестве повторений эксперимента).

Объяснение и обоснование:

Размах, мода и медиана ряда данных

Иногда выборку случайных величин или всю генеральную совокупность этих величин приходится характеризовать одним числом. На практике это необходимо, например, для быстрого сравнения двух или больше совокупностей по общему признаку. Рассмотрим конкретный пример.

Пусть после летних каникул провели опрос 10 девочек и 9 мальчиков одного класса о количестве книг, прочитанных ими за каникулы. Результаты были записаны в порядке опроса. Получили следующие ряды чисел:

  • для девочек: 4, 3, 5, 3, 8, 3, 12, 4, 5, 5;
  • для мальчиков: 5, 3, 3, 4, 6, 4, 4, 7, 4.

Чтобы удобнее было анализировать информацию, в подобных случаях числовые данные ранжируют, располагая их в порядке возрастания (когда каждое следующее число или больше, или не меньше предыдущего). В результате ранжирования получили следующие ряды.

  • Для девочек:
  • 3,3,3,4,4,5,5,5,8,12; (1)
  • для мальчиков:
  • 3,3,4,4,4,4,5,6,7. (2)

Тогда распределение по частотам М случайных величин: X — число книг, прочитанных за каникулы девочками, и Генеральная и выборочная совокупности - определение и вычисление с примерами решения — число книг, прочитанных за каникулы мальчиками, можно задать таблицами:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Эти распределения можно также проиллюстрировать графически с помощью полигона частот (рис. 159, а, б).

Для сравнения рядов (1) и (2) (то есть рядов значений случайных величин Генеральная и выборочная совокупности - определение и вычисление с примерами решенияиспользуют различные характеристики. Приведем некоторые из них.

Размахом ряда чисел (обозначается Генеральная и выборочная совокупности - определение и вычисление с примерами решения называют разность между наибольшим и наименьшим из этих чисел. Поскольку мы анализируем выборку случайных величин, то размах выборки — это разность между наибольшим и наименьшим значениями случайной величины в выборке.

Для ряда (1) размах R = 12 – 3 = 9, а для ряда (2) размах R = 7-3 = 4. На графике размах — это длина области определения полигона частот (рис. 161).

Важной статистической характеристикой ряда данных является его мода (обозначается Генеральная и выборочная совокупности - определение и вычисление с примерами решения от латинского слова modus — мера, правило).

Мода — это значение случайной величины, встречающееся чаще остальных.

Так, в ряду (1) две моды — числа 3 и 5: Генеральная и выборочная совокупности - определение и вычисление с примерами решения а в ряду (2) одна мода — число 4: Генеральная и выборочная совокупности - определение и вычисление с примерами решения = 4. На графике мода — это значение абциссы точки, в которой достигается максимум полигона частот (см. рис. 159). Отметим, что моды может и не быть, если все значения случайной величины встречаются одинаково часто.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Моду ряда данных обычно находят тогда, когда хотят выяснить некоторый типовой показатель. Например, когда изучают данные о моделях мужских рубашек, проданных в определенный день в универмаге, то удобно использовать такой показатель, как мода, который характеризует модель, пользующуюся наибольшим спросом (собственно, этим и объясняется название «мода»).

Еще одной важной статистической характеристикой ряда данных является его медиана.

Медиана — это так называемое серединное значение упорядоченного ряда значений случайной величины (обозначается Me).

Медиана делит упорядоченный ряд данных на две равные по количеству элементов части.

Если количество чисел в ряду нечетное, то медиана — это число, записанное посередине.

Например, в ряду (2) нечетное количество элементовГенеральная и выборочная совокупности - определение и вычисление с примерами решения Тогда его медианой является число, стоящее посередине, то есть на пятом месте: Me = 4.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Следовательно, о мальчиках можно сказать, что одна половина из них прочитала не больше 4 книг, а вторая — не меньше 4 книг. (Отметим, что в случае нечетного Генеральная и выборочная совокупности - определение и вычисление с примерами решения номер среднего члена ряда равен Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Если количество чисел в ряду четное, то медиана — это среднее арифметическое двух чисел, стоящих посередине.

Например, в ряду (1) четное количество элементов Генеральная и выборочная совокупности - определение и вычисление с примерами решения Тогда его медианой является число, равное среднему арифметическому чисел, стоящих посередине, то есть на пятом и шестом местах: Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Следовательно, о девочках можно сказать, что одна половина из них прочитала меньше 4,5 книг, а вторая — больше 4,5 книг. (Отметим, что в случае четного Генеральная и выборочная совокупности - определение и вычисление с примерами решения номера средних членов ряда равныГенеральная и выборочная совокупности - определение и вычисление с примерами решения

Среднее значение случайной величины и ее математическое ожидание

Средним значением случайной величины X (обозначается Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется среднее арифметическое всех ее значений.

Если случайная величина X принимает Генеральная и выборочная совокупности - определение и вычисление с примерами решения значений Генеральная и выборочная совокупности - определение и вычисление с примерами решения то

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Если случайная величина X принимает значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения соответственно с частотами Генеральная и выборочная совокупности - определение и вычисление с примерами решения то, заменяя одинаковые слагаемые в числителе на соответствующие произведения, получаем, что среднее арифметическое можно вычислять по формуле Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Последнюю формулу удобно использовать в тех случаях, когда распределение случайной величины по частотам задано в виде таблицы. Напомним, что распределение по частотам М случайных величин: X — число книг, прочитанных за каникулы девочками, и Генеральная и выборочная совокупности - определение и вычисление с примерами решения — число книг, прочитанных за каникулы мальчиками, было задано такими таблицами:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Тогда средние значения заданных случайных величин равны:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Поскольку Генеральная и выборочная совокупности - определение и вычисление с примерами решения то можно сказать, что за один и тот же промежуток времени девочки в классе читают книг больше, чем мальчики.

Если в правой части формулы (3) почленно разделить каждое слагаемое в числителе на знаменатель, то получим следующую формулу: Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Напомним, что отношение Генеральная и выборочная совокупности - определение и вычисление с примерами решения является относительной частотой случайного события — случайная величина X приняла значениеГенеральная и выборочная совокупности - определение и вычисление с примерами решения (мы обозначали это событие так:Генеральная и выборочная совокупности - определение и вычисление с примерами решения Если считать проведенные случайные эксперименты статистически стойкими, то при значительным количестве экспериментов значения относительных частот близки к соответствующим вероятностям. Обозначим вероятность события — случайная величина X приняла значение Генеральная и выборочная совокупности - определение и вычисление с примерами решения то есть Р (X = Генеральная и выборочная совокупности - определение и вычисление с примерами решения через Генеральная и выборочная совокупности - определение и вычисление с примерами решения -через Генеральная и выборочная совокупности - определение и вычисление с примерами решения Тогда правая часть равенства (4) приобретет вид Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Полученное выражение называется математическим ожиданием случайной величины X и обозначается MX (или М (X)). Сформулируем соответствующее определение для дискретной случайной величины.

Пусть случайная величина X принимает значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения соответственно с вероятностямиГенеральная и выборочная совокупности - определение и вычисление с примерами решения то есть имеет закон распределения:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Сумма произведений всех значений случайной величины на соответствующие вероятности называется математическим ожиданием величины

X:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Математическое ожидание показывает, на какое среднее значение случайной величины X можно надеяться в результате эксперимента (при значительном количестве повторений эксперимента). С помощью математического ожидания можно сравнивать случайные величины, заданные законами распределения.

Например, пусть количества очков, выбиваемых при одном выстреле каждым из двух ловких стрелков, имеют следующие законы распределения:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Чтобы выяснить, какой из стрелков стреляет более метко, находят математическое ожидание для каждой случайной величины: Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Следовательно, среднее количество очков, выбиваемое при одном выстреле, у второго стрелка несколько больше, чем у первого. Это дает основание сделать вывод о том, что второй стрелок стреляет немного лучше, чем первый.

Согласно закону больших чисел при значительном количестве экспериментов значения относительных частот близки к соответствующим вероятностям. Отсюда можно сделать вывод, что выражение Генеральная и выборочная совокупности - определение и вычисление с примерами решения

будет приближаться к выражению Генеральная и выборочная совокупности - определение и вычисление с примерами решения Но по формуле (4) первое из этих выражений является средним (то есть средним арифметическим) значением случайной величины X, а второе (по формуле (5)) — математическим ожиданием этой величины.

Таким образом, при значительном количестве экспериментов среднее арифметическое всех значений случайной величины приближается к ее математическому ожиданию.

Обратим внимание, что в пособиях по статистике моду, медиану и среднее значение объединяют одним термином — меры центральной тенденции, подчеркивая тем самым возможность охарактеризовать ряд выборки одним числом, к которому стремятся все ее значения.

Не для каждого ряда данных имеет смысл формально находить центральные тенденции. Например, если исследуется рядГенеральная и выборочная совокупности - определение и вычисление с примерами решения

годовых доходов четырех людей (в тыс. руб.), то очевидно, что ни мода (5), ни медиана (6,5), ни среднее значение (32) не могут выступать в роли единой характеристики всех значений ряда данных. Это объясняется тем, что размах ряда (105) является соизмеримым с наибольшим из его значений.

В данном случае можно искать центральные тенденции, например, для части ряда (5): 5, 5, 8, условно назвав его выборкой годового дохода низкооплачиваемой части населения.

Если в выборке среднее значение существенно отличается от моды, то его нецелесообразно выбирать в качестве типичной характеристики рассматриваемой совокупности данных (чем больше значение моды отличается от среднего значения, тем «более несимметричным» является полигон частот совокупности).

Отклонение от среднего значения, дисперсия, среднее квадратическое отклонение

Отклонение от среднего значения

Определение: Отклонением от среднего значения называют разность между рассматриваемым значением случайной величины и средним значением всей совокупности ряда данных (для случайной величины X отклонение от среднего — это Х-Генеральная и выборочная совокупности - определение и вычисление с примерами решения)

Пример:

Пусть случайная величина X задана таблицей распределения по частотам М:Генеральная и выборочная совокупности - определение и вычисление с примерами решенияГенеральная и выборочная совокупности - определение и вычисление с примерами решенияТогда получаем Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Дисперсия (D)

Дисперсией называется среднее арифметическое суммы квадратов всех отклонений от среднего заданных п значений случайной величины Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Для рассматриваемой случайной величины X:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Среднее квадратическое отклонение (Генеральная и выборочная совокупности - определение и вычисление с примерами решения — «сигма»)

Средним квадратическим отклонением называется квадратный корень из дисперсии Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Для рассматриваемой случайной величины X:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Объяснение и обоснование:

Отклонение от среднего значения и дисперсия

В предыдущем пункте было рассмотрено сравнение совокупностей значений случайных величин с помощью центральных тенденций (моды, медианы, среднего значения). Но бывают ситуации, когда такое сравнение выполнить невозможно.

Например, пусть на одно место токаря претендуют двое рабочих. Для каждого из них установили испытательный срок, в течение которого они должны были изготавливать одинаковые детали. Результаты их работы представлены в таблице: Количество деталей, изготовленных за день

День недели

первым рабочим (X) вторым рабочим (У)
Понедельник 52 61
Вторник 54 40
Среда 50 50

Четверг

48 55
Пятница 46 44

Каждый из рабочих за 5 дней изготовил 250 деталей, следовательно, средняя производительность труда за день обоих рабочих одинакова:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения (дет./день).

Моды у предложенных совокупностей отсутствуют, а медианы одинаковы (50 и 50).

Возникает вопрос: «Кого из этих рабочих взять на работу?» В данном случае как критерий сравнения совокупностей результатов их работы может выступать стабильность производительности труда рабочего. Ее можно оценить с помощью отклонений от среднего значения элементов совокупности.

Отклонением от среднего называют разность между рассматриваемым значением случайной величины и средним значением всей совокупности ряда данных (для случайной величины X отклонение от среднего — это Генеральная и выборочная совокупности - определение и вычисление с примерами решения).

Например, если значение величины Генеральная и выборочная совокупности - определение и вычисление с примерами решения = 52, а среднее значение Генеральная и выборочная совокупности - определение и вычисление с примерами решения =50, то отклонение Генеральная и выборочная совокупности - определение и вычисление с примерами решения, от среднего будет равняться Генеральная и выборочная совокупности - определение и вычисление с примерами решенияГенеральная и выборочная совокупности - определение и вычисление с примерами решения = 52 -50 = 2.

Очевидно, что отклонение от среднего может быть как положительным, так и отрицательным числом. Нетрудно показать, что сумма отклонений всех значений совокупности от среднего значения равна нулю (см., например, сумму отклонений в таблице, приведенной ниже). Поэтому характеристикой стабильности элементов совокупности может служить сумма квадратов отклонений от среднего.

Найдем соответствующие значения для количества деталей, изготовленных за день каждым рабочим и запишем их в таблицу:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Как видим, у второго рабочего сумма квадратов отклонений от среднего больше, чем у первого рабочего Генеральная и выборочная совокупности - определение и вычисление с примерами решения

На практике это означает, что второй рабочий имеет нестабильную производительность труда: в какие-то дни работает не в полную силу, а в какие-то наверстывает упущенное, что всегда сказывается на качестве продукции. Очевидно, что работодатель захочет взять на место токаря первого рабочего (у которого сумма квадратов отклонений от средней производительности труда меньше).

Если бы рабочие работали разное количество дней и изготовили в среднем одинаковое число деталей, то стабильность работы каждого из них можно было бы оценить по величине среднего арифметического суммы квадратов отклонений. Эта величина называется дисперсией (от латинского слова dispersio — рассеяние) и обозначается буквой D.

Таким образом, дисперсией называется среднее арифметическое суммы квадратов всех отклонений от среднего заданных п значений случайной величины.

Для случайной величины X, принимающей Генеральная и выборочная совокупности - определение и вычисление с примерами решения разных значенийГенеральная и выборочная совокупности - определение и вычисление с примерами решения и имеющей среднее значение Генеральная и выборочная совокупности - определение и вычисление с примерами решения, дисперсия находится по формуле

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №19

Два токаря вытачивали одинаковые детали, причем первый работал полную рабочую неделю, а второй — 4 дня. Сведения о количестве деталей, которые они изготавливали за каждый рабочий день, приведены в таблице:

Количество деталей, изготовленных за день

День недели

первым токарем (X) вторым токарем (У)
Понедельник 53 52
Вторник 54 46
Среда 49 53
Четверг 48 49
Пятница 46

Сравните стабильность работы токарей, используя дисперсию совокупности значений соответствующей случайной величины.

Решение:

 Найдем средние значения величин X и У:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Очевидно, что Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Вычислим сумму квадратов отклонений от средних значений величин X и У, последовательно записывая результаты в таблицу:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Найдем значения дисперсии:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Как видим,Генеральная и выборочная совокупности - определение и вычисление с примерами решения Следовательно, второй токарь работает более стабильно, чем первый. Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Обратим внимание, что в том случае, когда значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения случайной величины X повторяются с частотами Генеральная и выборочная совокупности - определение и вычисление с примерами решения соответственно, то дисперсию случайной величины X можно вычислить по формуле

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

где Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №20

Случайная величина X имеет распределение по частотам М, приведенное в таблице:Генеральная и выборочная совокупности - определение и вычисление с примерами решения Найдите ее дисперсию.

Решение:

Среднее значение случайной величины X равно:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

По формуле (3) находим дисперсию:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Ответ.Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Среднее квадратическое отклонение

Пусть величина X имеет некоторую размерность (например, сантиметры). Тогда ее среднее значение X и отклонение от среднего X – Генеральная и выборочная совокупности - определение и вычисление с примерами решения имеют ту же размерность, что и сама величина (сантиметры). Квадрат же отклоненияГенеральная и выборочная совокупности - определение и вычисление с примерами решения и дисперсия D имеют размерности квадрата этой величины (то есть квадратные сантиметры).

Для оценки степени отклонения от среднего значения удобно иметь дело с величиной той же размерности, что и величина X. С этой целью используют значение квадратного корня из дисперсии Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Квадратный корень из дисперсии называют средним квадратическим отклонением и обозначают а (греческая буква «сигма»):Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Замечание. Дисперсию и среднее квадратическое отклонение называют в статистике мерами рассеяния значений случайной величины вокруг среднего значения.

Пример №21

Распределение по частотам величины X — числа забитых голов десятью игроками футбольной команды за период соревнований — показано в таблице. Найти среднее квадратическое отклонение от среднего числа забитых голов.Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Решение:

Результаты последовательных расчетов будем заносить в таблицу:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Ответ:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Нормальное распределение. Правило трех сигм

Рассмотрим несколько примеров распределения случайных величин. Значения размеров одежды (X) и обуви (У) тысячи выбранных случайным образом одиннадцатиклассниц школ города и распределение их по частотам представлены в таблицах:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Полигоны частот заданных совокупностей изображены на рисунке 162.

Оказывается, что многие признаки разных явлений природы и техники (рост, масса живых организмов одного вида, результаты измерения характеристик однотипных технических изделий, дальность полета снаряда при стрельбе по цели из одной и той же пушки и др.) имеют подобные с представленными на рисунке 160 распределения своих числовых значений по частотам. Эти распределения называют нормальными распределениями.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Проведем через точки, отмеченные на рисунке 160, плавные кривые (рис. 161). Эти кривые называют кривыми нормального распределения. Отметим, что кривые нормального распределения симметричны относительно вертикальных прямых, проходящих через средние значенияГенеральная и выборочная совокупности - определение и вычисление с примерами решенияГенеральная и выборочная совокупности - определение и вычисление с примерами решениярассмотренных совокупностей.

Подобно тому, как графики всех парабол можно получить с помощью геометрических преобразований одной параболы Генеральная и выборочная совокупности - определение и вычисление с примерами решения так и все кривые нормальных распределений можно получить с помощью геометрических преобразований одной кривой. Эту кривую называют кривой нормального распределения, или гауссовой кривой, названной в честь немецкого математика Карла Гаусса (рис. 162).

Эта бесконечная «колоколоподобная» кривая симметрична относительно оси ординат и имеет единственный максимум. Площадь части плоскости, ограниченной гауссовой кривой и осью Ох, равна единице. Ее «ветви» очень быстро приближаются к оси абсцисс: площадь криволинейной трапеции, ограниченной гауссовой кривой, осью Ох и прямыми х = -3 и х = 3 больше 0,99 всей площади, то есть больше 99 % .

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Функцию, заданную гауссовой кривой, обозначаютГенеральная и выборочная совокупности - определение и вычисление с примерами решения Аналитически она задается достаточно сложной формулой:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Но для практических расчетов эта формула не очень нужна. Для значений этой функции составлены подробные числовые таблицы.

Примером реального получения кривой нормального распределения может служить результат опыта, проведенного английским ученым Ф. Гальтоном (1822-1911). Для проведения этого опыта в доску забивают в «шахматном порядке» гвозди (рис. 163). Доска устанавливается с небольшим наклоном к горизонтальной поверхности. В верхней части доски делается конусное отверстие, через которое пропускаются одинаковые шары. Расстояние между соседними гвоздями везде одинаково и немного больше диаметра шаров.

Пройдя через отверстие, шар отталкивается от первого верхнего гвоздя и случайным образом огибает его или слева, или справа. Аналогично шар проходит каждый из нижних гвоздей, встречающихся на его пути (с вероятностью, близкой Генеральная и выборочная совокупности - определение и вычисление с примерами решения огибает его или слева, или справа). Пройдя все ряды гвоздей, шар попадает в один из вертикальных пеналов-накопителей.

Если число рядов гвоздей значительно увеличить и запустить много шаров, можно заметить, что кривая, огибающая верхний ряд шаров в пеналах, имеет вертикальную ось симметрии и напоминает кривую нормального распределения.

В курсе теории вероятностей доказывается, что 68 % (или приблизительно Генеральная и выборочная совокупности - определение и вычисление с примерами решения всех значений нормально распределенной случайной величины X имеют отклонения от среднего значения, по абсолютной величине не превышающие среднее квадратическое отклонение Генеральная и выборочная совокупности - определение и вычисление с примерами решения всех значений — не превышающие Генеральная и выборочная совокупности - определение и вычисление с примерами решенияТакже доказывается, что почти все значения (точнее, 99,7 % всех значений) имеют отклонения от среднего, не превышающие по абсолютной величине утроенное среднее квадратическое отклонениеГенеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Эту закономерность часто называют правилом трех сигм (рис. 164). Известно, что результаты измерений в массовом производстве (длина, масса конкретных видов продукции) — непрерывные случайные величины, имеющие нормальное распределение.

Например, измерения диаметров Генеральная и выборочная совокупности - определение и вычисление с примерами решения партии труб (объем партии равен Генеральная и выборочная совокупности - определение и вычисление с примерами решения), изготовленных трубопрокатным заводом, показали, что размеры диаметров находятся в промежутке от 149,7 мм до 150,3 мм. Это означает, что среднее значение их совокупностиГенеральная и выборочная совокупности - определение и вычисление с примерами решения

Размеры диаметров труб распределены нормально со средним квадратическим отклонением от среднего значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения, равным Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Это проиллюстрировано на рисунке 165.Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Из приведенных рассуждений можно сделать вывод, что приблизительно Генеральная и выборочная совокупности - определение и вычисление с примерами решениявсех труб имеют диаметры от 149,9 мм до 150,1 мм, а значительная их часть (96 %) имеют диаметры от 149,8 мм до 150,2 мм.

Пример №22

В некоторых международных играх по разным видам спорта должны принимать участие 600 спортсменов. Известно, что размеры одежды (V) участников игр варьируются от 40-го (у гимнасток) до 62-го (у тяжелоатлетов). Оргкомитет игр решил подарить всем участникам майки с эмблемой игр. Швейной фабрике был сделан заказ на пошив маек свободного покроя трех условных размеров: I, II, III. Какие стандартные размеры (от 40-го до 62-го) целесообразно объединить в условные размеры I, II и III и сколько маек каждого из этих трех размеров необходимо сшить?

Решение:

Полагая, что размеры одежды (V) спортсменов имеют нормальное распределение, найдем среднее значение совокупности размеров Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Согласно правилу трех сигм считаем, что практически вся совокупность маек от 40-го до 62-го размера попадает в интервал длиной Генеральная и выборочная совокупности - определение и вычисление с примерами решения При этом в центральную часть распределения (рис. 166) попадают размеры 48, 50, 52, 54, им целесообразно присвоить условный размер II.

На эти размеры во всей совокупности будет приходиться приблизительно Генеральная и выборочная совокупности - определение и вычисление с примерами решения маек, то есть Генеральная и выборочная совокупности - определение и вычисление с примерами решения

В I условный размер войдут 40, 42, 44 и 46-й размеры; в III — 56, 58, 60 и 62-й размеры. Вследствие симметричности кривой нормального распределения относительно вертикальной прямой, проходящей через среднее значение, на I и III условные размеры маек приходится поровну:Генеральная и выборочная совокупности - определение и вычисление с примерами решения от всей совокупности маек, то есть по Генеральная и выборочная совокупности - определение и вычисление с примерами решениямаек.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Ответ. I (размеры 40-46) — 100 маек; II (размеры 48-54) — 400 маек; III (размеры 56-62) — 100 маек. Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Соединения с повторениями

Размещения с повторениями:

Размещением с повторениями из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов поГенеральная и выборочная совокупности - определение и вычисление с примерами решения называется конечная последовательность, состоящая из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов Генеральная и выборочная совокупности - определение и вычисление с примерами решениянекоторого re-элементного множества М

Формула числа размещений с повторениями:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример:

Количество различных трехзначных чисел, которые можно составить из цифр 1, 2, 3, 4, 5, 6, если цифры могут повторяться, равно Генеральная и выборочная совокупности - определение и вычисление с примерами решения Перестановки с повторениями

Перестановкой с повторениями состава Генеральная и выборочная совокупности - определение и вычисление с примерами решения из элементов Генеральная и выборочная совокупности - определение и вычисление с примерами решения некоторого множества М называется любая конечная последовательность, состоящая из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов, в которую элементГенеральная и выборочная совокупности - определение и вычисление с примерами решения входит Генеральная и выборочная совокупности - определение и вычисление с примерами решенияраз, элемент Генеральная и выборочная совокупности - определение и вычисление с примерами решения входитГенеральная и выборочная совокупности - определение и вычисление с примерами решения раз,…, элемент Генеральная и выборочная совокупности - определение и вычисление с примерами решения входитГенеральная и выборочная совокупности - определение и вычисление с примерами решения раз Формула числа перестановок с повторениями Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример:

Количество различных шестизначных чисел, которые можно составить из трех двоек, двух семерок и одной пятерки, равно Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Сочетания с повторениями:

Если задано Генеральная и выборочная совокупности - определение и вычисление с примерами решения-элементное множество, то сочетаниями с повторениями из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов по Генеральная и выборочная совокупности - определение и вычисление с примерами решения называются наборы, в каждый из которых входят Генеральная и выборочная совокупности - определение и вычисление с примерами решения заданных элементов (не обязательно разных), отличающихся только составом элементов (хотя бы одним элементом).

Формула числа сочетаний с повторениями Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример:

Если в продаже есть цветы четырех сортов, то количество разных букетов, составленных из 7 цветов, равно Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Схема решения комбинаторных задач

Выбор правила

Правило суммы:

Если элемент А можно выбрать Генеральная и выборочная совокупности - определение и вычисление с примерами решения способами, а элемент В — Генеральная и выборочная совокупности - определение и вычисление с примерами решения способами, то А или В можно выбратьГенеральная и выборочная совокупности - определение и вычисление с примерами решения способами.

Правило произведения

Если элемент А можно выбрать Генеральная и выборочная совокупности - определение и вычисление с примерами решения способами, а после этого элемент В —Генеральная и выборочная совокупности - определение и вычисление с примерами решения способами, то А и В можно выбрать Генеральная и выборочная совокупности - определение и вычисление с примерами решения способами. Выбор формулы

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Размещения с повторениями

Для введения понятия размещения с повторениями напомним понятие последовательности, которым вы пользовались в курсе алгебры 9 класса.

Например, рассмотрим последовательность Генеральная и выборочная совокупности - определение и вычисление с примерами решения двузначных чисел, оканчивающихся цифрой 5: 15; 25; 35; 45; 55; 65; 75; 85; 95.

У этой последовательности Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Можно сказать, что каждому натуральному числу от 1 до 9 ставится в соответствие единственное двузначное натуральное число, оканчивающееся цифрой 5. Тем самым задается функция, областью определения которой служит множество {1; 2; 3; 4; 5; 6; 7; 8; 9}, а областью значений — множество {15; 25; 35; 45; 55; 65; 75; 85; 95}.

Тогда можно дать следующее определение последовательности.

Функция, областью определения которой является множество натуральных чисел или множество первых п натуральных чисел, называется последовательностью.

Если последовательность определена на множестве всех натуральных чисел, то ее называют бесконечной последовательностью, а если последовательность определена на множестве первых п натуральных чисел, то ее называют конечной.

Размещением с повторениями из п элементов по Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется конечная последовательность, состоящая изГенеральная и выборочная совокупности - определение и вычисление с примерами решения элементов Генеральная и выборочная совокупности - определение и вычисление с примерами решения некоторогоГенеральная и выборочная совокупности - определение и вычисление с примерами решения-элементного множества М.

Например, из трех цифр множества {1; 5; 7} можно составить такие размещения из двух элементов с повторениями:

(1; 1), (1; 5), (1; 7), (5; 5), (5; 7), (7; 7), (5; 1), (7; 1), (7; 5).

Количество размещений из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов поГенеральная и выборочная совокупности - определение и вычисление с примерами решения элементов с повторениями обозначается Генеральная и выборочная совокупности - определение и вычисление с примерами решения (волнистая линия указывает на возможность повторения элементов). Как видим, Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Выясним, сколько всего можно составить размещений с повторениями из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов поГенеральная и выборочная совокупности - определение и вычисление с примерами решения Составление размещения представим себе как последовательное заполнение Генеральная и выборочная совокупности - определение и вычисление с примерами решения мест, которые мы будем изображать в виде клеточек (рис. 167). На первое место мы можем выбрать один из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов заданного множества (то есть элемент для первой клеточки можно выбрать Генеральная и выборочная совокупности - определение и вычисление с примерами решения способами). Далее, если элементы можно повторять, то на каждое следующее место мы снова можем выбрать один из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов заданного множества.

Поскольку нам необходимо выбрать элементы и на первое место, и на второе, …, и на Генеральная и выборочная совокупности - определение и вычисление с примерами решения то используем правило произведения и получим формулу для вычисления числа размещений из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов по Генеральная и выборочная совокупности - определение и вычисление с примерами решения с повторениями:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Например,Генеральная и выборочная совокупности - определение и вычисление с примерами решения (что совпадает с соответствующим значением, полученным выше).

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Напомним, что при решении простейших комбинаторных задач важно правильно выбрать формулу, по которой будут проводиться вычисления.Для этого достаточно выяснить:

  • — Учитывается ли порядок следования элементов в соединении?
  • — Все ли заданные элементы входят в полученное соединение?

Если, например, порядок следования элементов учитывается и изГенеральная и выборочная совокупности - определение и вычисление с примерами решения заданных элементов в соединении используется только Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов, то по определению — это размещение изГенеральная и выборочная совокупности - определение и вычисление с примерами решения элементов по Генеральная и выборочная совокупности - определение и вычисление с примерами решения. После определения вида соединения следует также выяснить, могут ли элементы в соединении повторяться, то есть выяснить, какую формулу необходимо использовать — для количества соединений без повторений или с повторениями.

Примеры решения задач:

Пример №23

Найдите количество трехзначных чисел, которые можно составить из цифр 3, 4, 5, 6, 7, 8, 9, если: 1) цифры в числе не повторяются; 2) цифры в числе могут повторяться.

Решение:

 Количество трехзначных чисел, которые можно составить из семи цифр 3, 4, 5, 6, 7, 8, 9, равно числу размещений из 7 элементов по 3. Тогда получаем количество трехзначных чисел для задания 1:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения для задания Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Комментарий:

При выборе формулы принимаем во внимание, что для чисел, которые мы будем составлять, порядок следования элементов учитывается и не все элементы выбираются (только 3 цифры из заданных семи). Следовательно, соответствующее соединение — размещение из 7 элементов по 3 (без повторений для задания 1 и с повторениями для задания 2).

Пример №24

Найдите количество трехзначных чисел, которые можно составить из цифр 3, 4, 5, 6, 7, 8, 0, если: 1) цифры в числе не повторяются; 2) цифры в числе могут повторяться.

Решение:

 1) Количество трехзначных чисел, которые можно составить из семи цифр (среди которых нет цифры 0), равно числу размещений из 7 элементов по 3, то есть Генеральная и выборочная совокупности - определение и вычисление с примерами решения Но среди данных цифр есть цифра 0, с которой не может начинаться трехзначное число. Поэтому из размещений из 7 элементов по 3 необходимо исключить те размещения, в которых первым элементом является Комментарий

Выбор формулы производится так же, как и в задаче 1. Следует учесть, что число, составленное из трех цифр, первая из которых цифра 0, не считается трехзначным. Тогда из заданных 7 цифр сначала можно составить все числа, состоящие из 3 цифр (см. задачу 1), а затем из их количества вычесть количество чисел, составленных из трех цифр, начинающихся цифрой 0. В последнем цифра 0. Их количество равно числу размещений из 6 элементов по 2, то есть Генеральная и выборочная совокупности - определение и вычисление с примерами решенияСледовательно, искомое количество трехзначных чисел равно Генеральная и выборочная совокупности - определение и вычисление с примерами решения

 2) На первое место в трехзначном числе мы можем поставить любую цифру, кроме 0, — всего 6 возможностей. Так как цифры в числе могут повторяться, то на второе место можно поставить любую из 7 заданных цифр — имеем 7 возможностей. На третье место снова можно поставить любую из 7 заданных цифр — также 7 возможностей. Поскольку мы должны заполнить и первое место, и второе, и третье, то по правилу произведения получаем, что искомое количество трехзначных чисел равно 6 • 7- 7 = 294. Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Также можно выполнить непосредственное вычисление, последовательно заполняя три места в трехзначном числе и используя правило произведения (см. задание 2). В этом случае, чтобы сделать рассуждения наглядными, удобно изобразить соответствующие разряды в трехзначном числе в виде клеточек, например так:

  1. 6 возможностей 6 возможностей 5 возможностей
  2. 6 возможностей 7 возможностей 7 возможностей

Перестановки с повторениями

Если мы будем переставлять цифры в числе 2226 так, чтобы получить разные четырехзначные числа, то получим перестановки с повторениями, составленные из трех двоек и одной шестерки: (2, 2, 2, 6), (2, 2, 6, 2), (2, 6, 2, 2), (6, 2, 2, 2) — всего 4 перестановки (соответственно получаем четыре четырехзначных числа: 2226, 2262, 2622, 6222).

Перестановкой с повторениями состава Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов Генеральная и выборочная совокупности - определение и вычисление с примерами решениянекоторого множества М называется любая конечная последовательность, состоящая из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов, в которую элемент Генеральная и выборочная совокупности - определение и вычисление с примерами решения входит Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз, Генеральная и выборочная совокупности - определение и вычисление с примерами решения входит Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз, …, Генеральная и выборочная совокупности - определение и вычисление с примерами решения входит Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз.

Количество перестановок с повторениями из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов обозначаютГенеральная и выборочная совокупности - определение и вычисление с примерами решенияИногда, чтобы подчеркнуть, что в заданной перестановке из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз повторяется первый элемент Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз повторяется второй элемент Генеральная и выборочная совокупности - определение и вычисление с примерами решенияГенеральная и выборочная совокупности - определение и вычисление с примерами решения раз повторяется Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементГенеральная и выборочная совокупности - определение и вычисление с примерами решения используется также обозначениеГенеральная и выборочная совокупности - определение и вычисление с примерами решения В частности, в рассмотренном примере можно записать:Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Выясним, сколько всего можно составить перестановок с повторениями из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов, если в каждой из перестановок Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз повторяется элемент Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз повторяется элемент Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз повторяется элемент Генеральная и выборочная совокупности - определение и вычисление с примерами решения Генеральная и выборочная совокупности - определение и вычисление с примерами решения Составление перестановки представим себе как последовательное заполнение Генеральная и выборочная совокупности - определение и вычисление с примерами решения мест, которые мы будем изображать в виде клеточек (на рисунке 168 изображена одна из таких перестановок). Сначала предположим, что все Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов, из которых составляется перестановка, разные. Тогда получаем перестановки без повторений, их количество Генеральная и выборочная совокупности - определение и вычисление с примерами решенияДалее учтем, что при перестановке местами элементовГенеральная и выборочная совокупности - определение и вычисление с примерами решения занимающих какие-то Генеральная и выборочная совокупности - определение и вычисление с примерами решения мест (не обязательно подряд), рассмотренная перестановка не изменится (поскольку мы переставляем одинаковые элементы). Элементы, стоящие на Генеральная и выборочная совокупности - определение и вычисление с примерами решенияместах, можно переставитьГенеральная и выборочная совокупности - определение и вычисление с примерами решения! способами. Подсчитывая общее количество перестановок из п разных элементов, мы пользовались правилом произведения. Тогда в полученном произведении Генеральная и выборочная совокупности - определение и вычисление с примерами решения в случае повторения Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз элемента Генеральная и выборочная совокупности - определение и вычисление с примерами решения лишним является произведение Генеральная и выборочная совокупности - определение и вычисление с примерами решения Чтобы избавиться от этого лишнего

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

множителя, достаточно число Генеральная и выборочная совокупности - определение и вычисление с примерами решения разделить на числоГенеральная и выборочная совокупности - определение и вычисление с примерами решения Аналогично, если элемент Генеральная и выборочная совокупности - определение и вычисление с примерами решения повторяется Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз, то в полученном произведении Генеральная и выборочная совокупности - определение и вычисление с примерами решения лишним является произведение Генеральная и выборочная совокупности - определение и вычисление с примерами решения Чтобы избавиться от этого множителя, достаточно число Генеральная и выборочная совокупности - определение и вычисление с примерами решения разделить на число Генеральная и выборочная совокупности - определение и вычисление с примерами решения Повторяя эти рассуждения Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз, получаем, что количество перестановок с повторениями из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов, в каждой из которых Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз повторяется элемент Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз повторяется элемент Генеральная и выборочная совокупности - определение и вычисление с примерами решения раз повторяется элемент Генеральная и выборочная совокупности - определение и вычисление с примерами решенияГенеральная и выборочная совокупности - определение и вычисление с примерами решенияравно

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Например, количество перестановок с повторениями, составленных из трех двоек и одной шестерки, равноГенеральная и выборочная совокупности - определение и вычисление с примерами решения (что совпадает со значением, полученным выше с помощью непосредственного вычисления количества таких перестановок).

Примеры решения задач:

Пример №25

Найдите количество разных четырехзначных чисел, которые можно получить при перестановке цифр 1, 1, 4, 4.

Решение:

Искомое количество четырехзначных чисел равно

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Комментарий:

Поскольку порядок элементов учитывается и для получения четырехзначного числа необходимо использовать все элементы, то искомое соединение — это перестановки с повторениями из 4 элементов. Их количество Генеральная и выборочная совокупности - определение и вычисление с примерами решения вычисляется по приведенной выше формуле, при этом учитывается состав этих перестановок: Генеральная и выборочная совокупности - определение и вычисление с примерами решения (2 цифры 4), Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Сочетания с повторениями

Пусть задано Генеральная и выборочная совокупности - определение и вычисление с примерами решения-элементное множество (то есть множество, содержащее Генеральная и выборочная совокупности - определение и вычисление с примерами решения разных элементов). Будем составлять наборы, содержащие Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов этого множества (один и тот же элемент может входить в набор несколько раз). Два таких набора будем считать одинаковыми тогда и только тогда, когда они имеют одинаковый состав (не учитывая порядок следования элементов в наборе). Такие наборы назовем сочетаниями с повторениями из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов по Генеральная и выборочная совокупности - определение и вычисление с примерами решения.

Таким образом, если задано Генеральная и выборочная совокупности - определение и вычисление с примерами решения-элементное множество, то сочетаниями с повторениями из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов по Генеральная и выборочная совокупности - определение и вычисление с примерами решения называются наборы, в каждый из которых входит Генеральная и выборочная совокупности - определение и вычисление с примерами решениязаданных элементов (не обязательно разных), отличающихся только составом элементов (хотя бы одним элементом).

Например, из двух букв {a; b} можно составить следующие сочетания с повторениями по четыре элемента: аааа, aaab, aabb, abbb, bbbb. (Отметим, что, в соответствии с принятой выше договоренностью, например, наборы aaab и abaa одинаковы, поскольку они имеют одинаковый состав — три буквы а и одну букву b.)

Количество сочетаний с повторениями из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов по Генеральная и выборочная совокупности - определение и вычисление с примерами решения обозначим Генеральная и выборочная совокупности - определение и вычисление с примерами решения Как видим,Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Выясним, сколько всего можно составить сочетаний с повторениями из Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов по Генеральная и выборочная совокупности - определение и вычисление с примерами решения Составление сочетания представим себе как заполнение (в любом порядке) Генеральная и выборочная совокупности - определение и вычисление с примерами решения мест, которые мы будем изображать в виде клеточек (рис. 169).

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Повторение элемента представим себе как его копирование и помещение копии этого элемента на соответствующем месте. Для того чтобы в последнюю клеточку мы могли поместить любой из заданных Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементов, в предыдущие Генеральная и выборочная совокупности - определение и вычисление с примерами решения – 1 клеточки мы должны поместить копии выбранных элементов (см. рис. 169). Но тогда мы должны фактически поместить Генеральная и выборочная совокупности - определение и вычисление с примерами решения элементовГенеральная и выборочная совокупности - определение и вычисление с примерами решения заданных элементов и ещеГенеральная и выборочная совокупности - определение и вычисление с примерами решения копию) без повторений наГенеральная и выборочная совокупности - определение и вычисление с примерами решения мест (не учитывая порядок следования элементов), а это можно сделать Генеральная и выборочная совокупности - определение и вычисление с примерами решения способами. Следовательно, Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Например, Генеральная и выборочная совокупности - определение и вычисление с примерами решения (что совпадает со значением, полученным выше с помощью непосредственного подсчета количества таких сочетаний с повторениями).

Примеры решения задач:

Пример №26

В почтовом отделении продаются открытки 5 видов. Найдите количество способов покупки 7 открыток.

Решение:

 Искомое число способов равно числу сочетаний с повторениями из 5 элементов по 7, то есть

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Комментарий:

При выборе открыток порядок их следования не учитывается, значит, соответствующие соединения — сочетания. Условие задачи не запрещает покупать одинаковые открытки, следовательно, используем формулу для числа сочетаний с повторениями: Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Решение более сложных комбинаторных задач

При решении комбинаторных задач с выбором нескольких элементов приходится выяснять, каким правилом необходимо пользоваться, а после этого определять, по каким формулам можно вычислить количество соответствующих соединений. Схема таких рассуждений приведена в таблице 36.

Напомним, что в случае, когда нам приходится выбирать набор, в который входит и первый, и второй, и третий, и т. д. элементы, способы выбора каждого элемента надо перемножать, а если приходится выбирать или первый элемент, или второй, или третий и т. д. элемент, способы выбора каждого элемента надо складывать.

При выборе формулы для подсчета количества соответствующих соединений следует иметь в виду, что в определении только одного вида соединений — сочетаний — не учитывается порядок следования элементов. А те соединения, где учитывается порядок следования элементов (размещения и перестановки), отличаются тем, что в перестановки входят все заданные элементы, а в размещения — не все (конечно, за исключением того случая, когда мы рассматриваем перестановки как частный случай размещения).

Таким образом, как уже отмечалось, для выбора соответствующей формулы достаточно дать ответ на два вопроса.

  • — Учитывается ли порядок следования элементов в соединении? (Если «нет», то это сочетания; если «да», то отвечаем на второй вопрос.)
  • — Все ли элементы входят в соединение? (Если «да», то это перестановки, если «нет», то это размещения.)

Кроме того, чтобы выбрать соответствующую формулу для соединений (без повторений или с повторениями) необходимо дополнительно выяснить, могут ли элементы в соединении повторяться. Приведем примеры таких рассуждений.

Пример №27

Собрание из 60 членов выбирает председателя, секретаря и трех членов редакционной комиссии по подготовке проекта постановления собрания. Сколькими способами это можно сделать?

Решение:

1) Поскольку надо выбрать и председателя, и секретаря, и членов редакционной комиссии, то будем использовать правило произведения. 2) Сначала выберем председателя и секретаря. Задаем себе вопрос: «Учитывается ли порядок следования элементов?» Ответ: «Да» (потому что первый выбранный будет председателем, а второй — секретарем собрания). Задаем себе второй вопрос: «Все ли элементы входят в соединение?» Ответ: «Нет» (потому что выбираем двух из 60 человек). Следовательно соответствующее соединение будет размещением (без повторений) из 60 элементов по 2, и число таких размещений равно Генеральная и выборочная совокупности - определение и вычисление с примерами решения Аналогично выбираем трех членов редакционной коммисии (из оставшихся 58 членов). Снова задаем себе вопрос: «Учитывается ли порядок элементов?» Ответ: «Нет» (потому что независимо от того, в каком порядке будут выбраны члены редакционной комиссии, они все будут выполнять одну и ту же работу). Значит, соответствующее соединение будет сочетанием (без повторений) из 58 элементов по 3, и число таких сочетаний равноГенеральная и выборочная совокупности - определение и вычисление с примерами решения.

Тогда выбор и председателя, и секретаря, и трех членов редакционной коммиссии выполняется Генеральная и выборочная совокупности - определение и вычисление с примерами решения способами, то есть Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Замечание. Как уже отмечалось, ответ к этой задаче можно не записывать в виде числа, а оставить в виде Генеральная и выборочная совокупности - определение и вычисление с примерами решения.

Некоторые комбинаторные задачи связаны с цифровой записью числа. Анализируя условие и требование таких задач, часто удобно изображать позиции, которые может занимать каждая цифра, в виде пустых клеточек (рис. 170, Генеральная и выборочная совокупности - определение и вычисление с примерами решения).

Пример №28

Сколько четных трехзначных чисел можно составить из цифр 1, 2, 3, 4, 5:

  • 1) если цифры в числе не повторяются;
  • 2) если цифры повторяются?

Решение:

 Чтобы число было четным, последняя его цифра должна быть четной, то есть из заданных цифр это 2 (рис. 169, б) или 4 (рис. 169, Генеральная и выборочная совокупности - определение и вычисление с примерами решения).

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Поскольку условию задачи удовлетворяет или первый вариант (последняя цифра 2), или второй (последняя цифра 4), то применим правило суммы. Вычислим количество четных трехзначных чисел в каждом варианте. Задаем себе вопрос: «Учитывается ли порядок следования элементов?» Ответ: «Да» (потому что, например, числа 352 и 532 — разные). Задаем второй вопрос: «Все ли элементы входят в соединение»? Ответ: «Нет» (потому что у нас только два свободных места, а на них «претендуют» 4 цифры (или 5 — если цифры могут повторяться). Следовательно, имеем дело с размещениями: 1) из четырех элементов по два (без повторений) —Генеральная и выборочная совокупности - определение и вычисление с примерами решения) из пяти элементов по два (с повторениями) — Генеральная и выборочная совокупности - определение и вычисление с примерами решения.

Количество возможных трехзначных чисел, оканчивающих на 2 и на 4 (см. рис. 170, б и в), одинаково, поэтому по правилу суммы общее количество четных трехзначных чисел будет следующим:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №29

Лифт, в котором находится 9 пассажиров, может останавливаться на 10 этажах. Пассажиры выходят группами по два, три и четыре человека. Сколькими способами эти группы пассажиров могут выходить из лифта на указанных этажах?

Решение:

Так как по условию 9 пассажиров выходят группами по 2, 3 и 4 человека, то лифт должен сделать 3 остановки, чтобы вышли все пассажиры (2 + + 3 + 4 = 9). Отдельно подсчитаем количество способов разделения пассажиров на три группы (по 2, 3 и 4 человека) и отдельно — количество способов выбора трех остановок лифта. Для решения задачи необходимо выбрать и группы пассажиров, и этажи для их выхода, следовательно, будем применять правило произведения.

Из 9 пассажиров можно выбрать группу из 2 человек (не учитывая порядок их выбора, поскольку они выходят на одном этаже) Генеральная и выборочная совокупности - определение и вычисление с примерами решения способами. Из семи оставшихся пассажиров можно выбрать группу из 3 человек Генеральная и выборочная совокупности - определение и вычисление с примерами решения способами. После этого останется 1 группа из 4 членов (формально ее можно выбрать Генеральная и выборочная совокупности - определение и вычисление с примерами решения = 1 способом). Следовательно, группы пассажиров можно составить Генеральная и выборочная совокупности - определение и вычисление с примерами решенияспособами.

Три остановки из 10 этажей можно выбрать Генеральная и выборочная совокупности - определение и вычисление с примерами решения способами (порядок учитывается, поскольку группы могут выходить в разном порядке). Тогда искомое число равно Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Обратим внимание, что для решения многих комбинаторных задач главным является не столько знание комбинаторных формул, сколько умение построить целесообразную математическую модель заданной ситуации.

Пример №30

В некотором сказочном королевстве не было двух людей с одинаковым набором зубов. Каким может быть максимальное количество жителей этого королевства, если у человека 32 зуба?

Решение:

Пронумеруем все зубы, которые должны быть у человека, числами от 1 до 32. Изобразим набор зубов у каждого жителя королевства в виде 32 клеточек (рис. 171) и в каждую клеточку поставим цифру 1, если на этом месте у рассмотриваемого жителя зуб есть, и цифру 0, если на этом месте у него зуба нет (на рисунке изображен один из возможных наборов зубов).

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Тогда каждый житель королевства будет закодирован некоторой упорядоченной последовательностью из 32 нулей и единиц. По условию, в королевстве нет людей с одинаковыми наборами зубов, поэтому максимальное количество людей в королевстве равно количеству таких наборов. Эти наборы являются размещениями с повторениями из двух элементов (0 и 1) по 32. Следовательно, их количество равноГенеральная и выборочная совокупности - определение и вычисление с примерами решения Таким образом, максимальное количество людей в сказочном королевстве может равняться Генеральная и выборочная совокупности - определение и вычисление с примерами решения (это приблизительно Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Понятие генеральной совокупности. Выборка из генеральной совокупности

Основными задачами математической статистики являются:

  1. Разработка методов получения (сбора) информации.
  2. Построение методов обработки полученной информации.

Определение. Под генеральной совокупностью понимается случайный количественный признак Генеральная и выборочная совокупности - определение и вычисление с примерами решения присущий рассматриваемому явлению или каждому элементу исследуемого множества.

Определение. Выборкой объема Генеральная и выборочная совокупности - определение и вычисление с примерами решения из генеральной совокупности Генеральная и выборочная совокупности - определение и вычисление с примерами решения с функцией распределения Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется последовательность Генеральная и выборочная совокупности - определение и вычисление с примерами решениянаблюдаемых значений случайной величины Генеральная и выборочная совокупности - определение и вычисление с примерами решения соответствующим Генеральная и выборочная совокупности - определение и вычисление с примерами решения независимым повторениям эксперимента. Выборка должна быть репрезентативной, т.е. наиболее полно и адекватно представлять свойства исследуемого объекта.

  1. Выборка должна быть достаточно большого объема
  2. Выборка должна представлять все группы исследуемого объекта.
  3. Выборка должна быть случайной.

Пример. Дана выборка объема Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения – варианта.

Определение. Наблюдаемые значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения записанные в порядке возрастания называются вариационным рядом.

2,2,2,3,4, 4,5,5,5,7,7,7,7, 10, 10.

Определение. Статистический ряд – таблица, первая строка которой – перечень вариант, вторая строка – перечень соответствующих им частот или относительных частот.
Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения– частота появления значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения в выборке.
Статистический ряд относительных частот:
Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения – относительная частота (частость Генеральная и выборочная совокупности - определение и вычисление с примерами решения
Определение. Размах выборки Генеральная и выборочная совокупности - определение и вычисление с примерами решения – разность между максимальным и минимальным значением элементов выборки.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Для большого объема данных или в случае непрерывного признака Генеральная и выборочная совокупности - определение и вычисление с примерами решения используют группированные выборки, для которых строят интервальный статистический ряд. Генеральная и выборочная совокупности - определение и вычисление с примерами решения– шаг, Генеральная и выборочная совокупности - определение и вычисление с примерами решения– размах выборки, Генеральная и выборочная совокупности - определение и вычисление с примерами решения число интервалов разбиения (для выборок большого объема можно, например, выбрать Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Интервальный ряд относительных частот

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Если в статистическом распределении вместо частот (относительных частот) указать накопленные частоты (относительные накопленные частоты), то такой ряд называют кумулятивным.

Накопленной частотой называется число значений признака Генеральная и выборочная совокупности - определение и вычисление с примерами решения меньших заданного значения Генеральная и выборочная совокупности - определение и вычисление с примерами решения то есть, число вариант Генеральная и выборочная совокупности - определение и вычисление с примерами решения в выборке, отвечающих условию Генеральная и выборочная совокупности - определение и вычисление с примерами решенияГенеральная и выборочная совокупности - определение и вычисление с примерами решения

Дискретный кумулятивный ряд:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Интервальный кумулятивный ряд:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Аналогично строятся кумулятивные ряды относительных частот.

Графическое представление выборки

1. Полигон частот (для малых выборок).

Полигон частот – ломаная, отрезки которой соединяют точки с координатами Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Гистограмма частот (для группированных выборок)

Гистограмма частот – ступенчатая фигура, состоящая из прямоугольников, основанием которых служат частичные интервалы, длиной Генеральная и выборочная совокупности - определение и вычисление с примерами решения а высоты равны отношению Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Гистограмма относительных частот:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Площадь гистограммы относительных частот равна единице; она даст представление о возможном распределении (плотности) непрерывной генеральной совокупности. 3. Эмпирическая функция распределения.

Эмпирическая функция распределения Генеральная и выборочная совокупности - определение и вычисление с примерами решения определяет для любого Генеральная и выборочная совокупности - определение и вычисление с примерами решения долю вариант Генеральная и выборочная совокупности - определение и вычисление с примерами решения в выборке, для которых справедливо условие Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения – накопленная частость.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

3. Кумулята (для непрерывного признака).

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

а) наносим точки с координатами Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

б) соединяем их отрезками

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Часто кумуляту обозначают так же, как и эмпирическую функцию распределения, F*x(x).

Точечные оценки

Важной задачей математической статистики является задача оценивания (приближенного определения) по выборочным данным параметров закона распределения признака Генеральная и выборочная совокупности - определение и вычисление с примерами решения генеральной совокупности. Статистические оценки могут быть точечными и интервальными. Точечной оценкой называют оценку, которая определяется одним числом.

Пусть Генеральная и выборочная совокупности - определение и вычисление с примерами решения – выборка объема Генеральная и выборочная совокупности - определение и вычисление с примерами решения из генеральной совокупности с функцией распределения Генеральная и выборочная совокупности - определение и вычисление с примерами решения с неизвестным параметром Генеральная и выборочная совокупности - определение и вычисление с примерами решения Произвольная функция элементов выборки Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется статистикой.

Значение статистики Генеральная и выборочная совокупности - определение и вычисление с примерами решения является точечной оценкой параметра Генеральная и выборочная совокупности - определение и вычисление с примерами решения если оно приблизительно равно оцениваемому параметру и может заменить его с достаточной степенью точности в статистических расчетах.

Оценка Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется несмещенной, если математическое ожидание оценки равно оцениваемому параметру, т.е. Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Оценка Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется состоятельной, если для любого Генеральная и выборочная совокупности - определение и вычисление с примерами решения

 Оценка Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется эффективной, если при фиксированном Генеральная и выборочная совокупности - определение и вычисление с примерами решения она имеет наименьшую дисперсию.

Точечные оценки числовых характеристик распределения (метод моментов).

Пусть Генеральная и выборочная совокупности - определение и вычисление с примерами решения – генеральная совокупность объема Генеральная и выборочная совокупности - определение и вычисление с примерами решения с функцией распределения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения – выборка объема Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральной средней Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется среднее арифметическое значений элементов генеральной совокупности.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Выборочной средней Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется среднее арифметическое элементов выборки.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Теорема: Генеральная и выборочная совокупности - определение и вычисление с примерами решения является несмещенной оценкой Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Доказательство: Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Замечание. Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Например: если Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральной дисперсией Генеральная и выборочная совокупности - определение и вычисление с примерами решения называют величину Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Выборочной дисперсией Генеральная и выборочная совокупности - определение и вычисление с примерами решения называют величину Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Теорема: выборочная дисперсия Генеральная и выборочная совокупности - определение и вычисление с примерами решения является смещенной оценкой генеральной дисперсии.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения – исправленная выборочная дисперсия, или несмещенная оценка  дисперсии генеральной совокупности.

Если математическое ожидание генеральной совокупности известно, то в качестве несмещенной оценки генеральной совокупности используется

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Заключение (основные формулы):

1) Оценка математического ожидания генеральной совокупности

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

2) Точечные оценки дисперсии генеральной совокупности

Генеральная и выборочная совокупности - определение и вычисление с примерами решения – смещенная оценка дисперсии генеральной совокупности 

Генеральная и выборочная совокупности - определение и вычисление с примерами решения – несмещенная оценка дисперсии генеральной совокупности 

Генеральная и выборочная совокупности - определение и вычисление с примерами решения несмещенная оценка дисперсии генеральной совокупности, если известно ее математическое ожидание.

Замечания.

А). На практике в качестве характеристик среднего значения генеральной совокупности также рассматривают моду и медиану распределения. По выборке медиану оценивают по формулам:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения если Генеральная и выборочная совокупности - определение и вычисление с примерами решения– четное; Генеральная и выборочная совокупности - определение и вычисление с примерами решения если Генеральная и выборочная совокупности - определение и вычисление с примерами решения – нечетное.

Мода – наиболее часто встречающееся в выборке значение признака Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Б). В качестве характеристик вариации рассматривают также выборочное

среднеквадратичное отклонение Генеральная и выборочная совокупности - определение и вычисление с примерами решения и коэффициент вариации Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Коэффициент вариации применяют для сравнения вариации признаков сильно отличающихся по величине, или имеющих разные единицы измерения (разные наименования).

Метод наибольшего (максимального) правдоподобия.

Метод наибольшего правдоподобия – это метод оценки неизвестных параметров

распределения, в основе которого – поиск максимального значения функции

правдоподобия.

Достоинства:

  1. Может использоваться в случае, когда теоретические моменты распределения отсутствуют.
  2. Оценки в основном состоятельны и эффективны.
  3. Оценки распределены асимптотически нормально.
  4. Наиболее полно используются данные о выборке (особенно полезны в случае малых выборок).

Недостатки:

  1. Оценки могут быть смещенными.
  2. Сложность вычислений.
  3. Не всегда совпадают с оценками по методу моментов.

1. Дискретная случайная величина Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пусть Генеральная и выборочная совокупности - определение и вычисление с примерами решения -выборка объема Генеральная и выборочная совокупности - определение и вычисление с примерами решения из генеральной совокупности Генеральная и выборочная совокупности - определение и вычисление с примерами решения с известной функцией распределения Генеральная и выборочная совокупности - определение и вычисление с примерами решения – неизвестный параметр, который нужно определить по выборке, Генеральная и выборочная совокупности - определение и вычисление с примерами решения – вероятность того, что в результате испытания Генеральная и выборочная совокупности - определение и вычисление с примерами решения примет значение Генеральная и выборочная совокупности - определение и вычисление с примерами решения

 Определение. Функцией правдоподобия дискретной случайной величины называется функция аргумента Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

В качестве точечной оценки Генеральная и выборочная совокупности - определение и вычисление с примерами решения принимается Генеральная и выборочная совокупности - определение и вычисление с примерами решения при которой Генеральная и выборочная совокупности - определение и вычисление с примерами решения принимает для данной выборки наибольшее значение.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения -оценка наибольшего правдоподобия.

Определение. Логарифмической функцией правдоподобия называют функцию Генеральная и выборочная совокупности - определение и вычисление с примерами решения Алгоритм построения Генеральная и выборочная совокупности - определение и вычисление с примерами решения

А) осуществляем выборку Генеральная и выборочная совокупности - определение и вычисление с примерами решения вычисляем вероятности Генеральная и выборочная совокупности - определение и вычисление с примерами решения и строим Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример:

Найти методом максимального правдоподобия оценку параметра Генеральная и выборочная совокупности - определение и вычисление с примерами решения распределения Пуассона.

Решение: 

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения где Генеральная и выборочная совокупности - определение и вычисление с примерами решения число испытаний? Генеральная и выборочная совокупности - определение и вычисление с примерами решения -число появлений события в Генеральная и выборочная совокупности - определение и вычисление с примерами решения опыте

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

2. Непрерывная случайная величина Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пусть Генеральная и выборочная совокупности - определение и вычисление с примерами решения -выборка объема Генеральная и выборочная совокупности - определение и вычисление с примерами решения из генеральной совокупности Генеральная и выборочная совокупности - определение и вычисление с примерами решения с известной функцией распределения Генеральная и выборочная совокупности - определение и вычисление с примерами решения– неизвестный параметр, который нужно определить по выборке, Генеральная и выборочная совокупности - определение и вычисление с примерами решения – плотность распределения вероятностей Генеральная и выборочная совокупности - определение и вычисление с примерами решения в точке Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Определение. Функцией правдоподобия непрерывной случайной величины Генеральная и выборочная совокупности - определение и вычисление с примерами решения называют Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример. Найти методом максимального правдоподобия оценку параметра Генеральная и выборочная совокупности - определение и вычисление с примерами решения показательного распределения:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Доверительные интервалы для параметров генеральной совокупности

Пусть Генеральная и выборочная совокупности - определение и вычисление с примерами решения – генеральная совокупность с функцией распределения Генеральная и выборочная совокупности - определение и вычисление с примерами решения зависящей от параметра Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения оценка Генеральная и выборочная совокупности - определение и вычисление с примерами решения полученная по выборке Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения оценка Генеральная и выборочная совокупности - определение и вычисление с примерами решения полученная по выборке Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Задача – по выборке объема Генеральная и выборочная совокупности - определение и вычисление с примерами решения построить интервал, которому с вероятностью Генеральная и выборочная совокупности - определение и вычисление с примерами решения принадлежит истинное значение параметра Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения
Генеральная и выборочная совокупности - определение и вычисление с примерами решения – уровень значимости, Генеральная и выборочная совокупности - определение и вычисление с примерами решения – доверительная вероятность, Генеральная и выборочная совокупности - определение и вычисление с примерами решения-доверительный интервал.

Определение. Доверительным интервалом для параметра Генеральная и выборочная совокупности - определение и вычисление с примерами решения генеральной совокупности Генеральная и выборочная совокупности - определение и вычисление с примерами решения с функцией распределения Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется интервал Генеральная и выборочная совокупности - определение и вычисление с примерами решения в который истинное значение параметра Генеральная и выборочная совокупности - определение и вычисление с примерами решения попадает с вероятностью Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №31

Генеральная и выборочная совокупности - определение и вычисление с примерами решения имеет нормальное распределение с параметрами Генеральная и выборочная совокупности - определение и вычисление с примерами решения Найти доверительный интервал для математического ожидания Генеральная и выборочная совокупности - определение и вычисление с примерами решения по результатам Генеральная и выборочная совокупности - определение и вычисление с примерами решения наблюдений при условии, что Генеральная и выборочная совокупности - определение и вычисление с примерами решения известна, а доверительная вероятность равна Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Определение. Квантилью порядка Генеральная и выборочная совокупности - определение и вычисление с примерами решения непрерывного теоретического распределения случайной величины Генеральная и выборочная совокупности - определение и вычисление с примерами решения называется действительное число Генеральная и выборочная совокупности - определение и вычисление с примерами решенияудовлетворяющее уравнению:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения  ИЛИ  Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения – функция распределения Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Введем обозначения Генеральная и выборочная совокупности - определение и вычисление с примерами решения – квантиль порядка Генеральная и выборочная совокупности - определение и вычисление с примерами решения стандартного нормального распределения. Тогда

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №32

Генеральная и выборочная совокупности - определение и вычисление с примерами решения имеет нормальное распределение с параметрами Генеральная и выборочная совокупности - определение и вычисление с примерами решения Найти доверительный интервал для Генеральная и выборочная совокупности - определение и вычисление с примерами решения по результатам Генеральная и выборочная совокупности - определение и вычисление с примерами решения наблюдений при условии, что Генеральная и выборочная совокупности - определение и вычисление с примерами решения известно, а доверительная вероятность равна Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Примечание:

1. Доверительный интервал для математического ожидания в случае, если дисперсия генеральной совокупности неизвестна:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

2. Доверительный интервал для дисперсии при неизвестном математическом ожидании:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №33

В результате тестирования группа студентов из 25 человек набрала баллы: 4, 0, 3, 4, 1, 0, 3, 1, 0, 1, 0, 0, 3, 1, 0, 1, 1, 3, 2, 3, 4, 2, 1, 2, 3. Построить дискретный вариационный ряд. Построить полигон распределения частот и относительных частот,  кумуляту и огиву статистического распределения.

Решение. Проранжируем исходные данные, подсчитаем частоту вариант: 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4 (табл. 1.3).

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Построим полигон частот.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Полигон относительных частот будет иметь следующий вид.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Вычислим накопленные частоты и частости (табл. 1.4).

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Пример №34

Результаты измерения производительности труда 100 рабочих имеют следующий вид:

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Построить интервальный вариационный ряд. Построить гистограмму (полигон) частот. Построить кумуляту и огиву.

Решение. В случае, когда число вариант Генеральная и выборочная совокупности - определение и вычисление с примерами решения достаточно велико Генеральная и выборочная совокупности - определение и вычисление с примерами решения составляют интервальный вариационный ряд. Наибольшим значением случайной величины является 95, а наименьшим Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Для определения величины интервала используем формулу Стерджссса:
Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Возьмем за ширину интервала Генеральная и выборочная совокупности - определение и вычисление с примерами решения
Интервальный ряд представлен в табл. 1.5.

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Гистограмма относительных частот является аналогом дифференциальной функции случайной величины.

Найдем накопленные частоты Генеральная и выборочная совокупности - определение и вычисление с примерами решения для каждого из интервалов данного интервального вариационного ряда (табл. 1.6).

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Кумулятивный ряд представлен в табл. 1.7. 

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

Генеральная и выборочная совокупности - определение и вычисление с примерами решения

  • Интервальные оценки параметров распределения
  • Алгебра событий – определение и вычисление
  • Свойства вероятности
  • Многомерные случайные величины
  • Теоремы теории вероятностей
  • Основные законы распределения дискретных случайных величин
  • Непрерывные случайные величины
  • Закон больших чисел

26.
Понятие выборки. Вариационный ряд.
Полигон частот. Выборочная функция
распределения. Гистограмма.

Математическая
статистика занимается установлением
закономерностей, которым подчинены
массовые случайные явления, на основе
обработки статистических данных,
полученных в результате наблюдений.
Двумя основными задачами математической
статистики являются:


определение способов сбора и группировки
этих статистических данных;


разработка методов анализа полученных
данных в зависимости от целей исследования,
к которым относятся:

а)
оценка неизвестной вероятности события;
оценка неизвестной функции распределения;
оценка параметров распределения, вид
которого известен; оценка зависимости
от других случайных величин и т.д.;

б)
проверка статистических гипотез о виде
неизвестного распределения или о
значениях параметров известного
распределения.

Генеральная
совокупность

– все множество имеющихся объектов.

Выборка
– набор объектов, случайно отобранных
из генеральной совокупности.

Объем
генеральной совокупности N и объем
выборки n

– число объектов в рассматривае-мой
совокупности.

Виды
выборки:

Повторная
– каждый отобранный объект перед выбором
следующего возвращается в генеральную
совокупность;

Бесповторная

отобранный объект в генеральную
совокупность не возвращается.

Пусть
некоторый признак генеральной совокупности
описыва­ется случайной величиной X.

Рассмотрим
выборку 12,…,хп}
объема
п
из
генеральной совокупности. этой выбор­ки
представляют собой значения случайной
величины X.

На
первом этапе статистической обработки
производят
ран­жирование
выборки,
т.е. упорядочивание чисел х12,…,хп
по
возрастанию.

Различные
элементы выборки называются вариантами.

Час­тотой
варианты

называется
число
,
показывающее,
сколь­ко раз эта варианта встречается
в выборке.

Частостью,
относи­тельной частотой

или
долей
варианты
называется число

(1.1)

Частоты
и частости называются весами.

Пусть
х
некоторое
число. Тогда количество вариант
,
значе­ния которых меньше х,
называется
накопленной частотой, т.е.

(1.2)

Отношение
накопленной частоты к общему числу
наблюдений п
называется
накопленной
частостью:

Ряд
вариант, расположенных в порядке
возрастания их зна­чений, с
соответствующими им весами называется
вариацион­ным
рядом.

Вариационные
ряды бывают:


дискретные;


интер­вальные.

Вариационный
ряд называется дискретным,
если
он представляет собой выборку значений
дискретной случайной ве­личины.

Ряд
называется непрерывным
(интервальным)
,
если
он представляет выборку непрерывной
случайной величины.

Общий
вид дискретного вариационного ряда:

Варианты

Частоты

Интер­вальный
ряд можно представить таблицей:

Варианты

Частоты

Полигон
частот. Выборочная функция распределения
и гистограмма.

Для
наглядного представления о поведении
исследуемой случайной величины в выборке
можно строить различные графики. Один
из них – полигон частот: ломаная, отрезки
которой соединяют точки с координатами
(x1, n1), (x2, n2),…, (xk, nk), где xiоткладываются
на оси абсцисс, а ni– на оси ординат. Если
на оси ординат откладывать не абсолютные
(ni), а относительные (wi) частоты, то получим
полигон относительных частот.

По
аналогии с функцией распределения
случайной величины можно задать некоторую
функцию, относительную частоту события
X < x.

Определение
15.1
.
Выборочной (эмпирической) функцией
распределения называют функцию F*(x),
определяющую для каждого значения х
относительную частоту события X <
x. Таким образом,

где

– число вариант, меньших х, n
– объем выборки.

Замечание.
В отличие от эмпирической функции
распределения, найденной опытным путем,
функцию распределения F(x) генеральной
совокупности называют теоретической
функцией распределения. F(x) определяет
вероятность события X < x, а F*(x) – его
относительную частоту. При достаточно
больших п, как следует из теоремы
Бернулли, F*(x) стремится по вероятности
к F(x).

Из
определения эмпирической функции
распределения видно, что ее свойства
совпадают со свойствами F(x), а именно:

1)
0 ≤ F*(x) ≤ 1.

2)
F*(x) – неубывающая функция.

3)
Если х1 – наименьшая варианта, то
F*(x) = 0 при х≤ х1; если хк – наибольшая
варианта, то F*(x) = 1 при х > хк .

Для
непрерывного признака графической
иллюстрацией служит
гистограмма
,
то есть ступенчатая фигура, состоящая
из прямоугольников, основаниями которых
служат частичные интервалы длиной h, а
высотами – отрезки длиной ni /h (гистограмма
частот) или wi /h (гистограмма относительных
частот). В первом случае площадь
гистограммы равна объему выборки, во
втором – единице.

Добавить комментарий