Выборочная проверка как найти

Выборочный
метод

это система научных принципов случайного
отбора определенной части совокупности,
которая представляла бы всю совокупность
и характеристики которой служили бы
надежной основой статистического
вывода.

Совокупность,
из которой отбираются элементы для
обследования, называют генеральной,
а совокупность, которую непосредственно
обследуют, — выборочной.
Статистические характеристики выборочной
совокупности рассматриваются как оценки
соответствующих характеристик генеральной
совокупности. Поскольку выборочная
совокупность неточно воспроизводит
структуру генеральной, то выборочные
оценки также не совпадают с характеристиками
генеральной совокупности. Различия
между ними называют ошибками
репрезентативности.
По причинам появления эти ошибки делятся
на систематические
(тенденционные) и случайные.
Систематические
ошибки
появляются, если при формировании
выборочной совокупности нарушен принцип
случайности отбора (преднамеренный
отбор элементов, несовершенная основа
выборки и т. п.). Случайные
ошибки
— это следствие случайности отбора
элементов совокупности для обследования.

При
организации выборочного обследования
важно предупредить появление
систематических ошибок. Избежать
случайных ошибок невозможно, однако на
основе теории выборочного метода можно
определить их размер и по возможности
регулировать.

В
практике выборочных наблюдений используют
два типа выборочных оценок — точечные
и интервальные. Точечная
оценка
— это значение параметра по данным
выборки: выборочная средняя

или выборочная доля р. Интервальная
оценка
— это интервал значений параметра,
рассчитанный по данным выборки для
определенной вероятности, т. е.
доверительный интервал. Границы его
определяются на основе точечной оценки
и предельной ошибки выборки 
= t:

для
средней

для
доли

где

— средняя, или стандартная ошибка
выборки; t — квантиль распределения
вероятностей (доверительное число);

и d0
— средняя и доля в генеральной
совокупности.

Стандартная
ошибка выборки


является средним квадратическим
отклонением выборочных оценок от
значений параметра, генеральной
совокупности:

при
повторном отборе

при
бесповторном

где
2
— выборочная дисперсия; n
и N — соответственно объем выборочной
и генеральной совокупностей.

При
практическом использовании данных
формул следует учитывать, что:

1)
дисперсия альтернативного признака
рассчитывается как произведение долей
2
= р(1 – р) = pq;

2)
в больших по объему совокупностях (30 и
более единиц) поправка

не вносит существенных изменений в
расчеты, а поэтому учитывается только
в малочисленных (малых) выборках;

3)
корректирующий множитель для бесповторной
выборки
при
малых величинах

приближается к 1, поэтому при 1—5%-й
выборке расчет 
проводится по формуле для повторной
выборки.

Предельная
ошибка выборки


= t
— это максимально возможная ошибка для
принятой вероятности F(x). Доверительное
число t
показывает, как соотносятся предельная
и стандартная ошибки. Так, t = 1 для
вероятности 0,683; t = 2 для вероятности
0,954; t = 3 для вероятности 0,997.

Таким
образом, используют следующие формулы
предельной ошибки выборки:

повторная
выборка

бесповторная
выборка

для
средней

для
доли

Как
видно из формул, размер предельной
ошибки зависит от вариации признака
2,
объема выборки n
и ее доли в генеральной совокупности
,
а также принятого уровня вероятности,
которому соответствует квантиль t.

При
малых выборках (n
< 30) квантиль t определяют по распределению
вероятностей Стьюдента. В прил. 2 приведены
значения t для F(x) = 0,95 и числа степеней
свободы k= n
– 1.

Пример.
По данным анализа плавки легированной
стали (10 проб), содержание никеля
составляет в среднем 4,25% при 2
= 0,18. Предельная ошибка выборки с
вероятностью F(x) = 0,95, для которой

(9) = 2,26:

Доверительные
границы: 4,25 ± 0,32, т.е. с вероятностью 0,95
можно утверждать, что содержание никеля
в легированной стали не меньше 3,93 и не
больше 4,57%.

При
сравнении точности выборочных оценок
используют относительную ошибку выборки
V,
которая показывает, на сколько процентов
выборочная оценка отклоняется от
параметра генеральной совокупности:

В
нашем примере 
= 0,14, а

Относительную
ошибку выборки можно рассчитывать на
основе коэффициента вариации признака
Vх:

для
повторной выборки

для
бесповторной выборки.

Так,
коэффициент вариации содержания никеля
в легированной стали составит

следовательно,

Аналогично
рассчитывают относительную ошибку
выборки для доли:

В
практике выборочных обследований
используют разные способы формирования
выборочных совокупностей, в частности:
простой случайный, механический,
типический (районированный), серийный.

Простой
случайный отбор

проводится путем жеребьевки или на
основе таблиц случайных чисел. Это
классический способ формирования
выборочной совокупности, и именно на
нем основывается теория выборочного
метода.

При
механическом отборе

основой выборки является упорядоченная
численность элементов генеральной
совокупности. Отбор элементов
осуществляется через одинаковые
интервалы, шаг интервала зависит от
доли выборки. Так, при
=
0,05 шаг интервала составляет

= 20. Ошибка механической выборки
вычисляется по формуле бесповторной
выборки. Для
моментных наблюдений
,
фиксирующих состояние непрерывного
процесса на определенные моменты
времени, используют формулу ошибки
повторной выборки.

Типический
(районированный) отбор

предусматривает предварительную
структуризацию генеральной совокупности
и независимый отбор элементов в каждой
составной части. Объем типической
выборки — это сумма частных
выборок
nj,
т. е.

, где m — число составных частей (групп,
типических районов и т. п.).

При
вычислении ошибки типической выборки
используют среднюю из групповых дисперсий

Как
правило,
,
следовательно, ошибка типической выборки
меньше, чем механической или простой
случайной. Чаще всего используют отбор,
пропорциональный численности составляющих
совокупности, т. е. доля выборки для всех
составляющих одинакова.

При
серийном
отборе

основа выборки состоит из серий элементов
совокупности, связанных территориально
(районы, поселки), организационно (фирмы,
акционерные общества) и т. п. Серии
отбираются по схеме механической или
простой случайной выборки, обследованию
подлежат все элементы серии. При
вычислении ошибки выборки учитывается
межсерийная вариация:

где
s — число серий,

— средняя k-й серии.

Проектируя
выборочные наблюдения, определяют
минимально достаточный объем выборки,
при котором выборочные оценки представляли
бы основные свойства генеральной
совокупности:

для
повторного отбора

для
бесповторного

Для
определения объема выборки n
используют оценки дисперсий 2
аналогичных или пробных обследований.
Если такие обследования отсутствуют,
можно воспользоваться соотношением
,
а для доли взять наибольшее значение
дисперсии 2
= 0,25.

Пример.
Изучается отношение сельского населения
региона к праву купли-продажи земли. По
результатам аналогичных обследований
в других регионах, 40% опрошенных
поддерживают это право. При каком объеме
выборки предельная ошибка (с вероятностью
0,954) не превысит 5%?

Опираясь
на результаты аналогичных обследований,
определим 2
= pq = 0,4 • 0,6 = 0,24. Тогда минимальный
достаточный объем выборки составит

Если
в основу расчета л положить относительную
ошибку выборки V
= tV
формулы соответственно модифицируются:

для
средней

для
доли

Статистическая
гипотеза

— это определенное предположение
относительно свойств генеральной
совокупности, которое можно проверить
по данным выборочного наблюдения.
Гипотеза, которую необходимо проверить,
формулируется как отсутствие различий
между параметром генеральной совокупности
G и заданной величиной а (нулевая
гипотеза
).
Содержание ее записывают так: Н0
:G = а. Каждой нулевой гипотезе
противопоставляют альтернативную На.
В зависимости от значимости отклонений
она формулируется как На
: G > а; На
: G < а или Н0
: G 
а.

Если
выборочные данные противоречат гипотезе
Н0
она отклоняется, если согласовываются
с ней — Н0
не отклоняется.
Проверка гипотез непременно связана с
риском принятия ошибочного решения:
риск I рода — отклонение верной нулевой
гипотезы, риск II рода — принятие Н0
когда в действительности верна
альтернативная.

Правило,
по которому гипотеза Н0
отклоняется или не отклоняется, называют
статистическим критерием. Математической
основой любого критерия является
статистическая характеристика Z, закон
распределения которой известен (например,
характеристика t-распределения
Стьюдента).

Вероятность
риска отклонить верную гипотезу называют
уровнем значимости а, а значение
статистической характеристики для
вероятности 1 – а — критическим значением
Z1-а.
В приложении приведены критические
значения наиболее распространенных
статистических критериев. Если выборочное
значение Z > Z^1-а,
гипотеза Н0
отклоняется, при Z < Z1-а
не отклоняется.

В
случае проверки справедливости Н0
: G = а против Н0
: G 
а используют двусторонний критерий, а
критическое значение Z определяется
для а/2 , т. е.

Пример/
На курсах восточных языков используют
две методики обучения — новую и
традиционную. Для сравнения эффективности
новой методики проведено тестирование
двух групп китайского языка по 100-балльной
системе. Восемь слушателей, обучавшихся
по новой методике, получили

средний
бал

= 84 при дисперсии

= 32; 10 слушателей, обучавшихся по
традиционной методике, за такой же тест
имели средний балл

= 76 при дисперсии

= 24. Разность между средними двух групп
составляет (

)
= 84 – 76 = 8 баллов. Необходимо проверить,
случайны ли эти различия, или они
обусловлены большей эффективностью
новой методики. Нулевая гипотеза
формулируется, исходя из предположения,
что отклонение средних случайно, т.е.
Н0 :


=
.
Альтернативная гипотеза предусматривает,
что новая методика эффективнее, т. е. Нa
:

>
.
При таком формулировании Ha
проводится односторонняя проверка
нулевой гипотезы. Статистической
характеристикой проверки H0
является нормированное отклонение
средних

подчиненное
распределению вероятностей Стьюдента
с числом степеней, свободы k = n1
+ n2
– 2.

В
нашем примере k = 8 + 10 – 2 = 16; оценка средней
из групповых дисперсий составляет:

Критическое
значение одностороннего t-критерия при
а = 0,05 и k = 16 составляет t0,95
(16) = 1,75, что меньше фактического (t = 3,03).
Следовательно, нулевая гипотеза Н0
:

=

отклоняется. С вероятностью 0,95 можно
утверждать, что новая методика изучения
восточных языков эффективнее.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Содержание:

Математическая статистика возникла (XVII в.) и создавалась параллельно с теорией вероятностей. Дальнейшее развитие математической статистики (вторая половина ХІХ и начало ХХ вв.) обязано, в первую очередь, П.Л.Чебышеву, А.А.Маркову, А.М.Ляпунову, а также К.Гауссу, А.Кетле, К.Пирсону и др. В ХХ в. наиболее существенный вклад в математическую статистику был сделан советскими математиками (В.И.Романовский, А.Н.Колмогоров и др.), а также английскими (Стьюдент, Р.Фишер, Э.Пирсон) и американскими (Ю.Нейман,
А.Вальд) учёными.

Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении статистических данных – результатах наблюдений, то есть основу исследований в математической статистике составляют данные наблюдений или опытов над случайными величинами.

Первая задача математической статистики – указать способы сбора и группировки (если данных
очень много) статистических сведений, в том числе определение объёма необходимых экспериментов до начала и в ходе исследования. Вторая задача математической статистики – разработать методы анализа статистических данных, в зависимости от целей исследования.

Изучение тех или иных явлений методами математической статистики служит средством решения многих вопросов, выдвигаемых наукой и практикой (правильная организация технологического процесса, наиболее целесообразное планирование и др.). Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.
 

Генеральная и выборочная совокупности

Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, если имеется партия деталей, то качественным признаком может служить стандартность детали, а количественным – контролируемый размер детали. Иногда проводят сплошное обследование, то есть обследуют каждый из
объектов совокупности относительно признака, которым интересуются. На практике, однако, сплошное обследование применяется сравнительно редко. Например, если совокупность содержит очень большое число объектов, то провести сплошное обследование физически невозможно. Если обследование объекта связано с его уничтожением или требует больших материальных затрат, то проводить сплошное обследование практически не имеет смысла. В таких случаях случайно отбирают из всей совокупности ограниченное число объектов и
подвергают их изучению.

Выборочной совокупностью, или просто выборкой, называют совокупность случайно отобранных объектов.

Генеральной совокупностью называют совокупность объектов, из которых производится выборка.
 

Объёмом совокупности (выборочной или генеральной) называют число объектов этой совокупности.

Выборочный метод - определение и вычисление с примерами решения

Например, если из 1000 деталей отобрано для обследования 100 деталей, то объём генеральной совокупности N = 1 000, а объём выборки n = 100. Часто генеральная совокупность содержит конечное число объектов. Однако, если это число достаточно велико, то иногда в целях упрощения
вычислений, или для облегчения теоретических выводов, допускают, что генеральная совокупность состоит из бесчисленного множества объектов. Такое допущение оправдывается тем, что увеличение объёма генеральной совокупности (достаточно большого объёма) практически не сказывается на результатах обработки данных выборки. При этом, что важно, для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной). В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если её осуществить случайно: каждый объект выборки отобран случайно из генеральной совокупности, при этом все объекты имеют одинаковую вероятность попасть в выборку.

При составлении выборки можно поступать двояко: после того, как объект отобран и над ним произведено наблюдение, он может быть возвращён, либо не возвращён в генеральную совокупность. В соответствии с этим, выборки подразделяют на повторные и бесповторные. Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность. Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается. Если объём генеральной совокупности достаточно велик, а выборка составляет лишь незначительную часть этой совокупности, то различие между повторной и бесповторной выборкам стирается; в предельном случае, когда рассматривается бесконечная генеральная совокупность, а выборка имеет конечный объём, это различие исчезает.

На практике применяются различные способы отбора. Принципиально эти способы можно подразделить на два вида:

1. Отбор, не требующий расчленения генеральной совокупности на части. Сюда относится, так называемый, простой случайный отбор (как повторный, так и бесповторный), то есть отбор, при котором объекты извлекают по одному из всей генеральной совокупности.

2. Отбор, при котором генеральная совокупность разбивается на части. Сюда относятся:

  • – типический отбор – отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой её «типической» части (например, если детали изготавливают на нескольких станках, то отбор производят не из всей совокупности деталей, произведённых всеми станками, а из продукции каждого станка в отдельности);
  • – механический отбор – отбор, при котором генеральная совокупность «механически» делится на столько групп, сколько объектов должно войти в выборку, и затем из каждой группы отбирается один объект (например, если нужно отобрать 20% изготовленных станком деталей, то отбирают каждую пятую деталь; если требуется отобрать 5% деталей, то отбирают каждую двадцатую деталь и т. д.);
  • – серийный отбор – отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергаются сплошному обследованию. Например, если изделия изготавливаются большой группой станков-автоматов, то подвергают сплошному обследованию продукцию только нескольких станков.

Заметим, что серийным отбором пользуются тогда, когда обследуемый признак колеблется в различных сериях незначительно.
 

Статистическое распределение выборки

В результате статистической обработки материалов можно подсчитать число единиц, обладающих конкретным значением того или иного признака. Каждое отдельное значение признака будем обозначать Выборочный метод - определение и вычисление с примерами решения

Если при изучении результатов выборки отдельные значения признака (варианты) расположим в возрастающем или убывающем порядке и относительно каждой варианты укажем, как часто она встречается в данной совокупности, тополучим статистическое распределение признака, или вариационный ряд. Он характеризует изменение (варьирование) какого-нибудь количественного признака. Следовательно, вариационный ряд представляет собой две строки (или колонки). В одной из них приводятся варианты, в другой – частоты.
 

Вариация признака может быть дискретной и непрерывной:

  1. Дискретной называется вариация, при которой отдельные значения признака (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число). Например: количество детей в семье; оценки, полученные студентами на экзамене; размеры обуви, проданной магазином за день. Если число элементов вариационного ряда велико, то для удобства его изучения образуют интервальный ряд, группируя значения в интервалы. Для интервального ряда частота i m равна числу значений, наблюдавшихся в i -ом интервале. Длина интервала чаще всего берётся одинаковой.
  2. Непрерывной называется вариация, при которой значения признака могут отличаться одно от другого на сколь угодно малую величину. Например: уровень рентабельности предприятия; процент занятости трудоспособного населения; депозитная ставка коммерческих банков. При непрерывной вариации распределение признака называется интервальным. Частоты относятся не к отдельному значению признака, а ко всему интервалу. Часто значением интервала принимают его середину, то есть центральное значение.

Нередко вместо абсолютных значений частот используют относительные. Для этого можно использовать долю частоты того или иного варианта (а также интервала) в сумме всех частот. Такая величина называется относительной частотой и обозначается w . Для получения относительных частот необходимо соответствующую частоту разделить на сумму всех частот:

Выборочный метод - определение и вычисление с примерами решениягде Выборочный метод - определение и вычисление с примерами решения – относительная частота j -ой варианты или интервала Выборочный метод - определение и вычисление с примерами решения. Сумма
всех относительных частот равна единице:Выборочный метод - определение и вычисление с примерами решения Относительные частоты можно выражать и в процентах, тогда их сумма равна 100%.

В интервальном вариационном ряду в каждом интервале различают нижнюю и верхнюю границы интервала: нижняя граница интервалаВыборочный метод - определение и вычисление с примерами решения ; верхняя граница интервала Выборочный метод - определение и вычисление с примерами решения ; величина интервалаВыборочный метод - определение и вычисление с примерами решения. Как правило, при построении интервальных вариационных рядов в каждый интервал включаются варианты, числовые значения которых больше нижней границы и меньше или равны верхней границе. Интервальные вариационные ряды бывают с одинаковыми и неодинаковыми интервалами. В последнем случае чаще всего встречаются
последовательно увеличивающиеся интервалы. Для выбора оптимальной величины интервала, то есть такой величины, при которой вариационный ряд не будет громоздким и, при этом, будут сохранены все особенности данного явления, можно рекомендовать формулу:

Выборочный метод - определение и вычисление с примерами решениягде n – число единиц в совокупности. Так, если в совокупности 200 единиц, наибольший вариант равен 49,961,
а наименьший – 49,918, то Выборочный метод - определение и вычисление с примерами решения

Другими словами, в данном случае оптимальной величиной интервала может служить 0,005.
 

Гистограмма и полигон статистических распределений

Для наглядности представления вариационного ряда большое значение имеют его графические изображения. Графически вариационный ряд может быть изображён в виде полигона, гистограммы и кумуляты. Полигон распределения (дословно – многоугольник распределения) называют ломанную, которая строится в прямоугольной системе координат. Величина признака Выборочный метод - определение и вычисление с примерами решения откладывается на оси абсцисс, соответствующие частотыВыборочный метод - определение и вычисление с примерами решения (или относительные частоты Выборочный метод - определение и вычисление с примерами решения ) – по оси ординат. Точки Выборочный метод - определение и вычисление с примерами решения Выборочный метод - определение и вычисление с примерами решения       соединяют отрезками прямых и получают полигон распределения. Чаще всего полигоны применяются для изображения дискретных вариационных рядов, но их
можно применять также и для интервальных рядов. В этом случае на оси абсцисс откладываются точки, соответствующие серединам данных интервалов. Гистограммой распределения называют ступенчатую фигуруВыборочный метод - определение и вычисление с примерами решения, состоящую из прямоугольников, основанием которых служат частичные интервалы длиною h, а высоты пропорциональны частотам (или относительным частотам) и равны Выборочный метод - определение и вычисление с примерами решения плотность частоты (илиВыборочный метод - определение и вычисление с примерами решения – плотность относительной частоты). Для построения гистограммы на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянииВыборочный метод - определение и вычисление с примерами решения Заметим, что площадь гистограммы частот (относительных частот) равна сумме всех частот (относительных частот), то есть, равна объему выборки (то есть – единице).
 

Пример №1

Уровень рентабельности предприятий лёгкой промышленности характеризуется следующими данными:

Выборочный метод - определение и вычисление с примерами решения

По приведённым данным построить полигон распределения и гистограмму.
 

Решение. Воспользовавшись определениями, нетрудно построить полигон распределения и гистограмму (см. рис.)

Выборочный метод - определение и вычисление с примерами решения

Кумулятивная кривая (кривая сумм – кумулята) получается при изображении вариационного ряда с накопленными частотами (или относительными частотами) в прямоугольной системе координат. Накопленная частота (или относительная частота) определённой варианты получается суммированием всех частот (относительных частот) вариант, предшествующих данной, с частотой (относительной частотой) этой варианты. При построении кумуляты дискретного признака по оси абсцисс откладывают значения признака (варианты). Ординатами
служат вертикальные отрезки, длина которых пропорциональна накопленной частоте (или относительной частоте) той или иной варианты. Соединением вершин ординат прямыми линиями получаем ломанную (кривую) кумуляту. При построении кумуляты интервального вариационного ряда нижней границе первого интервала соответствует частота (относительная частота), равная нулю, а верхней – вся частота (относительная частота) интервала. Верхней границе второго интервала соответствует накопленная частота (относительная частота) первых двух интервалов (то есть сумма частот (относительных частот) этих интервалов) и т. д.
 

Пример №2

По данным примера 1 построить кумуляту распределения.
 

Решение. Воспользовавшись определением и правилом построения кумуляты интервального вариационного ряда, нетрудно построить кумулятивную кривую данного распределения (см. рисунок).

Выборочный метод - определение и вычисление с примерами решения

Пример №3

В результате эксперимента получены следующие значения случайной величины X

3; 6; 8; 11; 6; 10; 7; 9; 7; 3; 4; 8;
7; 9; 4; 9; 11; 7; 8; 4; 10; 5; 6; 7; 2.
Требуется:

а) составить статистический ряд;

б) построить статистическое распределение;

в) изобразить полигон распределения.
 

Решение. а) Объем выборки n = 25.

Построим статистический ряд данной выборки: в первой строке таблицы укажем все различные значения, принимаемые случайной величиной  X; во второй строке укажем, сколько раз она приняла эти значения.

Выборочный метод - определение и вычисление с примерами решения

б) Найдем статистическое распределение случайной величины X, для чего в табл. 7.2 заменим вторую строку строкой, содержащей относительные частоты Выборочный метод - определение и вычисление с примерами решения

Выборочный метод - определение и вычисление с примерами решения

Контроль:
Выборочный метод - определение и вычисление с примерами решения
в) На плоскости Выборочный метод - определение и вычисление с примерами решенияпостроим точки:

Выборочный метод - определение и вычисление с примерами решения

Соединим их (рис. 7.3). Полученная ломаная – полигон данного распределения.

Выборочный метод - определение и вычисление с примерами решения

Ответ: а) табл. 7.2,     б) табл. 7.3,      в) рис. 7.3.

Пример №4

В результате эксперимента получены следующие значения случайной величины X:
16; 17; 9; 13; 21; 11; 7; 7; 19; 5; 17; 5; 20;
18; 11; 4; 6; 22; 21; 15; 15; 23; 19; 25; 1.
Требуется:

а) построить интервальный статистический ряд, разбив промежуток [0; 25] на 5 промежутков равной длины;

б) построить гистограмму относительных частот.
 

Решение.

а) Объем выборки n = 25. По экспериментальным данным составим таблицу (табл. 7.4). В её первой строке укажем промежутки разбиения: [0; 5), [5; 10), [10; 15), [15; 20) [20; 25].
Во второй строке укажем соответствующие числа Выборочный метод - определение и вычисление с примерами решения  − сколько раз случайная величина X приняла значение из этого промежутка.

Выборочный метод - определение и вычисление с примерами решения

Контроль: 2 + 6 + 3 + 8 + 6 = 25.
По табл. 7.4 составим интервальный статистический ряд, где во второй строке указаны относительные частоты (табл. 7.5).

Выборочный метод - определение и вычисление с примерами решения

б) На оси Ox отложим промежутки:

[0; 5), [5; 10), [10; 15), [15; 20) [20; 25]
интервального    статистического    ряда,  а  на   оси   Выборочный метод - определение и вычисление с примерами решения  –  относительные частоты.    Построив   по  этим   данным   прямоугольники  с  основаниями Выборочный метод - определение и вычисление с примерами решения и высотами  Выборочный метод - определение и вычисление с примерами решения получим ступенчатую фигуру – гистограмму   (рис.7.4)

Выборочный метод - определение и вычисление с примерами решения

Ответ:    а) табл. 7.4; б) рис. 7.5.

Пример №5

Дан статистический ряд 

Выборочный метод - определение и вычисление с примерами решения

Найти статистическую функцию распределения и построить её график.
Решение. Воспользовавшись формулой

Выборочный метод - определение и вычисление с примерами решения
где n – объем выборки; Выборочный метод - определение и вычисление с примерами решения – число выборочных значений, меньших x, вычисляем:

Выборочный метод - определение и вычисление с примерами решения                                            (1) 

Построим график функции Выборочный метод - определение и вычисление с примерами решения

Выборочный метод - определение и вычисление с примерами решения

Ответ:   а) формула (1);  б) рис. 7.5.

Числовые характеристики выборки

В качестве одной из важнейших характеристик вариационного ряда применяют среднюю величину. Математическая статистика различает несколько типов средних величин: арифметическую, геометрическую, гармоническую, квадратическую, кубическую и др. Все перечисленные типы средних могут быть рассчитаны для случаев, когда каждая из вариант вариационного ряда встречается только один раз (тогда средняя называется простой, или невзвешенной) и когда варианты или интервалы повторяются. При этом число повторений вариант или интервалов называют частотой, или статистическим весом, а среднюю, вычисленную с учётом статистического веса, – взвешенной средней.

Для характеристики вариационного ряда один из перечисленных типов средних выбирается не произвольно, а в зависимости от особенностей изучаемого явления и цели, для которой среднее вычисляется.

Практически при выборе того или иного типа средней следует исходить из принципа осмысленности результата при суммировании или при взвешивании. Только тогда средняя применена правильно, когда в результате взвешивания или суммирования получаются величины, имеющие реальный смысл.

Обычно затруднения при выборе типа средней возникают лишь в использовании средней арифметической, или гармонической. Что же касается геометрической и квадратической средних, то их применение обусловлено особыми случаями (см. далее).

Следует иметь в виду, что средняя только в том случае является обобщающей характеристикой, если она применяется к однородной совокупности. В случае использования средней для неоднородных совокупностей можно прийти к неверным выводам. Научной основой статистического анализа является метод статистических группировок, то есть расчленения совокупности на качественно однородные группы.

Все указанные типы средних величин можно получить из формул степенной средней. Если имеются варианты Выборочный метод - определение и вычисление с примерами решения, то среднюю из данных вариант можно рассчитать по формуле простой невзвешенной степенной средней порядкаВыборочный метод - определение и вычисление с примерами решения

При наличии соответствующих частотВыборочный метод - определение и вычисление с примерами решения средняя рассчитывается по формуле взвешенной степенной средней:

Выборочный метод - определение и вычисление с примерами решенияЗдесь Выборочный метод - определение и вычисление с примерами решения – степенная средняя; Выборочный метод - определение и вычисление с примерами решения– показатель степени, определяющий тип средней;
Выборочный метод - определение и вычисление с примерами решения – варианты; Выборочный метод - определение и вычисление с примерами решения – частоты или статистические веса вариантов.
Средняя арифметическая получается из формулы степенной средней при
подстановке значения Выборочный метод - определение и вычисление с примерами решения

  • – невзвешенная (простая) Выборочный метод - определение и вычисление с примерами решения
  • – взвешеннаяВыборочный метод - определение и вычисление с примерами решения

Средняя гармоническая получается при подстановке в формулу степенной средней значения Выборочный метод - определение и вычисление с примерами решения

  • – невзвешенная (простая)Выборочный метод - определение и вычисление с примерами решения
  • – взвешеннаяВыборочный метод - определение и вычисление с примерами решения

Средняя гармоническая вычисляется тогда, когда средняя предназначается для расчёта сумм слагаемых, обратно пропорциональных величине данного признака, то есть, когда суммированию подлежат не сами варианты, а обратные им величины Выборочный метод - определение и вычисление с примерами решения

Средняя квадратическая получается из формулы степенной средней при подстановке

  • – невзвешенная (простая) Выборочный метод - определение и вычисление с примерами решения
  • – взвешеннаяВыборочный метод - определение и вычисление с примерами решения

Средняя квадратическая используется только тогда, когда варианты представляют собой отклонения фактических величин от их средней
арифметической или от заданной нормы.
Средняя геометрическая получается из формулы степенной средней при предельном переходеВыборочный метод - определение и вычисление с примерами решения

  • Выборочный метод - определение и вычисление с примерами решения

Вычисления средней геометрической в значительной мере упрощаются, если воспользоваться логарифмированием. В этом случае получаем:

  • – для невзвешенной (простой) средней геометрической Выборочный метод - определение и вычисление с примерами решения
  • – для взвешеннойВыборочный метод - определение и вычисление с примерами решения

Таким образом, логарифм средней геометрической есть средняя арифметическая из логарифмов вариант. Средняя геометрическая используется главным образом при изучении динамики. Средние коэффициенты и темпы роста также рассчитывают по формулам средней геометрической. Если вычислить различные типы средних для одного и того же вариационного ряда, то числовые их значения будут различаться. При этом средние по своей величине расположатся в определённом порядке. Наименьшей из перечисленных средних окажется средняя гармоническая, затем геометрическая и т. д., наибольшей будет средняя квадратическая. При этом порядок возрастания средних определяется показателем степени z в формуле степенной средней. Так, при z =1 получаем среднюю гармоническую, при z =0 – геометрическую, при z =1 – арифметическую, при z =  2 – квадратическую:

Выборочный метод - определение и вычисление с примерами решения

В качестве характеристики вариационного ряда используют медиануВыборочный метод - определение и вычисление с примерами решения , то есть такое значение варьирующего признака, которое приходится на середину упорядоченного вариационного ряда. Если в вариационном ряду 2m +1 случаев, то значение признака у случая m +1 будет медианным. Если в ряду чётное число 2m случаев, то медиана равна средней арифметической из двух серединных значений.

Таким образом, медиана рассчитывается по формуле

  • – при нечётном количестве вариантов:Выборочный метод - определение и вычисление с примерами решения
  • – при чётном:Выборочный метод - определение и вычисление с примерами решения

При расчёте медианы интервального вариационного ряда сначала находят интервал, содержащий медиану, путём использования накопленных частот (или относительных частот). Медианному интервалу соответствует первая из накопленных частот (или относительных частот), превышающая половину всего объёма совокупности. Для нахождения медианы при постоянстве плотности внутри интервала, содержащего медиану, используют формулу:

Выборочный метод - определение и вычисление с примерами решениягде Выборочный метод - определение и вычисление с примерами решениянижняя граница медианного интервала; k – величина медианного интервала; Выборочный метод - определение и вычисление с примерами решения – накопленная частота интервала, предшествующая медианному; Выборочный метод - определение и вычисление с примерами решения – частота медианного интервала.

Медиану можно также определить графически – по кумуляте. Для этого последнюю ординату, пропорциональную суме всех частот (или относительных частот), делят пополам. Из полученной точки восстанавливают перпендикуляр до пересечения с кумулятой. Абсцисса точки пересечения – значение медианы.

Медиана обладает таким свойством: сумма абсолютных величин отклонений вариантов от медианы меньше, чем от любой другой величины (в том числе и от средней арифметической). Другими словами:

Выборочный метод - определение и вычисление с примерами решения

Это свойство медианы можно использовать при проектировании расположения трамвайных и троллейбусных остановок, бензоколонок и т. д.
 

Пример №6

На шоссе 100км имеется 10 гаражей. Для проектирования строительства бензоколонки были собраны данные о числе предполагаемых поездок на заправку с каждого гаража. Результаты обследования приведены в следующей таблице:

Выборочный метод - определение и вычисление с примерами решения

Бензоколонку нужно поставить так, чтобы общий пробег машин на заправку был наименьшим.

Выборочный метод - определение и вычисление с примерами решения

1-й способ:

Если бензоколонку поставить на середине шоссе, то есть на 50-м километре (средняя арифметическая), то пробеги с учётом числа поездок составят

– в одном направлении:

(50-7)-10 +(50-26)-15+ (50-28)-5+ (50-37)-20 +(50-40)-5 +(50-46)-25 = 1310 км;

– в противоположном:

(60 – 50)-15 + (78 – 50)- 30 + (86 – 50)-10 + (92-50)- 65 = 4080 км .

Общий пробег в оба направления окажется равным 5390 км.

2-й способ:

Уменьшения пробега можно достичь, если бензоколонку поставить на 63,85-м километре, то есть на среднем участке шоссе с учётом числа поездок (средняя арифметическая взвешенная). В этом случае пробеги составят по 2475,75 км в оба направления. Таким образом, общий пробег составит 4951,5 км и окажется меньше, чем в первом способе решения, на 438,5 км.
 

3-й способ:

Наилучший результат, то есть минимальный общий пробег, получим, если поставить бензоколонку на 78-м километре, что будет соответствовать медиане. Заметим, что медиана вычислена по формуле: Выборочный метод - определение и вычисление с примерами решенияПри этом вариационный ряд записываем в виде

Выборочный метод - определение и вычисление с примерами решения

Следовательно Выборочный метод - определение и вычисление с примерами решенияТогда пробеги составят 3820 км и 990 км
соответственно. Общий пробег, в этом случае, равен 4810 км, то есть он оказался меньше общих пробегов, рассчитанных в предыдущих способах. Модой Выборочный метод - определение и вычисление с примерами решения называется варианта, наиболее часто встречающаяся в данном вариационном ряду. Для дискретного ряда мода, являющаяся характеристикой вариационного ряда, определяется по частотам вариант и соответствует варианте с наибольшей частотой. В случае интервального распределения с равными интервалами, модальный интервал (то есть интервал, содержащий моду) определяется по наибольшей частоте, а при неравных интервалах – по наибольшей плотности. Мода рассчитывается по формуле:

Выборочный метод - определение и вычисление с примерами решения

где Выборочный метод - определение и вычисление с примерами решения – нижняя граница модального интервала; k – величина модального интервала; Выборочный метод - определение и вычисление с примерами решения – частота модального интервала; Выборочный метод - определение и вычисление с примерами решения – частота интервала, предшествующего модальному;Выборочный метод - определение и вычисление с примерами решения – частота интервала, следующего за модальным.

Вариационные ряды, в которых частоты вариант, равноотстоящих от средней, равны между собой, называются симметричными. Особенность симметричны вариационных рядов состоит в равенстве трёх характеристик – средней арифметической, моды и медианы, то есть:
Выборочный метод - определение и вычисление с примерами решения
(это необходимое, но не достаточное, условие симметричности вариационного ряда). Вариационные ряды, в которых расположение вариант вокруг средней не одинаково, то есть частоты по обе стороны от средней изменяются по-разному, называются асимметричными, или скошенными. Различают асимметрию – левостороннюю и правостороннюю. Средние величины, характеризую вариационный ряд одним числом, не учитывают вариацию признака, между тем эта вариация существует. Для измерения вариации признака в математической статистике применяют ряд способов.

Вариационный размах ( R), или широта распределения, есть разность между наибольшим и наименьшим значениями вариационного ряда:
Выборочный метод - определение и вычисление с примерами решения

Вариационный размах представляет собой величину неустойчивую, чрезвычайно зависящую от случайных обстоятельств; применяется для приблизительной оценки вариации.

Среднее линейное отклонениеВыборочный метод - определение и вычисление с примерами решения (обозначается d ) представляет собой среднюю арифметическую из абсолютных значений отклонений вариант от средней. В зависимости от отсутствия или наличия частот вычисляют среднее линейное отклонение невзвешенное или взвешенное:Выборочный метод - определение и вычисление с примерами решения

Средний квадрат отклонения, или дисперсия (обозначается D) наиболее часто применяется как мера колеблемости признака. Дисперсии невзвешенную и взвешенную вычисляют по формулам: Выборочный метод - определение и вычисление с примерами решенияТаким образом, дисперсия есть средняя арифметическая из квадратов отклонений вариант от их средней арифметической. Квадратный корень из дисперсииВыборочный метод - определение и вычисление с примерами решенияназывается среднеквадратическим отклонением. Обобщающими характеристиками вариационных рядов являются моменты
распределения. Характер распределения можно определить с помощью небольшого количества моментов. Средняя из k – х степеней отклонений вариант x от некоторой постоянной величины A (ложный ноль) называется моментом k -го порядка:Выборочный метод - определение и вычисление с примерами решения

При расчёте средних в качестве весов можно использовать частоты, относительные частоты или вероятности. При использовании в качестве весов частот или относительных частот моменты называются эмпирическими, а при использовании вероятностей – теоретическими. Порядок момента определяется величиной k . Эмпирический момент k -го порядка находится как отношение суммы произведений k -х степеней отклонений вариант Выборочный метод - определение и вычисление с примерами решения от постоянной величины A на соответствующие частоты Выборочный метод - определение и вычисление с примерами решения к сумме частот Выборочный метод - определение и вычисление с примерами решения(объём
выборки), то есть Выборочный метод - определение и вычисление с примерами решения

В зависимости от выбора постоянной величины A различают следующее моменты:

1. Если A= 0, то моменты называются начальными. Будем обозначать их через Выборочный метод - определение и вычисление с примерами решения и вычислять по формуле:

Выборочный метод - определение и вычисление с примерами решения

Тогда:

  • – при k = 0 получаем начальный момент нулевого порядка Выборочный метод - определение и вычисление с примерами решения;
  • – при k =1 получаем начальный момент первого порядка Выборочный метод - определение и вычисление с примерами решения
  • – при k =2 получаем начальный момент второго порядка Выборочный метод - определение и вычисление с примерами решения;
  • – при k = 3 получаем начальный момент третьего порядка Выборочный метод - определение и вычисление с примерами решения
  • – при k = 4 получаем начальный момент четвёртого порядка Выборочный метод - определение и вычисление с примерами решения

и так далее. На практике чаще всего используют моменты первых четырёх порядков.

2. Если Выборочный метод - определение и вычисление с примерами решения то моменты называются начальными относительноВыборочный метод - определение и вычисление с примерами решения , обозначаютсяВыборочный метод - определение и вычисление с примерами решенияи рассчитываются по формуле:

Выборочный метод - определение и вычисление с примерами решения

3. ЕслиВыборочный метод - определение и вычисление с примерами решениясредняя), то моменты называются центральными, обозначаются Выборочный метод - определение и вычисление с примерами решения и вычисляются так:

Выборочный метод - определение и вычисление с примерами решения

Тогда 

Выборочный метод - определение и вычисление с примерами решения

Коэффициентом асимметрии Выборочный метод - определение и вычисление с примерами решения называется отношение центрального момента третьего порядка к кубу среднеквадратического отклонения:

Выборочный метод - определение и вычисление с примерами решения

Если полигон вариационного ряда скошен, то есть одна из его ветвей, начиная от вершины, зримо короче другой, то такой ряд называют асимметричным.
Эксцессом называют уменьшенное на три единицы отношение центрального момента четвёртого порядка к четвёртой степени среднеквадратического отклонения:

Выборочный метод - определение и вычисление с примерами решенияКривые распределения, у которых Выборочный метод - определение и вычисление с примерами решения, менее крутые, имеют более плоскую вершину и называются плосковершинными. Кривые распределения, у которых Выборочный метод - определение и вычисление с примерами решения более крутые, имеют более острую вершину и называются островершинными.
 

Выборки и доверительные интервалы

Пусть у нас имеется большое количество предметов, с нормальным распределением некоторых характеристик (например, полный склад однотипных овощей, размер и вес которых варьируется). Вы хотите знать средние характеристики всей партии товара, но у Вас нет ни времени, ни желания измерять и взвешивать каждый овощ. Вы понимаете, что в этом нет необходимости. Но сколько штук надо было бы взять на выборочную проверку?

Прежде, чем дать несколько полезных для этой ситуации формул напомним некоторые обозначения.

Во-первых, если бы мы все-таки промерили весь склад овощей (это множество элементов называется генеральной совокупностью), то мы узнали бы со всей доступной нам точностью среднее значение веса всей партии. Назовем это среднее значение Х ср.ген. – генеральным средним. Мы уже знаем, что нормальное распределение определяется полностью, если известно его среднее значение и отклонение s. Правда, пока мы ни Выборочный метод - определение и вычисление с примерами решения ни s генеральной совокупности не знаем. Мы можем только взять некоторую выборку, замерить нужные нам значения и посчитать для этой выборки как среднее значение Выборочный метод - определение и вычисление с примерами решения так и среднее квадратическое отклонение Выборочный метод - определение и вычисление с примерами решения

Известно, что если наша выборочная проверка содержит большое количество элементов (обычно n больше 30), и они взяты действительно случайным образом, то s генеральной совокупности почти не будет отличаться от Выборочный метод - определение и вычисление с примерами решения

Кроме того, для случая нормального распределения мы можем пользоваться следующими формулами:

С вероятностью 95% Выборочный метод - определение и вычисление с примерами решения

С вероятностью 99% Выборочный метод - определение и вычисление с примерами решения

В общем виде с вероятностью P(t)

Выборочный метод - определение и вычисление с примерами решения

Связь значения t со значением вероятности P(t), с которой мы хотим знать доверительный интервал, можно взять из следующей таблицы: Выборочный метод - определение и вычисление с примерами решения

Таким образом, мы определили, в каком диапазоне находится среднее значение для генеральной совокупности (с данной вероятностью). Если у нас нет достаточно большой выборки, мы не можем утверждать, что генеральная совокупность имеет Выборочный метод - определение и вычисление с примерами решения Кроме того, в этом случае проблематична близость выборки к нормальному распределению. В этом случае также пользуются Выборочный метод - определение и вычисление с примерами решения вместо s в формуле: Выборочный метод - определение и вычисление с примерами решения

но значение t для фиксированной вероятности P(t) будет зависеть от количества элементов в выборке n. Чем больше n, тем ближе будет полученный доверительный интервал к значению, даваемому формулой (1). Значения t в этом случае берутся из другой таблицы (t-критерий Стьюдента), которую мы приводим ниже:

Значения t-критерия Стьюдента для вероятности 0,95 и 0,99

Выборочный метод - определение и вычисление с примерами решения

Пример №7

Из работников фирмы случайным образом отобрано 30 человек. По выборке оказалось, что средняя зарплата (в месяц) составляет 10 тыс. рублей при среднем квадратическом отклонении 3 тыс. рублей. С вероятностью 0,99 определить среднюю зарплату в фирме.

Решение:

По условию имеем Выборочный метод - определение и вычисление с примерами решения Для нахождения доверительного интервала воспользуемся формулой, соответствующей критерию Стьюдента. По таблице для n = 30 и Р = 0,99 находим t = 2,756, следовательно,

Выборочный метод - определение и вычисление с примерами решения

т.е. искомый доверительный интервал Выборочный метод - определение и вычисление с примерами решения Итак, вероятностью 0,99 можно утверждать, что интервал (27484; 32516) содержит внутри себя среднюю зарплату в фирме. Мы надеемся, что Вы будете пользоваться этим методом, при этом не обязательно, чтобы при Вас каждый раз была таблица. Подсчеты можно проводить в Excel автоматически. Находясь в файле Excel, нажмите в верхнем меню кнопку Выборочный метод - определение и вычисление с примерами решения Затем, выберите среди функций тип “статистические”, и из предложенного перечня в окошке – СТЬЮДРАСПОБР. Затем, по подсказке, поставив курсор в поле “вероятность” наберите значение обратной вероятности (т.е. в нашем случае вместо вероятности 0,95 надо набирать вероятность 0,05). Видимо, электронная таблица составлена так, что результат отвечает на вопрос, с какой вероятностью мы можем ошибиться. Аналогично в поле “степень свободы” введите значение (n-1) для своей выборки.

Понятие о статистике

«Статистика знает все», — утверждали И. Ильф и Е. Петров в своем знаменитом романе «Двенадцать стульев» и продолжали: «Известно, сколько какой пищи съедает в год средний гражданин республики… Известно, сколько в стране охотников, балерин, станков, собак всех пород, велосипедов, памятников, девушек, маяков и швейных машинок… Как много жизни, полной пыла, страстей и мысли, глядит на нас из статистических таблиц!»

Это ироничное описание дает достаточно точное представление о статистике (от латинского status — состояние) — науке, изучающей, обрабатывающей и анализирующей количественные данные о разнообразнейших массовых явлениях в жизни. Экономическая статистика изучает изменение цен, спроса и предложения товаров, прогнозирует рост и падение производства и потребления. Медицинская статистика изучает эффективность разных лекарств и методов лечения, вероятность возникновения некоторых заболеваний в зависимости от возраста, пола, наследственности, условий жизни, вредных привычек, прогнозирует распространение эпидемий. Демографическая статистика изучает рождаемость, численность населения, его состав (возрастной, национальный, профессиональный). А есть еще статистика финансовая, налоговая, биологическая, метеорологическая…

Статистика имеет многовековую историю. Уже в Древнем мире вели статистический учет населения. Однако случайное толкование статистических данных, отсутствие строгой научной базы статистических прогнозов даже в середине XIX в. еще не позволяли говорить о статистике как науке. Только в XX в. появилась математическая статистика — наука, опирающаяся на законы теории вероятностей. Выяснилось, что статистические методы обработки данных из самых разных областей жизни имеют много общего. Это позволило создать универсальные научно обоснованные методы статистических исследований и проверки статистических гипотез.

Таким образом:

Математическая статистика — это раздел математики, изучающий математические методы обработки и использования статистических данных для научных и практических выводов.

В математической статистике рассматриваются методы, которые дают возможность по результатам экспериментов (статистическим данным) делать определенные выводы вероятностного характера.

Математическая статистика подразделяется на две обширные области: 1) описательная статистика, которая рассматривает методы описания статистических данных, их табличное и графическое представление и пр.; 2) аналитическая статистика (теория статистических выводов), которая рассматривает обработку данных, полученных в ходе эксперимента, и формулировку выводов, имеющих прикладное значение для конкретной области человеческой деятельности. Теория статистических выводов тесно связана с теорией вероятностей и базируется на ее математическом аппарате. Среди основных задач математической статистики можно отметить следующие. 1. Оценка вероятности. Пусть некоторое случайное событие имеет вероятность p > 0, но ее значение нам неизвестно. Требуется оценить эту вероятность по результатам экспериментов, то есть решить задачу об оценке вероятности через частоту.

Оценка закона распределения:

Исследуется некоторая случайная величина, точное выражение для закона распределения которой нам неизвестно. Необходимо по результатам экспериментов найти приближенное выражение для функции, задающей закон распределения.

Оценка числовых характеристик случайной величины (например, математического ожидания ).

Проверка статистических гипотез (предположений).

Исследуется некоторая случайная величина. Исходя из определенных рассуждений, выдвигается, например, гипотеза о распределении этой случайной величины. Необходимо по результатам экспериментов принять или отвергнуть эту гипотезу. Результаты исследований, проводимых методами математической статистики, применяются для принятия решений. В частности, при планировании и организации производства, при контроле качества продукции, при выборе оптимального времени наладки или замены действующей аппаратуры (например, при определении времени замены двигателя самолета, отдельных частей станков и т. д.). Как и в каждой науке, в статистике используются свои специфические термины и понятия. Некоторые из них приведены в табл. 37. Запоминать их определения необязательно, достаточно понимать их смысл.

Выборочный метод - определение и вычисление с примерами решения

Выборочный метод - определение и вычисление с примерами решения

Генеральная совокупность и выборка

Для изучения различных массовых явлений проводятся специальные статистические исследования. Любое статистическое исследование начинается с целенаправленного сбора информации об изучаемом явлении или процессе. Этот этап называют этапом статистических наблюдений.

Для получения статистических данных в результате наблюдений похожие элементы некоторой совокупности сравнивают по разным признакам. Например, учащихся 11 классов можно сравнивать по росту, размеру одежды, успеваемости и пр. Болты можно сравнивать по длине, диаметру, массе, материалу и другим характеристикам. Практически любой признак или непосредственно измеряется, или может получить условную числовую характеристику (см. пример с выпадением «герба» или «числа» при подбрасывании монеты).

Таким образом, некоторый признак элементов совокупности можно рассматривать как величину, принимающую те или иные числовые значения. При изучении реальных явлений часто бывает невозможно обследовать все элементы совокупности.

Например, практически невозможно выяснить размеры обуви у всех людей планеты. А проверить, например, наличие листов некачественной фотобумаги в большой партии хотя и реально, но бессмысленно, потому что полная проверка приведет к уничтожению всей партии бумаги. В подобных случаях вместо изучения всех элементов совокупности, называемой генеральной совокупностью, обследуют ее значительную часть, выбранную случайным образом. Эту часть называют выборкой, а число элементов в выборке называется объемом выборки. Eсли в выборке все основные признаки генеральной совокупности представлены в той же пропорции и с той же относительной частотой, с которой данный признак выступает в данной генеральной совокупности, то эту выборку называют репрезентативной (от французского représentatif — показательный).

Иными словами, репрезентативная выборка представляет собой меньшую по размеру, но точную модель той генеральной совокупности, которую она должна отражать. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно с большой долей уверенности считать применимыми ко всей генеральной совокупности.

Понятие репрезентативности отобранной выборки не означает ее полного представительства по всем признакам генеральной совокупности, поскольку это практически обеспечить невозможно. Отобранная из всей совокупности часть должна быть репрезентативной относительно тех признаков, которые изучаются.

Чтобы выборка была репрезентативной, она должна быть выделена из генеральной совокупности случайным образом. Этого можно достичь различными способами.

Чаще всего используют следующие виды выборок:

  1. собственно-случайную;
  2. механическую;
  3. типическую;
  4. серийную.

Кратко охарактеризуем каждую из них.

1) Члены генеральной совокупности можно предварительно занумеровать и каждый номер записать на отдельной карточке. После тщательного перемешивания будем отбирать наугад из пачки таких карточек по одной и таким образом получим выборочную совокупность любого нужного объема, которая называется собственно-случайной выборкой. Номера на отобранных карточках укажут, какие члены генеральной совокупности попали в выборку. (Заметим, что при этом возможны два принципиально различных способа отбора карточек в зависимости от того, возвращается или не возвращается обратно вынутая карточка после записи ее номера.) Собственно-случайную выборку заданного объема п можно образовать и с помощью так называемых таблиц случайных чисел или генератора случайных чисел на компьютере. При образовании собственно-случайной выборки каждый член генеральной совокупности с одинаковой вероятностью может попасть в выборку.

2) Выборка, в которую члены из генеральной совокупности отбираются через определенный интервал, называется механической. Например, если объем выборки должен составлять 5% объема генеральной совокупности (5%-ная выборка), то отбирается ее каждый 20-й член, при 10%-ной выборке — каждый 10-й член генеральной совокупности и т. д. Механическую выборку можно образовать, если имеется определенный порядок следования членов генеральной совокупности, например, если они следуют друг за другом в определенной последовательности во времени. Именно так появляются изготовленные на станке детали, приборы, сошедшие с конвейера, и т. п. При этом необходимо убедиться, что в следующих один за другим членах генеральной совокупности значения признака не изменяются с той же (или кратной ей) периодичностью, что и периодичность отбора элементов в выборку. Например, пусть из продукции металлообрабатывающего станка в выборку попадает каждая пятая деталь, а после каждой десятой детали рабочий производит смену (или заточку) режущего инструмента и наладку станка. Эти операции рабочего направлены на улучшение качества деталей (износ режущего инструмента происходит более или менее равномерно). Следовательно, в выборочную совокупность попадут детали, на качество которых работа станка влияет в одну и ту же сторону, и значения признака выборочной совокупности могут неправильно отразить соответствующие значения признака генеральной совокупности.

3) Если из предварительно разбитой на непересекающиеся группы генеральной совокупности образовать собственно-случайные выборки из каждой группы (с повторным или бесповторным отбором членов), то отобранные элементы составят выборочную совокупность, которая называется типической.

4) Если генеральную совокупность предварительно разбить на непересекающиеся серии (группы), а затем, рассматривая серии как элементы, образовать собственно-случайную выборку (с повторным или бесповторным отбором серий), то все члены отобранных серий составят выборочную совокупность, которая называется серийной. Например, пусть на заводе 150 станков (10 цехов по 15 станков) производят одинаковые изделия. Если в выборку отбирать изделия из тщательно перемешанной продукции всех 150 станков, то образуется собственно-случайная выборка. Но можно отбирать изделия отдельно из продукции первого, второго и т. д. станков. Тогда будет образована типическая выборка. Если же членами генеральной совокупности считать цеха и сначала образовать собственно-случайную выборку цехов, а потом в каждом из отобранных цехов взять все произведенные изделия, то все отобранные изделия (из всех отобранных цехов) составят серийную выборку. Как уже отмечалось, практически любой изучаемый признак X может быть непосредственно измерен или получить числовую характеристику. Поэтому первичные экспериментальные данные, характеризующие выделенную выборку, обычно представлены в виде набора чисел, записанных исследователем в порядке их поступления. Количество (n) чисел в этом наборе – объем выборки, а численность (m) варианты (одного из значений элементов выборки) называют частотой варианты. Отношение m n называют относительной частотой (W) варианты.

Используя эти понятия, запишем соотношение между ними в репрезентативной выборке.

Пусть S — объем генеральной совокупности, n — объем репрезентативной выборки, в которой k значений исследуемых признаков распределены по частотамВыборочный метод - определение и вычисление с примерами решения. Тогда в генеральной совокупности частотам Выборочный метод - определение и вычисление с примерами решения будут соответствовать частоты Выборочный метод - определение и вычисление с примерами решения тех же значений признака, что и в выборке Выборочный метод - определение и вычисление с примерами решенияПо определению репрезентативной выборки получаем:Выборочный метод - определение и вычисление с примерами решения , где і — порядковый номер значения признака Выборочный метод - определение и вычисление с примерами решенияИз этого соотношения находим:

Выборочный метод - определение и вычисление с примерами решения

Пример №8

Обувной цех должен выпустить 1000 пар кроссовок молодежного фасона. Для того чтобы определить, сколько кроссовок и какого размера необходимо выпустить, были выявлены размеры обуви у 50 случайным образом выбранных подростков. Распределение размеров обуви по частотам представлено в таблице:

Выборочный метод - определение и вычисление с примерами решения

Сколько кроссовок разного размера будет изготавливать фабрика?

Решение:

Выборочный метод - определение и вычисление с примерами решенияБудем считать рассмотренную выборку объемом n = 50 подростков репрезентативной. Тогда в генеральной совокупности (объемом S = 1000) количество кроссовок каждого размера пропорционально количеству кроссовок соответствующего размера в выборке (и для каждого размера находится по формуле (1)). Результаты расчетов будем записывать в таблицу:

Выборочный метод - определение и вычисление с примерами решения

Ответ:

Выборочный метод - определение и вычисление с примерами решения

В сельском хозяйстве для определения количественного соотношения продукции разного сорта пользуются так называемым выборочным

методом. Суть этого метода будет ясна из описания следующего опыта, теоретическую основу которого составляет закон больших чисел. В коробке тщательно перемешан горох двух сортов: зеленый и желтый. Небольшой емкостью, например ложкой, вынимают из разных мест коробки порции гороха. В каждой порции подсчитывают число М желтых горошин и число n всех горошин. Для каждой порции находят относительную частоту появления желтой горошины Выборочный метод - определение и вычисление с примерами решенияТак делают k раз (на практике обычно берут 5 < k < 10) и каждый раз вычисляют относительную частоту. За статистическую вероятность извлечения желтой горошины из коробки принимают среднее арифметическое полученных относительных частот Выборочный метод - определение и вычисление с примерами решения

Выборочный метод - определение и вычисление с примерами решения

Табличное и графическое представление данных. Числовые характеристики рядов данных

Ранжирование ряда данных:

Под ранжированием ряда данных понимают расположение элементов этого ряда в порядке возрастания (имеется в виду, что каждое следующее число или больше, или не меньше предыдущего).

Пример:

Если ряд данных выборки имеет вид 5, 3, 7, 4, 6, 4, 6, 9, 4, то после ранжирования он превращается в ряд 3, 4, 4, 4, 5, 6, 6, 7, 9. (*)

Размах выборки (R)

Размах выборки — это разность между наибольшим и наименьшим значениями величины в выборке.

Для ряда (*) размах выборки: R = 9 – 3 = 6.

Мода (Mo)

Мода — это значение элемента выборки, встречающееся чаще остальных.

В ряду (*) значение 4 встречается чаще всего, итак, Mo = 4.

Медиана (Me)

Медиана — это так называемое серединное значение упорядоченного ряда значений: — если количество чисел в ряду нечетное, то медиана — это число, записанное посередине; — если количество чисел в ряду четное, то медиана — это среднее арифметическое двух чисел, стоящих посередине.

Для ряда (*), в котором 9 членов, медиана — это среднее (то есть пятое) число 5: Me = 5. Если рассмотреть ряд 3, 3, 4, 4, 4, 5, 6, 6, 7, 9, в котором 10 членов, то медиана — это среднее арифметическое пятого и шестого членов: Выборочный метод - определение и вычисление с примерами решения

Среднее значение Выборочный метод - определение и вычисление с примерами решения выборки

Средним значением выборки называется среднее арифметическое всех чисел ряда данных выборки. Если в ряду данных записаны значения Выборочный метод - определение и вычисление с примерами решения (среди которых могут быть и одинаковые), то Выборочный метод - определение и вычисление с примерами решения

Если известно, что в ряду данных различные значения Выборочный метод - определение и вычисление с примерами решения встречаются соответственно с частотами Выборочный метод - определение и вычисление с примерами решения (тогда Выборочный метод - определение и вычисление с примерами решения то среднее арифметическое можно вычислить по формуле Выборочный метод - определение и вычисление с примерами решения

Пусть ряд данных задан таблицей распределения его различных значений по частотам M:

Выборочный метод - определение и вычисление с примерами решения

Тогда по формуле (**) Выборочный метод - определение и вычисление с примерами решенияили по другой формуле

Выборочный метод - определение и вычисление с примерами решения

Табличное и графическое представление данных. Полигоны частот

Как уже отмечалось, практически любой изучаемый признак X может быть непосредственно измерен или получить числовую характеристику. Поэтому первичные экспериментальные данные, характеризующие выделенную выборку, обычно представлены в виде набора чисел, записанных исследователем в порядке их поступления.

Если данных много, то полученный набор чисел трудно обозрим и сделать по нему какие-то выводы очень сложно. Поэтому первичные данные нуждаются в обработке, которая обычно начинается с их группировки. Группировка выполняется различными методами в зависимости от целей исследования, вида изучаемого признака и количества экспериментальных данных (объема выборки). Наиболее часто группировка сводится к представлению данных в виде таблиц, в которых различные значения элементов выборки упорядочены по возрастанию и указаны их частоты (то есть количество каждого элемента в выборке).

При необходимости в этой таблице указывают также относительные частоты для каждого элемента, записанного в первой строке. Такую таблицу часто называют рядом распределения (или вариационным рядом). Например, пусть при изучении размера обуви 30 мальчиков 11 класса получили набор чисел (результаты записаны в порядке опроса): 39; 44; 41; 39; 40; 41; 45; 42; 44; 41; 41; 43; 42; 43; 41; 44; 42; 38; 40; 38; 41; 40; 42; 43; 42; 41; 43; 40; 40; 42. Чтобы удобнее было анализировать информацию, в подобных ситуациях числовые данные сначала ранжируют, располагая их в порядке возрастания (когда каждое следующее число или больше, или не меньше предыдущего). В результате ранжирования получаем следующий ряд: 38; 38; 39; 39; 40; 40; 40; 40; 40; 41; 41; 41; 41; 41; 41; 41; 42; 42; 42; 42; 42; 42; 43; 43; 43; 43; 44; 44; 44; 45. Затем составляем таблицу, в первой строке которой указаны все различные значения полученного ряда данных (X  размер обуви выбранных 30 мальчиков 11 класса), а во второй строке – их частоты М:

Выборочный метод - определение и вычисление с примерами решения

Получаем ряд распределения рассматриваемого признака X по частотам. Иногда удобно проводить анализ ряда распределения на основе его графического изображения. Отметим на координатной плоскости точки с координатамиВыборочный метод - определение и вычисление с примерами решенияВыборочный метод - определение и вычисление с примерами решенияи соединим их последовательно отрезками (рис. 23.1). Полученную ломаную линию называют полигоном частот.

Итак, полигоном частот называют ломаную, отрезки которой последовательно соединяют точки с координатами Выборочный метод - определение и вычисление с примерами решения, где Выборочный метод - определение и вычисление с примерами решения — значения различных элементов ряда данных, а Выборочный метод - определение и вычисление с примерами решения — соответствующие им частоты. Аналогично определяется и строится полигон относительных частот для рассматриваемого признака X (строятся точки с координатамиВыборочный метод - определение и вычисление с примерами решения — значения различных элементов ряда данных, а Выборочный метод - определение и вычисление с примерами решения — соответствующие им относительные частоты.

Выборочный метод - определение и вычисление с примерами решения

Если вычислить относительные частоты для каждого из различных значений ряда данных, рассмотренного в начале этого пункта, то распределение значений рассматриваемого признака X по относительным частотам можно задать таблицей:

Выборочный метод - определение и вычисление с примерами решения

Распределение значений рассматриваемого признака X по относительным частотам можно представить также в виде полигона относительных частот (рис. 23.2), в виде линейной диаграммы (рис. 23.3) или в виде круговой диаграммы, предварительно записав значения относительной частоты в процентах (рис. 23.4).

Выборочный метод - определение и вычисление с примерами решения

Напомним, что для построения круговой диаграммы круг разбивается на секторы, центральные углы которых пропорциональны относительным частотам, вычисленным для каждого из различных значений ряда данных. Обратим внимание, что круговая диаграмма сохраняет свою наглядность и выразительность только при небольшом количестве полученных секторов. В противном случае ее применение малоэффективно. Если рассматриваемый признак принимает много различных значений, то его распределение можно лучше себе представить после разбиения всех значений ряда данных на классы.

Количество классов может быть любым, удобным для исследования (обычно от 4 до 12). При этом величины (объемы) классов должны быть одинаковыми. Например, в следующей таблице представлены сведения о заработной плате 100 рабочих одного предприятия (в некоторых условных единицах). При этом значения зарплаты (округлены до целого числа условных единиц) сгруппированы в 7 классов, каждый объемом в 100 условных единиц.

Выборочный метод - определение и вычисление с примерами решения

(проверка: Выборочный метод - определение и вычисление с примерами решения = 100) Наглядно частотное распределение зарплат по классам можно представить с помощью полигона частот (рис. 23.5) или столбчатой диаграммы (рис. 23.6).

Выборочный метод - определение и вычисление с примерами решения

Числовые характеристики рядов данных. Размах, мода и медиана ряда данных

Иногда выборку случайных величин или всю генеральную совокупность этих величин приходится характеризовать одним числом. На практике это необходимо, например, для быстрого сравнения двух или больше совокупностей по общему признаку. Рассмотрим конкретный пример. Пусть после летних каникул провели опрос 10 девочек и 9 мальчиков одного класса о количестве книг, прочитанных ими за каникулы. Результаты были записаны в порядке опроса. Получили следующие ряды чисел:

  • для девочек: 4, 3, 5, 3, 8, 3, 12, 4, 5, 5;
  • для мальчиков: 5, 3, 3, 4, 6, 4, 4, 7, 4.

Как уже отмечалось, чтобы удобнее было анализировать информацию, в подобных случаях числовые данные ранжируют, располагая их в порядке возрастания (когда каждое следующее число или больше, или не меньше предыдущего). В результате ранжирования получили следующие ряды:

  • для девочек: 3, 3, 3, 4, 4, 5, 5, 5, 8, 12; (1)
  • для мальчиков: 3, 3, 4, 4, 4, 4, 5, 6, 7. (2)

Тогда распределение по частотам M величин: X — число книг, прочитанных за каникулы девочками, и Y — число книг, прочитанных за каникулы мальчиками, можно задать таблицами:

Выборочный метод - определение и вычисление с примерами решения

Эти распределения можно проиллюстрировать также графически с помощью полигона частот (рис. 23.7, а, б).

Выборочный метод - определение и вычисление с примерами решения

Для сравнения рядов (1) и (2) используют различные характеристики. Приведем некоторые из них. Размахом ряда чисел (обозначается R) называют разность между наибольшим и наименьшим из этих чисел. Поскольку мы анализируем выборку некоторых величин, то размах выборки — это разность между наибольшим и наименьшим значениями величины в выборке.

Для ряда (1) размах R = 12 – 3 = 9, а для ряда (2) размах R = 7 – 3 = 4. На графике размах — это длина области определения полигона частот (рис. 23.7). Одной из статистических характеристик ряда данных является его мода (обозначается Mo, от латинского слова modus — мера, правило).

Мода — это значение элемента выборки, встречающееся чаще остальных.

Так, в ряду (1) две моды — числа 3 и 5: Выборочный метод - определение и вычисление с примерами решения = 5, а в ряду (2) одна мода — число 4: Mo = 4. На графике мода — это значение абциссы точки, в которой достигается максимум полигона частот (см. рис. 23.7). Отметим, что моды может и не быть, если все значения рассматриваемого признака встречаются одинаково часто. Моду ряда данных обычно находят тогда, когда хотят выяснить некоторый типовой показатель. Например, когда изучают данные о моделях мужских рубашек, проданных в определенный день в универмаге, то удобно использовать такой показатель, как мода, который характеризует модель, пользующуюся наибольшим спросом (собственно, этим и объясняется название «мода»). Еще одной статистической характеристикой ряда данных является его медиана. Медиана — это так называемое серединное значение упорядоченного ряда значений (обозначается Me). Медиана делит упорядоченный ряд данных на две равные по количеству элементов части.

Если количество чисел в ряду нечетное, то медиана — это число, записанное посередине. Например, в ряду (2) нечетное количество элементов (n = 9). Тогда его медианой является число, стоящее посередине, то есть на пятом месте: Me =4

Выборочный метод - определение и вычисление с примерами решения

Следовательно, о мальчиках можно сказать, что одна половина из них прочитала не больше 4 книг, а вторая — не меньше 4 книг. (Отметим, что в случае нечетного n номер среднего члена ряда равен Выборочный метод - определение и вычисление с примерами решения

Если количество чисел в ряду четное, то медиана — это среднее арифметическое двух чисел, стоящих посередине. Например, в ряду (1) четное количество элементов (n = 10). Тогда его медианой является число, равное среднему арифметическому чисел, стоящих посередине, то есть на пятом и шестом местах:Выборочный метод - определение и вычисление с примерами решения

Выборочный метод - определение и вычисление с примерами решения

Следовательно, о девочках можно сказать, что одна половина из них прочитала меньше 4,5 книги, а вторая — больше 4,5 книги. (Отметим, что в случае четного n номера средних членов ряда равны Выборочный метод - определение и вычисление с примерами решения

Среднее значение выборки

Средним значением выборки (обозначается Выборочный метод - определение и вычисление с примерами решенияназывается среднее арифметическое всех чисел ряда данных выборки. Если в ряду данных записаны значения Выборочный метод - определение и вычисление с примерами решения(среди которых могут быть и одинаковые), тоВыборочный метод - определение и вычисление с примерами решения

Если известно, что в ряду данных различные значения Выборочный метод - определение и вычисление с примерами решения встречаются соответственно с частотами Выборочный метод - определение и вычисление с примерами решения (тогда ∑M = n ), то, заменяя одинаковые слагаемые в числителе на соответствующие произведения, получаем, что среднее арифметическое можно вычислять по формуле

Выборочный метод - определение и вычисление с примерами решения

Последнюю формулу удобно использовать в тех случаях, когда в выборке распределение величины по частотам задано в виде таблицы. Напомним, что распределение по частотам M величин: X — число книг, прочитанных за каникулы девочками, и Y — число книг, прочитанных за каникулы мальчиками, было задано такими таблицами:

Выборочный метод - определение и вычисление с примерами решения

Тогда средние значения заданных выборок равны:

Выборочный метод - определение и вычисление с примерами решения

Поскольку Выборочный метод - определение и вычисление с примерами решения то можно сказать, что за один и тот же промежуток времени девочки в классе читают книг больше, чем мальчики. Обратим внимание, что в пособиях по статистике моду, медиану и среднее значение выборки объединяют одним термином — меры центральной тенденции, подчеркивая тем самым возможность охарактеризовать ряд выборки одним числом. Не для каждого ряда данных имеет смысл формально находить центральные тенденции.

Например, если исследуется ряд 5, 5, 8, 110 (5) годовых доходов четырех людей (в тыс. у. е.), то очевидно, что ни мода (5), ни медиана (6,5), ни среднее значение (32) не могут выступать в роли единой характеристики всех значений ряда данных. Это объясняется тем, что размах ряда (105) является соизмеримым с наибольшим из его значений. В данном случае можно искать центральные тенденции, например, для части ряда (5): 5, 5, 8, условно назвав его выборкой годового дохода низкооплачиваемой части населения. Если в выборке среднее значение существенно отличается от моды, то его нецелесообразно выбирать в качестве типичной характеристики рассматриваемой совокупности данных (чем больше значение моды отличается от среднего значения, тем «более несимметричным» является полигон частот совокупности).

Сведения из истории:

Элементарные задачи, которые позднее были отнесены к стохастике, то есть к комбинаторике, теории вероятностей и математической статистике, ставились и решались еще во времена Древних Египта, Греции и Рима. Этот период так называемой предыстории теории вероятностей заканчивается в XVI в. работами итальянских математиков Д. Кардано (1501–1576) «Книга об игре в кости», Н. Тартальи (1499–1557) «Общий трактат о числе и мере», Г. Г а л и л е я (1564–1642) «О выпадении очков при игре в кости» и др. В этих работах уже фигурирует понятие вероятности, используется теорема о вероятности произведения независимых событий, высказываются некоторые соображения относительно так называемого закона больших чисел. В XVII–XVIII вв. вопросами теории вероятностей заинтересовались французские математики П. Ферма (1601–1665) и Б. Паскаль (1623–1662), нидерландский математик X. Гюйгенс (1629– 1695), швейцарские математики Я. Бернулли (1654–1705), И. Бернулли (1687–1759), Д. Бернулли (1700–1782) и российский математик Л. Эйлер (1707–1783). В своих работах они уже использовали теоремы сложения и умножения вероятностей, понятия зависимых и независимых событий, математического ожидания. Большую роль в распространении идей теории вероятностей и математической статистики в России сыграли выдающиеся российские математики  В. Я. Буняковский (1804–1889) и М. В. Остроградский (1801–1862). Дальнейшее развитие теории вероятностей потребовало уточнения основных ее положений. Большую работу в этом направлении провел выдающийся российский математик П. Л. Чебышёв (1821–1894). Его ученик А. А. Марков (1856– 1922) стал выдающимся математиком именно благодаря своим исследованиям в теории вероятностей.

Книга А. А. Маркова «Исчисление вероятностей», первое издание которой вышло в 1900 г., а четвертое — в 1924 г., в течение многих лет была лучшей из тех, по которым учились российские математики. В этой книге, в частности, раскрывается, в каком понимании статистическая вероятность Выборочный метод - определение и вычисление с примерами решения(А) близка к вероятности Р (А) при больших п: вероятность значительного отклонения Выборочный метод - определение и вычисление с примерами решения от Р (А) близка к нулю, но это не означает, что значительные отклонения невозможны при больших п. В XX в. теория вероятностей постепенно превращается в строгую аксиоматическую теорию. Это произошло благодаря работам многих математиков. Но действительно решающим этапом в развитии теории вероятностей стала работа А. Н. Колмогорова (1903–1987) «Основные понятия теории вероятностей» (изданная в 1937 г.), в которой он изложил свою аксиоматику теории вероятностей и после которой теория вероятностей заняла равноправное место среди других математических дисциплин. Большие достижения в теории вероятностей и математической статистике имели также российские математики А. Я. Хинчин (1894–1959), Е. Е. Слуцкий (1880–1948), Б. В. Генеденко (1911–1995), математики И. И. Гихман (1918–1985), В. С. Михалевич (1930–1994), и другие.

Выборка, вариационный ряд и гистограмма

Если теория вероятностей оперирует с известными законами распределения и их параметрами (числовыми характеристиками), то математическая статистика по результатам экспериментов проверяет, правильно ли подобрано распределение (нормальное, биномиальное, экспоненциальное и т. д.), оценивает параметры этого распределения, проверяет гипотезы о параметрах принятого распределения. Это позволяет заменить большое число экспериментальных данных небольшим числом параметров распределения, которые в сжатом виде характеризуют случайную величину и позволяют прогнозировать результаты эксперимента при известном комплексе условий.
Пусть проводится Выборочный метод - определение и вычисление с примерами решения измерений. В результате измерений получено Выборочный метод - определение и вычисление с примерами решения чисел Выборочный метод - определение и вычисление с примерами решения. Если повторить еще раз Выборочный метод - определение и вычисление с примерами решения измерений, то получатся другие Выборочный метод - определение и вычисление с примерами решения чисел, отличные от первого набора. Процесс из Выборочный метод - определение и вычисление с примерами решения измерений можно описать как и независимых случайных величин.
 

Результат и наблюдений Выборочный метод - определение и вычисление с примерами решения случайной величины X называется выборкой, Выборочный метод - определение и вычисление с примерами решения – объем выборки, а сама случайная величина X – называется генеральной случайной величиной.

Результат эксперимента Выборочный метод - определение и вычисление с примерами решения может быть интерпретирован либо апостериорной величиной, либо априорной. В первом случае это результат опыта. Во втором случае является случайной величиной (т. к. до опыта неизвестна), ко­торая получит свое конкретное значение в результате какого-то Выборочный метод - определение и вычисление с примерами решения опыта. В этом случае можно предполагать, что закон распределения Выборочный метод - определение и вычисление с примерами решения, совпадает с законом распределения генеральной случайной величиной X и Выборочный метод - определение и вычисление с примерами решения, можно рассматривать как экземпляр генеральной случайной величины X.

Далее мы будем считать выборки априорными. При этом будем полагать, что элементы выборки – независимые случайные величины с одинаковым законом распределения, т. е. мы можем широко использовать теоремы независимых случайных величинах.
 

Упорядоченная в порядке возрастания последовательность выборочных значений образует вариационный ряд:

Выборочный метод - определение и вычисление с примерами решения

члены вариационного ряда Выборочный метод - определение и вычисление с примерами решения называются порядковыми статистиками. Если объем выборки Выборочный метод - определение и вычисление с примерами решения – велик, то выборка позволяет приблизительно оценить закон распределения случайной величиной X. Для этого необходимо построить гистограмму. Есть два способа построения гистограммы – равноинтервальный и равновероятностный.

Рассмотрим равноинтервалъный способ.

  1. Разобьем весь диапазон выборочных значений от Выборочный метод - определение и вычисление с примерами решения на Выборочный метод - определение и вычисление с примерами решения равных частей. Величину Выборочный метод - определение и вычисление с примерами решения выбирают достаточно произвольно, можно так: Выборочный метод - определение и вычисление с примерами решения где Выборочный метод - определение и вычисление с примерами решения – объем выборки.
  2. Определяем длину каждого интервала: Выборочный метод - определение и вычисление с примерами решения
  3. Находим границы каждого интервала: для первого:Выборочный метод - определение и вычисление с примерами решения для второго: Выборочный метод - определение и вычисление с примерами решения для Выборочный метод - определение и вычисление с примерами решения

Определим середины каждого интервала: Выборочный метод - определение и вычисление с примерами решения

4. Подсчитываем (используя вариационный ряд) количество выборочных значений, попадающих в Выборочный метод - определение и вычисление с примерами решения интервал – Выборочный метод - определение и вычисление с примерами решения

5. Находим относительную частоту Выборочный метод - определение и вычисление с примерами решения попадания случайной величиной X в Выборочный метод - определение и вычисление с примерами решения интервал.
Полученные данные заносим в таблицу.

Выборочный метод - определение и вычисление с примерами решения

Эта таблица называется статистическим рядом.

Графическое изображение статистического ряда – это гистограмма.
Рисуем оси координат, делаем разметку осей, наносим на ось X границы интервалов и их середины. После этого строим на каждом отрезке прямоугольники высотой Выборочный метод - определение и вычисление с примерами решения. Аппроксимируем фигуру из прямоугольников пунктирной линией (рис. 8.1). По виду этой кривой можно выдвинуть предположение (гипотезу) о виде закона распределения генеральной случайной величиной X (на рис. 8.1. видно, что пунктирная линия похожа на кривую Гаусса, которая относится к нормальному закону).

Выборочный метод - определение и вычисление с примерами решения

Имея статистический ряд можно оценить числовые характеристики генеральной случайной величиной X :

Выборочный метод - определение и вычисление с примерами решения

Выборочный метод

Группа предметов или явлений, объединенных каким-либо общим признаком или свойством качественного или количественного характера, называется совокупностью. Предметы или явления, образующие совокупность, называются единицами совокупности. Если совокупность содержит ограниченное число единиц, то она называется конечной. Если число единиц совокупности безгранично, то ее называют бесконечной совокупностью.

Теоретические основы выборочного метода содержатся в теоремах Чебышева и Ляпунова.

 Основной предпосылкой применения выборочного метода является возможность судить о характеристиках генеральной (общей) совокупности по отобранной, так называемой выборочной совокупности. Наиболее важным принципом в применении выборочного метода является обеспечение равной возможности всем единицам, входящим в состав генеральной совокупности, быть избранными. При таком объективном подходе к отбору единиц, при котором ни одна единица не обладает преимуществом попасть в отбираемую совокупность по сравнению с другими единицами, характеристики выборочной совокупности при увеличении объема выборки стремятся к характеристикам генеральной совокупности.

Теорема Чебышева (применительно к выборочному методу) может быть записана в следующем виде:
Выборочный метод - определение и вычисление с примерами решения
где Выборочный метод - определение и вычисление с примерами решения—средняя по совокупности выбранных единиц;

Выборочный метод - определение и вычисление с примерами решения — средняя по генеральной совокупности;

Выборочный метод - определение и вычисление с примерами решения — среднее квадратическое отклонение в генеральной совокупности.

Теорема формулируется так: с вероятностью, сколь угодно близкой к единице (достоверности), можно утверждать, что при достаточно большом объеме выборки, и ограниченной дисперсии генеральной совокупности разность между выборочной средней Выборочный метод - определение и вычисление с примерами решения и генеральной средней Выборочный метод - определение и вычисление с примерами решения будет сколь угодно мала.

Примечания. 1. Выражение Выборочный метод - определение и вычисление с примерами решения часто обозначают Выборочный метод - определение и вычисление с примерами решения

2. При практическом использовании теоремы Чебышева генеральную-дисперсию Выборочный метод - определение и вычисление с примерами решения которая неизвестна, заменяют выборочной дисперсией Выборочный метод - определение и вычисление с примерами решения

Теорема Ляпунова

Ляпунов с помощью разработанного им метода характеристических функций доказал в 1900 г. центральную предельную теорему, носящую его имя. Эта теорема выясняет общие условия, при осуществлении которых распределение суммы независимых случайных величин стремится к нормальному распределению вероятностей. В частности, эта теорема дает возможность оценить погрешность приближенных равенств:Выборочный метод - определение и вычисление с примерами решения

при достаточно больших n (modo Bernulliano). Если Выборочный метод - определение и вычисление с примерами решенияВыборочный метод - определение и вычисление с примерами решения—независимые случайные величины и Выборочный метод - определение и вычисление с примерами решения то вероятность их средней Выборочный метод - определение и вычисление с примерами решения находится в пределе от а до b и может быть определена равенством:
Выборочный метод - определение и вычисление с примерами решения
где
Выборочный метод - определение и вычисление с примерами решения

Ограничительные условия теоремы Ляпунова сводятся в основном к тому, чтобы среди слагаемых случайных величин не было сильно выделяющихся (таких, колеблемость которых значительно превосходила бы большинство остальных). В приложении к выборочному методу данная теорема может быть сформулирована следующим образом:

При достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности вероятность того, что разность между выборочной средней и генеральной средней будет в пределах Выборочный метод - определение и вычисление с примерами решения равна Выборочный метод - определение и вычисление с примерами решения

Формулировка Ляпунова придает теореме Чебышева полную определенность и записывается так:

Выборочный метод - определение и вычисление с примерами решения

Замечание о практическом использовании ее то же, что и для формулы на стр. 125.

Теорема Я. Бернулли, опубликованная в 1713 г., послужила началом возникновения большой группы теорем, именуемых в общем законом больших чисел. Она представляет собой частный случай теоремы Чебышева и может быть из нее получена  

Выборочный метод - определение и вычисление с примерами решения

где Выборочный метод - определение и вычисление с примерами решения — доля признака среди отобранных единиц (частость);

р — доля признака в генеральной совокупности.

Теорема Бернулли применяется в тех случаях, когда из генеральной совокупности производится отбор единиц и доля признака не меняется от испытания к испытанию. Формулировка теоремы Бернулли применительно к выборке: с вероятностью, сколь угодно близкой к единице, можно утверждать, что разность между частостью и долей в генеральной совокупности при достаточно большом объеме выборки будет сколь угодно мала. При практическом использовании данной теоремы величина Выборочный метод - определение и вычисление с примерами решения рассчитывается путем замены р на Выборочный метод - определение и вычисление с примерами решения и q на Выборочный метод - определение и вычисление с примерами решения

Теорема Пуассона также является частным случаем теоремы Чебышева, когда доля признака в генеральной совокупности (р) с ходом выборки все время меняется. В этом случае

Выборочный метод - определение и вычисление с примерами решения

Тогда:

Выборочный метод - определение и вычисление с примерами решения

Ошибка репрезентативности (представительства Выборочный метод - определение и вычисление с примерами решения представляет собой разность между характеристиками выборочной и генеральной совокупности. Генеральная средняя Выборочный метод - определение и вычисление с примерами решения вычитается из выборочной средней Выборочный метод - определение и вычисление с примерами решения или доля признака в генеральной совокупности (р) вычитается из доли признака в выборочной совокупности, т. е. частости Выборочный метод - определение и вычисление с примерами решения

Если Выборочный метод - определение и вычисление с примерами решения представляет собой предел,которого не превосходит абсолютная величина Выборочный метод - определение и вычисление с примерами решения то

Выборочный метод - определение и вычисление с примерами решения

В формулах выборочного метода фигурирует дисперсия генеральной совокупности (Выборочный метод - определение и вычисление с примерами решения). Но при производстве выборки характеристики генеральной совокупности неизвестны. Однако обычно (за исключением очень малочисленных выборок) без большой погрешности можно заменить дисперсию генеральной совокупности дисперсией выборочной совокупности (Выборочный метод - определение и вычисление с примерами решения), которая вычисляется по формулам:

Выборочный метод - определение и вычисление с примерами решения

Предельная и средние ошибки выборки

Теория устанавливает соотношение между пределом ошибки выборки (Выборочный метод - определение и вычисление с примерами решения), гарантируемым с некоторой вероятностью (P), величиной t, связанной с этой вероятностью (см. приложение III), и так называемой средней ошибкой выборки (Выборочный метод - определение и вычисление с примерами решения):

Выборочный метод - определение и вычисление с примерами решения
или

Выборочный метод - определение и вычисление с примерами решения
Предельная ошибка выборки равна t-кратному числу средних ошибок выборки.

По способу организации выборки различают:

  1. собственно случайный отбор;
  2. типический отбор;
  3. механический отбор;
  4. серийный отбор;
  5. комбинированный отбор.

Собственно случайный отбор ориентирован на выборку единиц из генеральной совокупности без всякого расчленения ее на части или группы. При этом теоретически возможно применение собственно случайного повторного отбора и собственно случайного бесповторного отбора.

Формулы средней ошибки выборки при собственно случайном методе отбора:Выборочный метод - определение и вычисление с примерами решения

Для большей точности вместо множителя Выборочный метод - определение и вычисление с примерами решения следует брать множитель Выборочный метод - определение и вычисление с примерами решенияно при большой численности N различие между этими выражениями практически значения не имеет.

Пример №9

Из совокупности 10 000 деталей отобрано собственно случайным бесповторным методом 1000 деталей, для которых средний вес детали оказался равным 50 г, дисперсия 49. Бракованных деталей было обнаружено 20 штук. Вычислить средние ошибки выборки для средней и доли.

Дано:

Выборочный метод - определение и вычисление с примерами решения
По формулам табл. 1 находим средние ошибки выборки: для среднего веса детали при бесповторном отборе:

Выборочный метод - определение и вычисление с примерами решения

и для доли брака:

Выборочный метод - определение и вычисление с примерами решения

Случайные числа и таблицы случайных чисел

Однозначные числа, расположенные в случайном порядке, называются случайными числами. Случайность расположения чисел состоит в отсутствии закона, определяющего их расположение, и вместе с тем в приближенно равной частоте каждой из десяти цифр.

При организации собственно случайной выборки для соблюдения основного принципа выборки — равной возможности каждой единице генеральной совокупности быть отобранной — используются таблицы случайных чисел, позволяющие производить случайный отбор единиц наудачу, т. е. без привнесения элементов субъективности.

Таблицы случайных чисел составляются различными методами. Так, например, М. Кодыров выписывал 50 000 однозначных чисел из результатов переписи населения 1926 г. Брались срединные цифры одна за другой, в том порядке, в каком они встречались в сводках по городам и губерниям. Для избежания неслучайности крайние цифры из сводок вследствие тенденций к округлениям отбрасывались. А. К. Митропольский для получения таблиц случайных чисел брал 16—19-е знаки двадцатизначной таблицы логарифмов чисел от 90 000 до 100 000. Случайные цифры объединяются в четырехзначные числа.

Таблицы случайных чисел используются путем нумерации всех единиц генеральной совокупности и выписки из таблиц стольких чисел, сколько требуется для выборки. Из генеральной совокупности отбираются те единицы, порядковый номер которых соответствует выписанным из таблицы случайных чисел. Если число единиц в генеральной совокупности не более 999, то последнюю или первую цифру четырехзначного числа отбрасывают. Выборка с помощью таблицы случайных чисел может быть произведена по схеме возвращенного шара (повторная) и по схеме невозвращенного шара (бесповторная). В последнем случае одинаковые числа опускаются.

Пример №10

Генеральная совокупность состоит из 500 единиц. Производится 10-процентный бесповторный отбор. Пронумеруем все 500 единиц генеральной совокупности и возьмем из таблицы случайных чисел (приложение XI) 50 различных трехзначных чисел, начиная с первого числа 3-й колонки. Числа большие, чем 500, отбрасываем.

Получаем: 315, 255, 337, 179, 210, 455, 235-, 364, 489, 80, 117, 118, 174, 476, 111, 341, 296, 332, 4, 307, 22, 430, 52, 22, 83, 248, 319, 262, 36, 101, 27, 342, 470, 330, 170, 443, 499, 109, 42, 70, 490, 422, 336, 67, 121, 225, 57, 319, 499, 362, 198, 50, 286.

Эти числа означают номера тех единиц из 500, которые попали в случайную бесповторную выборку (в данном случае совпадают только три числа: 22, 319, 499; поэтому заменяем их другими).

Для случая, когда частость даже приблизительно неизвестна, можно произвести «грубый» расчет средней ошибки выборки для доли, вводя в расчет максимальную величину произведения Выборочный метод - определение и вычисление с примерами решения равную 0,25. Тогда для повторного отбора получим:

Выборочный метод - определение и вычисление с примерами решения

и для бесконечного отбора:

Выборочный метод - определение и вычисление с примерами решения

Пример №11

Из совокупности численностью в 900 деталей взята на выборку 81 деталь. Никаких данных, даже предположительных, об удельном весе деталей I сорта в генеральной совокупности нет.

Определить среднюю ошибку выборки для доли продукции I сорта.

Дано: N = 900; n = 81; допускаем, что Выборочный метод - определение и вычисление с примерами решения=0,25, тогда получаем:

Выборочный метод - определение и вычисление с примерами решения

Как было показано в § 7, Выборочный метод - определение и вычисление с примерами решения Из приложения III возьмем три значения t, тогда

при t=1    F(t) = 0,683;

t=2    F(t) = 0,954;

t=3     F(t) = 0,997.

Это показывает, что 0,683 измеряет вероятность того, что ошибка выборки не превысит предела, равного одной средней ошибке. Значительно больше вероятность того, что ошибка не превысит двойной средней ошибки, и т. д.

Вероятность 0,997 практически принимают за достоверность, т. е. считают, что предельная ошибка выборки равна трехкратной средней ошибке.

Иногда для определения размеров предельной ошибки связывают величину t с объемом выборки, применяя эмпирическую формулу:

Выборочный метод - определение и вычисление с примерами решения

тогда

Выборочный метод - определение и вычисление с примерами решения

Чем больше объем выборки, тем ближе предельная ошибка к утроенным средним ошибкам.

Численность выборки

При проектировке выборочного наблюдения предполагают заранее заданными величину допустимой ошибки выборки и вероятность ответа. Неизвестным, следовательно, остается тот минимальный объем выборки, который должен обеспечить требуемую точность. Из формулы Выборочный метод - определение и вычисление с примерами решения и формул средних ошибок выборки устанавливаем необходимую численность выборки (называемую иногда достаточно большим числом).

Формулы для определения численности выборки (n) при собственно случайном способе отбора:Выборочный метод - определение и вычисление с примерами решения

Примечание. При проектировании объема необходимой выборки величины Выборочный метод - определение и вычисление с примерами решения и Выборочный метод - определение и вычисление с примерами решения неизвестны, поэтому вместо точного их значения берут приближенные, установленные на основании уже проведенного другого наблюдения или нескольких пробных наблюдений, избирая из найденных результатов наибольшие значения Выборочный метод - определение и вычисление с примерами решения и Выборочный метод - определение и вычисление с примерами решения

Пример №12

Проектируется выборочное наблюдение, целью которого является установление среднего размера деталей в совокупности, состоящей из 10 000 деталей. Требуемая точность 1 см. Произведенные пробные выборки дали наибольшую дисперсию, равную 49. Нужно определить необходимую численность случайной бесповторной выборки, обеспечивающей с вероятностью 0,95 заданную точность.

Дано: N= 10 000; Выборочный метод - определение и вычисление с примерами решения=1; F(y)=0,95; Выборочный метод - определение и вычисление с примерами решения =49.

По приложению III находим по F(t) значение t= 1,96 и по формуле для бесповторной выборки, взятой из табл. 2, получаем:

Выборочный метод - определение и вычисление с примерами решения

Типический отбор дает более точные результаты. Генеральная совокупность делится по некоторому признаку на типические группы. Количество отбираемых единиц из каждой типической группы устанавливается в следующих размерах (см. табл. 3).
Выборочный метод - определение и вычисление с примерами решения

При отборе, не пропорциональном объему типических групп, общее число отбираемых единиц делится на число типических групп и полученная величина дает численность отбора из каждой типической группы.

При отборе, пропорциональном объему типических групп, число наблюдений по каждой группе определяется по формуле:

Выборочный метод - определение и вычисление с примерами решения
где Выборочный метод - определение и вычисление с примерами решения—объем выборки из i-й типической группы; 

n— общий объем выборки;

Выборочный метод - определение и вычисление с примерами решения— объем i-й типической группы;

N—объем генеральной совокупности.

При отборе с учетом колеблемости признака, дающем наименьшую величину ошибки выборки, процент выборки из каждой типической группы должен быть пропорционален среднему квадратическому отклонению в этой группе Выборочный метод - определение и вычисление с примерами решения Расчет численности Выборочный метод - определение и вычисление с примерами решения производится по формулам:

Выборочный метод - определение и вычисление с примерами решения – для средней;

Выборочный метод - определение и вычисление с примерами решения – для доли.
Для вычисления средних ошибок выборки используют формулы табл. 3.

Пример №13

Для определения средней из совокупности 10 000 единиц производится выборка типическим методом. Вся совокупность делится на 5 типических групп. Отбор единиц внутри типических групп производится случайным бесповторным методом пропорционально объему каждой группы. Отбирается 2000 единиц. При отборе получены следующие результаты:
Выборочный метод - определение и вычисление с примерами решения
  

Вычислить: а) среднюю ошибку для каждой группы и для всей выборочной совокупности (при собственно случайном и типическом способах отбора); б) границы, в которых с вероятностью 0,997 находится генеральная средняя по группам и по всей совокупности (при собственно случайном и типическом методах отбора).

Прежде всего рассчитывают численность отбираемых единиц из каждой типической группы пропорционально ее объему (см. колонку 3 табл. 4). Так, для первой типической группы имеем при заданном объеме всей выборки, равном 2000 единиц:

Выборочный метод - определение и вычисление с примерами решения

для второй типической группы:

Выборочный метод - определение и вычисление с примерами решения
и т. д.

Для определения средней ошибки выборки по группам и общей средней ошибки выборки при собственно случайном способе отбора (бесповторном) используем формулы из табл. 1, Получаем среднюю ошибку выборки:

для первой типической группы

Выборочный метод - определение и вычисление с примерами решения
для второй типической группы

Выборочный метод - определение и вычисление с примерами решения
и т. д. по всем группам (см. колонку 2 табл. 5).

Для удобства располагаем все получаемые результаты в таблицу (см. табл. 5).

Для расчета средней ошибки выборки всей совокупности при собственно случайном методе отбора и границ генеральной средней при этом же методе отбора нужно знать общую выборочную среднюю и общую дисперсию выборочной совокупности. Производим расчет общей выборочной средней из групповых выборочных средних путем взвешивания последних по численности отобранных групп

Выборочный метод - определение и вычисление с примерами решения

(см. итог колонки 4 табл. 4).

Для определения общей выборочной дисперсии используют теорему сложения вариации.
Выборочный метод - определение и вычисление с примерами решения

Находим сначала среднюю взвешенную из выборочных дисперсий:

Выборочный метод - определение и вычисление с примерами решения

а затем межгрупповую дисперсию:

Выборочный метод - определение и вычисление с примерами решения

Получаем общую дисперсию выборочной совокупности:

Выборочный метод - определение и вычисление с примерами решения

(см. итог колонки 5 табл. 4).

Находим среднюю ошибку выборки всей совокупности при собственно случайном методе отбора

Выборочный метод - определение и вычисление с примерами решения

(см. первую строку итога колонки 2 табл. 5).

Предельная ошибка собственно случайной выборки:

Выборочный метод - определение и вычисление с примерами решения 

(см. первую строку итога колонки 3 табл. 5).

Соответственно находим границы генеральной средней при собственно случайном методе отбора:

Выборочный метод - определение и вычисление с примерами решения

(см. первую строку итога колонок 4 и 5 табл. 5).

Рассчитываем среднюю ошибку типической выборки, пропорциональной объему типических групп, по формуле из табл. 3. Получим:

Выборочный метод - определение и вычисление с примерами решения
(см. вторую строку итога колонки 2 табл. 5).

Далее определяем ошибку типической выборки Выборочный метод - определение и вычисление с примерами решенияВыборочный метод - определение и вычисление с примерами решения и границы генеральной средней Выборочный метод - определение и вычисление с примерами решения т. е. Выборочный метод - определение и вычисление с примерами решения (см. вторую строку итога колонок 4 и 5 табл. 5).

Пример №14

Для определения доли признака производится типическая выборка 400 единиц из совокупности 10 500 единиц, разбитых на 3 типические группы численностью в 5000, 2500 и 3000 единиц. Имеются основания (прошлое обследование) считать, что искомая доля по типическим группам составляет около 10, 20 и 50%.

В каком объеме произвести выборку из типических групп, чтобы пропорции отбора были наивыгоднейшими?

Определяем численность первой типической группы по соответствующей формуле при объеме всей выборки, равной 400 единицам:

Выборочный метод - определение и вычисление с примерами решения
для второй типической группы:

Выборочный метод - определение и вычисление с примерами решения
для третьей типической группы:

Выборочный метод - определение и вычисление с примерами решения

При механической выборке совокупность делится на столько групп, сколько единиц должно войти в выборку, и из 1 каждой группы отбирается одна единица.

Средняя ошибка выборки подсчитывается по формулам ( собственно случайной выборки (табл. 1).    

При серийном отборе с равновеликими сериями генеральную совокупность делят на одинаковые по объему группы — серии и производят выборку не единиц совокупности, а серий. Попавшие в выборку серии обследуются сплошь. Серии могут отбираться повторным и бесповторным методами.

Средние ошибки выборки при таком отборе рассчитывают по формулам:

Выборочный метод - определение и вычисление с примерами решения
        

где К — число серий в генеральной совокупности;

r — число отобранных серий;

Выборочный метод - определение и вычисление с примерами решения — межсерийная (межгрупповая) дисперсия средних;

Выборочный метод - определение и вычисление с примерами решения — межсерийная (межгрупповая) дисперсия доли.

Пример №15

Генеральная совокупность состоит из 5000 единиц, разбитых на 50 равных по величине серий (по 100 единиц). Бесповторным методом отобрано 10 серий. Результаты выборки представлены в следующей таблице:
Выборочный метод - определение и вычисление с примерами решения

  Исчислить среднюю ошибку серийной бесповторной выборки. Вычисляем: а) общую среднюю всей выборочной совокупности по серийным средним:Выборочный метод - определение и вычисление с примерами решения

б) межсерийную (межгрупповую) дисперсию средних:
Выборочный метод - определение и вычисление с примерами решения
в) среднюю ошибку серийной выборки:
Выборочный метод - определение и вычисление с примерами решения

Необходимая численность отбираемых серий при серийном отборе получается из формул табл. 2, в которых вместо N, n и Выборочный метод - определение и вычисление с примерами решения подставляют R, r и Выборочный метод - определение и вычисление с примерами решения

Пример №16

Совокупность разбита на 50 серий. Имеются основания предполагать, что межсерийная дисперсия равна 16. Сколько серий нужно отобрать бесповторным методом, чтобы с вероятностью 0,954 утверждать, что ошибка выборочной средней не превысит 2,3.

Дано:

Выборочный метод - определение и вычисление с примерами решения

Находим необходимое число серий, отбор которых обеспечит требуемую точность:
Выборочный метод - определение и вычисление с примерами решения

Комбинированная выборка (равновеликие серии) предполагает комбинацию серийного отбора с индивидуальным отбором.

Генеральная совокупность разбивается на одинаковые по объему серии. Сначала отбираются серии, а затем из отобранных серий производится индивидуальная выборка единиц.

Квадрат средних ошибок выборки Выборочный метод - определение и вычисление с примерами решения рассчитывают по следующим формулам (см. табл. 8),

где Выборочный метод - определение и вычисление с примерами решения — общее число единиц, попавших в выборку при отборе серий, определяется по формуле:

Выборочный метод - определение и вычисление с примерами решения
n — число единиц, попавших в выборку из серий.
Выборочный метод - определение и вычисление с примерами решения

Пример №17

Генеральная совокупность состоит из 100 000 единиц, разбитых на 200 равных по объему серий. Произведена бесповторная выборка 50% серий и из каждой серии по 20% единиц. Средняя из серийных дисперсий оказалась равной 12, а межсерийная дисперсия — 5. Определить среднюю ошибку выборки. Дано:

Выборочный метод - определение и вычисление с примерами решения

Определяем общее число единиц, попавших в выборку:

Выборочный метод - определение и вычисление с примерами решения
Определяем среднюю ошибку выборки:
Выборочный метод - определение и вычисление с примерами решения
(по формуле из табл. 8 для бесповторного отбора).

Мы получили среднюю ошибку комбинированной выборки при отборе из генеральной совокупности 10 000 единиц. Можно было бы произвести выборку такого же объема, но отобрав 20% серий и 50% единиц из каждой серии.

При тех же значениях — средней из серийных дисперсий и межсерийной дисперсии — средняя ошибка выборки была бы равна:

Выборочный метод - определение и вычисление с примерами решения

Таким образом, величина ошибки увеличилась бы больше чем в два раза.

В иных случаях большая точность достигается большим числом наблюдений в пределах отобранных серий за счет сокращения числа последних.

Средняя ошибка разности выборочных средних

Выборочная средняя отличается от генеральной средней на t-кратное число средних ошибок Выборочный метод - определение и вычисление с примерами решения Если в результате выборок получены две выборочные средние Выборочный метод - определение и вычисление с примерами решения для каждой из которых найдена средняя ошибка выборки Выборочный метод - определение и вычисление с примерами решения то среднюю ошибку разности этих двух выборочных средних Выборочный метод - определение и вычисление с примерами решения можно определить по средним ошибкам этих выборочных средних
Выборочный метод - определение и вычисление с примерами решения
где R—коэффициент корреляции между вариантами двух выборочных совокупностей (см. раздел VII).

В случае некоррелированности признаков, т. е. равенства коэффициента корреляции нулю, формула примет следующий вид:

Выборочный метод - определение и вычисление с примерами решения

Пример №18

Из генеральной совокупности произведены две выборки. При этом средние ошибки выборочных средних оказались равными 0,48 и 0,43. Признаки некоррелированы. Найти среднюю ошибку разности двух выборочных средних. Она равна
Выборочный метод - определение и вычисление с примерами решения

Распределение выборочных средних

Имеется случайная величина х, распределенная в генеральной совокупности по закону нормального распределения со средней Выборочный метод - определение и вычисление с примерами решения и дисперсией Выборочный метод - определение и вычисление с примерами решения Если произвести достаточно много выборок из указанной совокупности собственно случайным методом и для каждой из выборок вычислить выборочную среднюю, то их распределение будет также подчинено закону нормального распределения со средней Выборочный метод - определение и вычисление с примерами решения и дисперсией Выборочный метод - определение и вычисление с примерами решения

Такое распределение выборочных средних не будет зависеть от объема выборок.

Доверительная вероятность

Для суждения о том, являются ли достоверными характеристики, полученные с помощью выборочных наблюдений, применяют доверительную вероятность, т. е. такую вероятность, которую исследователь признает достаточной при установлении границ случайного колебания изучаемого явления.

В качестве доверительной вероятности принимают Р(t), равное 0,95 или 0,99. Последняя наиболее достаточна.

Достоверность существенного различия

Сравнивая несколько статистических характеристик, например средние или коэффициенты вариации, исчисленные по результатам случайных выборок из генеральной совокупности, хотят установить, существенна ли разность между ними.

Существенным различием называют различие между средними или коэффициентами вариации, превосходящее по величине то, которое можно было бы объяснить случайными колебаниями.

Для признания достоверности существенного различия, приведшего к резкому качественному сдвигу величины изучаемого признака, сравнивают разность между характеристиками с доверительной границей, выражающей пределы случайной вариации. Если эта разность больше доверительной границы, то различие называют существенным, и оно выражает систематическое различие сравниваемых характеристик.

Нулевая гипотеза

При проверке статистической гипотезы об отсутствии существенных различий между несколькими выборочными совокупностями используют так называемую нулевую гипотезу, состоящую в признании того, что они взяты наудачу из одной генеральной совокупности.

Проверка нулевой гипотезы производится с помощью различных критериев согласия, позволяющих с помощью доверительных вероятностей сделать вывод об ее опровержении или неопровержении. При этом следует иметь в виду, что неопро-вержение нулевой гипотезы не означает ее подтверждения, а свидетельствует лишь о необходимости проведения дальнейшей проверки, в частности путем увеличения числа наблюдений. При проверке нулевой гипотезы наибольшее значение придается практической неосуществимости маловероятных событий. Так, если вероятность критерия согласия, выражающего вероятность случайного расхождения, очень мала (<0,05), то это свидетельствует о существенном различии, и нулевая гипотеза опровергается; если же она достаточна велика (>0,05), то вопрос о существенности различия остается без ответа.

В качестве критерия согласия, т. е. оценки существенности расхождения или различия двух выборочных средних, в случае,.если число отобранных единиц в каждой выборке больше 25, принимается неравенство:

Выборочный метод - определение и вычисление с примерами решения

При этом нулевая гипотеза состоит в отрицании существенности различия средних.

Пример №19

Произведем проверку нулевой гипотезы по следующим данным.

Выделено 5 участков лесонасаждений и с каждого участка взяты пробные площадки. В среднем на 1 га по пяти участкам получилось следующее распределение деревьев по толщине:Выборочный метод - определение и вычисление с примерами решения

Определить существенность расхождения средних диаметров деревьев по участкам:

а) Находим средние диаметры деревьев по участкам:
Выборочный метод - определение и вычисление с примерами решения

б)    Вычисляем средние квадратические отклонения по участкам:

Выборочный метод - определение и вычисление с примерами решения
в)    Вычисляем средние ошибки выборочных средних:

Выборочный метод - определение и вычисление с примерами решения

г)    Находим, например, следующие разности выборочных средних по участкам:

Выборочный метод - определение и вычисление с примерами решения

д)    Находим средние ошибки разности соответствующих пар выборочных средних:            

Выборочный метод - определение и вычисление с примерами решения

е) Находим критерий оценки существенности расхождения соответствующих выборочных средних:

Выборочный метод - определение и вычисление с примерами решения

Вывод. Из критериев оценки существенности заключаем, что выделения II, III, IV и V участков произведены правильно, так как критерии оценки существенности больше трех. И следовательно, мы имеем разные насаждения.

При сравнении I и II участков вопрос остается открытым.

Смещенные и несмещенные оценки

Если из генеральной совокупности производится выборка и по ее результатам вычисляются характеристики:

1) выборочная средняя Выборочный метод - определение и вычисление с примерами решения
2) выборочная дисперсия Выборочный метод - определение и вычисление с примерами решения то при большом
числе отобранных единиц (n) эти характеристики будут приближаться к соответствующим математическим ожиданиям: Е(х)
и Выборочный метод - определение и вычисление с примерами решения

При малом,числе отобранных единиц эти две характеристики могут значительно отличаться от соответствующих математических ожиданий. Поэтому, принимая эти выборочные характеристики в качестве оценок генеральных характеристик, мы допускаем определенную ошибку. Эта ошибка может быть несистематической, когда при неограниченном повторении выборок средняя из выборочных характеристик совпадет с генеральной; при этом систематической ошибки, т. е. регулярного завышения или занижения, не будет. В случае, если среднее значение принятых в качестве оценок выборочных характеристик совпадает с генеральной характеристикой, эти оценки называются несмещенными.

Можно доказать, что Выборочный метод - определение и вычисление с примерами решения поэтому величина Выборочный метод - определение и вычисление с примерами решения является несмещенной оценкой генеральной средней. Что же касается выборочной дисперсии, то ее математическое ожидание не равно генеральной дисперсии. Выборочный метод - определение и вычисление с примерами решения и поэтому Выборочный метод - определение и вычисление с примерами решения является смещенной оценкой. Для устранения систематической ошибки и получения несмещенной оценки нужно Выборочный метод - определение и вычисление с примерами решения умножить на Выборочный метод - определение и вычисление с примерами решения
Тогда дисперсию при малом числе наблюдений следует вычислять по формуле:

Выборочный метод - определение и вычисление с примерами решения

Малая выборка

При необходимости оценки генеральной совокупности по результатам малого числа наблюдений, т. е. при n меньше 20, формулы для обычной (большой) выборки, основанные на нормальном распределении вероятностей, дают значительные неточности.

Оценка результатов малой выборки производится путем «исправления» выборочного среднего квадратического отклонения и использования закона распределения вероятностей Стюдента.

Выборочное среднее квадратическое отклонение малой выборки исчисляется по формуле:

Выборочный метод - определение и вычисление с примерами решения

где n—1 представляет собой «Число степеней свободы», т. е. количество вариантов, могущих принимать произвольные значения, не меняющие величины средней.

Таким образом, выборочное среднее квадратическое отклонение малой выборки отличается от выборочного среднего квадратического отклонения (Выборочный метод - определение и вычисление с примерами решения) тем, что сумму квадратов отклонений от выборочной средней делят не на n, а на n—1. Зная выборочное среднее квадратическое отклонение Выборочный метод - определение и вычисление с примерами решения можно путем его «исправления» вычислить выборочное среднее квадратическое отклонение малой выборки Выборочный метод - определение и вычисление с примерами решения по формуле:

Выборочный метод - определение и вычисление с примерами решения

Пример №20

Произведена выборка 16 единиц. Выборочное среднее квадратическое отклонение (Выборочный метод - определение и вычисление с примерами решения) оказалось равным 100.

Вычислить выборочное среднее квадратическое отклонение малой выборки Выборочный метод - определение и вычисление с примерами решения      

Выборочный метод - определение и вычисление с примерами решения
 

Средняя ошибка малой выборки исчисляется по формуле:
Выборочный метод - определение и вычисление с примерами решения

Пример №21

На основе данных примера 12 можно вычислить среднюю ошибку малой выборки:
Выборочный метод - определение и вычисление с примерами решения

Среднюю ошибку малой выборки можно получить и путем использования «неисправленного» выборочного среднего квадратического отклонения
Выборочный метод - определение и вычисление с примерами решения
 

Среднюю ошибку разности двух выборочных средних исчисляют по формуле:
Выборочный метод - определение и вычисление с примерами решения
 

Нормированное отклонение или стандартизованная разность малой выборки (t) получается аналогично тому, как это получалось в обычной выборке:
Выборочный метод - определение и вычисление с примерами решения
 

Предельная ошибка малой выборки:
Выборочный метод - определение и вычисление с примерами решения

Опираясь на предположение о нормальном распределении признака в генеральной совокупности, Стюдент в 1908 г. нашел закон распределения t, который называется распределением Стюдента:
Выборочный метод - определение и вычисление с примерами решения

где P(t) =S(t) — вероятности того, что стандартизованная разность между выборочной и генеральной средней имеет величину t;
Выборочный метод - определение и вычисление с примерами решения – гаммы-функции, которые можно рассматривать как обобщение факториала натурального числа.

Для любого положительного числа n гамма-функция определяется следующим равенством:
Выборочный метод - определение и вычисление с примерами решения

Частные случаи:

Выборочный метод - определение и вычисление с примерами решения
Свойства гаммы-функции:

1)Выборочный метод - определение и вычисление с примерами решения и 2)Выборочный метод - определение и вычисление с примерами решения

Первый частный случай гаммы-функции и первое указанное ее свойство дают:

Выборочный метод - определение и вычисление с примерами решения

Свойство гаммы-функции позволяет находить Г(n) при n, кратном Выборочный метод - определение и вычисление с примерами решения Например:

Выборочный метод - определение и вычисление с примерами решения

Особенностью распределения Стюдента является то, что вероятность того или иного значения t зависит только от двух величин: объема выборки (n) и величины t. При возрастании объема выборки распределение Стюдента приближается к нормальному:

Выборочный метод - определение и вычисление с примерами решения

Если сделать определенные допущения о величине Генеральной средней, то можно вычислить фактическое нормированное отношение Выборочный метод - определение и вычисление с примерами решения при помощи интеграла Стюдента:
Выборочный метод - определение и вычисление с примерами решения

Тогда
Выборочный метод - определение и вычисление с примерами решения
где 

Выборочный метод - определение и вычисление с примерами решения
Выборочный метод - определение и вычисление с примерами решения—вероятность того, что стандартизованная разность (t) между действительной генеральной средней и выборочной средней будет меньше стандартизованной разности, вычисленной по результатам малой выборки Выборочный метод - определение и вычисление с примерами решения

Выборочный метод - определение и вычисление с примерами решения—определяется из приложения IV. При этом значение n определяется вычитанием единицы из числа наблюдений.

Интеграл Стюдента используют для решения ряда обычных задач малой выборки как для случаев, когда генеральная совокупность обладает нормальным распределением, так и для случаев, когда распределение признака в генеральной совокупности не совсем совпадает с нормальным.

Функция Выборочный метод - определение и вычисление с примерами решения используется для определения также вероятностей того, что: 1) Выборочный метод - определение и вычисление с примерами решения 2) Выборочный метод - определение и вычисление с примерами решения и 3) Выборочный метод - определение и вычисление с примерами решения

Так, вероятность того, что Выборочный метод - определение и вычисление с примерами решения будет:

Выборочный метод - определение и вычисление с примерами решения

где Выборочный метод - определение и вычисление с примерами решения — вероятность значений t, больших, чем Выборочный метод - определение и вычисление с примерами решения И далее:

Выборочный метод - определение и вычисление с примерами решения

где Выборочный метод - определение и вычисление с примерами решения— вероятность значений t, абсолютная величина которых больше, чем Выборочный метод - определение и вычисление с примерами решения

Выборочный метод - определение и вычисление с примерами решения

где Выборочный метод - определение и вычисление с примерами решения— вероятность значений t, абсолютная величина которых меньше, чем Выборочный метод - определение и вычисление с примерами решения

Пример №22

Первая типовая задача малой выборки. Оценка выборочной средней.

Произведена малая выборка урожая пшеницы. Срок уборки урожая своевременный. На выборку собственно случайным повторным методом взято 8 участков. Результаты выборки по отдельным участкам следующие:
Выборочный метод - определение и вычисление с примерами решения

Определить вероятность того, что разность между выборочным и генеральным средним урожаем не больше 0,5 ц с 1 га.

Дано:

Выборочный метод - определение и вычисление с примерами решения
Находим Выборочный метод - определение и вычисление с примерами решения по формуле (см. раздел I, стр. 58): Выборочный метод - определение и вычисление с примерами решения

Определяем:

Выборочный метод - определение и вычисление с примерами решения

«Исправляем» Выборочный метод - определение и вычисление с примерами решения и получаем:

Выборочный метод - определение и вычисление с примерами решения
Вычисляем среднюю ошибку малой выборки Выборочный метод - определение и вычисление с примерами решения
Выборочный метод - определение и вычисление с примерами решения
Определяем величину нормированного отклонения по выборочным данным и предполагаемым границам генеральной средней Выборочный метод - определение и вычисление с примерами решения
Выборочный метод - определение и вычисление с примерами решения

Находим:Выборочный метод - определение и вычисление с примерами решения

Так как число наблюдений равно 8, то берем n=7; тогда по приложению IV находим: Выборочный метод - определение и вычисление с примерами решения

Следовательно:

Р[ |/| >0,412] = 2 (1—0,649) = 2 • 0,351 = 0,702« 0,7.

Таким образом видно, что вероятность нормированных отклонений, по абсолютной величине превышающих 0,412, или, иными словами, вероятность отклонений генеральной средней от выборочной средней на абсолютную величину, превышающую 0,5 ц с 1 га, не мала (0,7). Поэтому разность между генеральной и выборочной средними легко могла превысить 0,5 ц с 1 га.

Можно было воспользоваться другой формулой и определить вероятность нормированных отклонений, абсолютная величина которых меньше 0,412, и прийти к тому же заключению:

Выборочный метод - определение и вычисление с примерами решения

Вероятность того, что генеральная средняя находится в определенных границах, определяется по формуле:    

Выборочный метод - определение и вычисление с примерами решения

Пример №23

Вторая типовая задача малой выборки: определение границ интервала, в которых находится генеральная средняя.

Из данных предыдущего примера 14 найти с вероятностью 0,954 границы интервала, в которых содержится генеральная средняя урожая.

Дано:

Выборочный метод - определение и вычисление с примерами решения

Находим Выборочный метод - определение и вычисление с примерами решения по соответствующей формуле:

Выборочный метод - определение и вычисление с примерами решения

По приложению IV находим Выборочный метод - определение и вычисление с примерами решения равное 2,5.

Следовательно, границы генеральной средней Выборочный метод - определение и вычисление с примерами решенияВыборочный метод - определение и вычисление с примерами решения

С вероятностью 0,954 можно утверждать, что Выборочный метод - определение и вычисление с примерами решения

Теория малой выборки дает возможность оценить существенность различия между двумя .выборочными средними. Вероятность значений разностей между двумя выборочными средними, по абсолютной величине не меньших, чем разность, полученная в результате опыта, т. е. фактическая, определяется по формуле:

Выборочный метод - определение и вычисление с примерами решения

где Выборочный метод - определение и вычисление с примерами решения— выборочные средние;

Выборочный метод - определение и вычисление с примерами решения — фактическая разность между двумя выборочными средними;

а величина Выборочный метод - определение и вычисление с примерами решения определяется по формуле:
Выборочный метод - определение и вычисление с примерами решения
Примечания: 1. При определении вероятности, равной Выборочный метод - определение и вычисление с примерами решения по приложению IV в качестве n следует брать Выборочный метод - определение и вычисление с примерами решения

2.    Если вероятность (Р) получается большой, то это свидетельствует о том, что следовало ожидать разностей, превышающих ту, которую мы получили фактически. И следовательно, фактическая разность, будучи меньше тех, которых следовало ожидать с большой вероятностью, не дает основания считать, что различия между средними существенны.

При полученной малой вероятности (Р) различие между средними не случайно, а существенно.

3.    При вычислении Выборочный метод - определение и вычисление с примерами решения можно использовать равенство Выборочный метод - определение и вычисление с примерами решения
Выборочный метод - определение и вычисление с примерами решения

Пример №24

Третья типовая задача малой выборки. Оценка разности двух выборочных средних. Произведена малая выборка девяти участков аналогично тому, как это сделано в примере 14. Урожай убрали с большим опозданием.

Результат сбора урожая по участкам представлен в табл. 11 (в колонках 1 и 2).

Оценить расхождение между средним урожаем, полученным при своевременной уборке урожая (пример 14) и уборке его с большим опозданием.

Дано:
Выборочный метод - определение и вычисление с примерами решения
Вычисляем:
Выборочный метод - определение и вычисление с примерами решения

Выборочный метод - определение и вычисление с примерами решения

По соответствующей формуле получаем:

Выборочный метод - определение и вычисление с примерами решения
Из приложения IV для n = 8+9—2=15 находим:

S (4,3) =0,999.

Тогда:

Выборочный метод - определение и вычисление с примерами решения

Так как вероятность (Р) очень мала, то следует считать, что средние урожаи существенно отличаются друг от друга, т. е. что опоздание в сроках уборки существенно снижает урожай.

При оценке существенности расхождения между двумя выборочными средними часто применяют правило трех сигм:

Выборочный метод - определение и вычисление с примерами решения

где Выборочный метод - определение и вычисление с примерами решения—среднее квадратическое отклонение, вычисляемое по формуле:            

Выборочный метод - определение и вычисление с примерами решения
В первом случае, т. е. если Выборочный метод - определение и вычисление с примерами решения больше трех сигм, расхождение между средними двух выборок полагают не случайным.

Пример №25

По данным примеров 14 и 16 оценить расхождение между двумя выборочными средними по указанным формулам:
Выборочный метод - определение и вычисление с примерами решения

Находим:

Выборочный метод - определение и вычисление с примерами решения

Получаем:

Выборочный метод - определение и вычисление с примерами решения

и, следовательно,Выборочный метод - определение и вычисление с примерами решения

Поэтому расхождение между двумя выборочными средними следует считать существенным, что согласуется с выводом примера 16.

Оценка существенности различия двух выборочных средних может быть произведена также путем использования критерия, основанного на подсчете инверсий. В данном случае нулевой гипотезой является предположение, что две выборочные средние отличаются друг от друга несущественно. Подсчет инверсий производится путем расположения ранжированных результатов двух полученных выборок последовательно. Инверсия образуется в том случае, если какому-нибудь варианту из первой выборки (х) предшествует вариант из второй выборки (у). Например, соединенные в одну последовательность ранжированные варианты двух выборок расположились следующим образом:
Выборочный метод - определение и вычисление с примерами решения
Тогда подсчет инверсий для Выборочный метод - определение и вычисление с примерами решения дает 1, для Выборочный метод - определение и вычисление с примерами решения и Выборочный метод - определение и вычисление с примерами решения— тоже единицу, для Выборочный метод - определение и вычисление с примерами решения инверсий —4, для Выборочный метод - определение и вычисление с примерами решения — 5 и т. д.

Выборочный метод - определение и вычисление с примерами решения

После подсчета числа инверсий находят математическое ожидание инверсии по формуле:

Выборочный метод - определение и вычисление с примерами решения
где Выборочный метод - определение и вычисление с примерами решения и Выборочный метод - определение и вычисление с примерами решения — объемы выборок.
Далее находят дисперсию: Выборочный метод - определение и вычисление с примерами решения

и Выборочный метод - определение и вычисление с примерами решения

Путем вычитания и прибавления к E(z) произведения Выборочный метод - определение и вычисление с примерами решения на Выборочный метод - определение и вычисление с примерами решения находят ожидаемые границы г. Если z находится в найденных границах, то нулевая гипотеза не опровергается. При выходе z за найденные границы нулевая гипотеза опровергается и делается вывод о существенности различий средних.

Данный метод обоснован в случаях, когда объем выборок больше 10, но может быть использован и при n, близком к 10.

Пример №26

Используя данные примеров 14 и 16, найдем существенность различия двух средних урожаев, полученных в результате сбора урожая своевременно и с большим опозданием.

Располагаем результаты обеих выборок в ранжированном порядке.

Выборочный метод - определение и вычисление с примерами решения

Имеем: Выборочный метод - определение и вычисление с примерами решенияПодсчитываем: Выборочный метод - определение и вычисление с примерами решения
Выборочный метод - определение и вычисление с примерами решения
Выборочный метод - определение и вычисление с примерами решения

Выборочный метод - определение и вычисление с примерами решения

Подсчитываем фактическое число инверсий: z=1 +1 + 1 + + 2 = 5.

В данном случае нулевая гипотеза опровергается и результат свидетельствует о существенном расхождении двух средних урожаев, что согласуется с выводами, полученными ранее другими способами.

При проверке гипотезы случайности выборки можно использовать метод последовательных разностей.

Пусть выборка n единиц из генеральной совокупности со средней Выборочный метод - определение и вычисление с примерами решения и дисперсией Выборочный метод - определение и вычисление с примерами решения расположились по значению признака в следующем порядке: Выборочный метод - определение и вычисление с примерами решения Находим сначала разности между значениями признака в последовательности их отбора.

Выборочный метод - определение и вычисление с примерами решения и т. д. до Выборочный метод - определение и вычисление с примерами решения Определяем среднюю из квадратов разностей по формуле:

Выборочный метод - определение и вычисление с примерами решения
Находим:

Выборочный метод - определение и вычисление с примерами решения
Вычисляем выборочную дисперсию:

Выборочный метод - определение и вычисление с примерами решения

и для получения критерия Выборочный метод - определение и вычисление с примерами решения делим Выборочный метод - определение и вычисление с примерами решения на Выборочный метод - определение и вычисление с примерами решения

Выборочный метод - определение и вычисление с примерами решения

Сравнение найденного критерия с теоретическим (Выборочный метод - определение и вычисление с примерами решения) в зависимости от объема выборки производится так.

Если n<20, то используют следующую таблицу (см. табл. 13):

Выборочный метод - определение и вычисление с примерами решения

Из таблицы находят Выборочный метод - определение и вычисление с примерами решения При этом если найденная Выборочный метод - определение и вычисление с примерами решения то это указывает на неверность рассматриваемой гипотезы. Если Выборочный метод - определение и вычисление с примерами решения то гипотеза верна.

При большом числе отобранных единиц (n>20) Выборочный метод - определение и вычисление с примерами решения определяется по формуле:
где находится по табличному значению Выборочный метод - определение и вычисление с примерами решения

где Выборочный метод - определение и вычисление с примерами решения находится по табличному значениюВыборочный метод - определение и вычисление с примерами решения 

При q = 5% имеем Выборочный метод - определение и вычисление с примерами решения Из приложения III находим, что Выборочный метод - определение и вычисление с примерами решения = 1,65, значит

Выборочный метод - определение и вычисление с примерами решения

Пример №27

Используя данные примера 16 о результатах сбора урожая по участкам с большим опозданием, оценим гипотезу случайности выборки.

1) Находим разности:
Выборочный метод - определение и вычисление с примерами решения
и вычисляем Выборочный метод - определение и вычисление с примерами решения а затем Выборочный метод - определение и вычисление с примерами решения

2) Определяем сначала среднюю:

Выборочный метод - определение и вычисление с примерами решенияа затем дисперсию:
Выборочный метод - определение и вычисление с примерами решения

3) Находим критерий:
Выборочный метод - определение и вычисление с примерами решения
4)    По табл. 13 определяем верхнюю допустимую границу Выборочный метод - определение и вычисление с примерами решения При n = 9 Выборочный метод - определение и вычисление с примерами решения = 0,512.

5)    Делаем вывод о том, что найденная Выборочный метод - определение и вычисление с примерами решения превосходит допустимую верхнюю границу Выборочный метод - определение и вычисление с примерами решения и поэтому наша гипотеза о случайности выборки верна.

Пример №28

Пусть отобрано 35 единиц. При q = 5% получаем:
Выборочный метод - определение и вычисление с примерами решения
Следовательно, если при выборке 35 единиц Выборочный метод - определение и вычисление с примерами решения будет меньше 0,725, то это укажет на неверность нашей гипотезы; если же больше, то гипотеза верна.    

Оценка существенности различия коэффициентов вариации устанавливается аналогично тому, как это делается при оценке существенности различия выборочных средних по критерию согласия. Если принять:

Выборочный метод - определение и вычисление с примерами решения
то при Выборочный метод - определение и вычисление с примерами решения>3 различие коэффициентов вариации полагают неслучайным.

Во всех случаях Выборочный метод - определение и вычисление с примерами решения<3 делают вывод, что при данном числе наблюдений нулевая гипотеза не подтверждается и тем самым существенность различия не доказана.

Пример №29

Используя данные примера 11 о выделении участков лесонасаждений, оценим существенность различия коэффициентов вариации по двум участкам — IV и V.

Имеем: Выборочный метод - определение и вычисление с примерами решения
Определяем коэффициенты вариации:

Выборочный метод - определение и вычисление с примерами решения

Находим

Выборочный метод - определение и вычисление с примерами решения

Так как Выборочный метод - определение и вычисление с примерами решения > 3, делаем вывод, что рассматриваемые коэффициенты вариации отличаются существенно, т. е. неслучайно.

  • Статистическая проверка гипотез
  • Статистические оценки
  • Теория статистической проверки гипотез
  • Линейный регрессионный анализ
  • Регрессионный анализ
  • Корреляционный анализ
  • Статистические решающие функции
  • Случайные процессы

Аудит затрат на производство продукции: выборочная проверка

“Аудиторские ведомости”, 2010, N 9

Разъясняется порядок, в соответствии с которым осуществляется выборочная аудиторская проверка. Дана содержательная характеристика ее этапов. Приведены методы, используемые аудитором в процессе выборочной проверки.

В аудиторской практике чаще всего используется выборочная проверка, так как сплошная проверка связана с большими временными затратами и снижает качество проверки в целом. Порядок использования выборки в ходе аудиторской проверки регламентирован Федеральным правилом (стандартом) аудиторской деятельности N 16 “Аудиторская выборка” (далее – Правило N 16).

Под аудиторской выборкой понимают прием, когда аудиторские процедуры применяются не ко всем элементам проверяемой статьи или группы однотипных операций. Выборка дает возможность получить и оценить аудиторские доказательства в отношении отобранных элементов, чтобы сформировать выводы о всей совокупности (экстраполировать результаты).

Выборочная проверка осуществляется по этапам – планирование, построение выборки, анализ результатов (см. схему).

Этапы выборочной проверки

--------------------------------------------------------------------------¬
¦ Планирование выборочной проверки ¦
+------------------------------------T------------------------------------+
¦ Определение совокупности ¦ Стратификация ¦
L------------------------------------+-------------------------------------
¦/
--------------------------------------------------------------------------¬
¦ Построение выборки ¦
+------------------------------------T------------------------------------+
¦ Определение способа отбора ¦ Определение объема выборки ¦
L------------------------------------+-------------------------------------
¦/
--------------------------------------------------------------------------¬
¦ Анализ результатов выборки ¦
+-----------------------T-------------------------T-----------------------+
¦ Анализ ошибок ¦ Экстраполяция ошибок и ¦ Формулирование выводов¦
¦ ¦ оценка рисков ¦ ¦
¦ ¦ выборочного исследования¦ ¦
L-----------------------+-------------------------+------------------------

Планирование выборочной проверки

На этапе планирования выборочной проверки аудитор должен определить:

  • совокупность данных, подлежащих проверке, – первичные документы по соответствующему разделу учета, регистры бухгалтерского учета;
  • страты, формирующие совокупность проверяемых данных.

Эффективность аудиторской проверки может быть повышена за счет стратификации генеральной совокупности на подмножества, имеющие идентифицирующие характеристики. Цель стратификации – снижение вариативности элементов в пределах каждой страты, что позволяет уменьшить объем выборки без увеличения риска. Например, по нашему мнению, при аудите затрат на производство продукции (работ, услуг) стратификацию целесообразно проводить в разрезе следующих контрольных точек:

  • списание материальных ценностей;
  • начисление заработной платы и отчислений на социальные нужды;
  • начисление амортизации по основным средствам и нематериальным активам;
  • прочие расходы, связанные с производством продукции (выполнением работ, оказанием услуг);
  • распределение косвенных расходов;
  • определение остатков незавершенного производства;
  • отражение в учете поступления, движения и реализации готовой продукции.

Кроме того, на данном этапе аудитор устанавливает целесообразность применения сплошной или выборочной проверки.

Применение сплошной проверки может быть целесообразным в случаях, когда:

  • генеральная совокупность состоит из небольшого количества элементов высокой стоимости;
  • неотъемлемый риск и риск средств контроля достаточно велики, а другие средства не позволяют получить надлежащие аудиторские доказательства;
  • повторяющийся характер расчетов или иных процессов, осуществляемых с помощью компьютерной системы бухгалтерского учета, делает сплошную проверку эффективной с точки зрения соотношения затрат и результатов.

Во всех остальных случаях целесообразно использовать выборочную проверку.

Принятие решения о целесообразности применения сплошной проверки целесообразно провести, используя оценочный лист (табл. 1). Знак “+” в колонках, выделенных цветом, означает, что, по мнению аудитора, аудиторские процедуры в отношении данной контрольной точки необходимо осуществлять сплошным методом.

Таблица 1

Оценочный лист для установления целесообразности применения сплошной или выборочной проверки

  Контрольные 
точки
  Объем генеральной 
совокупности
             Область риска существенного искажения             
      Характер операций      
большой
объем
  небольшой 
объем
существенные
суммы
безрисковая
минимального
риска
повышенного
риска
критического
риска
недопустимого
риска
повторяющаяся
неповторяющаяся
Списание      
материальных
ценностей
   +   
     +     
        -      
Начисление    
заработной
платы и
отчислений на
социальные
нужды
   +   
     +     
        -      
Начисление    
амортизации по
основным
средствам и
нематериальным
активам
   +   
     +     
        -      
Прочие        
расходы,
связанные с
производством
продукции
(выполнением
работ,
оказанием
услуг)
   +   
     +     
        -      
Распределение 
косвенных
расходов
     +      
     +      
        -      
Определение   
остатков
незавершенного
производства
     +      
     +      
        -      
Отражение в   
учете
поступления,
движения и
реализации
готовой
продукции
   +   
     +     
        -      

По результатам оценочного листа можно сделать вывод, что сплошную проверку целесообразно провести в отношении контрольных точек “Распределение косвенных расходов” и “Определение остатков незавершенного производства”.

При выполнении аудиторских процедур проверки по существу аудиторская выборка может использоваться при проверке верности одной или нескольких предпосылок подготовки финансовой (бухгалтерской) отчетности по конкретному показателю. Оценка возможности применения результатов аудиторской выборки при выполнении аудиторских процедур на участке аудита затрат на производство продукции (работ, услуг) может быть также выполнена на стадии подготовки финансовой (бухгалтерской) отчетности (табл. 2).

Таблица 2

Оценка возможности применения результатов аудиторской выборки при выполнении аудиторских процедур по существу на стадии подготовки финансовой (бухгалтерской) отчетности

    Статья    
отчетности,
содержащая
информацию о
затратах
Существование
  Права и  
обязанности
Возникновение
Полнота
Стоимостная
оценка
  Точное 
измерение
Представление
и раскрытие
Затраты в     
незавершенном
производстве
(форма N 1)
   +   
    +    
Готовая       
продукция
(форма N 1)
      +      
   +   
    +    
Себестоимость 
проданных
товаров,
продукции,
работ, услуг
(форма N 2)
     +     
      +      
   +   
     +     
    +    
Коммерческие  
расходы
(форма N 2)
      +      
   +   
Управленческие
расходы
(форма N 2)
      +      
   +   
Расходы       
будущих
периодов
(форма N 1)
     +       
     +     
      +      
   +   
     +     
    +    
Итого по      
элементам
затрат (форма
N 5)
      +      
   +   
     +     
    +    
       +     

Таким образом, на данном этапе формируется проверяемая совокупность, определяются контрольные точки, а также оценивается целесообразность проведения выборочной проверки.

Построение выборки

На данном этапе аудитору следует определить способы построения выборки и объем выборки.

В теории и практике аудита подходы к построению выборки принято делить на статистические и нестатистические.

Статистический подход к построению выборки предполагает использование методов, основанных на теории вероятности, что позволяет получить репрезентативную выборку. Статистические методы предполагают построение выборки с помощью:

  • случайного отбора (генератора случайных чисел, таблицы случайных чисел);
  • систематического отбора (интервального метода).

Нестатистические методы, такие как бессистемный отбор (отбор элементов без систематизации и использования случайных чисел), отбор элементов блоками (выбор смежных элементов генеральной совокупности), отбор специфических элементов, не позволяют сформировать репрезентативную выборку.

К специфическим элементам относятся:

  • ключевые элементы с высокой стоимостью или являющиеся необычными, рисковыми;
  • элементы, превышающие определенную величину, устанавливаемую аудитором исходя из профессионального суждения;
  • элементы для получения информации и проверки процедур.

По нашему мнению, построение аудиторской выборки на участке аудита затрат на производство продукции (работ, услуг) при проведении тестов надежности систем бухгалтерского учета и внутреннего контроля целесообразно осуществлять на базе нестатистических методов, в том числе путем отбора специфических элементов. В целом при проведении проверки по существу целесообразно использовать методы, представленные в табл. 3.

Таблица 3

Методы отбора элементов при построении аудиторской выборки на участке аудита затрат на производство продукции (работ, услуг)

    Страты    
(контрольные
точки)
  Статистические методы  
       Нестатистические методы      
Случайный
отбор
Систематический
отбор
Бессистемный
отбор
  Отбор  
элементов
блоками
    Отбор    
специфических
элементов
Списание      
материальных
ценностей
    +    
       +       
Начисление    
заработной
платы и
отчислений на
социальные
нужды
    +    
       +       
Начисление    
амортизации по
основным
средствам и
нематериальным
активам
      +      
Прочие        
расходы,
связанные с
производством
продукции
(выполнением
работ,
оказанием
услуг)
      +      
Отражение в   
учете
поступления,
движения и
реализации
готовой
продукции
    +    
       +       

В связи с тем что в отношении контрольных точек “Распределение косвенных расходов” и “Определение остатков незавершенного производства”, по нашему мнению, целесообразно проведение сплошной проверки, данные контрольные точки в табл. 3 не включены.

Определение объема выборки зависит от выбранного способа построения выборки. При использовании нестатистических методов – для контрольных точек “Начисление амортизации по основным средствам и нематериальным активам” и “Прочие расходы, связанные с производством продукции (выполнением работ, оказанием услуг)” – объем выборки определяется аудитором на основе профессионального суждения. При этом следует учитывать ряд зависимостей, содержащихся в Правиле N 16.

  1. Чем выше аудитор оценивает неотъемлемый риск, тем больше должен быть объем отобранной совокупности.
  2. Чем выше оценка аудитором риска средств внутреннего контроля, тем больше должен быть объем отобранной совокупности.
  3. Чем больше аудитор полагается на другие процедуры проверки по существу (детальные тесты хозяйственных операций и оборотов по счетам бухгалтерского учета либо аналитические процедуры) применительно к конкретному остатку по счету бухгалтерского учета или конкретной группе однотипных операций, тем меньшей уверенности аудитор будет требовать от выборочной проверки и, следовательно, тем меньше может быть объем отобранной совокупности.
  4. Чем больше аудитор уверен в том, что результаты проверки элементов отобранной совокупности достоверны с точки зрения фактического значения ошибки, допущенной в генеральной совокупности, тем больше должен быть объем отобранной совокупности.
  5. Чем ниже значение общей ошибки, которую готов принять аудитор, тем больше должен быть объем отобранной совокупности.
  6. Чем выше значение ошибки, которую аудитор предполагает выявить в генеральной совокупности, тем больше должен быть объем отобранной совокупности, чтобы дать разумную оценку действительному уровню ошибок в генеральной совокупности.
  7. Надлежащая стратификация генеральной совокупности позволяет уменьшить объем выборки.
  8. Число элементов генеральной совокупности фактически не влияет на объем выборки. При большой генеральной совокупности действительный объем ее оказывает лишь незначительное влияние на объем отобранной совокупности. При небольшой генеральной совокупности аудиторская выборка нередко является не столь эффективной, как альтернативные методы получения достаточных надлежащих аудиторских доказательств.

При аудите затрат на производство продукции (работ, услуг) представляется целесообразным выделение в рамках каждой страты субстрат по стоимостному признаку. Соответственно, по каждой субстрате определяется объем выборки согласно подходам. Под субстратой понимается элемент структуры, выделенный в рамках определенной страты, который объединен неким общим признаком. Считается возможным выделение субстрат по стоимостному признаку, используя показатели допустимой ошибки, которая определяется по каждой страте отдельно, и минимальной суммы, установленной аудитором на основе профессионального суждения. В данном случае, на наш взгляд, возможна следующая группировка элементов.

Субстрата 1. Документы в страте, стоимость которых превышает уровень допустимой ошибки:

Уровень допустимой ошибки <= Стоимость документа.

Субстрата 2. Документы в страте, стоимость которых превышает минимальный уровень, установленный аудитором на основе профессионального суждения, но менее уровня допустимой ошибки по страте:

Минимальный уровень <= Стоимость документа <= Уровень допустимой ошибки.

Субстрата 3. Документы в страте, стоимость которых менее минимального уровня, установленного аудитором на основе профессионального суждения:

Стоимость документа <= Минимальный уровень.

    Обозначим  через  К    номер  j-го документа, обладающего признаком i-й
ij
субстраты; через С - стоимость документа, обладающего признаком i-й
ij
субстраты. Тогда изложенная методика может быть представлена в табл. 4.

Таблица 4

Стратификация элементов аудиторского исследования при аудите затрат

------------T------------T----------T--------------T-------------T------------¬
¦ Страта ¦ Списание ¦Начисление¦ Начисление ¦ Прочие ¦ Отражение в¦
¦-----------¦материальных¦заработной¦ амортизации ¦ расходы, ¦ учете ¦
¦ Показатель¦ ценностей ¦ платы и ¦ по основным ¦ связанные с¦поступления,¦
¦ ¦ ¦отчислений¦ средствам и ¦производством¦ движения и ¦
¦ ¦ ¦ на ¦нематериальным¦ продукции ¦ реализации ¦
¦ ¦ ¦социальные¦ активам ¦ (выполнением¦ готовой ¦
¦ ¦ ¦ нужды ¦ ¦ работ, ¦ продукции ¦
¦ ¦ ¦ ¦ ¦ оказанием ¦ ¦
¦ ¦ ¦ ¦ ¦ услуг) ¦ ¦
+-----------+------------+----------+--------------+-------------+------------+
¦Уровень ¦ ДО ¦ ДО ¦ ДО ¦ ДО ¦ ДО ¦
¦допустимой ¦ 1 ¦ 2 ¦ 3 ¦ 4 ¦ 5 ¦
¦ошибки ¦ ¦ ¦ ¦ ¦ ¦
+-----------+------------+----------+--------------+-------------+------------+
¦Субстрата 1¦ К / С ¦ К / С ¦ К / С ¦ К / С ¦ К / С ¦
¦ ¦ 11 11 ¦ 12 12¦ 13 13 ¦ 14 14 ¦ 15 15 ¦
+-----------+------------+----------+--------------+-------------+------------+
¦Субстрата 2¦ К / С ¦ К / С ¦ К / С ¦ К / С ¦ К / С ¦
¦ ¦ 21 21 ¦ 22 22¦ 23 23 ¦ 24 24 ¦ 25 25 ¦
+-----------+------------+----------+--------------+-------------+------------+
¦Субстрата 3¦ К / С ¦ К / С ¦ К / С ¦ К / С ¦ К / С ¦
¦ ¦ 31 31 ¦ 32 32¦ 33 33 ¦ 34 34 ¦ 35 35 ¦
L-----------+------------+----------+--------------+-------------+-------------

После этого на основе методов, изложенных в американских стандартах по аудиту, определяется объем выборки по каждой субстрате и проводится отбор элементов, подлежащих проверке.

Анализ результатов выборки

Этот этап выборочной проверки включает:

  • анализ ошибок;
  • экстраполяцию и оценку рисков выборочного исследования;
  • формулирование выводов.

Проведя процедуры выборочной проверки и обнаружив ошибки, аудитор должен проанализировать их характер и причину, а также их возможное воздействие на цели конкретного теста и на другие области аудита.

В Правиле N 16 указаны следующие виды ошибок.

  1. Аномальная – ошибка, которая произошла вследствие единичного случая и не может произойти повторно (за исключением некоторых случаев), не является репрезентативной ошибкой с точки зрения проверяемой совокупности. Характерный пример – сбой в работе вычислительной техники.
  2. Характерные – ошибки, имеющие общие характеристики (например, вид или место совершения операции, участок производства, период). В таких обстоятельствах аудитор может принять решение выявить все элементы генеральной совокупности, которые обладают этой общей характеристикой, и провести аудиторские процедуры применительно к такой страте.

Способы экстраполяции результатов выборочной проверки на изучаемую совокупность представлены в табл. 5.

Таблица 5

Способы экстраполяции

    Репрезентативная выборка    
 Нерепрезентативная 
выборка
 Аномальные ошибки 
Для распространения ошибок,     
обнаруженных по элементам
репрезентативной выборки,
аудитору следует разделить сумму
ошибок, обнаруженных в этой
выборке, на суммарную стоимость
ее проверенных элементов и
умножить результат на суммарную
стоимость всех элементов
представительной совокупности
Ошибки учитываются в
фактически найденном
размере и
распространению не
подлежат
Исключаются при    
экстраполяции и
принимаются в
дополнение к оценке
полной величины
ошибок, не
являющихся
аномальными

При экстраполяции выявленных искажений следует учитывать риски, которые возникают в связи с применением выборочного исследования.

В Правиле N 16 отмечаются два типа рисков при выполнении тестов средств внутреннего контроля или аудиторских процедур проверки по существу.

При выполнении тестов средств внутреннего контроля может быть сделан вывод, что уровень системы внутреннего контроля ниже (риск первого типа) или выше (риск второго типа), чем реальный. При выполнении аудиторских процедур по существу может быть сделан вывод, что существенного искажения нет, тогда как оно есть в действительности (риск первого типа), или, наоборот, что существенное искажение есть, тогда как его нет в действительности (риск второго типа).

Таким образом, риски первого типа оказывают влияние на надежность аудита и с большой степенью вероятности могут привести к ненадлежащему аудиторскому мнению. Риски второго типа оказывают влияние на эффективность аудита, поскольку они обычно приводят к дополнительной работе, позволяющей установить, что первоначальные выводы были неверны.

Для оценки рисков выборочного исследования с помощью методов математической статистики определяют дисперсию выявленных искажений:

                 2        2
SUM d - n x D
2 i
сигма = ----------------,
n - 1
2
где сигма - дисперсия;

n – количество элементов выборки;

    d  - сумма выявленного отклонения i-го элемента;
i

D – среднее отклонение (определяется отношением суммарной величины отклонений к количеству элементов выборки).

После этого находят среднюю ошибку выборки:

              -----
/ 2
/сигма n
ми = / ------ x (1 - ---),
/ n N

где N – количество элементов генеральной совокупности.

Определив среднюю ошибку, можно утверждать, что с вероятностью P суммарная величина отклонений в генеральной совокупности (S) лежит в пределах:

N x (D – t x ми) < S < N x (D + t x ми),

где t – коэффициент доверия для двустороннего интервала (или для одностороннего интервала).

В случаях когда аудитора интересует только одна граница (верхняя или нижняя) возможных искажений, t берется аудитором из специальной таблицы в зависимости от выбранного им уровня вероятности P.

В заключение выборочного исследования аудитор формулирует выводы, т.е. подтверждает предварительную оценку проверяемой совокупности или рекомендует ее пересмотр. Как нам представляется, подтверждение предварительной оценки и ее пересмотр должны производиться как по изучаемой области аудита в целом, так и по отдельным стратам. Возможные при этом ситуации приведены в табл. 6.

Таблица 6

Оценка результатов выборочной проверки

               Подтверждение оценки              
    Пересмотр оценки   
  Неожиданно высокая ошибка  
  Величина ошибок  
меньше величины
допустимой ошибки,
но приближается к
ней
При тестировании средств     
внутреннего контроля:
неожиданно высокая доля
ошибок в отобранной
совокупности может привести к
увеличению оцениваемого
уровня риска средств
внутреннего контроля, если не
будут получены дополнительные
аудиторские доказательства,
обосновывающие первоначальную
оценку
Аудитор анализирует
убедительность
результатов
выборочной проверки
с точки зрения
других аудиторских
процедур
В этом случае аудитор  
должен:
обратиться к
руководству аудируемого
лица с просьбой
проанализировать
выявленные ошибки;
рекомендовать
руководству аудируемого
лица принять меры к
обнаружению в данной
области учета других
ошибок, а также
произвести необходимые
корректировки;
видоизменить
запланированные
аудиторские процедуры;
рассмотреть влияние
результатов проверки
отобранной совокупности
на выводы, содержащиеся
в аудиторском
заключении
При проверке по существу:    
неожиданно высокое значение
ошибки в отобранной
совокупности может дать
аудитору основания полагать,
что остаток по счету
бухгалтерского учета или
группа однотипных операций
являются существенно
искаженными при отсутствии
дополнительных аудиторских
доказательств того, что такие
существенные искажения не
имеют места
Требуются дополнительные     
аудиторские доказательства
Целесообразно      
получить
дополнительные
аудиторские
доказательства

При оценке достоверности финансовой (бухгалтерской) отчетности аудитору следует определить, является ли совокупность неисправленных искажений, выявленных в ходе аудита, существенной, т.е. необходимо сопоставить величину выявленных искажений с уровнем существенности, установленном на этапе планирования.

Если искажения существенны, то возможны два варианта:

  • снизить аудиторский риск, проведя дополнительные аудиторские процедуры;
  • потребовать от руководства аудируемого лица внести поправки в финансовую (бухгалтерскую) отчетность.

Если искажения приближаются к уровню существенности, то необходимо определить, существует ли вероятность того, что необнаруженные искажения, рассматриваемые вместе с совокупными обнаруженными, но неисправленными, могут превысить уровень существенности, определенный аудитором. По мере того как совокупные неисправленные ошибки будут приближаться к установленному уровню существенности, аудитор принимает один из указанных вариантов.

В случае когда руководство аудируемого лица отказывается вносить поправки в финансовую (бухгалтерскую) отчетность, а результаты дополнительных аудиторских процедур не позволяют аудитору сделать вывод, что совокупность неисправленных искажений не является существенной, ему следует рассмотреть вопрос о надлежащей модификации аудиторского заключения в соответствии с Федеральным правилом (стандартом) аудиторской деятельности N 6 “Аудиторское заключение по финансовой (бухгалтерской) отчетности”.

Литература

  1. Кочинев Ю.Ю. Выборочная проверка с помощью “монетарного” метода // Аудиторские ведомости. – 2009. – N 4.
  2. Левицкая Н.В. Риски при применении выборочного метода в аудите // Аудиторские ведомости. – 2009. – N 6.
  3. Левицкая Н.В. Оценка суммового (стоимостного) искажения на базе статистической выборки // Аудиторские ведомости. – 2009. – N 8.
  4. Макарова Ю.Ю. Аудиторская выборка: методы и их различия, применение на практике // Финансовые и бухгалтерские консультации. – 2009. – N 2.
  5. Руденко И.В. Применение внутрифирменного стандарта “Аудиторская выборка” // Аудиторские ведомости. – 2008. – N 12.

Т.В.Сергеева

Аудиторская фирма

“Сибирский аудит”

г. Абакан

Метод выборочной проверки  [c.259]

Метод выборочной проверки основан на принципах теории вероятностей, согласно которым можно получить довольно точные данные о целом по его относительно малой части.  [c.260]

Метод выборочной проверки 267  [c.267]

Метод выборочной проверки 269  [c.269]

Метод выборочной проверки 271  [c.271]

Выборочная проверка качества. Когда нет необходимости или возможности в проведении 100-процентного осмотра, проверка качества производится выборочно. При применении методов выборочной проверки предполагается, что может быть допущено некоторое количество брака. Когда ставится условие теоретической недопустимости брака, тогда обязательно следует проводить 100-процентный осмотр. Согласно принципу выборочной проверки состояние качества всей партии изделий, представленной на осмотр, можно точно определить путем проверки определенного числа изделий, произвольно взятых из этой партии. Объем выборки или количества изделий, извлекаемых из партии для проверки, определяется таким путем, чтобы он давал точное представление о состоянии качества всех изделий в партии. Чем жестче допуски или чем меньше допускаются отклонения от технических условий, тем больше требуемый объем выборки. Объем выборки зависит также от числа допустимых дефектов.  [c.287]

Сами методы проверки качества, применяемые при государственной приемке, различаются в зависимости от вида продукции. Если продукция единичная, т. е. производится в небольшом количестве, то проверяется каждый экземпляр. Для массовой продукции применяется метод выборочной проверки.  [c.172]

Метод выборочной проверки основан на законах теории вероятностей, согласно которым можно получить довольно точные данные о целом по его относительно малой части. В выборку включается только часть объектов проверяемой (генеральной) совокупности. Под ними понимаются элементы, составляющие сальдо счетов, или операции, составляющие обороты по счетам. В ходе дальнейшей проверки этих объектов собираются аудиторские доказательства и составляется мнение о всей совокупности.  [c.62]

Анализ возможностей применения статистических либо содержательных методов выборочной проверки  [c.159]

Выбор метода выборочной проверки 20  [c.120]

Целью данного стандарта является установление норм и правил построения аудиторской выборки, а также оценки результатов выборочной проверки. Настоящий стандарт в равной степени относится как к статистическому, так и к нестатистическому методам выборочной проверки, поскольку любой из указанных методов, при уместном применении, способен обеспечить достаточное аудиторское доказательство.  [c.120]

При использовании, и статистического, и нестатистического методов выборочной проверки аудитор должен определить и разработать метод выборки, выполнить аудиторские процедуры, а затем, произвести оценку результатов выборочной проверки на предмет обеспечения достаточного аудиторского доказательства.  [c.120]

Риск неэффективности выборочной проверки свидетельствует о вероятности ошибочного решения, которое может быть принято на основании анализа данных выборки. Он существует и при статистических, и при нестатистических методах выборочной проверки. Его нельзя избежать при выборочном контроле. Однако, при статистическом методе выборочной проверки его можно измерить, а при проверке достаточно большой выборки даже контролировать. При нестатистическом методе выборочной проверки его нельзя измерить, но учитывать необходимо. Аудитор может контролировать риск неэффективности выборочной проверки посредством соответствующего планирования аудиторских процедур и наблюдения за ними, а также наблюдения за персоналом, наличием политики и процедур качественного контроля за проведением аудита и наличием системы внутреннего контроля у клиента.  [c.122]

Эти задачи решаются в процессе оперативной работы складов, включающей ряд самостоятельных функций, к выполнению которых предъявляются определенные требования. При приемке материальных ценностей фактическое их количество и качество должны быть проверены и сопоставлены с данными сопроводительных документов.В зависимости от рода грузов количественная проверка проводится сплошным или выборочным методом. Качественную проверку осуществляет отдел технического контроля в соответствии с принятым общим порядком. Забракованные грузы временно остаются на хранении на складе.  [c.335]

Объективный перенос информации оперативного контроля на совокупность рабочих измерений показателей состава рабочих проб возможен, если они выполнены в одной серии с контрольными измерениями. Однако сплошной контроль характеристик погрешности для каждого из результатов доступен не всегда, поэтому для оценки реального качества всех выполняемых рабочих измерений и эффективного управления этим качеством принимают статистические методы выборочного контроля. Методы статистического контроля, основанные на выборочной проверке результатов контрольных измерений – части измерений их всех выполненных за контролируемый период, более эффективны и экономичны [15].  [c.42]

ПРИМЕРЫ ПРИМЕНЕНИЯ ВЫБОРОЧНОГО МЕТОДА И ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ  [c.218]

Компания использует различные методы принятия решений с учетом вероятности в таких областях деятельности, как разработка товара, маркетинг и контроль качества. Например, компания должна оценить успешность нового товара и на основании этого принять решения, связанные с текущими и перспективными производственными планами. Далее, тщательно отслеживается качество товаров. В частности, по товарам массового производства, например батончиком Биг-Байт , регулярно проводятся выборочные проверки. Доля выбраковки по этим выборкам указывает на вероятное количество брака во всей партии. Определение цены на товары и выставление гарантий качества при  [c.53]

Первые четыре метода широко известны, применялись и применяются в России в ревизорской работе. Естественно, что сплошная или выборочная проверка может быть и документальной, и фактической.  [c.163]

Финансовые отчеты, прошедшие аудит, отличаются от отчетов, не прошедших аудит, в одном весьма важном отношении — по степени подтверждения счетов активов, обязательств, продаж и затрат. Например, при проведении обычного аудита уровни запасов определяются физической выборочной проверкой, а дебиторские счета подтверждаются статистически достоверными выборочными методами.  [c.36]

Существует несколько типов проверки продукции, которые возможно применить при введении системы контроля качества. 100%-ный контроль продукции все же необходим в особых случаях, но наука о контроле качества создала методы выборочного контроля, которые сейчас широко используются. При массовом производстве выборочный контроль является обязательным, поскольку необходимо гарантировать стабильное качество и высокую продуктивность. Можно сказать, что выборочный контроль продукции является основным инструментом контроля качества — вся масса продукции считается дефектной или годной на основе проверки выборки из партии. Выборочный контроль очень гибкий  [c.6]

В них должна содержаться необходимая справочная информация о клиенте краткое описание выполняемой работы. Надо указать метод проведения проверки— сплошной или выборочный, или объем проверяемой документации замечания по результатам проверки перечень первичных и других документов, не представленных к проверке иные выявленные несоответствия действующему законодательству мнение аудитора о способах устранения выявленных недостатков другие рекомендации во улучшению хозяйственно-финансовой деятельности Клиентов.  [c.83]

Статистический контроль качества исходит из предпосылки о том, что при невозможности достижения идеального качества допустим определенный уровень дефектов, для проверки которого могут быть созданы методы выборочного контроля.  [c.249]

На третьем этапе компания-потребитель завершает работу по сокращению числа поставщиков, организует обучение их персонала правилам и методам контроля, но контроля уже не изготовленной продукции, а производственных процессов. С целью более жесткой привязки к себе поставщика компания-потребитель зачастую идет на прямое участие в его капитале. Создаются условия для отказа потребителя от полного входного контроля и перехода к выборочным проверкам каждой поступающей партии комплектующих изделий.  [c.216]

Выборочная проверка не всегда является менее точным средством определения качества”, чем 100-процентный осмотр. Однообразие и шаблонный порядок проведения 100-процентного осмотра вызывают инспекционную усталость у контролеров, что приводит к принятию изделий, имеющих дефекты. Выборочные методы часто применяются при проверке качества крупных партий относительно недорогих изделий.  [c.287]

После того.как ревизором определен метод проверки документов, а при выборочной проверке — периоды, за которые проверяются операции, производится рассмотрение, изучение и проверка отдельных документов. Этот процесс осуществляется различными способами.  [c.385]

Аудитором фиксируются метод проведения проверки (сплошной или выборочный), объем проверенной документации, замечания по результатам проверки, перечень не представленных к проверке первичных и других документов, нарушения действующего законодательства, а также мнение аудитора о способах устранения выявленных недостатков и другие рекомендации по улучшению хозяйственно-финансовой деятельности клиента.  [c.245]

В зависимости от периодичности и методов проведения, детализации и широты исследуемых показателей на предприятиях проводятся оперативный и целевой анализы, а также выборочная проверка конкретных норм.  [c.156]

Методами технического нормирования путем наблюдений изучают затраты рабочего времени, организационно-технические условия выполнения операции. Результаты наблюдений сопоставляются с нормативными. Выборочная проверка норм— процесс трудоемкий, поэтому для анализа следует выбирать нормы работ, занимающих наибольший удельный вес среди всех работ на данном участке. Результаты проверки оформляются в “Карте проверки качества норм времени”.  [c.158]

Формальные моменты равенства итогов, внутренняя согласованность отчетных данных, взаимосвязь с текущим учетом устанавливаются с помощью общего обзора отчета и его арифметической проверки. Однако полнота отчета, отражение в нем всех операций за отчетный период, соблюдение принципов оценки статей, правильность разграничения затрат и определения результатов могут быть выявлены на основе использования счетно-аналитических приемов и ревизий. Ознакомление с состоянием учета и отчетности, применяемыми методами первичной регистрации и сводки операций позволит определить качество аналитической базы. Значительные отклонения фактических данных от плана должны насторожить, так как они нередко являются следствием необоснованного планирования показателей, недостаточного учета возможностей предприятия. В процессе анализа необходимо убедиться в правильности проведения инвентаризаций и отражения их результатов в отчетности. При возникновении сомнения в реальности данных производятся выборочные проверки. Проверяется также правильность оценки основных фондов, сырья, материалов и других ценностей.  [c.40]

Выборочный контроль исключительно широко применяется при осуществлении аудиторских проверок. Это вызвано прежде всего стремлением аудиторов сэкономить время и уменьшить стоимость работ по сравнению с проведением сплошной проверки. Выборочные проверки применяются также в тех случаях, когда нет необходимости в абсолютно полной проверке ввиду очевидной незначительности возможных неточностей и ошибок. При этом применение метода выборочного контроля не должно снижать эффективности аудита в целом.  [c.62]

При малом объеме генеральной совокупности и малых расчетных значениях допустимой ошибки выборки объем выборки может сравняться с объемом генеральной совокупности и даже превысить его. В этом случае, как указано выше, проведение выборочной проверки статистическими методами становится нецелесообразным. Аудитору следует проводить сплошную проверку или с высокой степенью осторожности применять иные подходы к определению выборки и ее оценке (нестатистические).  [c.65]

Последующий контроль производится в порядке выборочной проверки правильности совершения, оформления и учета операций. Он осуществляется главным бухгалтером, его заместителями или по поручению главного бухгалтера руководителями групп (отделов) и специальными инспекторами по контролю путем систематич. проверок отдельных участков учетно-операционной работы. Наиболее эффективным является комплексный метод контроля, при к-ром проверяется вся работа исполнителя, бригады или группы. Наряду с таким контролем практикуются и тематические проверки работы всего учетно-операцион-ного аппарата по определенным показателям, напр, проверка правильности оформления выписок из лицевых счетов клиентов. Материалы проверок рассматриваются руководством учреждения банка, после чего принимаются меры к устранению выявленных недостатков. Последующий контроль осуществляется также путем ревизий и др. проверок учетно-операционной работы.  [c.244]

Коммуникация снизу-вверх традиционно играла чисто информационную роль – для принятия решений руководителям всех уровней необходимо знать о положении дел на местах. Большинство современных организаций имеют формализованную систему статистических и аналитических отчетов, справок и т.д. Однако различие в статусе между тем, кто предоставляет и получает информацию, зависимость первого от последнего создают объективную угрозу искажения информации. Подчиненные часто преувеличивают свои достижения и скрывают недостатки, опасаются предоставлять данные, которые по их мнению могут негативно сказаться на их карьере или вознаграждении. В результате предоставления искаженной информации страдает качество принимаемых руководителями решений и снижается эффективность управления организацией. Традиционными методами контроля качества предоставляемой снизу информации являются сбор данных из незвисимых источников и выборочные проверки. Оба этих метода основаны на понимании сотрудником, что заведомое искажение информации будет выявлено и он может понести наказание. Однако более -важным является создание атмосферы доверия между руководством и сотрудниками организации, которая может возникнуть при условии эффективной коммуникации сверху-вниз, обеспечивающей обратную связь и вовлечение рядовых сотрудников в управление организацией.  [c.297]

Приемочный контроль имеет целью выборочную проверку годности изделий. На рис. 7-2 дана схема осуществления приемочного контроля методом одинарных вьгборок.  [c.88]

Добавить комментарий