Как найти гипотезу математика

Для термина «Математическая гипотеза» см. также другие значения.

Действительная (красный) и мнимая части (синий) дзета-функции Римана на критической прямой {displaystyle mathrm {Re} (z)=1/2}. Первые нетривиальные нули находятся в точках {displaystyle mathrm {Im} (z)=pm 14{,}135;pm 21{,}022;pm 25{,}011}. Гипотеза Римана утверждает, что все нетривиальные нули дзета-функции находятся на критической линии. Этот факт позволяет сделать некоторые выводы о размещении простых чисел на действительной оси.

Гипотеза в математике — утверждение, которое на основе доступной информации представляется с высокой вероятностью верным, но для которого не удаётся получить математическое доказательство[1][2]. Математическая гипотеза является открытой математической проблемой, и каждую нерешённую математическую проблему, которая является проблемой разрешимости, можно сформулировать в форме гипотезы. Однако в виде гипотезы может быть сформулирована не всякая математическая проблема. Например, конкретное решение некоторой системы уравнений или задачи оптимизации для 2208 неизвестных предугадать невозможно, но такое решение может быть не только практическим, но и собственно математическим результатом[3].

Гипотеза Римана, Великая теорема Ферма, гипотеза Варинга и некоторые другие математические гипотезы сыграли значительную роль в математике, поскольку попытки их доказательства привели к созданию новых областей и методов исследования.

Математическая и естественнонаучная гипотеза[править | править код]

В отличие от естественнонаучной гипотезы, математическая гипотеза может быть логически доказана в некоторой системе аксиом, после чего она становится теоремой, верной при этих ограничениях, «на все времена». Характерным примером является научное наследие Ньютона, заявлявшего, что он «гипотез не измышляет», и стремившегося в физике не выходить за рамки математической модели. Математические теоремы Ньютона, как и древнейшая теорема Пифагора, по сей день остаются в силе, однако его классическая механика и теория тяготения после появления специальной и общей теорий относительности стали опровергнутыми физическими гипотезами. Если разрешимая математическая гипотеза может быть либо доказана, либо опровергнута, то для естественнонаучной гипотезы в силу относительности естественнонаучного знания свойства верифицируемости и фальсифицируемости не исключают друг друга[4]. Механика Ньютона неприменима для скоростей, близких к скорости света, но с очень большой точностью описывает движение большинства тел Солнечной системы. Поэтому в физике обычно говорят не об опровержении гипотез, а об ограничении сферы применимости теории.

Разрешение математических гипотез[править | править код]

Доказательство[править | править код]

Математика основана на формальных доказательствах. Сколь бы убедительной гипотеза ни казалась, сколько бы ни было приведено примеров в её подтверждение, гипотеза может быть опровергнута одним контрпримером. Современные математические журналы иногда публикуют результаты исследований о диапазоне, в пределах которого справедливость гипотезы проверена. Например, гипотеза Коллатца проверена для всех целых чисел вплоть до 1,2 × 1012, однако этот факт сам по себе ничего не даёт для доказательства гипотезы.

Для доказательства гипотезы должно быть предъявлено математическое доказательство, которое путём логически безупречного рассуждения на основе некоторой системы аксиом делает единственно возможным утверждение гипотезы или логически невозможным противоположное утверждение.

Когда гипотеза доказана, то в математике она становится теоремой. Теоремой может стать и опровержение явной или неявной гипотезы. В истории математики некоторые гипотезы длительное время существовали в неявной форме, и многочисленные попытки найти квадратуру круга или решение алгебраического уравнения пятой степени в радикалах исходили из опровергнутых впоследствии гипотез о том, что это возможно.

Опровержение[править | править код]

Опровержение гипотезы также осуществляется с помощью доказательства, но с учётом типичных формулировок гипотез опровержение часто является простейшим видом доказательства — контрпримером. Такое доказательство является простейшим с логической точки зрения, однако построение примера в теории графов или поиск примера в теории чисел (гипотеза Эйлера) может быть делом очень непростым. После опровержения гипотеза может стать фактом истории математики, а может трансформироваться в новую математическую гипотезу. Например, гипотеза Эйлера после опровержения трансформировалась в гипотезу Ландера — Паркина — Селфриджа. В этом случае процесс сходен с эволюцией естественнонаучных гипотез.

Неразрешимые гипотезы[править | править код]

Не для всякой гипотезы можно доказать её истинность или ложность в заданной системе аксиом. Согласно теореме Гёделя о неполноте, во всякой достаточно сложной аксиоматической теории, например в арифметике, существуют утверждения, которые нельзя ни опровергнуть, ни доказать в рамках самой теории. Поэтому всякая математическая теория, содержащая арифметику, содержит не опровергаемые и недоказуемые в её рамках гипотезы.

Например, было доказано, что континуум-гипотеза Кантора в теории множеств не зависит от общепринятой системы аксиом Цермело — Френкеля. Поэтому можно принять в качестве аксиомы это утверждение или его отрицание, не приходя к противоречию с остальными аксиомами и без каких-либо последствий для доказанных ранее теорем. В геометрии с древнейших времён сомнения математиков вызывала аксиома параллельности Евклида. Сегодня известно, что если принять противоположную аксиому, то можно построить непротиворечивую геометрию Лобачевского, включающую абсолютную геометрию, то есть с сохранением всех остальных аксиом.

Условные доказательства[править | править код]

Из справедливости некоторых недоказанных гипотез вытекают важные следствия. Если существует широко распространённое мнение, что гипотеза верна, то математики иногда доказывают теоремы, которые верны только при условии справедливости такой гипотезы, в надежде что гипотеза будет доказана. Подобные доказательства распространены, например, в связи с гипотезой Римана.

Несколько известных примеров[править | править код]

Здесь перечислены утверждения, которые оказали большое влияние на математику, находясь в статусе гипотез. Одни из них остаются гипотезами по сей день, другие были доказаны либо опровергнуты.

Великая теорема Ферма[править | править код]

В теории чисел Великая теорема Ферма утверждает, что ни для каких для трёх натуральных чисел a,b,c равенство {displaystyle a^{n}+b^{n}=c^{n}} не выполняется, если целое число n превышает 2.

Пьер Ферма записал это предположение в 1637 году на полях «Арифметики» Диофанта вместе с утверждением, что имеет доказательство, но оно слишком большое, чтобы уместиться на этих полях.[5] Первое успешное доказательство было получено Джоном Уайлсом в 1994 году и опубликовано в 1995 году, после 358 лет усилий многих математиков. Попытки решить эту проблему в XIX веке привели к развитию алгебраической теории чисел и доказательству теоремы о модулярности в XX веке.

Гипотеза Пуанкаре[править | править код]

Гипотеза Пуанкаре утверждает, что всякое односвязное компактное трёхмерное многообразие без края гомеоморфно трёхмерной сфере. Анри Пуанкаре сформулировал эту гипотезу в 1904 году. После почти вековых усилий математиков Григорий Перельман доказал эту гипотезу в трёх статьях, размещенных в 2002 и 2003 годах на сайте arXiv. Доказательство следовало предложению Ричарда Гамильтона использовать для решения поток Риччи.[6] Несколько команд математиков проверили доказательство Перельмана и подтвердили, что оно верное. Интересно, что для сфер большей размерности доказательства были получены ранее.

Гипотеза Римана[править | править код]

Гипотеза Римана, предложенная в 1859 году, утверждает, что все нетривиальные корни дзета-функции Римана имеют действительную часть, равную 1/2. Из справедливости гипотезы Римана вытекает ряд результатов о распределении простых чисел. Некоторые математики считают эту гипотезу наиболее важной нерешённой проблемой в «чистой математике». Гипотеза Римана входит в списки проблем Гильберта и задач тысячелетия.

Равенство классов P и NP[править | править код]

Вопрос о равенстве классов P и NP входит в список задач тысячелетия и является одной из главных проблем информатики. Неформально, но достаточно точно вопрос сводится к тому, можно ли любую задачу, предъявленное решение которой можно проверить за полиномиальное время, также и решить за полиномиальное время, используя полиномиальную память. Сегодня преобладает мнение, что это не так. Но если доказательство истинности этой гипотезы может быть конструктивным (надо предъявить всего лишь один алгоритм, что пытаются сделать очень многие), то как доказывать обратное — неясно. Вероятно, впервые проблема упомянута в
1956 году в письме Курта Гёделя Джону Нейману.[7] Точно проблему сформулировал в 1971 году Стивен Кук[8] и она считается многими важнейшей открытой проблемой в этой области[9].

История[править | править код]

Древнегреческие математики часто применяли в качестве метода математического доказательства мысленный эксперимент, включавший в себя выдвижение гипотез и вывод из них с помощью дедукции следствий с целью проверки правильности первоначальных догадок. Сегодня такие рассуждения называются методом доказательства от противного. Платон рассматривал гипотезы как посылки разработанного им аналитико-синтетического метода доказательства, способного обеспечить абсолютно истинный характер вывода. Однако гипотеза как метод исследования была отвергнута Аристотелем, который в качестве посылок силлогистического доказательства мыслил лишь общие, необходимые и абсолютные истины. Это обусловило последующее негативное отношение учёных к гипотезам как форме недостоверного или вероятного знания[4]. Преодолеть противопоставление гипотез и абсолютно точного знания и, как следствие, пренебрежительное отношение к гипотезам удалось лишь в XIX веке. В частности, Энгельс, рассматривая гипотезу как форму «развития естествознания»[10], выдвинул положение о взаимосвязи гипотез с законами и теориями как разными формами относительно истинного знания.

Примечания[править | править код]

  1. Oxford Dictionary of English (неопр.). — 2010.
  2. JL Schwartz. Shuttling between the particular and the general: reflections on the role of conjecture and hypothesis in the generation of knowledge in science and mathematics (англ.). — 1995. — P. 93.
  3. The Approximate Bilinear Algorithm of Length 46 for Multiplication of 4×4 Matrices (недоступная ссылка)
  4. 1 2 Гипотеза Архивная копия от 5 марта 2016 на Wayback Machine // Новая философская энциклопедия
  5. Ore, Oystein (1988), Number Theory and Its History, Dover, с. 203–204, ISBN 978-0-486-65620-5
  6. Hamilton, Richard S. Four-manifolds with positive isotropic curvature (неопр.) // Communications in Analysis and Geometry. — 1997. — Т. 5, № 1. — С. 1—92.
  7. Juris Hartmanis 1989, Godel, von Neumann, and the P = NP problem Архивная копия от 26 февраля 2015 на Wayback Machine, Bulletin of the European Association for Theoretical Computer Science, vol. 38, pp. 101—107
  8. Cook, Stephen  (англ.) (рус.. The complexity of theorem proving procedures // Proceedings of the Third Annual ACM Symposium on Theory of Computing (англ.). — 1971. — P. 151—158.
  9. Lance Fortnow, The status of the P versus NP problem Архивировано 24 февраля 2011 года., Communications of the ACM 52 (2009), no. 9, pp. 78-86. doi:10.1145/1562164.1562186
  10. Маркс К. и Энгельс Ф. Соч., т. 20, с. 555

Содержание:

Теория статистической проверки гипотез

Пусть имеется выборка Теория статистической проверки гипотез - определение и вычисление с примерами решения

Тогда нулевой гипотезой Теория статистической проверки гипотез - определение и вычисление с примерами решения называют основную (проверяемую) гипотезу, которая утверждает, что различие между сравниваемыми величинами отсутствует.
 

Альтернативной (конкурирующей, противоположной) гипотезой Н называется гипотеза, которая принимается тогда, когда отвергается нулевая.

Целью статистической проверки гипотез является выбор критерия по выборке Теория статистической проверки гипотез - определение и вычисление с примерами решения на основании которого принимается гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения или отклоняется в пользу альтернативной. При этом возможны ошибки двух видов:

  1. Отклонение Теория статистической проверки гипотез - определение и вычисление с примерами решения, когда она на самом деле верна – ошибка первого рода. Вероятность этой ошибки обозначается а и называется уровнем значимости.
  2. Принятие Теория статистической проверки гипотез - определение и вычисление с примерами решения когда она на самом деле не верна – ошибка второго рода, вероятность ошибки – Теория статистической проверки гипотез - определение и вычисление с примерами решения.

Чем серьезнее будут последствия ошибки первого рода, тем меньше надо выбирать уровень значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения Обычно выбирают Теория статистической проверки гипотез - определение и вычисление с примерами решения
 

Статистической характеристикой Z гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения называется некоторая случайная величина, определяемая по выборке, для которой известен закон распределения.
 

Областью отклонения (критической областью) Теория статистической проверки гипотез - определение и вычисление с примерами решения называется область, при попадании в которую статистической характеристики Z гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения отклоняется.
 

Дополнение области отклонения до всех возможных значений статистической характеристики Z называется областью принятия G.

При попадании статистической характеристики Z в область принятия ги­потеза Теория статистической проверки гипотез - определение и вычисление с примерами решения принимается. На рис. 11.1 изображены область отклонения Теория статистической проверки гипотез - определение и вычисление с примерами решения и область принятия G . Разделяет их точка на числовой оси Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

При попадании Z в область принятия гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения принимается. По существу область принятия есть доверительный интервал для статистической характеристики Z с доверительной вероятностью Теория статистической проверки гипотез - определение и вычисление с примерами решения

Область отклонения Теория статистической проверки гипотез - определение и вычисление с примерами решения выбирается таким образом, чтобы вероятность попадания в нее статистической характеристики Z при условии, что Теория статистической проверки гипотез - определение и вычисление с примерами решения верна, равнялась уровню значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения То есть область отклонения удовлетворяет условию:

Теория статистической проверки гипотез - определение и вычисление с примерами решения             (11.1)

С другой стороны, для того чтобы уменьшить вероятность ошибки второго рода при выбранном Теория статистической проверки гипотез - определение и вычисление с примерами решения область отклонения Теория статистической проверки гипотез - определение и вычисление с примерами решения, удовлетворяющую условию 1, нужно выбрать таким образом, чтобы вероятность попадания в нее статистической характеристики Z при условии, что верна альтернативная гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения была максимальной, т. е.

Теория статистической проверки гипотез - определение и вычисление с примерами решения
Вероятность Теория статистической проверки гипотез - определение и вычисление с примерами решения – называется мощностью критерия проверки гипотез.
Так как события Теория статистической проверки гипотез - определение и вычисление с примерами решения, – противоположны, то можно написать

Теория статистической проверки гипотез - определение и вычисление с примерами решения
Таким образом, имеем

Теория статистической проверки гипотез - определение и вычисление с примерами решения

где Теория статистической проверки гипотез - определение и вычисление с примерами решения – вероятность совершения ошибки второго рода).

Отметим, что ошибка первого рода существенней, поэтому а мы выбираем, а р – нет (принимаем полученное значение).

Из (11.2) следует, что между Теория статистической проверки гипотез - определение и вычисление с примерами решения существует простая зависимость и чтобы уменьшить Теория статистической проверки гипотез - определение и вычисление с примерами решения надо увеличить мощность критерия Теория статистической проверки гипотез - определение и вычисление с примерами решения Если Теория статистической проверки гипотез - определение и вычисление с примерами решения то Теория статистической проверки гипотез - определение и вычисление с примерами решенияТеория статистической проверки гипотез - определение и вычисление с примерами решения

Между Теория статистической проверки гипотез - определение и вычисление с примерами решения простой функциональной связи не существует, можно только сказать, что с увеличением одной, другая уменьшается и наоборот.

На рис. 11.2 приведены две кривые плотности распределения: одна кривая Теория статистической проверки гипотез - определение и вычисление с примерами решения – когда верна гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения , другая кривая Теория статистической проверки гипотез - определение и вычисление с примерами решения– когда верна альтернативная гипотеза Н.

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Из рис. 11.2 видно, что при уменьшении Теория статистической проверки гипотез - определение и вычисление с примерами решения, возрастает, область отклонения сужается и, следовательно, уменьшается вероятность отклонения гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения если она верна. Вместе с тем при сужении области отклонения Теория статистической проверки гипотез - определение и вычисление с примерами решения расширяется область принятия G и увеличивается вероятность принятия гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения если она на самом деле не верна. Поэтому нельзя брать Теория статистической проверки гипотез - определение и вычисление с примерами решения слишком малой.
Гипотезы бывают двух видов – параметрические и непараметрические.

Параметрические гипотезы – это гипотезы о проверке параметров законов распределения.

Непараметрические – это гипотезы о виде закона распределения.

Проверка гипотезы равенства математических ожиданий при неизвестной дисперсии (критерий Стьюдента)

Пусть Хи У – независимые нормальные случайные величины.
Введем обозначения:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Пусть дисперсии этих случайных величин равны и неизвестны:
Теория статистической проверки гипотез - определение и вычисление с примерами решения
где Теория статистической проверки гипотез - определение и вычисление с примерами решения – не предполагается известным.
Пусть даны выборки

Теория статистической проверки гипотез - определение и вычисление с примерами решения

По выборкам найдем критерий проверки гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения, состоящей в том, что математические ожидания этих случайных величин одинаковы:

Теория статистической проверки гипотез - определение и вычисление с примерами решения
При альтернативной гипотезе Теория статистической проверки гипотез - определение и вычисление с примерами решения

Известно, что случайные величины
Теория статистической проверки гипотез - определение и вычисление с примерами решения
имеют распределение Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы, где
Теория статистической проверки гипотез - определение и вычисление с примерами решения

Сумма независимых случайных величин с распределением Теория статистической проверки гипотез - определение и вычисление с примерами решения имеет то же распределение Теория статистической проверки гипотез - определение и вычисление с примерами решения с суммарным числом степеней свободы:
Теория статистической проверки гипотез - определение и вычисление с примерами решения

Случайная величина W имеет распределение Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы, (этот факт не очевиден, но несложно показать с помощью характеристических функций).

Ранее мы показывали, что несмещенной оценкой математического ожидания является выборочное среднее. Поэтому для проверки гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения возьмем разность между оценками математических ожиданий: Теория статистической проверки гипотез - определение и вычисление с примерами решения Нормируем эту разность, т. е. сделаем безразмерной. Для этого разделим ее на Теория статистической проверки гипотез - определение и вычисление с примерами решения и обозначим как U:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Очевидно, что случайная величина U имеет нормальное распределение, т. к. X и Y нормально распределены. Если проверяемая гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения о равенстве математических ожиданий выполняется Теория статистической проверки гипотез - определение и вычисление с примерами решения то имеем:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Таким образом, если гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения верна, то случайная величина U имеет нормированный нормальный закон распределения.

Рассмотрим случайную величину Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

где Теория статистической проверки гипотез - определение и вычисление с примерами решения где ; – ооъединенная выборочная дисперсия.
Случайную величину t можно представить в следующем виде через ранее введенные Un W:
Теория статистической проверки гипотез - определение и вычисление с примерами решения
Действительно:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

т. е. правые части (11.5) и (11.6 или 11.7) совпадают.

Но величина t (11.6) имеет распределение Стьюдента с Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы. Это следует из того, что U имеет нормированное нормальное распределение при условии, что Теория статистической проверки гипотез - определение и вычисление с примерами решения – верна. W – имеет распределение Теория статистической проверки гипотез - определение и вычисление с примерами решения с Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы, кроме того величины U и W независимы. Таким образом, величина t определяется по (11.5) и имеет распределение Стью­дента с Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы, если верна проверяемая гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения

Эту величину t (11.5) примем за статистическую характеристику Z. Про­верка гипотезы о равенстве .математических ожиданий состоит в следующем.

По таблицам распределения Стьюдента для заданного уровня значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения или доверительной вероятности Теория статистической проверки гипотез - определение и вычисление с примерами решения и числу степеней свободы Теория статистической проверки гипотез - определение и вычисление с примерами решения находим квантиль Теория статистической проверки гипотез - определение и вычисление с примерами решения , удовлетворяющий условию (на рис. 11.3 изображена кривая распределения Стьюдента и заштрихована область отклонения Теория статистической проверки гипотез - определение и вычисление с примерами решения ):

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Тогда если фактически найденное по выборкам значение статистиче­ской характеристики t (11.5) удовлетворяет условию Теория статистической проверки гипотез - определение и вычисление с примерами решения  то проверяемую гипотезу Теория статистической проверки гипотез - определение и вычисление с примерами решения о равенстве математических ожиданий отклоняем как несогласующуюся с результатами выборочных данных; при этом вероятность ошибки равна Теория статистической проверки гипотез - определение и вычисление с примерами решения Если Теория статистической проверки гипотез - определение и вычисление с примерами решения то гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решенияпринимается, математические ожидания случайных величин Х и Y одинаковы.

Проверка гипотезы о равенстве дисперсий (критерий Фишера)

Пусть Х и Y – нормальные независимые случайные величины. Обозначим их дисперсии:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

По выборкам Теория статистической проверки гипотез - определение и вычисление с примерами решения найдем критерий проверки гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения состоящей в том, что дисперсии этих случайных величин равны

Теория статистической проверки гипотез - определение и вычисление с примерами решения
При альтернативной гипотезе Теория статистической проверки гипотез - определение и вычисление с примерами решения.
Такая гипотеза выбирается, например, при Теория статистической проверки гипотез - определение и вычисление с примерами решения, где Теория статистической проверки гипотез - определение и вычисление с примерами решения– модифицированные выборочные дисперсии.

В качестве статистической характеристики возьмем случайную величину

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Если гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения, о равенстве дисперсии верна, то случайная величина F имеет распределение Фишера с Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы. Покажем это, представляя числитель и знаменатель (11.8) в следующем виде:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Видим, что величина Теория статистической проверки гипотез - определение и вычисление с примерами решения имеет распределение Теория статистической проверки гипотез - определение и вычисление с примерами решения степенью свободы, Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы. Следовательно, согласно определению (см. раздел 9.5, формула (9.7)), случайная величина F имеет распределение Фишера с Теория статистической проверки гипотез - определение и вычисление с примерами решения степенями свободы.
 

Проверка гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решениясостоит в следующем:

Из таблиц распределения Фишера по выбранному уровню значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения и числу степеней свободы Теория статистической проверки гипотез - определение и вычисление с примерами решения находим квантиль Теория статистической проверки гипотез - определение и вычисление с примерами решения , который удовлетворяет условию Теория статистической проверки гипотез - определение и вычисление с примерами решения Ha рис. 11.4 изображена кривая распределения Фишера с числом степеней свободы Теория статистической проверки гипотез - определение и вычисление с примерами решения и заштрихована область отклонения Теория статистической проверки гипотез - определение и вычисление с примерами решения площадь которой области равна Теория статистической проверки гипотез - определение и вычисление с примерами решения отмечен квантиль Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

По выборкам, используя (11.8), определяем значение статистической характеристики F. Если фактически вычисленное по формуле (11.8) значение F окажется больше табличного Теория статистической проверки гипотез - определение и вычисление с примерами решения (как видно из рис. 11.4, мы попадаем в область отклонения), то гипотезу о равенстве дисперсий отклоняем как не согласующуюся с выборкой. При этом вероятность ошибки равна Теория статистической проверки гипотез - определение и вычисление с примерами решения В противном случае, когда Теория статистической проверки гипотез - определение и вычисление с примерами решения, принимается гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения т. е. дисперсии случайных величин Х и Yравны.
 

Пример:

Пусть X – чувствительность телевизоров марки «Горизонт», Y – чувствительность телевизоров марки «Витязь». Проведены выборочные измерения чувствительности телевизоров для Теория статистической проверки гипотез - определение и вычисление с примерами решения = 7 телевизоров марки «Горизонт» и Теория статистической проверки гипотез - определение и вычисление с примерами решения = 6 телевизоров марки «Витязь». Результаты измерений чувствительности в Теория статистической проверки гипотез - определение и вычисление с примерами решения представлены в таблицах.

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Определить лучшую марку телевизора, если лучшим будет тот, у которого чувствительность в Теория статистической проверки гипотез - определение и вычисление с примерами решения будет меньше.

Найдем по результатам измерений средние значения чувствительности, вычисляя Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Можно ли сказать, что чувствительность телевизоров марки «Горизонт» лучше? Нет, т. к. выборки, выборочные средние Теория статистической проверки гипотез - определение и вычисление с примерами решения и разность между ними – элементы случайные.

Сначала убедимся в равенстве дисперсий по критерию Фишера – гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения

Вычислим несмещенные оценки дисперсий Теория статистической проверки гипотез - определение и вычисление с примерами решения
Теория статистической проверки гипотез - определение и вычисление с примерами решения
Используя (11.8), найдем значение статистической характеристики F:

Теория статистической проверки гипотез - определение и вычисление с примерами решения

По таблицам распределения Фишера для [6;5] степеней свободы, задавая уровень значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения = 0,05, найдем квантиль – Теория статистической проверки гипотез - определение и вычисление с примерами решения= 4,95. Сравнивая Теория статистической проверки гипотез - определение и вычисление с примерами решения видим, что 1,196 < 4,95. Значит, гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения принимается, т. е. дисперсии случайных величин X и Y равны.

Теперь проверим гипотезу о равенстве математических ожиданий случайных величин X и Y , применяя критерий Стьюдента.
Гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения т. е. чувствительность телевизоров марки «Горизонт» и «Витязь» одинакова.

Найдем объединенную выборочную дисперсию:
Теория статистической проверки гипотез - определение и вычисление с примерами решения
По формуле (11.5) вычислим статистическую характеристику t :

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Задавая уровень значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения = 0,05 для числа степеней свободы v = 7 + 6 – 2 = ll, по таблицам распределения Стьюдента находим квантиль Теория статистической проверки гипотез - определение и вычисление с примерами решения Сравнивая Теория статистической проверки гипотез - определение и вычисление с примерами решения видим, что |0,343| <2,201, значит, гипотезу о равенстве чувствительности телевизоров марки «Горизонт» и «Витязь» принимаем.

Проверка гипотезы о законе распределения генеральной случайной величины. Критерий Пирсона

Проверка гипотезы о законе распределения генеральной случайной величины. Критерий Пирсона. (Критерий согласия Теория статистической проверки гипотез - определение и вычисление с примерами решения)

Пусть задана генеральная случайная величинами выборка Теория статистической проверки гипотез - определение и вычисление с примерами решения
Если по выборке построить гистограмму, то по виду гистограммы можно выдвинуть гипотезу о виде закона распределения генеральной случайной величины X. Тогда в качестве нулевой гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения будет предположение, что случайная величина X имеет плотность распределенияТеория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения
При альтернативной гипотезе Теория статистической проверки гипотез - определение и вычисление с примерами решения

Обычно для построения гистограммы равноинтервальным способом разбивают весь диапазон выборочных значений случайной величины X на Теория статистической проверки гипотез - определение и вычисление с примерами решения одинаковых интервалов. Если Теория статистической проверки гипотез - определение и вычисление с примерами решения– число выборочных значений, попавших в Теория статистической проверки гипотез - определение и вычисление с примерами решения интервал, то Теория статистической проверки гипотез - определение и вычисление с примерами решения – объем выборки. Введем случайную величину Теория статистической проверки гипотез - определение и вычисление с примерами решения относительную частоту попадания случайной величины X в Теория статистической проверки гипотез - определение и вычисление с примерами решения интервал. Тео­ретическая вероятность Теория статистической проверки гипотез - определение и вычисление с примерами решения попадания значений случайной величины X в Теория статистической проверки гипотез - определение и вычисление с примерами решения интервал может быть определена как Теория статистической проверки гипотез - определение и вычисление с примерами решения – длина Теория статистической проверки гипотез - определение и вычисление с примерами решения интервала, Теория статистической проверки гипотез - определение и вычисление с примерами решения – границы Теория статистической проверки гипотез - определение и вычисление с примерами решения интервала.

Рассмотрим событие, состоящее в том, что случайная величина X попадет в интервал Теория статистической проверки гипотез - определение и вычисление с примерами решения раз. Тогда введем случайную величину Y, равную числу попаданий случайной величины в Теория статистической проверки гипотез - определение и вычисление с примерами решения интервал Теория статистической проверки гипотез - определение и вычисление с примерами решения Вероятности возможных ее значений определяются по формуле Бернулли, случайная величина У имеет биномиальный закон распределения, и ее числовые характеристики имеют вид Теория статистической проверки гипотез - определение и вычисление с примерами решения

Для введенной ранее случайной величины Теория статистической проверки гипотез - определение и вычисление с примерами решения определим числовые характеристики:
Теория статистической проверки гипотез - определение и вычисление с примерами решения

Проведем нормировку случайной величины Теория статистической проверки гипотез - определение и вычисление с примерами решения для этого мы ее центрируем, сделаем безразмерной, разделив на Теория статистической проверки гипотез - определение и вычисление с примерами решения и обозначим Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения
Эта величина распределена по биномиальному закону, т. к. в нее входит случайная величина Теория статистической проверки гипотез - определение и вычисление с примерами решения Образуем сумму квадратов случайных величин Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Сумма квадратов нормированных нормальных случайных величин (как было показано ранее) имеет распределение Теория статистической проверки гипотез - определение и вычисление с примерами решения обозначим

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Эта случайная величина имеет закон распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения с числом степеней свободы
Теория статистической проверки гипотез - определение и вычисление с примерами решения                              (11.11)
где Теория статистической проверки гипотез - определение и вычисление с примерами решения – число параметров закона распределения, оцениваемых по выборочным данным.

Анализируя правые части формул (11.9) и (11.10), можно отметить, что в критерии согласия Теория статистической проверки гипотез - определение и вычисление с примерами решения фактически сравниваются эмпирические и теоретические частоты распределения.
 

Проверка гипотезы состоит в следующем. Задаем уровень значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения

По таблицам Теория статистической проверки гипотез - определение и вычисление с примерами решения – распределения для заданных Теория статистической проверки гипотез - определение и вычисление с примерами решения и числу степеней свободы Теория статистической проверки гипотез - определение и вычисление с примерами решения находим квантиль Теория статистической проверки гипотез - определение и вычисление с примерами решения , удовлетворяющий условию Теория статистической проверки гипотез - определение и вычисление с примерами решения По формуле (11.10) вычисляем значение Теория статистической проверки гипотез - определение и вычисление с примерами решения . Сравнивая рассчитанное значение Теория статистической проверки гипотез - определение и вычисление с примерами решения с квантилем Теория статистической проверки гипотез - определение и вычисление с примерами решения, найденным по таблицам, принимаем одно из двух решений:

  1. Если Теория статистической проверки гипотез - определение и вычисление с примерами решения то нулевая гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения отвергается в пользу альтернативной Н, т. е. Теория статистической проверки гипотез - определение и вычисление с примерами решения не согласуется с результатами эксперимента.
  2. Если Теория статистической проверки гипотез - определение и вычисление с примерами решения, то Теория статистической проверки гипотез - определение и вычисление с примерами решения, принимается, т. е. Теория статистической проверки гипотез - определение и вычисление с примерами решения согласуется с эксперимен­тальными данными, закон распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения подтверждается. При этом вероятность ошибки равна Теория статистической проверки гипотез - определение и вычисление с примерами решения

Критерий Романовского

Рассмотрим неравенство
Теория статистической проверки гипотез - определение и вычисление с примерами решения                               (11.12)
где Теория статистической проверки гипотез - определение и вычисление с примерами решения вычисляется по формуле (11.10);

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Проверка гипотезы состоит в следующем: если это неравенство выполняется Теория статистической проверки гипотез - определение и вычисление с примерами решения то расхождение теоретических и экспериментальных данных неслучайно, т. е. закон распределения не подтверждается, гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения отклоняется.
В противном случае гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения подтверждается, действительно случайная величина X имеет плотность распределенияТеория статистической проверки гипотез - определение и вычисление с примерами решения Этот критерий хорош тем, что для проверки гипотезы не требуются таблицы Теория статистической проверки гипотез - определение и вычисление с примерами решения– распределения.

Критерий согласия Колмогорова

В критерии согласия А. Н. Колмогорова проводится сравнение эмпириче­ской и теоретической функций распределения. Укажем этапы проверки гипотез этим критерием.

1. По выборке Теория статистической проверки гипотез - определение и вычисление с примерами решения строится вариационный ряд и график эмпирической функции распределения.

2. По виду графика функции распределения выдвигается гипотеза о виде закона распределения генеральной случайной величины X. Тогда в качестве нулевой гипотезы Теория статистической проверки гипотез - определение и вычисление с примерами решения будет предположение, что генеральная случайная величина X имеет функцию распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения
При альтернативной гипотезе Теория статистической проверки гипотез - определение и вычисление с примерами решения

3. По выборке Теория статистической проверки гипотез - определение и вычисление с примерами решения находят точечные оценки параметров теоретической функции распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения, используя метод моментов или метод наибольшего правдоподобия.

4. На графике эмпирической функции распределения строится график теоретической функции распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения

5. Путем сравнения графиков вычисляется максимальное значение моду­ля отклонения значений эмпирической функции распределения от теоретиче­ской функции распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения

Теория статистической проверки гипотез - определение и вычисление с примерами решения

6. Рассчитывают значение Теория статистической проверки гипотез - определение и вычисление с примерами решениякритерия Колмогорова:

Теория статистической проверки гипотез - определение и вычисление с примерами решения
7. Задавая уровень значимости а , определяем квантиль из условия 

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Отметим, что самостоятельно решать это уравнение не надо, поскольку составлены таблицы квантилей распределения Колмогорова, из которых по заданному уровню значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения определяем квантиль Теория статистической проверки гипотез - определение и вычисление с примерами решения
 

Сравнивая значение Теория статистической проверки гипотез - определение и вычисление с примерами решения рассчитанное по формуле (11.13) с квантилем Теория статистической проверки гипотез - определение и вычисление с примерами решения делаем следующие выводы:

Следует отметить, что критерий Колмогорова применяется тогда, когда полностью известен закон распределения функции распределения F(x) и зна­чения ее параметров. При решении практических задач это не всегда удается выполнить. Для этого прибегают к некоторым дополнительным исследованиям: применяют вероятностные бумаги, строят гистограммы и т. д. Это помогает правильно подобрать теоретический закон распределения для функции распределения F(x). Но в этом случае неизвестны ее параметры. И если их оценивать по этой же выборке, то это может привести к ошибочным выводам в отношении принятой гипотезы. В этом случае следует использовать другие критерии согласия, например Теория статистической проверки гипотез - определение и вычисление с примерами решения .
 

Пример:

Проведено 100 измерений расстояния радиодальномером до цели. Результаты представлены в виде статистического ряда Теория статистической проверки гипотез - определение и вычисление с примерами решения – границы интервалов в [км], Теория статистической проверки гипотез - определение и вычисление с примерами решения – число выборочных значений, попавших в Теория статистической проверки гипотез - определение и вычисление с примерами решенияинтервал).
Оценить закон распределения ошибки измерения дальности радиодальномером.

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Занесем в таблицу значения относительных частот Теория статистической проверки гипотез - определение и вычисление с примерами решения

Анализ значений относительных частот позволяет выдвинуть гипотезу о равномерном законе распределения. Теоретическая функция распределения для этого закона имеет вид

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Принимаем а = 450, b = 800. Полагая Теория статистической проверки гипотез - определение и вычисление с примерами решения для каждого интервала, рассчитываем Теория статистической проверки гипотез - определение и вычисление с примерами решения в этих точках и заносим результат в таблицу. Зная Теория статистической проверки гипотез - определение и вычисление с примерами решения рассчитаем эмпирическую функцию распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения в точках Теория статистической проверки гипотез - определение и вычисление с примерами решения для каждого интервала: Теория статистической проверки гипотез - определение и вычисление с примерами решения где Теория статистической проверки гипотез - определение и вычисление с примерами решения – число значений Теория статистической проверки гипотез - определение и вычисление с примерами решения меньших заданного х, Теория статистической проверки гипотез - определение и вычисление с примерами решения – объем выборки. Рассчитаем разность: Теория статистической проверки гипотез - определение и вычисление с примерами решения Данные заносим в таблицу.

Теория статистической проверки гипотез - определение и вычисление с примерами решения

Вычисляем критерий Колмогорова по формуле (11.13), учитывая, что из таблицы Теория статистической проверки гипотез - определение и вычисление с примерами решениятогда Теория статистической проверки гипотез - определение и вычисление с примерами решения Задавая уровень значимости Теория статистической проверки гипотез - определение и вычисление с примерами решения – 0,05, по таблице квантилей Колмогорова находим кван­тиль Теория статистической проверки гипотез - определение и вычисление с примерами решения 1,358. Поскольку Теория статистической проверки гипотез - определение и вычисление с примерами решения то гипотеза Теория статистической проверки гипотез - определение и вычисление с примерами решения принимается, т. е. действительно генеральная случайная величина X имеет функцию распределения Теория статистической проверки гипотез - определение и вычисление с примерами решения c равномерным законом распределения.

  • Линейный регрессионный анализ
  • Вариационный ряд
  • Законы распределения случайных величин
  • Дисперсионный анализ
  • Случайные процессы
  • Выборочный метод
  • Статистическая проверка гипотез
  • Статистические оценки

Гипотеза в математике — утверждение, которое на основе доступной информации представляется с высокой вероятностью верным, но для которого не удаётся получить математическое доказательство. Математическая гипотеза является открытой математической проблемой, и каждую нерешённую математическую проблему, которая является проблемой разрешимости, можно сформулировать в форме гипотезы. Однако в виде гипотезы может быть сформулирована не всякая математическая проблема. Например, конкретное решение некоторой системы уравнений или задачи оптимизации для 2208 неизвестных предугадать невозможно, но такое решение может быть не только практическим, но и собственно математическим результатом.

Гипотеза Римана, Великая теорема Ферма, гипотеза Варинга и некоторые другие математические гипотезы сыграли значительную роль в математике, поскольку попытки их доказательства привели к созданию новых областей и методов исследования.

Математическая и естественнонаучная гипотеза

В отличие от естественнонаучной гипотезы, математическая гипотеза может быть логически доказана в некоторой системе аксиом, после чего она становится теоремой, верной при этих ограничениях, «на все времена». Характерным примером является научное наследие Ньютона, заявлявшего, что он «гипотез не измышляет», и стремившегося в физике не выходить за рамки математической модели. Математические теоремы Ньютона, как и древнейшая теорема Пифагора, по сей день остаются в силе, однако его классическая механика и теория тяготения после появления специальной и общей теорий относительности стали опровергнутыми физическими гипотезами. Если разрешимая математическая гипотеза может быть либо доказана, либо опровергнута, то для естественнонаучной гипотезы в силу относительности естественнонаучного знания свойства верифицируемости и фальсифицируемости не исключают друг друга. Механика Ньютона неприменима для скоростей, близких к скорости света, но с очень большой точностью описывает движение большинства тел Солнечной системы. Поэтому в физике обычно говорят не об опровержении гипотез, а об ограничении сферы применимости теории.

Разрешение математических гипотез

Доказательство

Математика основана на формальных доказательствах. Сколь бы убедительной гипотеза ни казалась, сколько бы ни было приведено примеров в её подтверждение, гипотеза может быть опровергнута одним контрпримером. Современные математические журналы иногда публикуют результаты исследований о диапазоне, в пределах которого справедливость гипотезы проверена. Например, гипотеза Коллатца проверена для всех целых чисел вплоть до 1,2 × 1012, однако этот факт сам по себе ничего не даёт для доказательства гипотезы.

Для доказательства гипотезы должно быть предъявлено математическое доказательство, которое путём логически безупречного рассуждения на основе некоторой системы аксиом делает единственно возможным утверждение гипотезы или логически невозможным противоположное утверждение.

Когда гипотеза доказана, то в математике она становится теоремой. Теоремой может стать и опровержение явной или неявной гипотезы. В истории математики некоторые гипотезы длительное время существовали в неявной форме, и многочисленные попытки найти квадратуру круга или решение алгебраического уравнения пятой степени в радикалах исходили из опровергнутых впоследствии гипотез о том, что это возможно.

Опровержение

Опровержение гипотезы также осуществляется с помощью доказательства, но с учётом типичных формулировок гипотез опровержение часто является простейшим видом доказательства — контрпримером. Такое доказательство является простейшим с логической точки зрения, однако построение примера в теории графов или поиск примера в теории чисел (гипотеза Эйлера) может быть делом очень непростым. После опровержения гипотеза может стать фактом истории математики, а может трансформироваться в новую математическую гипотезу. Например, гипотеза Эйлера после опровержения трансформировалась в гипотезу Ландера — Паркина — Селфриджа. В этом случае процесс сходен с эволюцией естественнонаучных гипотез.

Неразрешимые гипотезы

Не для всякой гипотезы можно доказать её истинность или ложность в заданной системе аксиом. Согласно теореме Гёделя о неполноте, во всякой достаточно сложной аксиоматической теории, например в арифметике, существуют утверждения, которые нельзя ни опровергнуть, ни доказать в рамках самой теории. Поэтому всякая математическая теория, содержащая арифметику, содержит не опровергаемые и недоказуемые в её рамках гипотезы.

Например, было доказано, что континуум-гипотеза Кантора в теории множеств не зависит от общепринятой системы аксиом Цермело — Френкеля. Поэтому можно принять в качестве аксиомы это утверждение или его отрицание, не приходя к противоречию с остальными аксиомами и без каких-либо последствий для доказанных ранее теорем. В геометрии с древнейших времён сомнения математиков вызывала аксиома параллельности Евклида. Сегодня известно, что если принять противоположную аксиому, то можно построить непротиворечивую геометрию Лобачевского, включающую абсолютную геометрию, то есть с сохранением всех остальных аксиом.

Условные доказательства

Из справедливости некоторых недоказанных гипотез вытекают важные следствия. Если существует широко распространённое мнение, что гипотеза верна, то математики иногда доказывают теоремы, которые верны только при условии справедливости такой гипотезы, в надежде что гипотеза будет доказана. Подобные доказательства распространены, например, в связи с гипотезой Римана.

Несколько известных примеров

Здесь перечислены утверждения, которые оказали большое влияние на математику, находясь в статусе гипотез. Одни из них остаются гипотезами по сей день, другие были доказаны либо опровергнуты.

Великая теорема Ферма

В теории чисел Великая теорема Ферма утверждает, что ни для каких для трёх натуральных чисел a , b , c {displaystyle a,b,c} равенство a n + b n = c n {displaystyle a^{n}+b^{n}=c^{n}} не выполняется, если целое число n {displaystyle n} превышает 2.

Пьер Ферма записал это предположение в 1637 году на полях «Арифметики» Диофанта вместе с утверждением, что имеет доказательство, но оно слишком большое, чтобы уместиться на этих полях. Первое успешное доказательство было получено Джоном Уайлсом в 1994 году и опубликовано в 1995 году, после 358 лет усилий многих математиков. Попытки решить эту проблему в XIX веке привели к развитию алгебраической теории чисел и доказательству теоремы о модулярности в XX веке.

Гипотеза Пуанкаре

Гипотеза Пуанкаре утверждает, что всякое односвязное компактное трёхмерное многообразие без края гомеоморфно трёхмерной сфере. Анри Пуанкаре сформулировал эту гипотезу в 1904 году. После почти вековых усилий математиков Григорий Перельман доказал эту гипотезу в трёх статьях, размещенных в 2002 и 2003 годах на сайте arXiv. Доказательство следовало предложению Ричарда Гамильтона использовать для решения поток Риччи. Несколько команд математиков проверили доказательство Перельмана и подтвердили, что оно верное. Интересно, что для сфер большей размерности доказательства были получены ранее.

Гипотеза Римана

Гипотеза Римана, предложенная в 1859 году, утверждает, что все нетривиальные корни дзета-функции Римана имеют действительную часть, равную 1/2. Из справедливости гипотезы Римана вытекает ряд результатов о распределении простых чисел. Некоторые математики считают эту гипотезу наиболее важной нерешённой проблемой в «чистой математике». Гипотеза Римана входит в списки проблем Гильберта и задач тысячелетия.

Равенство классов P и NP

Вопрос о равенстве классов P и NP входит в список задач тысячелетия и является одной из главных проблем информатики. Неформально, но достаточно точно вопрос сводится к тому, можно ли любую задачу, предъявленное решение которой можно проверить за полиномиальное время, также и решить за полиномиальное время, используя полиномиальную память. Сегодня преобладает мнение, что это не так. Но если доказательство истинности этой гипотезы может быть конструктивным (надо предъявить всего лишь один алгоритм, что пытаются сделать очень многие), то как доказывать обратное — неясно. Вероятно, впервые проблема упомянута в 1956 году в письме Курта Гёделя Джону Нейману. Точно проблему сформулировал в 1971 году Стивен Кук и она считается многими важнейшей открытой проблемой в этой области.

История

Древнегреческие математики часто применяли в качестве метода математического доказательства мысленный эксперимент, включавший в себя выдвижение гипотез и вывод из них с помощью дедукции следствий с целью проверки правильности первоначальных догадок. Сегодня такие рассуждения называются методом доказательства от противного. Платон рассматривал гипотезы как посылки разработанного им аналитико-синтетического метода доказательства, способного обеспечить абсолютно истинный характер вывода. Однако гипотеза как метод исследования была отвергнута Аристотелем, который в качестве посылок силлогистического доказательства мыслил лишь общие, необходимые и абсолютные истины. Это обусловило последующее негативное отношение учёных к гипотезам как форме недостоверного или вероятного знания. Преодолеть противопоставление гипотез и абсолютно точного знания и, как следствие, пренебрежительное отношение к гипотезам удалось лишь в XIX веке. В частности, Энгельс, рассматривая гипотезу как форму «развития естествознания», выдвинул положение о взаимосвязи гипотез с законами и теориями как разными формами относительно истинного знания.

Решения задач на проверку статистических гипотез

Проверка статистических гипотез включает в себя большой пласт задач математической статистики. Зная некоторые характеристики выборки (или имея просто выборочные данные), мы можем проверять гипотезы о виде распределении случайной величины или ее параметрах.

В учебных задачах речь обычно идет о простой гипотезе $H_0$ (ее называют нулевой), однозначно определяющей закон распределения. Вместе с ней вводят альтернативную гипотезу $H_1$ (конкурирующую) и определяют уровень значимости $alpha$, на котором будет сделан вывод о справедливости гипотезы.

Далее по выборочным данным вычисляется значение статистического критерия (формула зависит от конкретной гипотезы) и выясняется, попадает ли оно в критическую область (одностороннюю или двустороннюю). Если попадает – нулевую гипотезу следует отвергнуть. При проверке гипотез есть вероятность допустить ошибку: первого рода (верная гипотеза отклонена, $alpha$) или второго рода (неверная гипотеза принята, $beta$).

Ниже в примерах мы разберем основные учебные задачи на проверку гипотез о значении среднего, дисперсии, вероятности, о равенстве числовых характеристики. Задачи на проверку гипотез о виде распределения (с помощью критерия согласия Пирсона и других) ищите тут: Проверка гипотез о законе распределения.

Понравилось? Добавьте в закладки

Примеры решений на проверку гипотез онлайн

Гипотеза о равенстве среднего значения числу

Пример 1. Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 10 мм. Используя односторонний критерий с α=0,05, проверить эту гипотезу, если в выборке из n шариков средний диаметр оказался равным 10,3 мм, а дисперсия известна и равна 1 мм.

Пример 2. Продавец утверждает, что средний вес пачки чая составляет 100 г. Из партии извлечена выборка и взвешена. Вес каждой пачки – см. таблицу вариантов. Не противоречит ли это утверждению продавца? Доверительная вероятность 99%. Вес пачек чая распределен нормально.

Гипотеза о равенстве дисперсии числу

Пример 3. По результатам $n=7$ независимых измерений найдено, что $overline{x}=82,48$ мм, а $S=0,08$ мм. Допустив, что ошибки измерения имеют нормальное распределение проверить на уровне значимости $alpha=0,05$ гипотезу $H_0: sigma^2=0,01$ мм$^2$. против конкурирующей гипотезы $H_0: sigma^2=0,005$ мм$^2$. В ответе записать разность между фактическим и табличным значениями выборочной характеристики.

Пример 4. Компания не осуществляет инвестиционных вложений в ценные бумаги с дисперсией годовой доходности более чем 0,04. Выборка из 52 наблюдений по активу А показала, что выборочная дисперсия ее доходности равна 0,045.Выяснить, допустимы ли для данной компании инвестиционные вложения в актив А на уровне значимости: а) 0,05; б) 0,01.

Гипотеза о равенстве вероятности числу

Пример 5. Фирма рассылает рекламные каталоги возможным заказчикам. Как показал опыт, вероятность того, что организация получившая каталог, закажет рекламируемое изделие, равна 0,08. Фирма разослала 1000 каталогов новой, улучшенной, формы и получила 100 заказов. На уровне значимости 0,05 выяснить, можно ли считать, что новая форма рекламы существенно лучше прежней.

Пример 6. Обычно применяемое лекарство снимает послеоперационные боли у 80% пациентов. Новое лекарство, применяемое для тех же целей, помогло 90 пациентам из первых 100 оперированных. Можно ли на уровне значимости а = 0,05 считать, что новое лекарство лучше? А на уровне а = 0,01?

Гипотеза о равенстве средних

Пример 7. Ожидается, что добавление специальных веществ уменьшит жесткость воды. По оценке жесткости воды до после добавления специальных веществ по 40-ка и 50-ти пробам соответственно получим средние значения жесткости (в стандартных единицах), равные 4,0 и 0,8. Дисперсия измерений в обоих случаях предполагается равно 0,25. Подтверждают ли эти результаты ожидаемый эффект? Принять $alpha=0,05$. Контролируемая величина имеет нормальное распределение.

Пример 8. Производительность каждого из агрегатов А и В составила (в кг вещества за час работы)
Номер замера 1 2 3 4 5
Агрегат А 14,1 13,1 14,7 13,7 14,0
Агрегат В 14,0 14,5 13,7 12,7 14,1
Можно ли считать производительность агрегатов А и В одинаковой в предложении, что обе выборки получены из нормально распределенных генеральных совокупностей, при уровне значимости a = 0,1?

Гипотеза о равенстве дисперсий

Пример 9. До наладки станка была проверена точность изготовления 10 втулок и найдено значение оценки дисперсии диаметра $s_1^2=9,6$ мкм$^2$. После наладки подверглись контролю еще 15 втулок и получено новое значение оценки дисперсии $s_2^2=5,7$ мкм$^2$. Можно ли считать, что в результате наладки станка точность изготовления деталей увеличилась? Принять $alpha=0,05$.

Пример 10. При уровне значимости $alpha=0,1$ проверить гипотезу о равенстве дисперсий двух нормально распределенных случайных величин Х и Y на основе выборочных данных (табл. 4) при альтернативной гипотезе $H_1: sigma_x^2 ne sigma_y^2$.

Гипотеза о равенстве вероятностей

Пример 11. Из 200 задач первого раздела курса математики, предложенных для решения, абитуриенты решили 130, а из 300 задач второго раздела абитуриенты решили 120. Можно ли при α=0,01 утверждать, что первый раздел школьного курса абитуриенты усвоили лучше, чем второй.

Пример 12. Выборочная проверка надежности материнских плат 2-х производителей дала следующие результаты: в течения месяца после продажи в 15 из 200 материнских плат производителя А обнаружены дефекты, тогда как среди 400 материнских плат производителя В 8% оказались дефектами. Существенны ли различия в надежности материнских плат производителей А и В? Уровень значимости принять равным 0,01.

Нужно решить задачи на проверку статистических гипотез?

Полезные ссылки

  • Проверка гипотез о законе распределения по критерию Пирсона
  • Что такое проверка статистической гипотезы?
  • Решение задач на заказ
  • Ссылки на учебники
  • Решенные контрольные

Решебник по математической статистике

Ищете решенное задание на проверку статистических гипотез? Попробуйте тут:

Проверка статистических гипотез

  1. Понятие о статистической гипотезе
  2. Уровень значимости при проверке гипотезы
  3. Критическая область
  4. Простая гипотеза и критерии согласия
  5. Критерий согласия (X^2) Пирсона
  6. Примеры

п.1. Понятие о статистической гипотезе

Статистическая гипотеза – это предположение о виде распределения и свойствах случайной величины в наблюдаемой выборке данных.

Прежде всего, мы формулируем «рабочую» гипотезу. Желательно это делать не на основе полученных данных, а исходя из природы и свойств исследуемого явления.
Затем формулируется нулевая гипотеза (H_0), отвергающая нашу рабочую гипотезу.
Наша рабочая гипотеза при этом называется альтернативной гипотезой (H_1).
Получаем, что (H_0=overline{H_1}), т.е. нулевая и альтернативная гипотеза вместе составляют полную группу несовместных событий.

Основной принцип проверки гипотезы – доказательство «от противного», т.е. опровергнуть гипотезу (H_0) и тем самым доказать гипотезу (H_1).

В результате проверки гипотезы возможны 4 исхода:

Верная гипотеза
(H_0) (H_1)
Принятая гипотеза (H_0) True Negative
(H_0) принята верно
False Negative
(H_0) принята неверно
Ошибка 2-го рода
(H_1) False Positive
(H_0) отвергнута неверно
(H_1) принята неверно
Ошибка 1-го рода
True Positive
(H_0) отвергнута верно
(H_1) принята верно

Ошибка 1-го рода – «ложная тревога».
Ошибка 2-го рода – «пропуск события».

Например:
К врачу обращается человек с некоторой жалобой.
Гипотеза (H_1) – человек болен, гипотеза (H_0) – человек здоров.
True Negative – здорового человека признают здоровым
True Positive – больного человека признают больным
False Positive – здорового человека признают больным – «ложная тревога»
False Negative – больного человека признают здоровым – «пропуск события»

Уровень значимости при проверке гипотезы

Статистический тест (статистический критерий) – это строгое математическое правило, по которому гипотеза принимается или отвергается.
В статистике разработано множество критериев: критерии согласия, критерии нормальности, критерии сдвига, критерии выбросов и т.д.

Уровень значимости – это пороговая (критическая) вероятность ошибки 1-го рода, т.е. непринятия гипотезы (H_0), когда она верна («ложная тревога»).
Требуемый уровень значимости α задает критическое значение для статистического теста.

Например:
Уровень значимости α=0,05 означает, что допускается не более чем 5%-ая вероятность ошибки.

В результате статистического теста на конкретных данных получают эмпирический уровень значимости p. Чем меньше значение p, тем сильнее аргументы против гипотезы (H_0).

Обобщив практический опыт, можно сформулировать следующие рекомендации для оценки p и выбора критического значения α:

Уровень
значимости (p)
Решение о гипотезе (H_0) Вывод для гипотезы (H_1)
(pgt 0,1) (H_0) не может быть отклонена Статистически достоверные доказательства не обнаружены
(0,5lt pleq 0,1) Истинность (H_0) сомнительна, неопределенность Доказательства обнаружены на уровне статистической тенденции
(0,01lt pleq 0,05) Отклонение (H_0), значимость Обнаружены статистически достоверные (значимые) доказательства
(pleq 0,01) Отклонение (H_0), высокая значимость Доказательства обнаружены на высоком уровне значимости

Здесь под «доказательствами» мы понимаем результаты наблюдений, свидетельствующие в пользу гипотезы (H_1).

Традиционно уровень значимости α=0,05 выбирается для небольших выборок, в которых велика вероятность ошибки 2-го рода. Для выборок с (ngeq 100) критический уровень снижают до α=0,01.

п.3. Критическая область

Критическая область – область выборочного пространства, при попадании в которую нулевая гипотеза отклоняется.
Требуемый уровень значимости α, который задается исследователем, определяет границу попадания в критическую область при верной нулевой гипотезе.

Различают 3 вида критических областей

Критическая область на чертежах заштрихована.
(K_{кр}=chi_{f(alpha)}) определяют границы критической области в зависимости от α.
Если эмпирическое значение критерия попадает в критическую область, гипотезу (H_0) отклоняют.
Пусть (K*) – эмпирическое значение критерия. Тогда:
(|K|gt K_{кр}) – гипотеза (H_0) отклоняется
(|K|leq K_{кр}) – гипотеза (H_0) не отклоняется

п.4. Простая гипотеза и критерии согласия

Пусть (x=left{x_1,x_2,…,x_nright}) – случайная выборка n объектов из множества (X), соответствующая неизвестной функции распределения (F(t)).
Простая гипотеза состоит в предположении, что неизвестная функция (F(t)) является совершенно конкретным вероятностным распределением на множестве (X).

Например:
Простая гипотеза и критерии согласия
Глядя на полученные данные эксперимента (синие точки), можно выдвинуть следующую простую гипотезу:
(H_0): данные являются выборкой из равномерного распределения на отрезке [-1;1]

Критерий согласия проверяет, согласуется ли заданная выборка с заданным распределением или с другой выборкой.

К критериям согласия относятся:

  • Критерий Колмогорова-Смирнова;
  • Критерий (X^2) Пирсона;
  • Критерий (omega^2) Смирнова-Крамера-фон Мизеса

п.5. Критерий согласия (X^2) Пирсона

Пусть (left{t_1,t_2,…,t_nright}) – независимые случайные величины, подчиняющиеся стандартному нормальному распределению N(0;1) (см. §63 данного справочника)
Тогда сумма квадратов этих величин: $$ x=t_1^2+t_2^2+⋯+t_n^2 $$ является случайной величиной, которая имеет распределение (X^2) с n степенями свободы.
График плотности распределения (X^2) при разных n имеет вид: Критерий согласия X^2 Пирсона
С увеличением n распределение (X^2) стремится к нормальному (согласно центральной предельной теореме – см. §64 данного справочника).

Если мы:
1) выдвигаем простую гипотезу (H_0) о том, что полученные данные являются выборкой из некоторого закона распределения (f(x));
2) выбираем в качестве теста проверки гипотезы (H_0) критерий Пирсона, –
тогда определение критической области будет основано на распределении (X^2).

Заметим, что выдвижение основной гипотезы в качестве (H_0) при проведении этого теста исторически сложилось.
В этом случае критическая область правосторонняя.
Критерий согласия X^2 Пирсона
Мы задаем уровень значимости α и находим критическое значение
(X_{кр}^2=X^2(alpha,k-r-1)), где k – число вариант в исследуемом ряду, r – число параметров предполагаемого распределения.
Для этого есть специальные таблицы.
Или используем функцию ХИ2ОБР(α,k-r-1) в MS Excel (она сразу считает нужный нам правый хвост). Например, при r=0 (для равномерного распределения):
Критерий согласия X^2 Пирсона
Пусть нам дан вариационный ряд с экспериментальными частотами (f_i, i=overline{1,k}).
Пусть наша гипотеза (H_0) –данные являются выборкой из закона распределения с известной плотностью распределения (p(x)).
Тогда соответствующие «теоретические частоты» (m_i=Ap(x_i)), где (x_i) – значения вариант данного ряда, A – коэффициент, который в общем случае зависит от ряда (дискретный или непрерывный).
Находим значение статистического теста: $$ X_e^2=sum_{j=1}^kfrac{(f_i-m_i)^2}{m_i} $$ Если эмпирическое значение (X_e^2) окажется в критической области, гипотеза (H_0) отвергается.
(X_e^2geq X_{кр}^2) – закон распределения не подходит (гипотеза (H_0) не принимается)
(X_e^2lt X_{кр}^2) – закон распределения подходит (гипотеза (H_0) принимается)

Например:
В эксперименте 60 раз подбрасывают игральный кубик и получают следующие результаты:

Очки, (x_i) 1 2 3 4 5 6
Частота, (f_i) 8 12 13 7 12 8

Не является ли кубик фальшивым?

Если кубик не фальшивый, то справедлива гипотеза (H_0) – частота выпадений очков подчиняется равномерному распределению: $$ p_i=frac16, i=overline{1,6} $$ При N=60 экспериментах каждая сторона теоретически должна выпасть: $$ m_i=p_icdot N=frac16cdot 60=10 $$ по 10 раз.
Строим расчетную таблицу:

(x_i) 1 2 3 4 5 6
(f_i) 8 12 13 7 12 8 60
(m_i) 10 10 10 10 10 10 60
(f_i-m_i) -2 2 3 -3 2 -2
(frac{(f_i-m_i)^2}{m_i}) 0,4 0,4 0,9 0,9 0,4 0,4 3,4

Значение теста: $$ X_e^2=3,4 $$ Для уровня значимости α=0,05, k=6 и r=0 находим критическое значение:
Критерий согласия X^2 Пирсона $$ X_{кр}^2approx 11,1 $$ Получается, что: $$ X_e^2lt X_{кр}^2 $$ На уровне значимости α=0,05 принимается гипотеза (H_0) про равномерное распределение.
Значит, с вероятностью 95% кубик не фальшивый.

п.6. Примеры

Пример 1. В эксперименте 72 раза подбрасывают игральный кубик и получают следующие результаты:

Очки, (x_i) 1 2 3 4 5 6
Частота, (f_i) 8 12 13 7 10 22

Не является ли кубик фальшивым?

Если кубик не фальшивый, то справедлива гипотеза (H_0) – частота выпадений очков подчиняется равномерному распределению: $$ p_i=frac16, i=overline{1,6} $$ При N=72 экспериментах каждая сторона теоретически должна выпасть: $$ m_i=p_icdot N=frac16cdot 72=12 $$ по 12 раз.
Строим расчетную таблицу:

(x_i) 1 2 3 4 5 6
(f_i) 8 12 13 7 10 22 72
(m_i) 12 12 12 12 12 12 72
(f_i-m_i) -4 0 1 -5 -2 10
(frac{(f_i-m_i)^2}{m_i}) 1,333 0,000 0,083 2,083 0,333 8,333 12,167

Значение теста: $$ X_e^2=12,167 $$ Для уровня значимости α=0,05, k=6 и r=0 находим критическое значение:
Пример 1 $$ X_{кр}^2approx 11,1 $$ Получается, что: $$ X_e^2gt X_{кр}^2 $$ На уровне значимости α=0,05 гипотеза (H_0) про равномерное распределение не принимается.
Значит, с вероятностью 95% кубик фальшивый.

Пример 2. Во время Второй мировой войны Лондон подвергался частым бомбардировкам. Чтобы улучшить организацию обороны, город разделили на 576 прямоугольных участков, 24 ряда по 24 прямоугольника.
В течение некоторого времени были получены следующие данные по количеству попаданий на участки:

Число попаданий, (x_i) 0 1 2 3 4 5 6 7
Количество участков, (f_i) 229 211 93 35 7 0 0 1

Проверялась гипотеза (H_0) – стрельба случайна.

Если стрельба случайна, то попадание на участок должно иметь распределение, подчиняющееся «закону редких событий» – закону Пуассона с плотностью вероятности: $$ p(k)=frac{lambda^k}{k!}e^{-lambda} $$ где (k) – число попаданий. Чтобы получить значение (lambda), нужно посчитать математическое ожидание данного распределения.
Составим расчетную таблицу:

(x_i) 0 1 2 3 4 5 6 7
(f_i) 229 211 93 35 7 0 0 1 576
(x_if_i) 0 211 186 105 28 0 0 7 537

$$ lambdaapprox M(x)=frac{sum x_if_i}{N}=frac{537}{576}approx 0,932 $$ Тогда теоретические частоты будут равны: $$ m_i=Ncdot p(k) $$ Получаем:

(x_i) 0 1 2 3 4 5 6 7
(f_i) 229 211 93 35 7 0 0 1 576
(p_i) 0,39365 0,36700 0,17107 0,05316 0,01239 0,00231 0,00036 0,00005 0,99999
(m_i) 226,7 211,4 98,5 30,6 7,1 1,3 0,2 0,0 576,0
(f_i-m_i) 2,3 -0,4 -5,5 4,4 -0,1 -1,3 -0,2 1,0
(frac{(f_i-m_i)^2}{m_i}) (результат) 0,02 0,00 0,31 0,63 0,00 1,33 0,21 34,34 36,84

Значение теста: (X_e^2=36,84)
Поскольку в ходе исследования мы нашли оценку для λ через подсчет выборочной средней, нужно уменьшить число степеней свободы на r=1, и критическое значение статистики искать для (X_{кр}^2=X^2(alpha,k-2)).
Для уровня значимости α=0,05 и k=8, r=1 находим:
Пример 2
(X_{кр}^2approx 12,59)
Получается, что: (X_e^2gt X_{кр}^2)
Гипотеза (H_0) не принимается.
Стрельба не случайна.

Пример 3. В предыдущем примере объединили события x={4;5;6;7} с редким числом попаданий:

Число попаданий, (x_i) 0 1 2 3 4-7
Количество участков, (f_i) 229 211 93 35 8

Проверялась гипотеза (H_0) – стрельба случайна.

Для последней объединенной варианты находим среднюю взвешенную: $$ x_5=frac{4cdot 7+5cdot 0+6cdot 0+7cdot 1}{7+1}=4,375 $$ Найдем оценку λ.

(x_i) 0 1 2 3 4,375
(f_i) 229 211 93 35 8 576
(x_if_i) 0 211 186 105 35 537

$$ lambdaapprox M(x)=frac{sum x_if_i}{N}=frac{537}{576}approx 0,932 $$ Оценка не изменилась, что указывает на правильное определение средней для (x_5).
Строим расчетную таблицу для подсчета статистики:

(x_i) 0 1 2 3 4,375
(f_i) 229 211 93 35 8 576
(p_i) 0,3937 0,3670 0,1711 0,0532 0,0121 0,9970
(m_i) 226,7 211,4 98,5 30,6 7,0 574,2
(f_i-m_i) 2,3 -0,4 -5,5 4,4 1,0
(frac{(f_i-m_i)^2}{m_i}) 0,02 0,00 0,31 0,63 0,16 1,12

Значение теста: (X_e^2=1,12)
Критическое значение статистики ищем в виде (X_{кр}^2=X^2(alpha,k-2)), где α=0,05 и k=5, r=1
Пример 3
(X_{кр}^2approx 7,81)
Получается, что: (X_e^2lt X_{кр}^2)
Гипотеза (H_0) принимается.
Стрельба случайна.

И какой же ответ верный? Полученный в Примере 2 или в Примере 3?
Если посмотреть в расчетную таблицу для статистики (X_e^2) в Примере 2, основной вклад внесло слагаемое для (x_i=7). Оно равно 34,34 и поэтому сумма (X_e^2=36,84) в итоге велика. А в расчетной таблице Примера 3 такого выброса нет. Для объединенной варианты (x_i=4,375) слагаемое статистики равно 0,16 и сумма (X_e^2=1,12) в итоге мала.

Правильный ответ – в Примере 3.
Стрельба случайна.

Внимание!Критерий согласия (X^2) чувствителен к низкочастотным (редким) событиям и может ошибаться на таких выборках. Поэтому низкочастотные события нужно либо отбрасывать, либо объединять с другими событиями. Эта процедура называется коррекцией Йетса.

Добавить комментарий