1.3.2. Общая методика проверки статистических гипотез.
Обозначим через
количество наблюдений, на основе которых принимается или отвергается некоторая гипотеза, подлежащая проверке. Любой возможный исход
последовательных наблюдений образует выборку объемом
Методика проверки, приводящей к принятию или отклонению проверяемой гипотезы, заключается просто в некотором правиле, определяющем на основании каждой возможной выборки объема
следует ли принять или отвергнуть данную гипотезу.
Эту мысль можно также выразить следующим образом: методика проверки заключается в подразделении множества всех возможных выборок объема
на два непересекающихся подмножества (скажем, подмножество 1 и подмножество 2) и в применении следующего правила: проверяемая гипотеза должна быть отвергнута, если наблюденная выборка попадает в подмножество 1, и должна быть принята, если наблюденная выборка принадлежит подмножеству 2. Подмножество 1 называют также критической областью. Поскольку подмножество 2 состоит из всех тех выборок объема
которые не вошли в подмножество 1, то подмножество 2
однозначно определяется заданием подмножества 1. Таким образом, выбор той или иной методики проверки эквивалентен выбору критической области.
В качестве иллюстрации рассмотрим несколько примеров. Предположим, что партия товара, состоящая из
промышленных изделий, подвергается приемочному контролю. Будем считать, что каждое изделие можно отнести к одной из двух категорий: либо оно дефектно, либо недефектно. Относительное количество
дефектных изделий в проверяемой партии считается неизвестным. Обозначим через
такую величину, лежащую между нулем и единицей, что считается целесообразным принять партию товара, если относительное количество дефектных изделий
меньше или равно этой величине. В противном случае, т. е. когда
мы предпочитаем забраковать партию. Предположим, что проверяется выборка из
изделий, случайным образом выбранная из рассматриваемой партии, и по результатам этой проверки выносится решение о принятии или отклонении гипотезы
Критическую область, обычно используемую в подобных случаях, можно определить следующим образом: гипотеза
отвергается, т. е. партия товара бракуется, в том (и только в том) случае, если относительное количество дефектных изделий в выборке из
изделий превысит соответствующим образом выбранную постоянную величину с.
Второй пример. Предположим, что мы производим измерение длины стержня при помощи инструмента, ошибка измерения которого распределена по нормальному закону с единичной дисперсией, так что результат х нашего измерения является нормально распределенной случайной величиной со средним значением
равным истинной длине стержня, и с дисперсией, равной единице. Допустим, что мы проверяем гипотезу о том, что истинная длина стержня равна некоторой заданной величине
Эта гипотеза должна быть проверена на основе выборки, состоящей из
независимых измерений
длины стержня. Критическая область, обычно используемая в подобных случаях, определяется следующим образом: гипотеза о том, что
отвергается тогда (и только тогда), когда наблюденная выборка такова, что
где
среднее арифметическое значение
наблюдений, с — соответствующим образом выбранная постоянная.
Вообще говоря, существует бесконечное количество способов выбора критической области. Так, в последнем примере
мы могли бы использовать не среднее арифметическое значение наблюдений, а медиану, среднее геометрическое, среднее гармоническое или некоторое другое среднее значение наблюдений.
Очевидно, что различным образом выбранные критические области не могут приводить к одинаково хорошим результатам. Поэтому основная проблема, связанная с проверкой статистических гипотез, заключается в установлении некоторых принципов для соответствующего выбора критической области. Такие принципы были выдвинуты
Нейманом и
Пирсоном. В следующем пункте мы кратко обсудим основную идею теории Неймана — Пирсона.