4.5. Проверка гипотез
Пусть дана некоторая оценка построенная по выборке из независимых наблюдений случайной величины х. Предположим, что есть основания считать истинное значение оцениваемого параметра равным Однако даже если истинное значение параметра равно выборочные значения вероятно, не будут в точности равняться из-за выборочной изменчивости, присущей Поэтому возникает следующий вопрос. Если предположить, что то при каком отклонении от эта гипотеза должна быть отвергнута как несостоятельная? На этот вопрос ответ можно дать в статистических терминах, вычислив вероятность любого значимого отклонения от по выборочному распределению Если вероятность такого отклонения мала, то отличие следует считать значимым, и гипотеза должна быть отвергнута. Если же вероятность такого отличия велика, то отклонение следует приписать естественной статистической изменчивости, и гипотеза может быть принята.
Это рассуждение представляет собой простейший вид статистической процедуры, называемой проверкой гипотез. Для уяснения общего подхода предположим, что выборочное значение являющееся оценкой параметра имеет плотность вероятности . Теперь, если гипотеза верна, должна иметь среднее значение (рис. 4.2). Вероятность того, что окажется меньше нижней границы равна
а вероятность того, что превзойдет верхнюю границу равна
Рис. 4.2. Области принятия и отклонения гипотезы при проверке гипотез.
Следовательно, вероятность того, что окажется вне интервала, заключенного между есть а. Пусть теперь а настолько мало, что представляется крайне неправдоподобным выход за пределы интервала, заключенного между Если бы выборка была такой, что вычисленное по ней значение оказалось вне интервала, заключенного между появились бы серьезные основания сомневаться в истинности исходной гипотезы поскольку в случае ее истинности такое значение было бы крайне неправдоподобным. Следовательно, гипотезу нужно отвергнуть. С другой стороны, если значение попадает в интервал, заключенный между то нет никаких серьезных оснований ставить под сомнение истинность исходной гипотезы. Поэтому гипотеза может быть принята.
Вероятность а, использованная при испытании гипотез, называется уровнем значимости критерия. Область значений при которых гипотеза должна быть отвергнута, называется областью отклонения гипотезы или критической областью. Область значений при которых гипотеза принимается, называется областью принятия гипотезы. Описанный выше простой критерий испытания гипотез называется двусторонним критерием, так как в том случае, когда гипотеза неверна, значение может быть либо больше либо меньше. Следовательно, нужно проверять значимость отклонений от в обе стороны. В других случаях достаточно бывает односторонних критериев. Например, пусть гипотеза состоит в том, что В этой ситуации гипотеза будет неверна только тогда, когда меньше Следовательно, в критерии должна использоваться только нижняя граница, определяемая по плотности вероятности
При проверке гипотез возможны два типа ошибок. Во-первых, гипотеза может быть отклонена, хотя фактически она верна. Такая ошибка называется ошибкой первого рода. Во-вторых, гипотеза может быть принята, хотя фактически она неверна. Такая ошибка называется ошибкой второго рода. Из рис. 4.2 видно, что ошибка первого рода происходит в том случае, когда при справедливости гипотезы попадает в область ее отклонения. Следовательно, вероятность ошибки первого рода равна а, т. е. уровню значимости критерия.
Для определения вероятности ошибки второго рода следует уточнить каким-то образом отклонение истинного значения параметра от постулируемого гипотезой и подлежащего проверке значения Предположим, к примеру, что истинный параметр равен либо либо как показано на рис. 4.3. Если гипотеза состоит в том, что тогда как на самом деле то вероятность того, что попадет в область принятия гипотезы, заключенную между равна Следовательно, вероятность ошибки второго рода равна при выявлении отклонений величиной от гипотетического значения
Вероятность называется мощностью критерия. Очевидно, что при любом данном размере выборки вероятность ошибки первого рода может быть сделана как угодно малой за счет уменьшения уровня значимости а. Однако при этом возрастет вероятность ошибки второго рода
Рис. 4.3. Определение ошибки второго рода при проверке гипотез.
(уменьшится мощность критерия). Единственный способ одновременно уменьшить и состоит в увеличении размера выборки используемой для вычисления оценки Такие соображения лежат в основе выбора нужного размера выборки в статистических экспериментах.
ПРИМЕР 4.2. ПОСТРОЕНИЕ КРИТЕРИЯ ПРОВЕРКИ ГИПОТЕЗ. Предположим, что есть основания считать, что среднее значение случайной величины х равно Предположим далее, что дисперсия х известна и равна Найдем размер выборки, позволяющей построить критерий проверки гипотезы -уровнем значимости и -ошибкой второго рода для выявления -отклонений от гипотетического значения. Построим также область принятия гипотезы для данного критерия.
Выборочное среднее х, определенное формулой (4.3), является несмещенной оценкой Соответствующее выборочное распределение х определяется из соотношения (4.34):
где нормальная случайная величина с нулевым средним значением и единичной дисперсией. Отметим, что такое выборочное распределение х будет точным, если распределена нормально, и приближенным, если распределение х отлично от нормального.
Верхняя и нижняя границы области принятия гипотезы в данном критерии соответственно равны
Если теперь истинное среднее значение равно на самом деле то с вероятностью произойдет ошибка второго рода, если выборочное
значение окажется меньше верхней границы или больше нижней. В терминах выборочного распределения х с средним или имеем соответственно для верхней и нижней границ
Итак, справедливы следующие равенства:
Оба эти соотношения дают
Отсюда находим требуемый размер выборки
При конкретных значениях, принятых в данном примере требуемый размер выборки равен Область принятия гипотезы в данном критерии определяется соответственно следующими верхней и нижней границами: