§ 11.5. Задачи проверки гипотез
Рассмотрим теперь задачу статистического решения, в которой пространство решений содержит ровно два решения: Допустим, что решение следует принимать, если параметр лежит в некотором подмножестве параметрического пространства Q, а принятие решения целесообразно, лежит в дополнительном множестве Однако в или могут быть точки, для которых решения и одинаково целесообразны. Мы упростим наши обозначения и будем писать вместо для обозначения ущерба при и решении Примем, что функция потерь имеет такой вид:
Здесь «Зона безразличия» для которой одинаково целесообразны, задается так:
Во многих задачах Иногда состоит из точек про странства пограничных между и вероятность этого множества при данном априорном распределении равна 0. Но в некоторых задачах множество может быть «больше» и может иметь положительную вероятность.
Задачи, включающие в себя лишь два решения, известны как задачи проверки гипотез. Пусть гипотеза состоит в том, что лежит в множестве а альтернативная гипотеза в том, что лежит в множестве Если вероятность «зоны безразличия» равна 0, то выбор решения в этой ситуации равносилен принятию гипотезы и отвержению гипотезы Аналогично выбор решения равносилен отклонению и принятию . В качестве общепринятого пособия по общей теории проверки гипотез можно рекомендовать монографию Лемана (1959).
Гипотеза называется простой, если множество содержит ровно одну точку, и сложной, если содержит более одной точки.
Метод проверки простой гипотезы против простой альтернативной гипотезы был детально изложен в § 8.11. В этом случае как так и содержат ровно две точки. Вообще говоря, с помощью излагаемых здесь методов можно рассматривать любую задачу проверки простых или сложных гипотез Однако ввиду различия в размерностях и часто нужно использовать специальные типы априорных распределений. Например, в некоторых задачах параметрическое пространство есть -мерное пространство а множество содержит лишь одну точку. Такая ситуация возникает в том случае, когда в силу принятых воззрений или на основе какой-либо физической теории статистик имеет основания полагать, что параметр имеет определенное значение но допускает и должен исследовать возможность и других значений . В ситуациях такого типа гипотезу часто называют нулевой гипотезой. Априорное распределение обычно таково, что а оставшаяся мера распределена на согласно некоторой п. р. в. Таким образом, для всех подмножеств
Предположим теперь, что статистик наблюдает значение случайной величины или случайного вектора X, для которого задана семейство условных о. в. п. . Тогда апостериорная вероятность того, что если удовлетворяет следующему соотношению:
Точно также, если верна гипотеза то апостериорная п. р. в. параметра на множестве задается формулой
Для простоты обозначений и расчетов в интегралах, входящих в (3) и (4), стоит всё множество вместо подмножества Поскольку мы считаем, что есть п. р. в. на добавление или удаление одной точки не влияет на значение интеграла.