8.4. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ
В гл. 4 мы уже упоминали об обширном классе двухальтернативных задач, связанных с проверкой гипотезы о том, что совокупность наблюдаемых данных подчиняется некоторому заданному распределению вероятности при свободной альтернативе, т. е. в предположении, что наряду с выполнением этой гипотезы могут встретиться какие угодно случаи. Там же был рассмотрен пример такой задачи в параметрическом варианте, когда класс возможных распределений вероятности ограничен некоторым параметрическим семейством с совершенно произвольными значениями параметров. При отсутствии такого ограничения задача приобретает дополнительною специфику, связанную с очень большой степенью априорной неопределенности и необходимостью
- трического решения. Правило решения этой задачи, по установившаяся терминологии, называется критерием согласия и неоднократно пасем ч-тривалось в литературе по математической статистике, явдяясь
ческим примером задачи принятия решения в условиях априорной неопределенности. Покажем, как получить известные и
непарс метрические критерии согласия на основе адаптивного байесова подседа.
Сформулируем более четко постановку задачи. Пусть имеется совокупность независимых наблюдений
и функция распределения величины
есть либо
либо
причем функция распределения
известна, а функция распределения
полностью неизвестна и совершенно произволона. На основании наблюдения совокупности данных
требуется решить, какая из альтернатив имеет место в действительности:
1)
-выборка
описывается распределением вероятности с функцией распределения
2)
-выборка
не описывается распределением вероятности с функцией распределения
а оппеывгчтея распределением вероятности с какой-то иной отличной от
функцией распределения
Обозначим решения, состоящие в принятии первой
второй альтернативы, через
соответственно и определим функцию потерь
Обычно для правильных решений принимаются нулевые потери
а значение потерь от принятия решьиия
(решение о том, что выборка не согласуется с заданной функцией распределения
когда на самом деле совокупность данных
описывается функцией распределения
бьпь
принято равности произвольной константе, без ограничения
Потери
от принятия решения
выборка описывается функцией распределения
когда на самом деле она не описывается
естественно задать
чтобы они были малы, если различие между функциями распредения
мало, и увеличивались по мере роста различий между этими
акциями распределения, т. е.
Для того чтобы задача имела нетривиальное решение, функнция
должен обращаться в нуль
Это естественное требование соответствует тому очевидному факту, что при
потери должны обращаться в нуль, поскольку вторая альтернатива совпадает с первой. В качестве функционала
удовлетворяющего всем перечисленным требованиям, удобно взять ту или иную меру различия
в функциональном пространстве функций распределения. Примерами таких мер являются
и т. д.
Зададим также априорные вероятности альтернатив
и введем произвольное рандомизированное правило решения, определив для этого решающую функцию
-вероятность принять решение
если наблюдаемая совокупность данных есть
Тогда средний риск
естественно зависит от неизвестной функции распределения
и поэтому также неизвестен.
Предположим на время, что функция распределения,
известна и равна
т. е. речь идет о задаче проверки гипотезы с простой заданной альтернативой
Тогда, применяя обычный байесов подход, получаем нерандомизированное правило решения:
Неравенство (8.4.5), определяющее условия принятия решения
о том, что выборочные данные согласуются с распределением вероятности, задаваемым функцией распределения
можно переписать в следующем виде:
-некоторая функция выборочных данных, определяемая при известной
левой частью неравенства (8.4.5).
При неизвестной функции распределения
в соответствии с общими. принципами адаптивного байесова подхода нужно заменить незаметные нам лам статистические описания данных наблюдения оценочными значениями, полученными с помощью тех же данных наблюдения. В данном случае нам неизвестны как функция потерь — величина
зависящая от неизвестной функции распределения
так и отношение правдоподобия
входящее в функцию
и зависящее от неизвестной плотности вероятнасти
Состоятельной оценкой функции распределения
в предположении, что имеет место вторая альтернатива, является выборочная функция распределения
где
а состоятельной оценкой
величина
которая зависит от совокупности имеющихся данных
Нужно отметить, что, используя (8.4.7), мы уже израсходовали все имеющиеся данные наблюдения на оценку функции распределения
и функции потерь
Такая политика в отношении распределения имеющейся информации для устранения априорной неопределенности является в данном случае правильной, поскольку все равно без дополнительных предположений о возможном виде функции распределения
(т. е. ограничения второй альтернативы) никакой состоятельной оценки плотности вероятности
и функции правдоподобия, входящей в величину
не существует. Лучшее, что можно сделать в этих условиях, — заменить в
его состоятельной оценкой
из (8.4.9), а
некоторой константой.
В результате приходим к следующему правилу решения, определяющему непараметрический критерий согласия: решение
о том, что совокупность данных наблюдения
подчиняется распределению с функцией распределения
принимается в том случае, если выполняется неравенство
Различным определениям меры различия
соответствуют разные критерии согласия: для (8.4.1) получается критерий Колмогорова, для
-критерий
Мизеса — Смирнова и т. д. Константа С в (8.4.10) обычно выбирается так, чтобы вероятность принять решение
когда выполняется первая альтернатива
была равна заданной величине.
Правило решения (8.4.10) обладает следующими свойствами асимптотической инвариантности: при
распределение вероятности случайной величины
в случае, если выборка
описывается функцией распределения
не зависит от вида этой функции, т. е. получается универсальным для всех
а в случае, если выборка описывается функцией распределения
зависит от истинной величины
Асимптотические свойства критериев согласия (8.4.10) и их поведение при конечных
подробно исследованы в литературе по математической статистике.
Совершенно аналогично можно получить решение некоторых более сложных задач проверки гипотезы со свободной альтернативой. Пусть,
например, имеется две совокупности данных наблюдения
и требуется решить, подчиняются ли они одному и тому же распределению вероятности (на этот раз неизвестному) или нет. Если обозначить
выборочные фикции распределения, построенные по совокупности х и у соответственно, то аналогично (8.4.10) правило решения для этой задачи определяется следующим неравенством:
При этом меру
обычно задают так, что она удовлетворяет требованиям, вытекающим из обычного определения расстояния, т. е.
(Заметим, что функции
из (8.4.2), (8.4.3) не отвечают этому свойству.) В частности, для
из (8.4.1) получаем известный критерий Смирнова.
Можно еще усложнить постановку задачи с учетом возникающих практических потребностей. Пусть, например, задана некоторая функция
и производятся две независимые серии наблюдений
Требуется принять решение, связаны ли эти величины заданной функ циональной зависимостью, т. е. являются ли случайные величины
значениями функции
от случайного аргумента с тем же распределением вероятности, что и любая из величин Осуществим преобразование случайных величин
в соответствии с правилом
в результате чего получим совокупность данных
Тогда поставленная задача статистического решения сводится к задаче проверки гипотезы о том, что совокупности
подчиняются одному и тому же распределению вероятности, а непараметрическое правило ее решения дается неравенством (8.4.12), где
В заключение отметим, что приведенные в этой главе примеры применения адаптивного байесова подхода, несмотря на довольно значительную общность каждого из них, ни в коей мере не исчерпывают даже небольшой доли того громадного множества задач, которое возникает в практических приложениях. Однако читатель получил определенное представление о возможностях применения адаптивного байесова подхода к задачам с непараметрической априорной неопределенностью и сможет применить при необходимости изложенные выше методы.