3.5.3. Байесовский последовательный критерий.
Последовательный критерий можно также применять для того, чтобы сократить количество наблюдаемых переменных, требуемых для принятия решения. Это целесообразно в случае, если у каждого объекта отдельные признаки проверяют последовательно. Однако на пути применения такого подхода встречается много трудностей.
1) Наблюдаемые переменные взаимно коррелированы и имеют разные распределения.
2) Значение порога должно изменяться при каждом наблюдении. На рис. 3.9 изображен пример классификации двумерного
Рис. 3.9. Последовательный критерий для одного объекта.
объекта на классы
Если наблюдается случайная величина
то для отношения правдоподобия можно установить значения порогов равными
Однако, если наблюдаются дне случайные величины
то
должно быть равно
так как нельзя откладывать принятие решения до предъявления следующей переменной. Как правило, предполагают, что по мере увеличения к значения порогов
стремятся к одному и тому же значению.
3) Вероятность ошибки определяется условными плотностями вероятности
при наблюдении всего набора из
переменных.
Последовательный критерий не уменьшает вероятность ошибки, но сокращает число переменных, требуемых для принятия решения. Поэтому такая процедура может быть оправдана, если стоимость наблюдения каждой переменной является существенным фактором.
Хотя вычислительная процедура обычного байесовского последовательного критерия очень сложна, этот критерий используют для последовательной проверки признаков объекта. Байесовский риск можно представить следующим образом:
где
— стоимость наблюдений
— математическое ожидание штрафа для случая, когда
и использовано решающее правило
— область пространства X, для которой последовательность испытаний заканчивается при
наблюдении. В случае байесовского критерия необходимо отыскать решающие правила
минимизирующие риск
для заданного множества стоимостей наблюдений.
В заключение данного параграфа сделаем следующие замечания.
1) Для нахождения решающих правил
минимизирующих риск
можно использовать метод динамического программирования
2) Значения порогов для отношения правдоподобия становятся равными константе, независимой от числа наблюдений, если выполняются следующие три условия: а) стоимость наблюдения каждой переменной не меняется; б)
— независимые и одинаково распределенные случайные величины; в) количество переменпых
неограничено. Эти условия выполняются, если объекты наблюдаются последовательно, как предполагалось в начале
этого параграфа. Даже для этого упрощенного случая вычисление значений порога представляется достаточно сложным и должно выполняться численными методами [Хелстрем, 1968;. Блэкуэлл, Гиршак, 1954].