3.1.2. Байесовское решающее правило, минимизирующее функцию риска.
Решающее правило
было получено из условия, что предъявляемый объект отпосится к классу, характеризуемому наибольшей апостериорной вероятностью. Одпако можно сформулировать решающее правило, исходя из несколько иных соображений.
Предположим, что, принимая решение, мы должны платить штраф. Величина штрафа зависит от того, к какому истинному классу припадлежит классифицируемый объект. Можно ввести четыре типа штрафов:
Предположим, что ошибочное решение штрафуется больше чем правильное, т. е.
Пусть и
— области тех значений вектора X, для которых принимаются решения
соответственно. Мы хотим выбрать области
так, чтобы минимизировать математическое ожидание штрафа, или риск
Так как области
пересекаются и в совокупности покрывают пространство, то
Используя выражение (3.15), математическое ожидание (3.14) можно представить в виде
Теперь задача заключается в том, чтобы выбрать область
из условия минимума риска
Предположим, что для данного X подынтегральное выражение в формуле (3.16) отрицательно. Тогда можно уменьшить риск
путем отнесения X к области
Если же подынтегральное выражение положительно, то можно уменьшить
путем отнесения X к области
Таким образом, решающее правило, минимизирующее риск, заключается в том, что к области
относятся те и только те объекты X, для которых подынтегральное выражение в (3.16) является отрицательным. Это решающее правило можно представить следующим неравенством:
или
где
— положительные величины, что следует из неравенства (3.13). Это решающее правило называют байесовским критерием, минимизирующим риск.
Сравнивая выражение (3.18) с (3.4), можно заметить, что байесовский критерий, минимизирующий риск, является критерием отношения правдоподобия, по с другим порогом по сравнению с критерием (3.4). Кроме того, назначение штрафа за решение эквивалентно изменению априорных вероятностей
Для частного случая, когда штрафы (3.12) связаны соотношением
выражения (3.18) и (3.4) совпадают. Это так называемый случай симметричной функции штрафа, при которой штрафом является вероятность ошибки, и критерий (3.4) минимизирует вероятность ошибки. Другие функции штрафа используются тогда, когда неправильное решение для одного класса является более критичным, чем неправильное решение для другого класса.