2.11. СОСТАВНАЯ БАЙЕСОВСКАЯ ЗАДАЧА ПРИНЯТИЯ РЕШЕНИЙ И КОНТЕКСТ
Вернемся к ранее рассмотренному примеру разработки классификатора для сортировки двух видов древесины — ясеня и березы. Первоначально было принято, что последовательность видов древесины настолько непредсказуема, что состояние природы представляется чисто случайной переменной. Не отказываясь от этого, предположим, что последовательные состояния природы могут и
не быть статистически независимыми. Например, если даже априорные вероятности для ясеня и березы оказываются равными, то может оказаться, что при появлении некоторого куска древесины более вероятно, что несколько последующих кусков будут того же самого вида. В этом случае последовательные состояния природы находятся в некоторой зависимости, которую можно использовать для улучшения образа действия. Это один из примеров ориентации на контекст при выборе решения.
Способ использования такой информации будет несколько варьироваться в зависимости от того, есть ли возможность дожидаться выхода
кусков древесины, после чего принимать все
решений сразу, или же принимать решение надо при появлении каждого куска древесины. Первая задача называется составной задачей принятия решений, а вторая — последовательной составной задачей принятия решений. Рассмотрим первый случай как более наглядный.
Для формулировки задачи в общем виде обозначим
состояний природы вектором
где
относится к одному из с значений
. Пусть
есть априорная вероятность
состояний природы. Пусть
есть матрица, определяющая
наблюдаемых векторов признаков, где
есть вектор признаков, получаемый при состоянии природы
. И наконец, пусть
— функция плотности условного распределения величины X при условии, что множество состояний природы есть
. В этом случае апостериорная вероятность состояния со определяется выражением
где
Для составной задачи принятия решений в общем случае можно определить матрицу потерь и отыскивать решающее правило, минимизирующее составной риск. Данная теория строится
аналогии с ранее рассмотренной простой задачей принятия решения, приводя в итоге к тому, что оптимальная процедура состоит в минимизации составного условного риска. В частном случае, если при правильном решении потери отсутствуют и если все ошибки имеют одинаковую цену, то процедура сводится к вычислению
для всех
и выбору такого
, апостериорная вероятность которого наибольшая.
Так как при этом требуется проделать все необходимые вычисления для определения
задача на практике часто оказывается чересчур громоздкой. Если каждая из компонент со
может принимать одно из с значений, то необходимо рассмотреть
возможных
значений
. Задача несколько упрощается в случае, когда распределение вектора признаков
зависит от соответствующего состояния природы
и не зависит от других векторов признаков и состояний природы. Общая плотность
определяется при этом просто произведением плотностей компонент
Таким образом, вычисление
при этом упрощается, однако все еще сохраняются трудности определения априорной вероятности
Эта вероятность, отражающая взаимосвязь состояний природы, лежит в основе составной байесовской задачи принятия решения. Поэтому задачу вычисления
нельзя упрощать, вводя предположение о независимости состояний природы. Кроме того, на практике обычно стараются каким-нибудь способом избавиться от вычисления
для всех
возможных значений
Оставим эти задачи предметом для дополнительных раздумий, а читателей, интересующихся дальнейшими подробностями, отошлем к соответствующей литературе.