19.4. ПОСЛЕДОВАТЕЛЬНЫЕ ПРОЦЕДУРЫ ПРИНЯТИЯ РЕШЕНИЙ
19.4.1. ОСНОВНЫЕ ИДЕИ
Теория последовательного принятия решений развивается очень интенсивно, и мы в этом разделе ограничимся только описанием существа основных задач, а в деталях рассмотрим только «деревья решений».
Для определенности рассмотрим такую задачу. Предпринимается начальное действие
после этого мир оказывается в (неопределенном) состоянии
затем предпринимается дальнейшее действие
Рис. 19.4.1. Схема «двухэтапной» последовательной задачи принятия решений
приводящее к неопределенному состоянию
и в итоге получаем последствие
Каким образом исследователь должен подходить к задаче выбора начального действия?
Описанная ситуация изображена на рис. 19.4.1, где квадратами обозначены точки принятия решений (в которых исследователь выбирает действие), а кружками — точки неопределенности (в которых выясняется неконтролируемое состояние природы). Предположим, что конечному последствию приписана определенная полезность
Мы изобразили лишь конечный «веер» возможных действий, выходящий из каждой точки принятия решений. Конечный веер возможных исходов, исходящий из точки неопределенности, вообще говоря, может быть непрерывным диапазоном как решений, так и исходов. Поэтому на рис. 19.4.1 нужно смотреть лишь как на чисто условную схему ситуации.
Существо проблемы последовательного принятия решений состоит в том, что мы не можем разумно решить, что делать на начальной стадии, пока не продумаем все возможные последствия
Поэтому мы начинаем с правого конца дерева и спрашиваем, что бы мы хотели сделать во второй точке принятия решений, если первоначально было выбрано действие
а исход оказался
Такой подход приводит к дереву, изображенному на рис. 19.4.2. При данном выборе
распределение вероятностей для неизвестного второго исхода
имеет вид
Используя для удобства интегральную форму (соответствующую непрерывному диапазону изменения
можно записать условие, определяющее оптимальное действие и ожидаемую полезность, в виде
Таким образом, для данных
определена максимальная полезность. Ситуацию, с которой исследователь встретился на первом этапе, можно теперь изобразить так, как это показано на рис. 19.4.3. Отсюда видно, что полное решение задачи определяется из условия
Рис. 19.4.2. Модификация рис. 19.4.1 для случая, когда известно, что исходом на начальном этапе является
Рис. 19.4.3. Решение на первом этапе (в предположении оптимальности решения на втором)
Очевидно, что для
-шаговой задачи структура решения остается такой же. Начиная с правой стороны дерева и проходя последовательно через вершины неопределенности и решения, мы будем повторять процедуры взятия математического ожидания и максимизации. При использовании этой процедуры возникают сложности. Во-первых, заметим, что в ней неявно используются все возможные «предыстории» процесса (т. е. все комбинации действий, которые можно было предпринять, и исходов, которые могли быть). Во-вторых, распределение вероятностей исходов на данной стадии должно быть условным по отношению к предшествующей истории процесса. При этом вычисления могут стать очень сложными, если только структура задачи не позволяет упростить возникающие рекуррентные формулы.
Рассмотрение многих частных случаев и соответствующего математического аппарата можно найти, например, в книге [DeGroot (1970)], к которой мы и отсылаем интересующегося читателя.
Однако в случае конечных множеств действий и исходов задачи могут быть описаны и решены при помощи стандартного простого подхода с использованием дерева решений. Эти методы описываются в следующем разделе.