Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
1.2. Итерационный алгоритм нахождения стратегийНиже мы приведем итерационный алгоритм нахождения стратегий для марковских процессов принятия решений с переоценкой, который был впервые предложен Ховардом [63] и поэтому иногда называется итерационным алгоритмом Ховарда. Он тесно связан с линейным программированием, и эта связь будет позднее обсуждена. Материал этого параграфа является основой для рассмотрения общих процессов принятия решений в гл. 7. Пусть
Стратегия Стационарная стратегия
обозначается При любой стратегии
где
Чтобы показать ограниченность этого вектора, положим
где Справедливы следующие равенства:
где Определим векторные неравенства следующим образом. Для любых векторов Определение 1.1. Стратегия Это определение означает, что оптимальная стратегия оптимальна одновременно для всех начальных состояний — факт, не являющийся тривиальным, как будет показано далее. Из определения следует, что Лемма 1.1. Оператор Доказательство. Пусть Отсюда получаем следующие теоремы. Теорема 1.1. Если Доказательство. По предположению теоремы при всех Неоднократное применение этого соотношения приводит к неравенству
справедливому при всех Доказательство. По предположению Следующая теорема является основной. Теорема 1.3. Пусть
где 1) Если 2) Если и б)
Доказательство, Следствие. Существует стационарная Доказательство. По теореме 1.3 любая стационарная стратегия Доказанные теоремы содержат описание метода нахождения оптимальной стационарной стратегии. Этот метод, называемый итерационным алгоритмом Ховарда, состоит из следующих двух процедур. Процедура определения весов. Выбирая произвольную политику
относительно Процедура улучшения решения. Используя найденные значения найдем при каждом
Если множества В качестве начальной стратегии можно взять, например, такую, в которой В разделе 1.6 будут даны численные примеры применения итерационного алгоритма.
|
1 |
Оглавление
|