Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
2.3. Итерационный алгоритм нахождения стратегийЗдесь будет приведен итерационный алгоритм нахождения стратегий для процесса с одним эргодическим классом. Методы данной главы являются частным случаем методов, представленных в гл. 3. Предположение о наличии лишь одного эргодического класса позволяет упростить выкладки. В этой и следующей главах мы будем рассматривать исключительно стационарные стратегии и обозначать их Пусть величина удовлетворяет рекуррентному соотношению
где
Лемма 2.4. Если
где
Доказательство.
Полагая
получим (2.24). Заметим, что если в данной лемме вместо вектора Если
или
Равенство (2.27) определяет Далее, определим процедуру улучшения решения. Применим для этого эвристический подход Ховарда [63]. При достаточно больших
Так как
Член
по всевозможным решениям, принимаемым в каждом состоянии, используя известные значения Если существует стратегия
то эта стратегия лучше Теорема 2.2. Если при некотором Доказательство. Пусть
Для двух стратегий
Вычитая (2.33) и (2.32) и полагая
получим
Умножая обе части этого равенства слева на предельный вектор
поскольку Представим итерационный алгоритм нахождения стратегий для процесса с одним эргодическим классом в следующем виде. Процедура определения весов. Возьмем любую стационарную стратегию
относительно Процедура улучшения решения. Используя найденные значения
при всех Если в процедуре улучшения решения существуют два или более решений из множества
О причинах такого выбора будет сказано в разделе 2.5.
|
1 |
Оглавление
|