Пред.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
2.3. Итерационный алгоритм нахождения стратегийЗдесь будет приведен итерационный алгоритм нахождения стратегий для процесса с одним эргодическим классом. Методы данной главы являются частным случаем методов, представленных в гл. 3. Предположение о наличии лишь одного эргодического класса позволяет упростить выкладки. В этой и следующей главах мы будем рассматривать исключительно стационарные стратегии и обозначать их Пусть величина удовлетворяет рекуррентному соотношению
где
Лемма 2.4. Если
где
Доказательство.
Полагая
получим (2.24). Заметим, что если в данной лемме вместо вектора Если
или
Равенство (2.27) определяет Далее, определим процедуру улучшения решения. Применим для этого эвристический подход Ховарда [63]. При достаточно больших
Так как
Член
по всевозможным решениям, принимаемым в каждом состоянии, используя известные значения Если существует стратегия
то эта стратегия лучше Теорема 2.2. Если при некотором Доказательство. Пусть
Для двух стратегий
Вычитая (2.33) и (2.32) и полагая
получим
Умножая обе части этого равенства слева на предельный вектор
поскольку Представим итерационный алгоритм нахождения стратегий для процесса с одним эргодическим классом в следующем виде. Процедура определения весов. Возьмем любую стационарную стратегию
относительно Процедура улучшения решения. Используя найденные значения
при всех Если в процедуре улучшения решения существуют два или более решений из множества
О причинах такого выбора будет сказано в разделе 2.5.
|
1 |
Оглавление
|