Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Глава 1. Марковские процессы принятия решений с переоценкой1.1. ВведениеРассмотрим систему, у которой пространство состояний 5 содержит конечное число элементов. Пусть 5 совпадает с множеством целых чисел Пространством политик К назовем прямое произведение множеств решений, т. е. Если система находится в состоянии
Рассмотрим процесс с переоценкой. Пусть Зададим начальное распределение
где
Тогда система описывается неоднородной цепью Маркова с доходами. Будем искать стратегии, максимизирующие суммарный средний доход с учетом переоценки при конечном или бесконечном времени планирования, причем стратегия определяется, как последовательность решений, принимаемых в каждый момент времени во всех состояниях В данной главе анализируются процессы принятия решений с переоценкой при бесконечном времени планирования, причем рассматривается задача максимизации (задача минимизации сводится к ней путем изменения знака у величин доходов).
|
1 |
Оглавление
|