Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
7.5. Примеры1. Марковская модель принятия решений с переоценкой (см. гл. 2). Для этой модели
где Поскольку
то выполняется условие сжатия. Далее, если
что равносильно выполнению условия монотонности. Таким образом, применяя результаты раздела 7.3, получаем два оптимизационных алгоритма нахождения оптимальной стратегии. Один из них — алгоритм линейного программирования, сформулированный в разделе 1.3 в виде двойственной задачи. Второй — итерационный алгоритм нахождения стратегий, приведенный в разделе 1.2. 2. Процесс с поглощением (см. раздел 2.7). Для этой модели
Хотя отображение 3. Обобщенный марковский процесс принятия решений (см. гл. 6). В этой модели пространство состояний Пусть
где а) при каждой фиксированной паре является распределением на
где
Из этого включения вытекает, что
Тогда
показывающие, что выполняется условие сжатия. Условие монотонности проверяется стандартным путем. Отметим, что определение функции 4. Полумарковский процесс принятия решений с переоценкой (см. раздел 5.4). Этот пример отличается от трех предыдущих тем, что рассматривается процесс с непрерывным временем. В остальном он аналогичен примеру 1. Чтобы избежать некоторых трудностей, связанных с интегрируемостью, опять воспользуемся функцией Пусть Выбор решения
— функция распределения времени пребывания процесса в состоянии
Написанное выражение имеет смысл только тогда, когда функция
и предположим, что 1 при всех Тогда, как нетрудно показать, выполняются условия сжатия и монотонности. Легко проверить, что в рассматриваемую задачу вложена задача примера 1, описываемая объектами
А тогда теорема 7.7 позволяет свести задачу оптимизации к более простой: с конечными пространствами состояний и решений, обходя трудности, связанные с интегрируемостью. Существование стационарной оптимальной стратегии гарантируется следствием 2 теоремы 7.4, что попутно доказывает теорему 5.1. 5. Стохастическая игра с остановкой (см. Приложение). Пусть
при всех
Заметим, что при фиксированных
Пусть этого отображения. Определим оператор
Теорема 7.4 остается справедливой и в случае минимизации (вместо максимизации), а значит, она обеспечивает выполнение условия сжатия при каждом 8. Тогда, замечая, что
и применяя снова теорему 7.4, убеждаемся, что
Ссылки и комментарии Основные понятия математического анализа, использованные в этой главе, можно найти, например, в книгах Колмогорова и Фомина [76] или Эльсгольца [54]. Результаты этой главы были получены Денардо [31], а также Денардо и Миттеном [35]. Условие монотонности было впервые введено Миттеном [91]. Некоторые результаты для процессов с конечным пространством состояний получили Карп и Хелд [69].
|
1 |
Оглавление
|