Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
4.2. ПРИНЦИП ПЕРЕХОДА И ОСНОВНОЕ УРАВНЕНИЕПриемы, с помощью которых мы будем решать дифференциальные игры, вообще говоря, отличаются от использованных в дискретных случаях гл. 3. С 1951 г, когда впервые была публично сформулирована [17] общая идея, на которой основаны эти приемы, появилось несколько других вариантов той же идеи (принцип оптимальности, принцип максимума Понтрягина), относящихся к играм с одним игроком (теория управления) Эту идею мы назвали Принцип перехода Если в игре произошел переход из одного положения в другое и если во втором положении значение V известно, то в первом оно определяется следующий требованием игроки должны оптимизировать приращение функции V (т. е. добиться его минимакса) за время перехода В дискретных играх принцип перехода применяется непосредственно, а в непрерывном случае в результате его применения получаются дифференциальные Предположим, что цена дифференциальной игры существует. Она будет зависеть от начальной точки х, и мы обозначаем ее
Суммирование производится от 1 до В силу предположения о минимаксе уравнение не изменится, если в (4 2 1) Мы дадим два способа вывода основного уравнения Первый изложим в этом параграфе. Подход наш является но сути эвристическим, что вполне допустимо ввиду того, что строгие обоснования мы приведем при втором способе (математик легко сможет усмотреть, как сделать наши рассуждения строгими) Преимущество первого способа заключается в его прямом и поучительном характере Он основан на принципе перехода. Суть его состоит в том, что рассматривается совокупность траекторий, исходящих из различных начальных точек Возьмем некоторый интервал времени в середине игры Пусть к началу этого интервала траектория достигла некоторой определенной точки в Изложим теперь все это формально. Пусть в момент времени в точку
Действительно, за время Будем теперь считать точку х фиксированной, а Разложим интеграл в ряд Тейлора по формуле
Точку
где для достаточно малого
ибо
где Мы должны взять минимакс Если мы действительно найдем говоря, зависеть от
Если эти функции подставить в (4.2 1), то выражение в скобках обратится в нуль, и мы получим
Это уравнение в частных производных первого порядка относительно V, которому должна удовлетворять иена игры. Мы уже обозначали раньше через В дальнейшем при написании уравнения (4 2.3) аргументы В приведенных здесь упражнениях уравнения движения такие же, как в примерах 44 1—4 45 (для выполнения упражнений, однако, нет необходимости вникать в сущность примеров). Упражнение 4.2.1. Пусть плата терминальная и уравнения движения имеют вид
где
где
(Использовать лемму 2.8.1.) Упражнение 4.2.2. Игра «шофер-убийца». Написать основное уравнение в форме (4.2.1) и (4.2.3) для уравнений движения в естественном пространстве (пример 2.1.1) и в редуцированном пространстве (пример 2.2.2). Для Отметим, что вдоль оптимальной траектории
и что V постоянна на всех таких траекториях в том и только в том случае, когда плата является терминальной. Существует другая точка зрения на применение принципа перехода, и хотя впоследствии она не будет использована в явном виде, читателю следует иметь ее в виду для лучшего понимания дальнейшего материала. Пусть Решения игр Второй вывод основного уравнения опирается на некоторую новую концепцию, изложенную в следующем параграфе.
|
1 |
Оглавление
|