Главная > Дифференциальные игры
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

2.4. ПЛАТА

Численная величина, которую игроки стараются минимизировать или максимизировать в играх степени, может иметь различный вид. Мы предпочитаем взять за образен следующую форму платы:

Будем предполагать, что функция так же как обладает частными производными. Интеграл берется вдоль траектории, которую х проходит в на протяжении партии; нижний предел интегрирования (мы можем положить его равным нулю) соответствует начальной точке в верхний предел есть время окончания игры — когда х достигает

Функция является гладкой функцией, определенной на Для каждой партии второе слагаемое в (2.4.1) есть значение в терминальной точке, т. е. в точке, где х встречается с и игра оканчивается.

Случай, когда обе функции тождественно равны нулю, мы исключаем как не имеющий смысла. Если мы говорим, что игра имеет интегральную плату, если терминальную плату. Этими двумя типами платы охватывается большинство практических случаев. Например, игра преследования со временем захвата в качестве платы является игрой с интегральной платой, здесь Игра в примере 1.9.2 имеет терминальную плату — расстояние от до защищаемого объекта в момент захвата.

Для определенных теоретических целей оказывается полезным рассмотрение игр с терминальной платой; так, нам пригодится следующая теорема.

Теорема 2.4.1. Игру с платой в форме где можно преобразовать в эквивалентную игру с терминальной платой.

Доказательство. Для обозначения новой, эквивалентной, игры примем буквы со штрихами; первоначальной игре будут соответствовать буквы без штрихов. Пусть с — прямое произведение где -область изменения новой фазовой координаты Аналогично

Уравнения, описывающие аналогичны плюс еще уравнение

К прежним уравнениям движения добавляется

Плата будет терминальной, и ее можно записать так:

Теперь рассмотрим партию в новой игре, начинающуюся из точки с координатами и оканчивающуюся в точке множества Если мы спроектируем траекторию на то ее проекция совпадет с одной из траекторий в первоначальной игре, поскольку не входит в первые уравнений движения. И обратно, любая партия в старой игре соответствует единственной партии в новой. Для конкретной партии так же как являются известными функциями от их можно подставить в (2.4.3), и тогда это уравнение можно проинтегрировать с начальным условием

Каково значение платы в новой игре? Оно получается из формулы (2.4.4), где есть терминальная точка на имеющая те же компоненты, что на и еще одну компоненту Интегрируя (2.4.3) от (в точке до его конечного значения получаем, используя (2.4.2),

где интегрирование производится вдоль траектории в или, что то же самое, вдоль ее проекции на ибо не входит под знак интеграла. Подставляя в (2.4.4), получаем

Если мы предпишем начальной точке значение равное 0, то плата будет точно такой же, как в первоначальной игре.

Заметим, что при таком ограничении на начальное значение существенной потери общности не происходит. Так как не входит ни в одну из правых частей уравнений движения, то все траектории в отличающиеся в начальном положении только значениями — просто сдвиги на это значение в направлении соответствующей траектории в

К виду (2.4.1) можно привести также и другие типы платы. Предположим, что время входит явно в правые части уравнений движения, в или даже в В последнем случае

плата является функцией не только состояния, но и времени окончания игры. Тогда мы к уравнениям движения добавляем уравнение берем новые как прямые произведения первоначальных и на прямую область изменения и заменяем аргумент в на Проанализировав преобразованную игру, мы отбрасываем все начальные точки, кроме тех, у которых

Существуют задачи, где плата имеет вид

здесь некоторое наперед заданное положительное значение времени означает время начала игры). По существу здесь можно считать фазовой координатой. Мы добавляем к уравнениям движения еще уравнение

и принимаем за новое с? прямое произведение старого на луч За мы берем ту часть границы нового где Преобразованная игра имеет интегральную плату с подинтегральной функцией Мы используем затем только те начальные точки, у которых равно заданному значению

Предположим, что нам дана функция определенная на значение которой в момент является платой. Этот случай можно рассматривать аналогично предыдущему, считая К терминальной платой

Рассмотрим еще один тип платы, который по крайней мере в простых случаях можно привести к стандартному виду. Пусть в задана функция Платой является минимум этой функции, который достигается за время игры. Например, как близко от убегающего может оказаться преследователь?

Пусть подмножество в на котором может заставить возрастать, что бы ни делал при этом Тогда есть множество тех точек х, для которых

Пусть граница подмножества Ясно, что если вопреки оптимальному противодействию со стороны минимум К достигается, то он будет достигнут на Таким образом, мы

можем свести задачу к игре с терминальной платой, равной значению К на множестве Читатель, однако, легко может построить примеры игр, в которых добивается наименьшего значения платы лишь тогда, когда траектория входит в множество а затем покидает его; в таких случаях осуществить предложенную идею будет трудно.

Пусть

где -координаты некоторого вектора и.

В наших исследованиях существенную роль будет играть

Предположение о мини макс Для всех и всех

Во всех приложениях, с которыми нам приходилось сталкиваться, можно было представить в виде суммы двух функций, одна из которых не зависит от а другая — от . В таких случаях предположение о минимаксе очевидно выполняется.

1
Оглавление
email@scask.ru