Главная > Дифференциальные игры
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ГЛАВА 2. Определения, формулировки и предположения

В этой главе основные понятия, связанные с теорией дифференциальных игр, переводятся на математический язык и тем самым становятся точными. Высказываемые утверждения обосновываются и иллюстрируются примерами. Использование некоторых предположений оправдано тем, что они, как правило, оказываются полезными в дальнейших исследованиях.

Здесь и далее рассматриваются игры с полной информацией. Это означает, что оба игрока в каждый момент времени знаю значения фазовых координат.

2.1. КИНЕМАТИКА

Местом действия является область в n-мерном евклидовом пространстве и ее граница. Эта граница состоит из кусков некоторых поверхностей (под поверхностями понимаются -мерные многообразия). Уравнения

или, короче,

описывающие движение некоторой точки в фазовом пространстве будем называть уравнениями движения.

Функции заданы; мы предполагаем их достаточно гладкими, т. е. будем считать, что существуют все их частные производные, которые нам понадобятся. Переменные будем называть управлениями. Игроки могут изменять их в любой момент. Тем самым движение точки х определяется желаниями двух сторон. Если они действуют с противоположными целями — а нас интересуют именно такие случаи — в ситуации появляется нечто от природы игры. Как принято в теории игр, точкой х

будем обозначать положение, или состояьие, и называть ее координаты фазовыми координатами, если они описывают это состояние, действующие стороны называют игроками Фазовые координаты описывают состояние в следующем смысле Если развитие дифференциальной игры останавливается до ее завершения, величины в момент прекращения игры должны содержать в себе все данные, необходимые для возобновления партии Если новая партия начинается с тех же значений то она эквивалентна продолжению старой

В частности, значения в начале игры представляют собой все необходимые для хода игры начальные данные Таким об разом, термин игра относится не к единственной партии, а ко всей совокупности их Партии, начинающиеся в различных точках пространства считаются различными

В общем случае на оба вектора налагаются некоторые условия, зависящие в основном от х Обычно эти условия записываются в виде В дальнейшем мы всегда будем предполагать, что удовлетворяют таким условиям, если не оговорено противное

При фиксированных множество векторов для всех будем называть вектограммои для или -вектограммой (аналогично вводится определение для вектограммы) Полную вектограмму получаем в том случае, когда оба управления пробегают все допустимые значения

Например, простое движение на плоскости в каждой точке описывается вектограммой в виде окружности фиксированного радиуса, равного скорости Такая вектограмма) изображена на рис 2 11 ,а На рис приведен простой пример полной вектограммы, когда имеют по одной компо ненте

Принимая за количественное определение платы выражение (2 4 1), обозначим игрока, который ее минимизирует, через он имеет управление Игрока, максимизирующего обозначим через а его управление — через Эти обозначения соответствуют тем, которые были введены в играх преследования С таких игр и начиналась настоящая теория, но, как по кажут дальнейшие примеры, теперь она охватывает гораздо более широкий круг явлений Из того, что мы сохранили за игроками буквы читатель не должен детать поспешного заключения, что слова «преследование» и «убегание» заменяют стова «дифференциальные игры» Просто игры преследования,

особенно в начальных главах книги, — прекрасный объект для иллюстрации некоторых положений всей теории

Названия для игроков являются не столь бессодержательными, как, скажем, «первый игрок и второй игрок» или «красный и синий» Наши обозначения придают игрокам индивидуальность, или, если хотите, персональность, не нарушая при этом некоторой симметрии их ролей, что существенно в теории игр в противоположность задачам с одним игроком

Рис. 2.1.1

Для фазовых координат мы часто будем в конкретных задачах использовать более наглядные обозначения, чем. Например, точку на плоскости можно обозначать такими стандартными координатами, как или а если этих точек несколько, то к буквам можно добавить соответствующие индексы Иногда для обозначения таких количеств, как численность войск, военные запасы, оружие, время и т. д., мы будем употреблять начальные буквы слов

Пример 2.1.1. Плоское преследование при простом движении игроков. Если в примерах 19 1 и 192 обозначить через координаты через координаты а через соответственно скорости, то уравнения движения можно записать так

Пример 2.1.2. Игра «шофер-убийца». Чтобы записать уравнения движения игроков в этой игре, достаточно задать пягь фазовых координат: по две координаты для обозначения положения и еще одну для обозначения направления движения Обозначим их через задание этих фазовых координат полностью и однозначно определяет состояние игры в каждый момент. Перейдем теперь к управлениям.

Рис. 2.1.2

Управление для выглядит проще. Для описания направления его движения достаточно задать угол как это показано на рисунке. Теперь выберем управление для Проведем через точку прямую перпендикулярную вектору скорости преследователя. По своему желанию выбирает мгновенный центр кривизны своей траектории в любой точке, например в лежащей на этой прямой вне интервала Управление будем считать равным по абсолютной величине положительным для точек лежащих справа от и отрицательным — слева; таким образом, — Тогда уравнения движения можно записать так:

Игроки могут управлять настоящим и будущим, но никак не воздействуют на прошлое. Таким образом, мы интерпретируем левые части уравнений движения как производные по возрастающем) аргументу.

Categories

1
Оглавление
email@scask.ru