1.2. ФАЗОВЫЕ КООРДИНАТЫ И УПРАВЛЕНИЯ
Типичными примерами дифференциальных игр являются сражения, воздушные бои, футбол, преследование судна торпедой, перехват самолета зенитной ракетой, охрана объектов от нападения. Если один из игроков выключается из игры, мы получаем обычную задачу максимизации. Она уже относится к вариационному исчислению и составляет основную часть теории управления.
Решения игроков всегда заключаются в выборе некоторых величин, называемых управлениями. Они в свою очередь определяют собой значения других величин - фазовых координат. Последние обладают тем свойством, что знание их значений в любой момент времени полностью определяет течение игры. Смысл этого положения поясним тремя эквивалентными утверждениями.
1. Для определения исхода игры нужно знать значения фазовых координат в начальный момент.
2. Фазовые координаты являются именно теми величинами, значения которых в каждый момент времени должен принимать во внимание игрок при выборе своего решения.
3. Если игрок должен быть заменен другим на протяжении партии, то информация, необходимая последнему для возобновления игры, представляет собой текущие значения фазовых координат.
В процессе игры фазовые координаты меняются. Если их число равно
то мы будем обозначать их
и рассматривать как координаты точки в
-мерном евклидовом пространстве. Это пространство, или, скорее, некоторое его подмножество, является пространством игры, или пространством состояний; мы будем обозначать его
Движение точки
все время находится под частичным контролем двух игроков, который может осуществляться путем надлежащего выбора управлений.
Текущие значения фазовых координат всегда известны обоим игрокам; таким образом, мы изучаем игры с полной информацией. Это, по-видимому, самое сильное ограничение на данном этапе развития теории, которое исключает многие применения ее в военном деле. Распространение теории на случай неполной
информации явилось бы благодатным полем для дальнейших исследований. Глава 12, которую можно читать вне связи с остальными главами, посвящена многообещающим идеям такого обобщения.
Развитие игры характеризуется движением точки
Игра заканчивается, если выполняются некоторые условия, и всегда можно сделать так, чтобы эти условия состояли в попадании точки х на некоторую поверхность, или
-мерное многообразие, которую можно принять за часть границы пространства
По окончании партии становится известной численная величина, называемая платой. Целью одного игрока является ее максимизация, а другого — минимизация. Как это принято в теории игр, наилучшее значение платы, ее минимакс, будет называться ценой игры. Она равна плате при оптимальном действии обоих игроков. Если один из них станет действовать не оптимально, то его противник получит возможность достичь платы, более выгодной для него, чем цена.
Рассмотрим теперь эти понятия для одного общего класса приложений.