Главная > Дифференциальные игры
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

11.6. ВОИНА НА ИЗНУРЕНИЕ И НАПАДЕНИЕ: ИЗУЧЕНИЕ

При ведении продолжительной войны каждая сторона должна взвесить альтернативу между прямым сражением и рейдами к источникам снабжения, результат которых может дать больше, но в будущем. Думая о такой широкой задаче, как эта, мы будем использовать еще более широкую терминологию, пытаясь решить общую задачу: тактика дальнего прицела против тактики ближнего прицела.

Пример 5.4, по-видимому, — простейший из всех возможных и к тому же хороший вариант, с которого стоит начать. Первое уравнение движения имеет вид

Напомним, что силы двух сторон, скажем, число самолетов в момент невозмущенные скорости заводского производства; доли оружия, выделенные для целей изнурения, т. е. для истощения вражеского снабжения. Выписанное уравнение означает, что количество оружия игрока убывает со скоростью, пропорциональной величине — количеству, предназначенному для истощения в момент времени оружия, имеющегося у игрока

Это как раз пример предположения о линейной зависимости, упоминавшейся в предыдущем параграфе. Значение (если речь идет, скажем, о самолетах) есть величина, на которую снижается скорость производства самолетов стороны вследствие атаки одной вражеской машины. Есть ли какая-нибудь надежда разумной оценки для значения (и, разумеется, для

В самом деле, значение есть результат многих факторов — качеств атакующих самолетов, вида и эффективности обороны, типа и силы оружия (бомб), уязвимости баз и заводов. Если оценить эти компоненты, то будет оценено и значение Но не следует забывать, что все это так сложно лишь вследствие общности всей картины и что мы работаем с предварительной упрощенной схемой.

Существует, разумеется, много способов приблизиться к реальности — и к сложности. Один из них, который мы испробуем в дальнейшем в этой главе, состоит в предположении, что убывание оружия пропорционально не только вражеским атакам, но и собственному наличному оружию. Это означает, что при атаках разрушается определенная доля, а не фиксированное количество оружия, служащего целью. Тогда последний член в (11.6.1) надо заменить на

Другой путь состоит в разделении оружия на три части. Новая, третья часть оружия предназначается для защиты «баз»,

т. е. она парализует удары, наносимые противником. Для того чтобы записать уравнения движения в этом случае, мы сначала проанализируем конфликт между нападающими и обороняющимися силами. Результат даст некоторые ожидаемые потери с обеих сторон и некоторое ожидаемое проникновение, ведущее, как и прежде, к уменьшению производства. Но это может потребовать гораздо более обширного анализа, чем настоящий.

Разумеется, в любом случае надо принять в расчет убыль оружия, предназначенного для разных целей. Простейшее предположение — это прямо пропорциональная зависимость, и тогда к надо прибавить члены вида

где и средняя доля оружия, теряемого при его назначении на изнурение и на нападение соответственно.

Тем самым постулирована однородность оружия. На самом деле надо было бы рассмотреть несколько его типов (бомбардировщики предназначены для уничтожения не только бомбардировщиков противника). Одни из этих типов, как и раньше, можно использовать для изнурительных налетов, защиты, атак и других целей, другие же имеют ограниченное предназначение. Число фазовых координат при этом увеличится и задача станет более громоздкой, но, по-видимому, нет причин не решить ее при должной затрате труда.

Вернемся теперь к плате. В первоначальной версии предполагалось, что существует театр военных действий, удаленный от объектов-снабжения. В каждую единицу времени — скажем, в день — каждый из противников выделяет часть своего оружия для этих действий, и только от этого оружия зависит плата. Мерой выгоды для каждой из сторон является накопленная ею совокупность — например, число оружия-дней — в течение обусловленного периода времени Платой является разность этих мер

так что каждая сторона пытается накопить больше оружия, чем противник.

Другой платой может служить просто избыток наличного оружия в некоторый фиксированный будущий момент времени Здесь плата терминальная с Целью при этом будет накопить наибольший возможный избыток резервов оружия; эффективная война ожидается в будущем, а не в настоящем, где идет борьба на изнурение.

Слабость такого определения платы проявляется сразу же; мы должны знать продолжительность войны — заранее. С какой точностью можно оценить и сколько мы теряем при ошибках? Если эта оценка пересматривается в течение конфликта, то подход, используемый в нашей теории, делает последующие наилучшие изменения в оптимальной стратегии естественными и простыми. Последствия плохой исходной оценки будут при этом смягчены, и с помощью вычислений мы сможем оценить интересующую нас погрешность.

Еще один тип платы приписывает различную ценность оружию в зависимости от времени его вступления в основную войну (скажем, аэроплан, готовый к употреблению раньше, сослужит большую службу, чем изготовленный позднее). Ее выражение мы получим, если умножим подинтегральный член в (11.6.2) на множитель Если функция с увеличением достаточно быстро стремится к нулю, то верхний предел можно заменить на Тогда плата не будет зависеть ни от какой априорной оценки и будет выражать общее превосходство в воздушном флоте. Ценой за полученное упрощение является необходимость выбора оценочной функции.

Если мы не знаем значения но каким-то образом догадываемся или знаем о его вероятностном распределении, то плата вновь имеет приведенный выше вид, где функция выступает в качестве плотности вероятности.

Наиболее рационально выбирать плату, основываясь на детальном анализе основной войны. В общем случае эта задача гораздо труднее предыдущей. Если мы сможем выразить цену этой войны в терминах поставок оружия для обоих противников, то этот функционал станет логичной платой для настоящей игры.

Но и среди более простых выражений для платы читатель, наделенный воображением, почувствует наличие многих возможностей как в описанном выше, так и в других подходах. Важны не столько реальность и доступность выражений платы для оценок, сколько вопрос о том, будут ли существовать у соответствующих решений (у цены и у стратегии) общие черты, независимые от выбора этих выражений.

Разберем теперь примеры 5.4 и 11.9.1; последний будет помещен в этой главе позднее, чтобы не прерывать изложения. В первом примере мы находим существенно простые стратегии. Напомним, что есть мера разрушительной силы оружия игрока Е: единица такого оружия, используемая для целей изнурения, уменьшает оружие стороны на единиц за единицу

времени. Для игрока величина играет ту же роль, и мы предположим, что Тогда оптимальная стратегия для игрока с лучшим оружием, состоит в направлении всех сил на изнурение до момента времени отсчитанного от предназначенного конца конфликта, и затем в резком переключении на стратегию «все для атаки».

Что это означает? Величина может быть интерпретирована как среднее время, необходимое для того, чтобы определенное количество оружия игрока могло разрушить то же количество оружия игрока Здесь мы получаем возможность выяснить физический смысл полученного критерия. Если остается больше времени, чем то имеет преимущество в скорости обмена: его оружие имеет достаточно времени, чтобы успеть уничтожить превосходящие силы противника. Как только такое положение нарушается, становится выгоднее бросить все силы на непосредственную войну.

Но со своим оружием худшего качества делает подобное переключение раньше. Он дожидается, пока время до намеченного окончания войны не станет равным

Существует ли эвристическая интерпретация и здесь? Этот результат кажется трансцендентным по крайней мере для поверхностной интуиции. Разумеется, нужно ожидать еще больших осложнений, так как принимая свое решение, должен предвидеть оптимальное поведение своего противника, которое требует переключения в течение оставшегося времени. С другой стороны, когда вычисляет наилучшее время для переключения, он тоже должен учесть последующий постоянный простой способ поведения все силы бросить на атаку. Заметьте, что эти стратегии не зависят ни от скоростей производства ни от соответствующих сил а зависят лишь от эффективности оружия. Это, конечно, не верно.

Для контраста отметим превращение, которое претерпевает оптимальная стратегия при изменении предположений относительно уравнений движения, сделанное в примере 11.9.1. Фактическое нововведение состоит в том, что теперь будет означать не абсолютную, а относительную ко всему оружию скорость убывания оружия игрока Точно тот же смысл имеет и

Мы обнаружим, что при некоторых ограничениях переключается с изнурения на атаку в момент времени, отстоящий на от конца войны. Этот критерий походит на предыдущий и допускает ту же самую интерпретацию. Но теперь переключение не происходит последовательно, так как применяет в различных обстоятельствах (о деталях см. § 11.9) аналогичное время переключения

Более интересными оказываются универсальные поверхности. Опять при некоторых ограничениях (и аналогично до момента переключения пытается удержать силы на уровне

Он играет «все для атаки» или «все на изнурение» в зависимости от того, окажется ли больше или меньше этого значения. Когда равно этому числу, расщепляет свои силы в отношении

для поддержания состояния (11.6.3). Так он действует до момента тхсх, после чего переключается целиком на атаку.

Что все это означает?

Следующим важным шагом в осуществлении нашей программы было бы изучение цены игры. Каково наказание за отклонение от только что описанной стратегии?

1
Оглавление
email@scask.ru