Главная > Дифференциальные игры
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

11.6. ВОИНА НА ИЗНУРЕНИЕ И НАПАДЕНИЕ: ИЗУЧЕНИЕ

При ведении продолжительной войны каждая сторона должна взвесить альтернативу между прямым сражением и рейдами к источникам снабжения, результат которых может дать больше, но в будущем. Думая о такой широкой задаче, как эта, мы будем использовать еще более широкую терминологию, пытаясь решить общую задачу: тактика дальнего прицела против тактики ближнего прицела.

Пример 5.4, по-видимому, — простейший из всех возможных и к тому же хороший вариант, с которого стоит начать. Первое уравнение движения имеет вид

Напомним, что силы двух сторон, скажем, число самолетов в момент невозмущенные скорости заводского производства; доли оружия, выделенные для целей изнурения, т. е. для истощения вражеского снабжения. Выписанное уравнение означает, что количество оружия игрока убывает со скоростью, пропорциональной величине — количеству, предназначенному для истощения в момент времени оружия, имеющегося у игрока

Это как раз пример предположения о линейной зависимости, упоминавшейся в предыдущем параграфе. Значение (если речь идет, скажем, о самолетах) есть величина, на которую снижается скорость производства самолетов стороны вследствие атаки одной вражеской машины. Есть ли какая-нибудь надежда разумной оценки для значения (и, разумеется, для

В самом деле, значение есть результат многих факторов — качеств атакующих самолетов, вида и эффективности обороны, типа и силы оружия (бомб), уязвимости баз и заводов. Если оценить эти компоненты, то будет оценено и значение Но не следует забывать, что все это так сложно лишь вследствие общности всей картины и что мы работаем с предварительной упрощенной схемой.

Существует, разумеется, много способов приблизиться к реальности — и к сложности. Один из них, который мы испробуем в дальнейшем в этой главе, состоит в предположении, что убывание оружия пропорционально не только вражеским атакам, но и собственному наличному оружию. Это означает, что при атаках разрушается определенная доля, а не фиксированное количество оружия, служащего целью. Тогда последний член в (11.6.1) надо заменить на

Другой путь состоит в разделении оружия на три части. Новая, третья часть оружия предназначается для защиты «баз»,

т. е. она парализует удары, наносимые противником. Для того чтобы записать уравнения движения в этом случае, мы сначала проанализируем конфликт между нападающими и обороняющимися силами. Результат даст некоторые ожидаемые потери с обеих сторон и некоторое ожидаемое проникновение, ведущее, как и прежде, к уменьшению производства. Но это может потребовать гораздо более обширного анализа, чем настоящий.

Разумеется, в любом случае надо принять в расчет убыль оружия, предназначенного для разных целей. Простейшее предположение — это прямо пропорциональная зависимость, и тогда к надо прибавить члены вида

где и средняя доля оружия, теряемого при его назначении на изнурение и на нападение соответственно.

Тем самым постулирована однородность оружия. На самом деле надо было бы рассмотреть несколько его типов (бомбардировщики предназначены для уничтожения не только бомбардировщиков противника). Одни из этих типов, как и раньше, можно использовать для изнурительных налетов, защиты, атак и других целей, другие же имеют ограниченное предназначение. Число фазовых координат при этом увеличится и задача станет более громоздкой, но, по-видимому, нет причин не решить ее при должной затрате труда.

Вернемся теперь к плате. В первоначальной версии предполагалось, что существует театр военных действий, удаленный от объектов-снабжения. В каждую единицу времени — скажем, в день — каждый из противников выделяет часть своего оружия для этих действий, и только от этого оружия зависит плата. Мерой выгоды для каждой из сторон является накопленная ею совокупность — например, число оружия-дней — в течение обусловленного периода времени Платой является разность этих мер

так что каждая сторона пытается накопить больше оружия, чем противник.

Другой платой может служить просто избыток наличного оружия в некоторый фиксированный будущий момент времени Здесь плата терминальная с Целью при этом будет накопить наибольший возможный избыток резервов оружия; эффективная война ожидается в будущем, а не в настоящем, где идет борьба на изнурение.

Слабость такого определения платы проявляется сразу же; мы должны знать продолжительность войны — заранее. С какой точностью можно оценить и сколько мы теряем при ошибках? Если эта оценка пересматривается в течение конфликта, то подход, используемый в нашей теории, делает последующие наилучшие изменения в оптимальной стратегии естественными и простыми. Последствия плохой исходной оценки будут при этом смягчены, и с помощью вычислений мы сможем оценить интересующую нас погрешность.

Еще один тип платы приписывает различную ценность оружию в зависимости от времени его вступления в основную войну (скажем, аэроплан, готовый к употреблению раньше, сослужит большую службу, чем изготовленный позднее). Ее выражение мы получим, если умножим подинтегральный член в (11.6.2) на множитель Если функция с увеличением достаточно быстро стремится к нулю, то верхний предел можно заменить на Тогда плата не будет зависеть ни от какой априорной оценки и будет выражать общее превосходство в воздушном флоте. Ценой за полученное упрощение является необходимость выбора оценочной функции.

Если мы не знаем значения но каким-то образом догадываемся или знаем о его вероятностном распределении, то плата вновь имеет приведенный выше вид, где функция выступает в качестве плотности вероятности.

Наиболее рационально выбирать плату, основываясь на детальном анализе основной войны. В общем случае эта задача гораздо труднее предыдущей. Если мы сможем выразить цену этой войны в терминах поставок оружия для обоих противников, то этот функционал станет логичной платой для настоящей игры.

Но и среди более простых выражений для платы читатель, наделенный воображением, почувствует наличие многих возможностей как в описанном выше, так и в других подходах. Важны не столько реальность и доступность выражений платы для оценок, сколько вопрос о том, будут ли существовать у соответствующих решений (у цены и у стратегии) общие черты, независимые от выбора этих выражений.

Разберем теперь примеры 5.4 и 11.9.1; последний будет помещен в этой главе позднее, чтобы не прерывать изложения. В первом примере мы находим существенно простые стратегии. Напомним, что есть мера разрушительной силы оружия игрока Е: единица такого оружия, используемая для целей изнурения, уменьшает оружие стороны на единиц за единицу

времени. Для игрока величина играет ту же роль, и мы предположим, что Тогда оптимальная стратегия для игрока с лучшим оружием, состоит в направлении всех сил на изнурение до момента времени отсчитанного от предназначенного конца конфликта, и затем в резком переключении на стратегию «все для атаки».

Что это означает? Величина может быть интерпретирована как среднее время, необходимое для того, чтобы определенное количество оружия игрока могло разрушить то же количество оружия игрока Здесь мы получаем возможность выяснить физический смысл полученного критерия. Если остается больше времени, чем то имеет преимущество в скорости обмена: его оружие имеет достаточно времени, чтобы успеть уничтожить превосходящие силы противника. Как только такое положение нарушается, становится выгоднее бросить все силы на непосредственную войну.

Но со своим оружием худшего качества делает подобное переключение раньше. Он дожидается, пока время до намеченного окончания войны не станет равным

Существует ли эвристическая интерпретация и здесь? Этот результат кажется трансцендентным по крайней мере для поверхностной интуиции. Разумеется, нужно ожидать еще больших осложнений, так как принимая свое решение, должен предвидеть оптимальное поведение своего противника, которое требует переключения в течение оставшегося времени. С другой стороны, когда вычисляет наилучшее время для переключения, он тоже должен учесть последующий постоянный простой способ поведения все силы бросить на атаку. Заметьте, что эти стратегии не зависят ни от скоростей производства ни от соответствующих сил а зависят лишь от эффективности оружия. Это, конечно, не верно.

Для контраста отметим превращение, которое претерпевает оптимальная стратегия при изменении предположений относительно уравнений движения, сделанное в примере 11.9.1. Фактическое нововведение состоит в том, что теперь будет означать не абсолютную, а относительную ко всему оружию скорость убывания оружия игрока Точно тот же смысл имеет и

Мы обнаружим, что при некоторых ограничениях переключается с изнурения на атаку в момент времени, отстоящий на от конца войны. Этот критерий походит на предыдущий и допускает ту же самую интерпретацию. Но теперь переключение не происходит последовательно, так как применяет в различных обстоятельствах (о деталях см. § 11.9) аналогичное время переключения

Более интересными оказываются универсальные поверхности. Опять при некоторых ограничениях (и аналогично до момента переключения пытается удержать силы на уровне

Он играет «все для атаки» или «все на изнурение» в зависимости от того, окажется ли больше или меньше этого значения. Когда равно этому числу, расщепляет свои силы в отношении

для поддержания состояния (11.6.3). Так он действует до момента тхсх, после чего переключается целиком на атаку.

Что все это означает?

Следующим важным шагом в осуществлении нашей программы было бы изучение цены игры. Каково наказание за отклонение от только что описанной стратегии?

1
Оглавление
email@scask.ru