А.5. ИГРА «БОМБАРДИРОВЩИК И БАТАРЕЯ»

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

271

272

273

274

275

276

277

278

279

280

281

282

283

284

285

286

287

288

289

290

291

292

293

294

295

296

297

298

299

300

301

302

303

304

305

306

307

308

309

310

311

312

313

314

315

316

317

318

319

320

321

322

323

324

325

326

327

328

329

330

331

332

333

334

335

336

337

338

339

340

341

342

343

344

345

346

347

348

349

350

351

352

353

354

355

356

357

358

359

360

361

362

363

364

365

366

367

368

369

370

371

372

373

374

375

376

377

378

379

380

381

382

383

384

385

386

387

388

389

390

391

392

393

394

395

396

397

398

399

400

401

402

403

404

405

406

407

408

409

410

411

412

413

414

415

416

417

418

419

420

421

422

423

424

425

426

427

428

429

430

431

432

433

434

435

436

437

438

439

440

441

442

443

444

445

446

447

448

449

450

451

452

453

454

455

456

457

458

459

460

461

462

463

464

465

466

467

468

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

А.5. ИГРА «БОМБАРДИРОВЩИК И БАТАРЕЯ»

Этот пример иллюстрирует удивительное многообразие, скрытое в простых на первый взгляд военных (или других) играх. Здесь полное решение расщепляется на девять отдельных случаев, и некоторые из них допускают дальнейшее логическое подразделение. Мы только наметим эту картину, останавливаясь на особенно поучительных моментах.

Атакующий самолет, управляемый игроком осуществляет простое движение по плоскости со скоростью и. Его целью является территория игрока ограниченная береговой линией. Из батареи, находящейся в фиксированной точке стреляет по Игра происходит в соответствии с условиями так что платой является вероятность поражения.

Каждый игрок по-разному ограничен в своих действиях.

Для ограничено время полета, запас горючего или длина траектории; все эти ограничения эквивалентны в силу постоянства скорости. Мы выберем первое: время полета не должно превосходить заданной величины Это ограничение того типа, который обсуждался в § 5.7.

У ограничен запас боеприпасов который он имеет в своем распоряжении для стрельбы по цели Пусть с — максимальная скорость, с которой может стрелять Его управлением будет та часть этой скорости, которую он может выбирать в каждый момент времени. Поэтому мы включим в уравнения движения уравнение

и заменим в этом случае (см. § А.1) на

Таким образом, уменьшение скорости стрельбы пропорционально отражается на уменьшении текущей эффективности оружия.

Задача игрока состоит в выборе такой траектории со временем полета, не превосходящим по которой он из своей точки старта достигнет линии с минимальной вероятностью поражения. В течение этого полета стреляет по нему, так распределяя свое фиксированное количество боеприпасов по времени стрельбы, чтобы максимизировать вероятность поражения.

Решение, по-видимому, не будет иметь большой практической важности, так как разница вероятности поражения для мало отличных друг от друга путей будет, по всей видимости, незначительной (см. обсуждение практических оценок в гл. 11). Зато поучительность решения здесь велика: разнообразие явлений типично для других, особенно военных задач. Кроме того, задача иллюстрирует наличие двух различных и одновременно эффективных видов ограничений.

Рис. А.5.1.

Если не оговорено противное, мы будем считать прямой линией с батареей О, расположенной на ней. Для некоторых целей будет полезнее поместить О впереди тогда мы будем говорить о выдвинутой защите.

В первом из приведенных ниже примеров будет рассмотрен также случай произвольной формы береговой линии.

Положение будем задавать полярными координатами и 0; эти координаты и управление показаны на рис. Другими фазовыми координатами служат время полета игрока и количество боеприпасов, находящихся в распоряжении Итак, уравнения движения имеют вид

Помимо очевидных условий потребуем, чтобы

так что всегда может достичь (по крайней мере по прямой на рисунке), и

в силу симметрии. Очевидно, что будет рассеивающей поверхностью (но никакой мгновенной смешанной стратегии здесь не требуется).

Существуют две естественные возможности для выбора терминальной поверхности:

находится Здесь партия кончается. При этом может существовать или не существовать некоторый избыток боеприпасов Введем следующую параметризацию:

Далее, на поверхности имеем и в соответствии с условиями § 5.7 мы в качестве третьего параметра выбираем

Если то шансов поражения больше не остается. С этого момента стратегия игрока может быть любой (мы предполагаем, что достаточно велико, чтобы позволить ему достичь т. е. что выполнено условие Итак, плоскость есть естественная терминальная поверхность. Здесь параметризация такова:

Следующие три примера — это поучительные, но крайние случаи в том смысле, что они лежат на границе множества решений.

Пример А.5.1. Неограниченный запас боеприпасов. Предположим, что настолько велико, что может вести огонь в полную силу на протяжении всей партии. Тогда можно не считать фазовой координатой. Выберем начальные условия на (с отброшенным третьим неравенством из и положим Тогда задача превратится в иллюстрацию к уже рассмотренному случаю интегральных ограничений из § 5.7, где, конечно,

Если решить систему с то мы получим траектории, которые, как мы знаем, будут оптимальными для даже в том случае, если он свободен от ограничений на Для береговой

линии общего вида эти траектории (такие, как показанная на рис. А.5.2 траектория описываются уравнениями вида где с, — константы.

При мы получаем траектории показанные на рисунке), где ограничение существенно, т. е. время которым располагает оказывается меньшим, чем то, которое необходимо для прохождения Наконец, появляется траектория где времени хватает лишь на то, чтобы пройти по горизонтальному отрезку превращается в равенство).

Рис. А.5.2.

В нашем стандартном случае прямолинейного берега с расположенной на нем батареей абсолютно оптимальная траектория (см. рис. А.5.1) оказывается дугой окружности с постоянным В то же время существенно ограниченные траектории определяются уравнениями

где

Выражение для в конечном виде можно получить, если взять неопределенный интеграл

где а — корни многочлена

Следующее тождество, которое можно получить с помощью уравнений характеристик и основного уравнения, оказывается полезным при интегрировании почти во всех случаях:

Пример А.5.2. Неограниченное время полета. Если может лететь по траектории любой длины, а ограничен как в максимальной скорости стрельбы с, так и в запасе боеприпасов то оптимальная игра становится очевидной: движется по прямой от О до тех пор, пока не истратит все боеприпасы; после этого он любым способом следует к Ясно также, что сразу

начинает стрелять с полной скоростью и продолжает делать это до полного истощения боеприпасов.

Упражнение Используя получить этот результат аналитически.

Разумеется, приведенное выше решение справедливо и при условии, что время ограничено, если только оно достаточно велико, чтобы позволить после радиального полета достичь не уменьшая при этом расстояние Более точно: нужно, чтобы

Равенство приводит к траектории показанной на рис. А.5.3. Здесь дуга окружности.

Рис. А.5.3.

Пример А. 5.3. Ограниченность боеприпасов и неманеврирующий самолет.

Если в должно выполняться равенство, то не остается иного выбора, кроме прямолинейного пути, перпендикулярного к Тогда положение идентично рассмотренному в примере 7.14.1 с имеющейся там полууниверсальной поверхностью.

Интересно изучить обобщение задачи на случай выдвинутой защиты, когда батарея О расположена на расстоянии впереди Предположим сначала, что мало. Тогда будет стрелять в полную силу в то время как будет двигаться в интервале соответствующей длины, симметричном относительно О. Но если то остается достаточно боеприпасов, чтобы начать стрельбу до того, как подойдет к на расстояние Тогда начинает стрелять в полную силу в тот самый момент, когда он окажется способным поддерживать полный огонь до тех пор, пока не достигнет Таким образом, он стреляет на протяжении последнего интервала игры

длительностью Если же то открывает полный огонь немедленно; достигает когда часть боеприпасов еще остается неиспользованной.

Все это приводит к траекториям в пространстве показанным на рис. А.5.4 (на плоскости необходимы только две фазовые координаты), которые читатель без труда сможет истолковать.

Рис. А.5.4.

Проблема Можно ли получить это очевидно верное решение чисто аналитическим путем?

Исследуем теперь более общие решения и найдем возможную -универсальную поверхность. Идеи гл. 7 требуют, во-первых, сведения к случаю терминальной платы. Число фазовых координат станет тогда равным пяти; наша обычная техника оказывается неприменимой, но можно решить эту игру по частям.

Три уравнения (7.13.2) имеют в этом случае вид

где вновь введенная фазовая координата.

Оставляя в стороне очевидно тривиальный случай находим из что Такое движение означает, что траектория является дугой окружности постоянного радиуса с центром в точке О.

Если имеет достаточно боеприпасов для поддержания непрерывного огня с максимальной скоростью, то мы возвращаемся к примеру А.5.1. Поэтому мы предположим, что не всегда Нам придется найти — оптимальный для способ распределения ограниченного количества боеприпасов.

Мы утверждаем, что значение в течение игры должно быть постоянным и при этом таким, чтобы израсходовал весь свой запас как раз в тот момент, когда достигнет Действительно, если распределит свой запас неравномерно, то будет существовать по крайней мере один малый интервал времени, где будет больше, чем среднее значение и некоторый другой, на котором меньше, чем это значение. Если укоротит свой путь на протяжении последнего интервала, летя по хорде, а не по дуге окружности своей оптимальной круговой траектории, и, используя сэкономленное время слегка увеличит на протяжении первого интервала, то он улучшит (уменьшит) плату. Следовательно, такая стратегия не сможет быть оптимальной.

На поверхности, которая должна быть универсальной, постоянны и равны, скажем, Введем параметризацию (в исходном пространстве

На этой поверхности в силу первоначального определения плата равна

Задача А.5.1. Показать, что необходимые условия выполняются на поверхности Доказать непосредственным рассуждением, что эта поверхность универсальна.

Используя в качестве начальных условий, мы можем проинтегрировать уравнения характеристик обычным образом при для получения двух множеств траекторий-притоков.

Траектории-притоки при максимальной скорости стрельбы

Интегрирование показывает, что всегда является возрастающей функцией от следовательно, эти траектории

подходят к универсальной поверхности с внутренней стороны. Заметим также, что они отличаются от траекторий примера А.5.1, где невозрастающая функция от

Не все интегралы уравнений характеристик представляют собой оптимальные траектории. Действительно, если бы траектории, на которых пересекали универсальную поверхность на линии с израсходованными боеприпасами и были оптимальными, то это противоречило бы установленному в примере А.5.1.

Изучим предельное поведение при Среди уравнений траекторий с находим

Рис. А.5.5.

Но это радиальная траектория примера А.5.2. Далее мы видим, что по достижении универсальной поверхности обращается в нуль и продолжает движение по дуге окружности при отсутствии огня Таким образом, мы получаем в точности всю траекторию, приведенную на рис. А.5.3. Эта траектория единственна, если не хватает запаса времени для какой-либо другой. Поэтому этот случай отмечает то критическое значение при переходе через которое исследуемый здесь случай переходит к случаю, рассмотренному в примере

Посмотрим теперь, что случится, если начнет убывать от этого критического значения. Траектории последовательно изменяются, проходя через точки на рис. На участке поддерживается максимальная скорость стрельбы на дугах окружностей стреляет с такой постоянной скоростью чтобы исчерпать все боеприпасы как раз в тот момент, когда достигнет

Посмотрим, что случится при другом предельном переходе, когда Траектории-притоки переходят в дуги окружностей, которые лежат на универсальной поверхности. Это может случиться, только если

Таким образом, нет качественного различия между притоками и универсальными траекториями.

Итак, посмотрим, что происходит, когда начинает движение из заданной начальной точки при фиксированном, но

достаточно большом а располагаемое им время принимает различные значения. Наименьшее допустимое допускает лишь прямолинейную траекторию показанную на рис. А.5.5. При увеличении траектория непрерывным образом переходит в дугу (как в примере А.5.1); плата при этом уменьшается. Предположим, что остается избыток боеприпасов, в точке Большие значения как мы знаем, приводят к траекториям Но поскольку на этом множестве траекторий убывает, мы должны начать с траектории где лежит на на всем протяжении партии. Эта траектория, как мы видим, отлична от и не является оптимальной. Итак, плата для больше, чем для Но плата для меньше (она наименьшая из всех возможных). Следовательно, должна существовать промежуточная траектория, скажем для которой значение платы равно ее значению на

Таким образом, если возрастает выше значения, соответствующего траектории то на некотором интервале времени последняя остается оптимальной, а плата V — постоянной. Это происходит до тех пор, пока не возрастет настолько, чтобы оказалась осуществимой траектория здесь имеет две оптимальные стратегии. (Есть ли здесь рассеивающая поверхность?) Дальнейшее увеличение ведет к траекториям с возрастанием V, пока, наконец, мы не получим траекторию

Чем больше тем больше указанный пробел. Случай бесконечного как в примере А.5.1, приводит к тому, что наилучшей возможной траекторией оказывается и пробел, увеличиваясь до бесконечности, перестает существовать.

Проблема А.5.2. Охарактеризовать множество начальных положений, для которых имеет две оптимальные стратегии. Может ли оно быть получено конструкцией, аналогичной той, которая приведена в § 6.5 и результатом которой является рассеивающая поверхность?

Траектории-притоки при отсутствии стрельбы

Интегрирование уравнений характеристик показывает, что эти траектории прямолинейны. Следовательно, они касаются универсальной поверхности и имеют вид, показанный на рис.

Ясно, что для них выполняется условие

меньше того значения, которое требуется для поддерживания огня с полной скоростью во время прохождения указанной на рисунке пунктирной дуги.

Отметим естественность результата. Траектории таковы, что максимизируется достигающееся на них минимальное расстояние.

Наконец, должен быть еще один класс решений.

Рис. А.5.6.

Рассмотрим пример в котором так что обязан двигаться по прямолинейному горизонтальному отрезку, а невелико, и поэтому стреляет с полной скоростью лишь на конечном интервале. Мы видели, что в результате получается полууниверсальная поверхность.

Рис. А.5.7.

При небольшом увеличении траектории расположены поблизости от прямой траектории и следует ожидать, что между ними будет качественное сходство. Это явление более интересно в случае выдвинутой защиты. Основное новшество состоит в том, что многие оптимальные партии кончаются, когда запас уже исчерпан, а еще не достиг (причины этого интуитивно ясны). Поверхность состоит из положений, находящихся левее

О, где запаса времени в точности достаточно для горизонтального полета до О.

Решения разбиваются на два класса. Один состоит из траекторий, на которых растет вместе с искривляющихся по направлению к Второй содержит поверхность переключения. Типичная оптимальная траектория показана на рис. А.5.7.

Рис. А.5.8.

Здесь В есть точка поверхности точка поверхности переключения. На прямолинейных отрезках и огонь отсутствует. Стрельба ведется только на кривой, которая гладко переходит в и На ней (за исключением самих точек и она симметрична относительно своей средней точки.

Хотя такие траектории и похожи на траектории примера однако мы здесь не изучили деталей распределения огня. Он, по-видимому, также постепенно уменьшается до на притоках к универсальной поверхности.

Эта поверхность в случае выдвинутой защиты включает оптимальную игру, подобную изображенной на рис. А.5.8. Дуга лежит на универсальной поверхности и заканчивается на множестве точек, представленном на рисунке точкой слева от нее, как и раньше, лежат горизонтальные траектории без стрельбы.

Возможность слияния притоков рис. А.5.6 с такой универсальной поверхностью, траектории которой показаны на рис. А.5.1, достаточно очевидна.

ЛИТЕРАТУРА

(см. скан)

<< Предыдущий параграф

Следующий параграф >>

Оглавление