Главная > Вычислительные методы для инженеров
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

Глава 10. МЕТОДЫ МНОГОМЕРНОЙ МИНИМИЗАЦИИ

Одной из наиболее часто встречающихся в инженерных расчетах и научных исследованиях вычислительных задач является задача минимизации функции действительных переменных -Функция (целевая функция) минимизируется на некотором множестве . В случае, когда (т. е. ограничения на переменные отсутствуют) принято говорить о задаче безусловной минимизации. В противном случае (т. е. тогда, когда № говорят о задаче условной минимизации.

В данной главе рассматриваются методы решения задачи безусловной минимизации. Многие из них являются основой для перехода к более сложным методам решения задач условной минимизации.

§ 10.1. Задача безусловной минимизации функции многих переменных

1. Постановка задачи. Определения.

Пусть действительная функция многих переменных, определенная на множестве Точка называется точкой глобальною минимума функции на множестве X, если для всех выполняется неравенство . В этом случае значение называется минимальным значением функции на

Точка называется точкой локального минимума функции если существует такая -окрестность этой точки, что для всех

выполняется неравенство Если же для всех выполняется строгое неравенство то х называется точкой строгою локальною минимума.

Подавляющее большинство методов решения задачи безусловной минимизации в действительности являются методами поиска точки локального минимума. За исключением весьма редких случаев для нахождения точки глобального минимума, вообще говоря, не остается ничего иного, как найти все точки локального минимума и, сравнивая вычисленные в этих точках значения функции выделить среди них точку глобального минимума. Однако такой подход связан с чрезмерно большими вычислительными затратами и вряд ли перспективен. На практике чаще используется другой подход к нахождению точки глобального минимума, который состоит в том, чтобы определить ее местоположение из анализа самой решаемой задачи, а затем применить для вычисления один из методов поиска точки локального минимума.

2. Поверхность уровня, градиент и матрица Гессе. Необходимые и достаточные условия локального минимума.

Напомним некоторые определения и факты, известные из стандартного курса теории функций многих переменных.

Рис. 10.1

Множество точек, для которых целевая функция принимает постоянное значение называется повергнйстью уровня. В случае это множество называют линией уровня. На рис. 10.1 показано, как получаются линии уровня для функции двух переменных. Функция задает в трехмерном пространстве некоторую поверхность низшая точка которой и дает решение задачи минимизации. Для того чтобы изобразить рельеф этой поверхности, проведем несколько равноотстоящих плоскостей и Проекции на плоскость линий пересечения этих плоскостей с поверхностью и дают линии уровня.

Для дифференцируемой функции определен вектор из первых частных производных

Рис. 10.2

который называется градиентом. Если в точке х градиент не равен нулю, то он, как известно, перпендикулярен проходящей через эту точку поверхности уровня и указывает в точке х направление наискорейшего возрастания функции. Вектор называется антиградиентом и указывает направление наискорейшего убывания функции (рис. 10.2).

Известно также, что равенство нулю градиента в точке является необходимым условием того, чтобы внутренняя для множества X точка х была точкой локального минимума дифференцируемой функции Точка х, для которой выполняется равенство

называется стационарной точкой функции Равенство (10.1) представляет собой систему нелинейных уравнений относительно компонент вектора х, имеющую вид

Однако не всякая стационарная точка является точкой локального минимума. Пусть функция дважды непрерывно дифференцируема. Тогда достаточным условием того, чтобы стационарная точна х была точкой локального минимума, является положительная определенность матрицы

составленной из вторых частных производных функции Матрицу (10.3) принято называть матрицей Гессе.

3. Выпуклые функции.

Понятие выпуклости играет значительную роль в теории методов минимизации. Функция называется строю выпуклой, если для любых выполняется неравенство

Рис. 10.3

Это определение имеет наглядный геометрический смысл — график функции на интервале, соединяющем точки лежит строго ниже хорды, проходящей через точки (рис. 10.3). Для дважды непрерывно дифференцируемой функции положительная определенность матрицы Гессе является достаточным условием строгой выпуклости.

Функция называется сильно выпуклой с постоянной если для любых выполнено неравенство

Дважды непрерывно дифференцируемая функция является сильно выпуклой тогда и только тогда, когда для всех х матрица Гессе удовлетворяет условию

где постоянная, входящая в неравенство (10.4).

4. Задача минимизации квадратичной функции.

Часто первоначальное исследование свойств методов безусловной минимизации проводится применительно к задаче минимизации квадратичной функции

коэффициенты которой являются элементами симметричной положительно определенной матрицы А. Используя матричные обозначения, запишем функцию

Вычислим градиент и матрицу Гессе для функции (10.5). Дифференцирование по дает

Пользуясь симметрией матрицы А, получим формулу

Таким образом,

Дифференцируя обе части равенства (10.7) по получим Это означает, что для квадратичной функции (10.5) матрица Гессе не зависит от х и равна А.

Задача минимизации квадратичной функции представляет интерес многим причинам. Отметим две основные из них. Во-первых, в малой окрестности точки минимума гладкая целевая функция хорошо аппроксимируется суммой первых трех слагаемых ее разложения по формуле Тейлора:

с центром в точке Функция с точностью до постоянного слагаемого может быть записана в виде (10.6) с матрицей Поэтому можно ожидать, что вблизи точки минимума качественный характер поведения последовательности генерируемой методом минимизации, для функции окажется почти таким же, как и для квадратичной функции

Во-вторых, хорошо известно, что в случае, когда А — симметричная положительно определенная матрица, задача минимизации квадратичной функции (10.6) эквивалентна задаче решения системы линейных алгебраических уравнений

Более того, решение системы (10.10) дает точку минимума функции

(10.6). Действительно, является стационарной точкой функции Так как матрица Гессе положительно определена, то в точке выполнены достаточные условия минимума и, значит,

Таким образом, всякий метод безусловной минимизации, будучи примененным к поиску минимума функции (10.6), порождает некоторый метод решения системы (10.10).

Отметим, что поверхностями уровня квадратичной функции (10.6) служат -мерные эллипсоиды (при эллипсы) с центром в точке х. Отношение большей оси каждого из этих эллипсоидов (эллипсов) к меньшей оси равно числу обусловленности матрицы А. Здесь Лпвд и максимальное и минимальное собственные значения матрицы А. Чем больше отношение тем сильнее вытянуты поверхности (линии) уровня.

5. Обусловленность задачи минимизации.

В § 9.2 достаточно подробно обсуждалась обусловленность задачи поиска строгого локального минимума функции одной переменной. Так как ситуация в многомерном случае аналогична, то здесь изложим соответствующие положения более кратко.

Пусть точка строго локального минимума дважды непрерывно дифференцируемой функции матрица Гессе которой в точке х положительно определена. Предположим, что в некоторой окрестности точки минимума вычисляемые приближенные значения удовлетворяют неравенству Тогда для радиуса соответствующей области неопределенности справедлива грубая оценка где минимальное собственное значение матрицы Гессе

Отсюда следует, что методы приближенного решения задачи минимизациии, в которых используются только значения не могут, вообще говоря, гарантировать получение приближенного решения х с погрешностью меньшей чем Это означает, например, что даже для хорошо масштабированных задач (т. е. при неизбежна потеря примерно половины из того числа верных значащих цифр, которые содержались в приближенных значениях

Пусть теперь для решения задачи минимизации доступны

приближенные значения градиента Тогда сведение задачи поиска точки минимума х к эквивалентной задаче решения системы уравнений существенно улучшает обусловленность задачи. В частности, справедлива такая оценка границы абсолютной погрешности:

Здесь граница абсолютной погрешности значений считающаяся достаточно малой величиной. Поэтому если для вычисления х можно использовать значения градиента, то такой возможностью не следует пренебрегать.

1
Оглавление
email@scask.ru