Главная > Основы автоматического регулирования и управления
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

§ 11.3. СИНТЕЗ ОПТИМАЛЬНОГО ЗАКОНА УПРАВЛЕНИЯ С ИСПОЛЬЗОВАНИЕМ МЕТОДА ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ И ПРИНЦИПА МАКСИМУМА

Рассмотренная в § 11.2 задача синтеза оптимальной функции веса решена при полной свободе выбора структуры и параметров системы. При синтезе оптимальных САУ объект управления обычно задан. Тогда воспользоваться рассмотренной методикой в общем случае не представляется возможным. Пусть объект управления описывается системой нелинейных дифференциальных уравнений вида

где фазовые координаты системы (параметры состояния); — управляющее воздействие; — заданные детерминированные функции своих аргументов.

Рассмотрим задачу синтеза управляющего воздействия для объекта (11.21) из условия минимизации критерия качества

где и — заданные функции фазовых координат, определяющие точность, расход энергии или другие показатели качества управления.

Для решения задачи можно воспользоваться методом динамичен кого программирования, предложенным Р. Веллманом [7] для широкого круга систем, будущее состояние которых определяется их состоянием в настоящем. Метод динамического программирования базируется на принципе оптимальности, который можно сформулировать в следующей форме: оптимальное управление не зависит от «предыстории» системы и определяется лишь ее состоянием в рассматриваемый момент времени.

Рассмотрим оптимальную траекторию в фазовом пространстве координат (рис. 11.4), соединяющую точки Минимальное значение критерия (11.22), соответствующее оптимальной траектории обозначим через По принципу оптимальности участок траектории от любой точки до конечной точки В также является оптимальной траекторией. При этом часть критерия оптимальности (11.22), которая соответствует участку и отрезку времени от до Т, должна иметь минимально возможное значение. Обозначим это значение через

Рис. 11.4. Оптимальная траектория в пространстве фазовых координат

В окрестности точки С выберем точку такую, что время, соответствующее где бесконечно малый промежуток времени.

Для участка траектории отвечающего интервалу времени , можно найти минимальное значение функционала (11.22):

Согласно принципу оптимальности условие для определения оптимального управления можно записать в виде

или

так как функция в явной форме не зависит от управления.

В соответствии с введенными выше участками траектории и интеграл в выражении (11.23) вычислим по частям.

Обозначив

получим

При достаточно малом первый интеграл в выражении (11.24) можно представить в виде

где — величина высшего порядка малости по сравнению с . С учетом этого выражение (11.24) примет вид (в интеграле заменим переменную интегрирования

Так как первое слагаемое правой части выражения (11.25) зависит лишь от значения а второе определяется и значениями в интервале изменения переменной интегрирования, то выражение (11.25) можно записать в виде

Второе слагаемое в правой части выражения (11.26) есть поэтому

Разложим функции в ряд Тейлора в окрестности точки Тогда получим

где — величина высшего порядка малости относительно величины

Так как в соответствии с уравнениями (11.21), то

Подставим последнее выражение в функцию и разложим ее в бесконечно малой окрестности точки в ряд Тейлора. При этом получим

где — величина высшего порядка малости по сравнению с

Формула (11.30) справедлива только в том случае, если существуют частные производные функции по переменным Подставляя выражение (11.30) в уравнение (11.27), получаем

где величина высшего порядка малости по сравнению с После преобразований будем иметь

Устремив к нулю, получим функциональное уравнение Веллмана

так как величина в пределе равна нулю.

Уравнение (11.31) является дифференциальным уравнением в частных производных. Граничное условие для функции получим при

Если то граничное условие принимает вид

Уравнение (11.31) представляет собой необходимое и достаточное условие оптимальности. Основным ограничением для него является требование непрерывности и гладкости оптимальной функции

Если дифференциальные уравнения (11.21) являются линейными:

где — заданные функции времени; возмущения, то функциональное уравнение (11.31) запишется в виде

При получим

Если правая часть уравнения (11.31) непрерывна по управлению и и на управление не наложено никаких ограничений, то для отыскания минимума выражения в квадратных скобках можно приравнять нулю частную производную. Это дает

откуда можно получить соотношение для структуры оптимального управления:

Подстановка соотношения (11.36) в уравнение исключает из него управление и и позволяет получить нелинейное дифференциальное уравнение в частных производных для определения функции

Трудности решения уравнений в частных производных общеизвестны, поэтому не всегда удается отыскать аналитическую зависимость в функции фазовых координат и времени. Однако если решение уравнения в частных производных удается найти, то однозначно определяются частные производные а, значит, и структура алгоритма управления

Пример 11.3. Для объекта с дифференциальным уравнением

найдем оптимальное управление, минимизирующее критерий качества

Используем функциональное уравнение (11.34):

Так как выражение в квадратных скобках непрерывно относительно и, то из условия (11.35) получим, что

или

Подставляя формулу (11.40) в уравнение (11.39), получаем уравнение в частных производных:

или

Решение уравнения (11.41) можно найти, если предположить, что

Так как

то

откуда следует дифференциальное уравнение для определения неизвестной функции

Уравнение 11.42) является дифференциальным уравнением Рикатти с граничным условием

вытекающим из соотношения (11.32).

Введя новую переменную получим

Найдя решение уравнения (11.44) в виде а значит, и можно определить искомое оптимальное управление:

Пример 11 4. Найдем оптимальное управление для объекта с дифференциальным уравнением (11.38) из условия минимизации критерия качества

если на управление наложено ограничение

Используя функциональное уравнение (11.34), получаем

Так как выражение в квадратных скобках является линейной функцией управления, то его минимум обеспечивается при

Подставляя это выражение в уравнение (11.45), находим

или

Уравнение (11.47) является нелинейным уравнением в частных производных. Поэтому задача определения оптимального управления усложняется. Пример 11.5. Определим оптимальные параметры управления

для процесса, описанного дифференциальным уравнением (11.38), из условия минимизации критерия качества

Очевидно в этом случае будем иметь

поэтому

Как видно, оптимальное управление получено в классе с переменной структурой (см. § 8.7). Задача определения функции в этом случае является достаточно сложной.

Рассмотренные примеры синтеза оптимального управления для объекта с дифференциальным уравнением первого порядка показывают, что с использованием метода динамического программирования можно определить класс функций, к которым относится оптимальное управление, но не всегда просто найти параметры оптимального управления.

Для объектов, описываемых сложными нелинейными дифференциальными уравнениями (11.21), задача синтеза оптимального управления с использованием метода динамического программирования оказывается практически неразрешимой.

Коротко остановимся на необходимых условиях оптимальности, которые дает принцип максимума [41].

Если дополнить уравнения (11.21) уравнениями

и ввести в рассмотрение функции

где а также учесть соотношение то функциональное уравнение (11.31) формально можно записать в форме принципа максимума

где — так называемый гамильтониан.

Условие (11.48) представляет собой необходимое условие оптимальности в принципе максимума.

Дифференциальные уравнения для определения функций имеют вид

Исходная система уравнений определяется аналогично:

Итак, условие (11.48) совместно с дифференциальными уравнениями (11.49) и (11.50) позволяет принципиально поставить задачу об отыскании оптимального управления. Необходимые и достаточные условия оптимальности принимают вид:

Систему уравнений (11.52) необходимо дополнить начальными условиями

Определив из условий (11.51) выражение для управления и и подставив его в уравнения (11.52) и (11.53), можно найти систему дифференциальных уравнений для отыскания функций .

Для линейной системы (11.33) при система уравнений (11.51) и (11.52) примет вид

Условие оптимальности (11.51) при этом можно записать следующим образом:

Если удастся найти решение совместной системы уравнений (11.51)-(11.53) или (11.54), (11.55), то задачу синтеза

тимального управления можно считать решенной. Однако этот путь наталкивается на серьезные трудности. Так, из системы уравнений (11.54) следует, что при устойчивом объекте уравнения для функций Дают неустойчивые решения. Кроме того, при заданных функциях достаточно сложной является задача определения зависимостей между функциями и что необходимо для синтеза управления в форме обратной связи. Поэтому принцип максимума в большей степени приспособлен для отыскания программных оптимальных управлений в функции времени, нежели для решения задач синтеза оптимального закона управления.

1
Оглавление
email@scask.ru