Главная > Прикладные задачи фильтрации и управления
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

§ 2.8. Оптимизация терминального управления с вычислением стохастических градиентов

Описанный алгоритм оптимизации управления методом стохастического программирования (способ 1) основывался на определении вектора стохастического квазиградиента разностной формулой (2.89), в которую входят интерполированные значения функции условных рисков найденной на предыдущем шаге в узлах решетки области Теоретический анализ точности алгоритма, по-видимому, невыполним. Однако можно предположить, что с уменьшением величины А в (2.89) все более заметными станут ошибки определения стохастических квазиградиентов, вызываемые ошибками ЦВМ и ошибками интерполяции. Последние могут стать недопустимо большими, если векторы в правой части (2.89) находятся внутри одного и того же элементарного -мерного параллелепипеда решетки области

Аналогичную потерю точности можно ожидать в способе 2 при вычислении стохастических квазиградиентов по формуле (2.94). Если допустить гладкость функции в правой части (1.7) по то в формулах алгоритма стохастического программирования стохастический квазиградиент можно заменить стохастическим градиентом, определяемым численным интегрированием некоторой системы дифференциальных уравнений.

Рассмотрим вначале методику определения градиента по и функции Зафиксируем

реализацию случайной вектор-функции допредельной модели белого шума на интервале Наряду с уравнением (1.7) рассмотрим сопряженное уравнение

где матрица, у которой элемент, принадлежащий строке и столбцу. Пусть вектору и дано малое приращение Тогда соответствующее приращение удовлетворяет уравнению

где матрица с элементами Из (2.95), (2.96) получим

Интегрируя (2.97) от 0 до получим, считая

Положим где вектор градиента функции Тогда

и, следовательно,

где вектор градиента по и функции вектор и на отрезке постоянен. Положив получим следующую методику определения вектора градиента используемого в алгоритме стохастического программирования:

1. В память ЦВМ заносится некоторая реализация на отрезке случайной ступенчатой функции численным интегрированием уравнения (1.7) от до при фиксированных определяются векторы и для моментов шаг интегрирования) заносятся в память ЦВМ.

2. Уравнение (2.95) численно интегрируется от до при условии фиксированном и занесенных ранее в намять ЦВМ функций векторы заносятся в память ЦВМ в моменты

3. Вектор градиента определяется путем вычисления векторного интеграла в правой части (2.99) при и использования занесенных в память ЦВМ векторных функций Вектор является стохастическим градиентом по и функции в смысле [25], так как, допустив перестановочность операций дифференцирования по и осреднения по случайному вектору , получим

Алгоритм (2.100) обеспечит сходимость почти наверное к вектору оптимального управления если коэффициенты удовлетворяют условиям (2.76) и функция выпукла вниз по и.

Для проведения последующих шагов численного синтеза надо в соответствии с уравнением (2.86) определять стохастические градиенты по и функций которые являются градиентами по и соответственно функций

Векторы этих градиентов определяются формулой вида (2.99), в которой последовательно положено а векторы определяются численным интегрированием от до от до сопряженного уравнения (2.95) при начальных условиях

где векторы градиентов по х функций Возможны два способа определения векторов этих градиентов по х. Способ 1 рассмотрим вначале применительно к задаче определения вектора используя на шаге вычислений наряду с алгоритмом (2.100) алгоритм (2.87). В результате в

узлах решетки области помимо векторов будут найдены и занесены в память ЦВМ величины на шаге вычислений (определение ) из уравнения найден вектор Вектор градиента определяется приближенно разностной формулой

где узел решетки области ближайший к точке числа, входящие в формулу (2.4), II орты В

Как уже отмечалось, формула вида (2.101) не дает систематических ошибок вычислений градиента, если функцию в окрестности точки можно аппроксимировать квадратичной функцией. Заметим, что вектор можно найти более точно, если по формуле (2.101) найти градиенты для всех вершин элементарного параллелепипеда, внутри которого лежит точка и провести интерполяцию.

По аналогичной методике определяются градиенты для последующих шагов численной оптимизации.

Рассмотрим способ 2 определения векторов градиентов не требующий применения разностных формул. Сделаем предварительное замечание. Уравнение (2.95) будем интегрировать раз от до 0 при векторах начальных условий, которые образуют единичную диагональную матрицу размерности При каждом интегрировании от до 0 получаем векторы , образующие фундаментальную матрицу линейного уравнения (2.95). Положим в (2.96), (2.97) , а в (2.97) вместо подставим . Тогда

и, следовательно,

так как Из (2.102) следует, что

где левая часть (2.103) означает матрицу, у которой строке и столбцу принадлежит элемент

Перейдем к определению градиента Дифференцируя по х, получим, используя (2.103) при

матрица получена -кратным интегрированием (2.95) при фиксированных

Образуем случайную последовательность векторов алгоритмом

где верхиий индекс в правой части (2.105) означает, что при интегрировании (1.7) и (2.95) положено Эта последовательность сходится почти наверное к вектору градиента Таким образом, на первом шаге численного синтеза наряду с определением производится «заготовка» для второго шага: определяются и заносятся в память ЦВМ компоненты вектора Методика определения векторов аналогична.

Из соотношения (2.91) следует, что

где матрица получена -кратпым интегрированием (2.95) от до при фиксированных Вектор был «заготовлен» на предыдущем шаге численного синтеза, если только х совпадает с одним из узлов решетки области В противном случае надо провести интерполяцию или считать, что где узел, ближайший к х. К вектору сходятся векторы определяемые алгоритмом

Итак, особенность изложенного способа 2 определения векторов градиентов состоит в том, что на шаге численного синтеза наряду с определением производится «заготовка» для следующего шага: определяются и заносятся в память ЦВМ градиенты

1
Оглавление
email@scask.ru