§ 3.4 Оптимизация методам стохастического программирования
1. При оптимизации управления линейной динамической системы методом стохастического программирования (способ 1, §
на каждом шаге решается задача определения вектор-функции
где из (2.79), (2.80) и (3.15), (3.17)
причем
и
осреднение производится по ранее определенному. случайному вектору у, имеющему размерность соответственно
Ранее (§ 2.6) было показано, что функции
выпуклы вниз по и (при выпуклости вниз функций
что гарантирует в определенном ранее смысле сходимость процесса стохастического программирования, описываемого алгоритмом
Реализация этого процесса для линейных динамических систем существенно проще, чем для систем нелинейных. Это объясняется простотой модели, генерирующей для разных векторов и, меняющихся в процессе итераций, случайные векторы
по формуле (3.17), в которой характеристика рассеивания (матрица
не зависит от и и, следовательно, постоянна на данном шаге процесса оптимизации. Вектор
вектор градиента по и функции
(вектор стохастического градиента функции
по и равен
, необходимый на каждой итерации, определяется формулой
где
вектор градиента функции
Этот вектор можно найти по приближенной разностной