§ 7.3. Экстремальное управление в условиях помех. Стохастическая аппроксимация
Постановка задачи экстремального управления однопараметрическими объектами в условиях помех. Существо подхода к ее решению. Если реализовать алгоритм (7.2.11) поиска экстремума объекта (7.2.1), то часто оказывается, что изменение управляющего параметра реализуется неточно, кроме того, на вход объекта поступает вместе с сигналом управления некоторое возмущение, а измерение выхода объекта сопровождается помехами.
Уравнение объекта (7.2.1) в этом случае принимает вид
(7.3.1)
где
— внешнее возмущение, прикладываемое ко входу объекта вместе с управляющим параметром;
— помеха, сопровождающая процесс измерения выхода
объекта;
— измеряемая переменная (результат измерения
).
Функции
— случайные процессы с неизвестными законами распределения. Однако известно, что они имеют нулевое математическое задание и ограниченную дисперсию. Требуется найти алгоритм поиска экстремума, при котором математическое ожидание выхода
достигает наименьшего значения.
При решении этой задачи будем для простоты полагать
и тогда уравнения (7.3.1) примут вид
(7.3.2)
Существо метода стохастической аппроксимации состоит [7.6], [7.7] в следующем: каждое измеренное состояние объекта, каково бы оно ни было, должно быть так использовано для изменения управляющего воздействия, что в пределе выполнится условие
(7.3.3)
Будем изменять управляющее воздействие в соответствии с алгоритмом
(7.3.4)
который отличается от (7.2.11) тем, что в нем используются результаты измерений
(7.3.6)
где
- случайные величины, являющиеся реализацией помех измерения на интервале
, так как измерения осуществляются в различные моменты времени в течение указанного интервала.
Заметим также, что в отличие от (7.2.11) величина
пробных шагов не постоянна, а изменяется при
.
Метод стохастической аппроксимации позволяет найти также параметры рабочего и пробного шагов
, при которых алгоритм (7.3.4) обеспечивает нахождение экстремума (выполнение условия
) в условиях помех, относительно которых известно лишь, что они имеют нулевое математическое ожидание и дисперсия их ограничена.
Определение параметров рабочего и пробного шагов
Утверждение 7.3.1. Для сходимости поискового алгоритма (7.3.4) нужно, чтобы параметры рабочих и пробных шагов удовлетворяли условиям
(7.3.7)
Указанные в утверждении условия выполняются, если, например,
(7.3.9)
где
.
Поясним происхождение условий (7.3.7), (7.3.8). Учитывая (7.3.5) и (7.3.6), запишем алгоритм (7.3.4) в виде
(7.3.11)
Полагая, что пробные шаги достаточно малы так, что
, и учитывая, что
вычислим математическое ожидание эффективности
шага:
(7.3.12)
Нетрудно видеть, что среднее значение совпадает с (7.2.18) при отсутствии помех, и поэтому для сходимости процессов «в среднем» необходимо выполнение соотношений (7.2.27), (7.2.28), которые совпадают с (7.3.7).
Переходя к условию (7.3.8), вычислим математическое ожидание и дисперсию рабочего шага
. Очевидно, что
(7.3.13)
где
— дисперсии случайных величин
.
Естественно, что сумма дисперсий сколь угодно большого числа рабочих шагов, осуществляемых в процессе поиска, должна быть ограничена
где
.
Отсюда следует условие (7.3.8). Оно означает, в частности, что величина пробного шага
должна стремиться к нулю медленнее, чем
, так как в противном случае величины дисперсий рабочих шагов, как следует из
. будут расти до недопустимо больших величин.