§ 9.3. Стохастическая аппроксимация. Идентификация параметров и переменных состояния
Алгоритм стохастической аппроксимации.
Рассмотрим асимптотически устойчивый объект управления, описываемый уравнениями
(9.3.1)
где
-
-мерный вектор состояния;
- управляющий сигнал;
- внешнее возмущение и помеха, являющиеся последовательностями случайных чисел с нулевым средним и ограниченными дисперсиями;
(9.3.3)
Требуется по результатам измерений переменной
определить компоненты векторов
, являющихся неизвестными параметрами объекта (9.3.1) (9.3.2).
Представим уравнения (9.3.1) (9.3.2) в форме (9.2.8), которая является моделью со скользящим средним (СС-модель). Для этого найдем изображение измеряемой переменной при нулевых начальных условиях
где z — комплексное число дискретного преобразования Лапласа (в частности,
). Используя разложение
(9.3.5)
в справедливости которого нетрудно убедиться, умножая (9.3.5) на
, получим на основе (9.3.4), после перехода к оригиналу, что
(9.3.6)
В силу асимптотической устойчивости объекта ограничимся первыми
членами ряда (9.3.6), тогда
(9.3.7)
Таким образом, числа
в модели (9.2.8) определяются выражениями
(9.3.8)
Вводя обозначения
(9.3.9)
запишем (9.3.7) в виде
(9.3.11)
Будем искать оценку
вектора
из условия минимизации критерия
(9.3.12)
В соответствии с алгоритмом стохастической аппроксимации определяем искомую оценку из условия минимума (в каждый момент времени) невязки
по методу градиента:
(9.3.13)
где параметр
удовлетворяет условиям § 7.3,
В [9.9] доказано, что оценки
сходятся с вероятностью
к истинному значению
в среднеквадратическом смысле:
(9.3.15)
Если вектор
найден, то искомые векторы
находятся из отношений
(9.3.16)
Переходя к доказательству этих соотношений, отметим, что в силу (9.3.10)
(9.3.17)
Теперь убедимся в справедливости (9.3.16) при
. В этом случае
(9.3.18)
Нетрудно видеть, что
(9.3.19)
и, таким образом, из (9.3.19) следует первое из отношений (9.3.16). Второе из равенств (9.3.16) имеет в рассматриваемом случае вид
(9.3.20)
Нетрудно проверить, что
и поэтому (9.3.20) можно записать в виде
(9.3.21)
Используя теорему Гамильтона — Кэли, в соответствии с которой
, убеждаемся в справедливости (9.3.21) и, следовательно, (9.3.16) выполняется.
Таким образом, имеет место утверждение.
Утверждение 9.3.1. Алгоритм идентификации параметров (векторов
и
) объекта (9.3.1), (9.3.2) состоит из операций: а) в соответствии с рекуррентным соотношением (9.3.13), в котором параметр
удовлетворяет условиям (9.3.14), определить при достаточно больших k вектор
по формулам (9.3.16) найти искомые векторы
и
.