§ 9.3. Стохастическая аппроксимация. Идентификация параметров и переменных состояния
Алгоритм стохастической аппроксимации.
Рассмотрим асимптотически устойчивый объект управления, описываемый уравнениями
(9.3.1)
где - -мерный вектор состояния; - управляющий сигнал; - внешнее возмущение и помеха, являющиеся последовательностями случайных чисел с нулевым средним и ограниченными дисперсиями;
(9.3.3)
Требуется по результатам измерений переменной определить компоненты векторов , являющихся неизвестными параметрами объекта (9.3.1) (9.3.2).
Представим уравнения (9.3.1) (9.3.2) в форме (9.2.8), которая является моделью со скользящим средним (СС-модель). Для этого найдем изображение измеряемой переменной при нулевых начальных условиях
где z — комплексное число дискретного преобразования Лапласа (в частности, ). Используя разложение
(9.3.5)
в справедливости которого нетрудно убедиться, умножая (9.3.5) на , получим на основе (9.3.4), после перехода к оригиналу, что
(9.3.6)
В силу асимптотической устойчивости объекта ограничимся первыми членами ряда (9.3.6), тогда
(9.3.7)
Таким образом, числа в модели (9.2.8) определяются выражениями
(9.3.8)
Вводя обозначения
(9.3.9)
запишем (9.3.7) в виде
(9.3.11)
Будем искать оценку вектора из условия минимизации критерия
(9.3.12)
В соответствии с алгоритмом стохастической аппроксимации определяем искомую оценку из условия минимума (в каждый момент времени) невязки по методу градиента:
(9.3.13)
где параметр удовлетворяет условиям § 7.3,
В [9.9] доказано, что оценки сходятся с вероятностью к истинному значению в среднеквадратическом смысле:
(9.3.15)
Если вектор найден, то искомые векторы находятся из отношений
(9.3.16)
Переходя к доказательству этих соотношений, отметим, что в силу (9.3.10)
(9.3.17)
Теперь убедимся в справедливости (9.3.16) при . В этом случае
(9.3.18)
Нетрудно видеть, что
(9.3.19)
и, таким образом, из (9.3.19) следует первое из отношений (9.3.16). Второе из равенств (9.3.16) имеет в рассматриваемом случае вид
(9.3.20)
Нетрудно проверить, что
и поэтому (9.3.20) можно записать в виде
(9.3.21)
Используя теорему Гамильтона — Кэли, в соответствии с которой , убеждаемся в справедливости (9.3.21) и, следовательно, (9.3.16) выполняется.
Таким образом, имеет место утверждение.
Утверждение 9.3.1. Алгоритм идентификации параметров (векторов и ) объекта (9.3.1), (9.3.2) состоит из операций: а) в соответствии с рекуррентным соотношением (9.3.13), в котором параметр удовлетворяет условиям (9.3.14), определить при достаточно больших k вектор по формулам (9.3.16) найти искомые векторы и .