§ 14.12. Многомерные задачи управления
Мы рассмотрим теперь обобщение задачи предыдущего параграфа на случай, когда состояние
это
-мерйый вектор (к 1). Так как проводимые ниже рассуждения вполне аналогичны уже проделанным, то мы опустим некоторые детали.
Предположим, что процесс подчиняется следующей системе уравнений:
Здесь
это
-мерный вектор,
— заданная невырожденная
-матрица,
заданный
-мерный вектор,
-мерный вектор управления, значение которого должно быть выбрано статистиком, и
-мерный случайный вектор с нормальным распределением, вектор средних которого есть 0, а к
-матрица ковариаций равна
причем случайные векторы
независимы.
Допустим, что наблюдаемый процесс описывается следующей системой уравнений:
Здесь
это
-мерный вектор, — заданная
-матрица
может быть отлично от
, и
-мерный случайный вектор, распределенный по нормальному закону с вектором средних 0 и невырожденной ковариационной
-матрицей
причем случайные векторы
и
независимы. В задачах такого типа размерность
вектора наблюдений
может быть больше, меньше или равна размерности к вектора состояний
Предположим, что задана последовательность
-мерных целевых векторов
Пусть, далее, общий ущерб
шаге
является суммой ущерба, отвечающего разности между состоянием
и целевым вектором
и платы за использование значения
вектора управления. Более точно, предполагается, что
имеет при
вид
Здесь
— заданные симметрические неотрицательно определенные
-матрицы. Статистик должен выбрать последовательность
ил, минимизирующую среднее значение суммы
Предположим, наконец, что априорное распределение начального состояния
нормальное с вектором средних
и невырожденной ковариационной к
-матрицей
Тогда на любом шаге процесса распределение
также нормальное. При
будем считать, что после выбора значения
но до наблюдения
распределение состояния
имеет вектор средних ту и матрицу ковариаций
Тогда при
после наблюдения значения
апостериорное распределение состояния
имеет такие вектор «средних
и ковариационную матрицу
Далее, при любом выборе значения управления
следующее состояние
распределено нормально с вектором средних
и ковариационной матрицей
имеющими вид
Поскольку
случайный вектор, то вектор
из (4) — также случайный с вектором средних
и ковариационной матрицей
где
Индекс
в (8) и (9) показывает, что эти значения вычислены после выбора значения
но до того как наблюдалось значение
При
обозначим через
среднее значение суммы
Для случая, когда апостериорный вектор средних
есть
и все последующие значения управлений выбираются оптимальным образом. Если определить функцию
как тождественный 0, то для
получим
Покажем теперь по индукции, что для
функция
задается равенством
Здесь
некоторая симметрическая неотрицательно определенная
-матрица,
-мерный вектор, 4 — некоторое число. Кроме того, мы докажем, что оптимальным значением
вектора управления будет
Мы предположим, что матрица
невырождена для
(см. упр. 9). Тогда матрица
также будет невырожденной.
Так как функция
тождественно равна 0, то она представима в виде (11) с
Предположим, что при некотором
функция имеет вид
Тогда, согласно соотношениям (3) и (8) упр. 11 к гл. И,
Если заменить
на его значение (6), то получим, что правая часть (13) является квадратичной функцией вектора
Доставляющее минимум значение управления
совпадает тогда с указанным в (12).
Если это оптимальное значение
подставить в правую часть (13), то найдем, что
имеет вид
чем и завершается доказательство по индукции. Произведя некоторые алгебраические преобразования, можно установить, что матрица а и вектор
фигурирующие в
имеют вид
Снова значение
не входит в (12), так что для оптимального выбора управления его знать не нужно и мы его не приводим. Соотношения (12) и (14) интересно сравнить с соответствующими одномерными результатами (10) § 14.11 и (9) § 14.10. Из соотношений (12) и (14) можно найти вид оптимальной последовательности управлений
если учесть еще условия