§ 14.13. Задачи управления с погрешностями, вносимыми статистиком
В этом параграфе мы опять рассмотрим одномерный процесс управления, при котором на каждом шаге состояние системы наблюдается безошибочно. Мы, однако, приблизим нашу модель к реальности, предположив, что при осуществлении управления системой статистик на каждом шаге вносит в систему случайную погрешность, величина которой зависит от величины управления.
Эта погрешность отражается на последующем состоянии системы. Таким образом, при значение управления влияет не только на среднее значение состояния на следующем шаге, но и на его дисперсию.
Более точно, предположим, что процесс описывается следующей системой уравйений:
Здесь постоянные управление и случайное возмущение имеют тот же смысл, что и в § 14.10. Произведение случайной величины и управления отвечает погрешности, вносимой статистиком. Предполагается, что Далее, мы будем считать, что начальное состояние фиксировано и случайные величину независимы в совокупности.
При любом заданном состоянии и управлении среднее значение очередного состояния равно как и в задаче из § 14.10, но дисперсия его равна теперь в то время как в упомянутой задаче она равнялась просто Однако если общий ущерб опять представляется в виде суммы где определены формулой (2) § 14.10, то оптимальное управление на каждом шаге по-прежнему будет линейной функцией от состояния на этом шаге. Изучаемая здесь задача является обобщением задачи § 14.10, поскольку мы можем положить при
Если функции при определены, как в § 14.10 то они должны удовлетворять соотношению (3) § 14.10. Как и раньше, можно доказать по индукции, что квадратичная функция вида (4) § 14.10. В настоящей задаче и при
Значения в нашей задаче опять задаются формулами (9) § 14.10. Далее, рассуждение по индукции показывает, что оптимальное значение управления при имеет вид
Доказательство этих соотношений составляет предмет упр. 10.
Так же как и в § 14.10, оптимальная последовательность не зависит от значений дисперсий Следовательно, эти значения статистику знать не необходимо. Далее,
значения указанные в (3), будут оптимальными, если предположить только, что случайные величины независимы, а их первые два момента удовлетворяют указанным требованиям. Никакие дополнительные допущения о распределениях этих величин не нужны.
Дальнейшие замечания и ссылки на литературу. Много задач типа рассмотренных в § 14.10-14.13, а также более общих задач разобрано в книге Аоки (1967). В ней приведена также обширная библиография по теории управления. Вот некоторые другие книги по этой тематике: Ту (1964), Фельдбаум (1966), Савараги, Сунахара и Накамидзо (1967), Клейндорфер и Клейндорфер (1967) исследовали обобщение задали из § 14.12, в котором функция потерь может включать как линейные, так и квадратичные члены. Ванде Линде (1967) рассмотрел обобщение, в котором на каждом шаге статистик может выбирать между несколькими управлениями с различными характеристиками и стоимостями.
Во многих задачах управления некоторые из коэффициентов, определяющих процесс, неизвестны и их значениям должно быть приписано определенное априорное распределение. В задачах такого типа, как правило, оптимальная процедура уже не ймеет такого простого линейного вида, как в изученных нами случаях. См. по этому поводу названные монографии.