§ 10.7. Стохастические оптимальные системы. Методы синтеза. Методы оптимальной оценки состояния. Принцип разделимости
Для детерминированных систем управления не имеет значения
какое управление — программное или с обратной связью — используется, так как знание управления и начального состояния позволяет однозначно определить состояние системы в любой момент времени. Наблюдение за текущим состоянием системы не дает новой информации. В стохастических системах управления, т. е. в системах управления, подверженных случайным воздействиям, по известным управлению и начальному состоянию предсказать ход протекания процесса невозможно, так как он зависит еще от случайных воздействий. И возможности управления такими системами существенно зависят от той информации, которая может быть получена путем измерения и обработки выходной (наблюдаемой) переменной. Поэтому стохастические оптимальные системы управления должны быть замкнутыми, т. е. системами управления с обратной связью.
В теории детерминированного управления основное внимание также уделяется замкнутым системам, так как практически все системы управления подвержены случайным воздействиям. Детерминированные системы рассматриваются как модели, которые используются в процессе синтеза, ввиду их простоты по сравнению со стохастическими системами. Предполагается, что в действительности в процессе функционирования они будут подвержены случайным воздействиям.
Задача синтеза стохастической оптимальной системы управления в общем случае ставится следующим образом. Задаются дифференциальные уравнения объекта, ограничения, краевые условия, уравнения наблюдения, критерий оптимальности и характеристики случайных воздействий и параметров.
Требуется найти управление как функцию от измеренных значений выходной переменной
на интервале
Для решения стохастических задач оптимального управления разработаны методы, в том числе стохастический принцип максимума, метод динамического программирования и другие [5, 9, 17, 18, 19]. Ниже будут рассмотрены метод динамического программирования и методы, основанные на сведении стохастических задач оптимального управления к задачам оптимальной оценки состояния и синтеза детерминированной оптимальной системы управления.