Главная > Прикладные задачи фильтрации и управления
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

§ 1.7. Оптимальная оценка фазовых координат и дуальное управление

В изложенной выше трактовке задача синтеза оптимального стохастического управления не требует постановки и решения задачи оценки фазовых координат. Задача оценки зависит от выбранного критерия качества оценивания и, как видно, непосредственно не связана с задачей управления (по крайней мере в формальном плане). Поэтому задача оценки решается для того, чтобы «знать», а не для того, чтобы «управлять». Однако умение определять векторы достаточных статистик позволяет решать задачу оценивания, оптимального по произвольному критерию.

Пусть векторы управлений — произвольные функции векторов обратной связи и качество оценки вектора определяется средним значением положительной функции потерь , где вектор оценки вектора

Тогда вектор оптимальной оценки решает задачу

где

Но

и из (1.41)

где в (1.60) и далее символ означает осреднение при фиксированном При выбранных управлениях векторы не зависят от векторов оценок. Поэтому из (1.60) и (1.61) получим, что вектор оптимальной оценки определится при решении задачи

Итак, если решена задача определения достаточных статистик и условных плотностей вероятностей нужных для вычисления то задача оптимальной оценки сводится к относительно простой задаче (1.62), численно решаемой, например, методом стохастического программирования, если на ЦВМ

существует программа, генерирующая случайные векторы при фиксированном векторе главу 2).

Наиболее часто

где матрица R положительно определена (определение и необходимые свойства подобных матриц изложены в § 2.3). Обозначим через условное (после фиксации векторов вектора Покажем, что

Представим (1.63) в виде

и, следовательно,

Первое слагаемое в правой части (1.65) от z не зависит, а второе — минимально при что доказывает справедливость (1.64). Поэтому называют вектором оценки вектора оптимальным по среднеквадратичному критерию. Этот вектор не зависит от конкретного вида матрицы Вектор наиболее важная вектор-функция вектора достаточны статистик.

Выше предполагалось, что вектор оптимальной оценки определяется при заданных функциях — векторах управлений. Однако можно поставить задачу управлять системой так, чтобы получить вектор оценки, оптимальный на множестве допустимых управлений. При этом, конечно, надо задаться некоторым фиксированным моментом времени для которого ищется вектор оценки оптимальный на множестве допустимых управлений Пусть для определенности в (1.4) положим и

Из следует, что вектор оптимальной оценки и векторы оптимальных управлений

определяется при последовательном решении уравнений

Заметим, что векторы оптимальных управлений можно было бы по терминологии [51] назвать векторами дуальных управлений, так как оптимальные управления выбираются из условия достижения наилучшёй оценки — наилучше «узнавания» фазовых, координат системы в момент в которые, конечно, могут быть включены неизвестные параметры, характеризующие динамическую систему. Если в (1.68) величина не зависит от то управления не влияют на среднее значение и дуальных управлений не существует.

1
Оглавление
email@scask.ru