Главная > Статистический синтез при априорной неопределенности и адаптация информационных систем
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

10.6. АДАПТИВНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ

Рассмотрим теперь несколько задач, в которых множества решений и параметров А. определяющих величину потерь, имеют разную структуру. Примеры подобного рода постоянно встречаются При синтезе систем управления, когда решением является выбор управляющего воздействия, а потери зависят от координат управляемою объекта. Итак, Нусть имеется объект управления, вообще говоря, нелинейный, описываемый следующим рекуррентным соотношением:

где вектор, задающий состояние объекта на шаге; управляющее воздействие на шаге, переводящее объект из состояния на шаге в состояние на шаге;

совокупность неизвестных параметров, характеризующих неполноту априорного Описания объекта из-за ограниченного знания его структуры и характеристик, известная функция состояния объекта, управляющего воздействия и совокупности неизвестных параметров.

Простейшим примером (10.6.1) является линейная система, описываемая соотношением

где С — квадратная матрица того же порядка, что и вектор - прямоугольная матрица с числом столбцов, равным размерности вектора Если об этой системе ничего, кроме ее линейности, неизвестно, то совокупность параметров включает все элементы матриц В общем случае ограниченного знания ее характеристик можно представить матрицы в виде функций от некоторого количества параметров

Естественно, что при переходе к непрерывному времени рекуррентные соотношения или (10.6.2) заменяются соответствующими дифференциальными уравнениями.

Пусть цель управления заключается в том, чтобы на каждом шаге минимизировать некоторую функцию, зависящую от состояния объекта на этом же шаге и, возможно, от велйчины выбираемого для достижения этого состояния управляющего воздействия Обозначим эту функцию через Кроме того, будем считать, что управляющее воздействие не произвольно, а может выбираться из заданной ограниченной области Описанная цель управления соответствует локальному критерию оптимальности, при котором выбор управляющего воздействия на каждом шаге осуществляется независимо от остальных шагов. К этому случаю иногда сводится и требование глобальной оптимальности системы, если только функция потерь, зависящая от состояний объекта и управляющих воздействий, на всех шагах обладает свойством сепарабельности, например, аддитивна, т. е.

а возможные ограничения на совокупность управляющих воздействий разбиваются на совокупность ограничений на отдельные значения Используя общие уравнения динамического программирования можно показать, что при некоторых ограничениях на и уравнения (10.6.1) управляемый многошаговый процесс принятия решений разбивается на совокупность независимых решений на отдельных шагах, т. е. соответствует требованию локальной оптимальности.

Функция потерь в зависимости от требований к системе управления может иметь различный вид. Если, например, требуется, чтобы на на шаге состояние объекта было наиболее близким к некоторому заданному состоянию и мера близости задается квадратичной, то

где некоторая матрица того же порядка, что вектор В этом случае функция потерь зависит от только неявно, посредством зависимости от вектора состояний объекта Если реализация управления влечет за собой определенные затраты, зависящие от величины выбираемого управляющего воздействия, то функция потерь будет явно зависеть и от например:

где слагаемое учитывает затраты, связанные с выбором управляющего воздействия Выбор управляющего воздействия осуществляется с использованием последовательности данных наблюдения каждая из наблюдаемых величин (в общем случае векторная) зависит от состояния объекта управления на шаге и имеет плотность распределения вероятности

также в силу имеющейся априорной неопределенности зависящую от совокупности неизвестных параметров а. В практических задачах чаще всего представляет собой результат измерения состояния объекта на шаге с некоторыми ошибками измерения, т. е.

где ошибка измерения, статистические свойства которой известны неполностью и могут быть описаны только с помощью распределения вероятности, зависящего от совокупности неизвестных параметров а.

Согласно общим правилам теория решений выбор оптимального решения — управляющего воздействия осуществляется минимизацией апостериорного риска, т. е. функции

где вектор, описывающий совокупность полученных за шагов данных наблюдения, а минимизация (10.6.7) производится по значениям принадлежащим к области соответствующей заданным ограничениям на управляющее воздействие. Подставляя в (10.6.7) значение из уравнения (10.6.1), описывающего состояние объекта управления, будем иметь

Из этого выражения видно, что для получения апостериорного риска (нужно усреднить функцию потерь по апостериорному распределению вероятности для вектрра описывающего состояние системы на шаге, при заданном значении вектора описывающего имеющуюся совокупность данных наблюдения. При этом имеется в виду, что для всех предыдущих шагов задача уже решена и соответствующие управляющне воздействия выбраны.

При наличии априорной неопределенности апостериорное распределение вероятности зависит от неизвестных параметров

Дополняя, как в § 10.4., вектор этими параметрами и вводя обозначение для их полной совокупности где будем иметь

где

В тех же приближениях, что в § 10.4 (при гауссовой аппроксимации апостериорного распределения вероятности), после вычисления условного математического ожидания в (10.6.9) и предполагая, что функция потерь дважды дифференцируема по получаем

где V). — оператор градиента по первому аргументу функции потерь оценка совокупности параметров апостериорная корреляционная матрица этой совокупности;

Оценка и матрица (или определяются по рекуррентным соотношениям (10.4.21), (10.4.22), в которых в соответствии с видом уравнения (10.6.1) следует положить При этом, вычисляя оценку на шаге, в правой части этих рекуррентных соотношений, которая зависит от предыдущего значения управляющего воздействия посредством вектора

следует положить равным тому значению управляющего воздействия, которое уже выбрано на шаге.

Само выражение (10.6.11) получается путем разложения функции потерь в ряд Тейлора в окрестности точки по степеням малой разности и интегрирования этого ряда с гауссовым распределением вероятности для разности с отбрасыванием после интегрирования членов четвертого и более высоких порядков малости.

Последним этапом в решении задачи является выбор оптимального значения управляющего воздействия путем минимизации (с учетом имеющихся ограничений) явно зависящего от выражения для апостериорного риска (10.6.11). При этом часто второе слагаемое (по крайней мере асимптотически, когда с ростом числа шагов матрица стремится к нулю) является малой поправкой к величине функции потерь В этом случае выбор соответствует значению, минимизирующему функцию потерь, в которой значения

вектора характеризующего состояние управляемого объекта, и параметра введенных для описания неопределенности свойств этого объекта, заменяются их оценками, вычисленными по имеющимся данным наблюдения по рекуррентным соотношениям § 10.4. Зависимость оптимального управляющего воздействия от при этом получается точно такой же, как зависимость от в полностью детерминированной задаче, когда значения на каждом шаге точно известны. Это приближение для апостериорного риска, т. е.

справедливое при наиболее удобно с точки зрения решения задачи минимизации апостериорного риска по но может оказаться сравнительно грубым. Более точным является приближение, в котором только оценки параметров считаются точными и учитываются ошибки оценки состояния объекта При этом соответствующие блоки матрицы в (10.6.11) заменяются на нули и в результате имеем еще одно приближение:

где подматрица матрицы для компонент вектора

Это приближение за счет уменьшения порядка матриц во втором слагаемом проще (10.6.11) с точки зрения решения задачи минимизации

1
Оглавление
email@scask.ru