Главная > Нейроуправление и его приложения
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

3.3. Управление с самонастройкой

Управление с самонастройкой можно рассматривать как вид управления, выполняющий две основные задачи в замкнутом цикле обратной связи. Общая схема такого метода управления приведена на рис. 3.3.1. На ней показаны обе основные задачи системы самонастройки. Первая из них — сбор информации о текущем состоянии управляемого процесса. К данной задаче относится постоянное определение текущего состояния управляемого процесса на основе измеримых данных о входе и выходе процесса, а также сигналов состояния.

Полученная информация используется для идентификации системы, которая включает определение структуры модели, оценку ее параметров, а также оценку параметров неконтролируемых сигналов (например, шумовых сигналов в стохастических системах). Определение структуры модели требует построения вида математического представления системы, соответствующего решаемой задаче. Оценка параметров представляет собой ключевой элемент самонастройки. Она выполняется в оперативном режиме. Для управления с самонастройкой

Рис. 3.3.1. Общая схема самонастраивающегося контроллера

используется несколько схем рекурсивной оценки параметров. Наиболее распространенная схема—рекурсивный метод оценки на основе метода наименьших квадратов [31], [32] или его расширение — UD факторизационный метод [33], который является более надежным.

Вторая задача системы самонастройки — задача проектирования (контроллера); ее решение обычно базируется на оптимизации критерия оптимальности управления. Цель управления задается для каждой конкретной системы; при этом требуется принять решения в отношении того, как контроллер должен адаптироваться или настраиваться. На этой основе рассчитывается новый набор параметров контроллера (взамен прежних параметров в цикле управления). Эта часть процесса известна как этап ратификации или утверждения; одно из основных достоинств системы самонастройки состоит в том, что данный процесс выполняется в оперативном режиме и в реальном времени. При традиционном методе процесс утверждения обычно выполняется в автономном режиме; результаты часто оказываются неудовлетворительными, и весь процесс моделирования и проектирования приходится повторять. Расчет закона управления выполняется на основе процедуры, называемой эквивалентом определенности; в ней неопределенность текущих оценок параметров игнорируется.

Подход к оцениванию параметров передаточной функции по процессу и воздействию называется методом косвенной самонастройки, или методом полной определенности. Примером реализации метода такого типа может служить самонастраивающийся регулятор Острема (Astrom) и Виттенмарка (Wittenmark) [6], известный также под названием системы управления по минимуму дисперсии. Критерий оптимальности такого регулятора — минимизация дисперсии выходного процесса по всем моментам дискретного времени Это может быть достигнуто следующим образом: сначала предсказывается будущая вёлична выходного процесса на шагов вперед — затем текущая величина управляющего

воздействия устанавливается таким образом, чтобы сделать этот выход нулевым. Однако в этом методе не делается попыток оптимизации уставок, атакже возможны чрезмерно большие величины управляющих воздействий. Другим недостатком данного метода является нестабильность замкнутого цикла из-за потери нулей процесса, если процесс не является минимально-фазовым. Для преодоления этих сложностей Кларк (Clarke) и Гаутроп (Gawthrop) [18], [19] изменили критерий: минимизируется нетолько дисперсия выхода, но и функция, включающая управляющее воздействие, выход, атакже изменения уставки. Таким образом обеспечивается возможность использования большего набора целей функционирования. В этом критерии управляющий сигнал подвергается «штрафу» таким образом, что уменьшаются его избыточные пики, и обеспечиваются возможности оптимального отслеживания уставки. Кроме того, модифицированный критерий обеспечивает стабильное управление неминимально-фазовым процессом. Такой тип самонастраивающегося контроллера известен также под названием УОМД (управление по обобщенному минимуму дисперсии). В последнее время в литературе приводятся различные усовершенствования и расширения этого контроллера [34—39].

Для вывода алгоритма работы таких контроллеров рассматривается система в форме модели управляемой авторегрессии — скользящего среднего (УАРСС) (Controlled Auto-Regressive Moving Average (CARMA) model). Систему можно представить в виде следующей математической модели:

где — выходной процесс, — входной процесс (управляющее воздействие), — некоррелированная случайная последовательность с нулевым математическим ожиданием и ковариацией (среднеквадратическим отклонением) a, d — время задержки, — целочисленное время. выражаются через оператор z-преобразования:

Предполагается, что корни полинома располагаются внутри круга единичного радиуса. Никаких предположений о корнях полиномов не делается, т.е. считается, что за пределами единичного круга могут находиться как корни (что означает неустойчивость объекта управления в разомкнутом состоянии), так и корни (объект управления неминимально-фазовый).

В этом случае используется критерий качества в виде:

где — математическое ожидание, — задаваемые пользователем полиномы, — уставка, — дробно-рациональная передаточная функция:

Здесь — полиномы степени соответственно. Данный критерий качества в некоторых отношениях отличается от критерия качества по минимуму дисперсии, предложенного Остремом. Управление по последнему критерию направлено только на стабилизацию выходного процесса вблизи нулевого значения при действии случайных возмущений. Однако во многих реальных ситуациях требуется поддерживать при случайных возмущениях выход системы на некотором постоянном уровне. В УОМД-контроллере используется как стабилизация, так и серворегулирование. Кроме того, УОМД-контроллер придает такой вес управляющему воздействию, что он препятствует появлению излишне больших значений этого воздействия при подавлении последствий от нулей, находящихся вне области устойчивости. В рассматриваемом подходе

вводится понятие псевдовыхода, задаваемого следующим выражением:

Таким образом, систему можно рассматривать как обобщенный выход системы с прогнозирующим элементом, фильтрующим действием на входе и с уставкой. Многие стратегии самонастройки основываются на прогнозирующей схеме управления; горизонтом прогнозирования при этом является временная задержка Оптимальное прогнозирование выхода в момент может быть получено в момент если вход выбран таким образом, что возмущения нейтрализуются. Для получения оптимального прогноза псевдовыхода рассмотрим уравнение тождества (тождественное равенство) в следующей форме:

где

и

Умножая уравнения (3.3.1) на получим:

Подставляя из уравнения (3.3.8) в уравнение (3.3.12), получим:

Здесь Прибавляя к обеим частям уравнения (3.3.13), получим:

что эквивалентно выражению:

Обозначив через оптимальный прогноз величины полученный на основе измерений до момента времени а через — ошибку прогноза, а также полагая получим:

и

Здесь Учитывая, что ошибки в последующие моменты времени не коррелированы с текущими и предыдущими измерениями на входе и выходе, управление по минимальной дисперсии достигается путем выбора таким, чтобы обращалось в ноль. Таким образом, получим

Так как в момент времени величины известны, выражение прогноза можно уменьшить до

Таким образом, оптимальный прогноз на шагов вперед задается следующим выражением:

Параметры контроллера можно легко получить из тождества (3.13), если полиномы известны. Если же они неизвестны, то для оценки элементов можно использовать рекурсивный метод наименьших квадратов, рассматриваемый ниже. Векторы параметров регрессии и данных следующие:

где — оценки элементов соответственно.

Для самонастраивающегося контроллера оценка параметров выполняется рекурсивно, а наблюдения производятся последовательно. Процесс рекурсивной оценки параметров показан на рис. 3.3.2. Оценка текущего выхода вычисляется на основе прошлой информации о модели, полученной из оценки Ошибка моделирования получается путем

Рис. 3.3.2. Блок-схема рекурсивной оценки параметров

сравнения оценки выхода с наблюдаемым выходом. Затем ошибка минимизируется в смысле наименьших квадратов, а оценка корректируется в соответствии с новым значением Оценки могут быть получены с помощью трех важных рекурсивных уравнений:

где — ковариационная матрица, задаваемая выражением:

1
Оглавление
email@scask.ru