Главная > Энциклопедия кибернетики. Т.2
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

СИСТЕМА ЭКСТРЕМАЛЬНОГО РЕГУЛИРОВАНИЯ

— система, в которой с помощью непосредственного измерения некоторого показателя качества работы объекта и выработки соответствующего управляющего воздействия автоматически отыскивается и поддерживается режим работы, характеризующийся максимально (минимально) возможным значением показателя качества. Этот показатель качества называют иногда показателем экстремума или целевой функцией, в качестве которой часто принимают такие величины, как кпд, производительность, себестоимость, энергозатраты и т. д. Как правило, в процессе экстрем, регулирования отыскивается экстремум статической характеристики нелинейного нестационарного объекта, обладающего инерционностью и подверженного действию возмущений, изменяющих положение экстремума в пространстве управляющих воздействий. Этим задача экстрем, регулирования существенно отличается от задачи поиска экстремума ф-ции многих переменных, где вопросы учета инерционности объекта и экстремума дрейфа обычно не рассматриваются. Одна из наиболее простых структур одномерного объекта экстрем, регулирования (рис. 1) может служить удобной моделью для иллюстрации существа задачи экстрем, регулирования. На рис. НЗ — нелинейное звено, — целевая ф-ция, имеющая один или несколько экстремумов по передаточные функции звеньев, отображающие, в частности, инерционные свойства соответственно исполнительных и измерительных элементов системы; и — управляющее воздействие; произвольные неконтролируемые возмущения (в частности, ) учитывает наличие помех, накладывающихся на выходной сигнал объекта регулирования); у — измеряемая координата. Цель регулирования заключается в получении

Т. к. ин.д ф-ции заранее, как праиило, точно не изиестен, то можно гоиорить лишь о приближенном решении задачи (1). Следовательно, осн. задачи, решаемые при создании С. э. р., состоят и разработке способов получения оценок градиента целеиой ф-ции при наличии помех, возмущений и инерционности объекта. а также и организации устойчииого движения системы относительно точки экстремума.

Первые работы по экстрем, регулированию принадлежат Т. Штейну и М. Леблану (1922). С. э. р. начали систематически изучаться и работах В. В. Казакеиича (1945), Ч. Дрейпера и В. Ли (1951).

(рис. см. скан)

1. Блок-схема одномерного объекта экстремального регулирования.

2. Блок-схема системы экстремального регулирования, использующей принцип регулирования по возмущению.

3. Блок-схема импульсной системы экстремального регулирования автоколебательного типа.

4. Блок-схема непрерывной и импульсной (б) систем экстремального регулирования с синхронным детектором.

Наиболее актииное исследование С. э. р. началось и 1960-х годах, уже известно свыше 100 промышленных применений их.

По основным признакам С. э. р. классифицируют так. 1) По принципу регулирования они строятся как системы управления разомкнутые, использующие принцип упраиления по возмущению, и с использоианием упраиления по отклонению (с обратной связью) либо с одновременным использоианием обоих этих принципои (комбинированные системы автоматического управления). На рис. 2 прииедена структурная схема простейшей разомкнутой С. э. р. для случая, когда по услоииям задачи иозмущение измеряемо, а . Здесь — нелинейное звено (функциональный преобразователь), реализующее заиисимость при которой достигается По способу определения напраиления диижения к экстремуму (оценки градиента) замкнутые С. э. р. разделяют на беспоисковые (дифференциальные С. а. р., системы со испомогательным оператором и т. д.) и поискоиые системы, у которых для оценки градиента целеиой ф-ции на осн. диижение упраиляющих координат накладывается дополнительное диижение. Промежуточное положение между этими двумя классами С. э. р. занимают т. н. дуальные С. э. р., в которых упраиляющие и поискоиые воздействия заменяются единым процессом накопления информации об объекте и упраиления им (см. Дуальное управление). 3) По используемому поискоиому сигналу замкнутые С. э. р. делят на системы с детерминироианным и со случайным поискоиыми сигналами. 4) По ииду решаемой задачи С. э. р. разделяют на системы, обеспечивающие отыскание локального экстремума, и системы, обеспечииающие отыскание глобального экстремума (все рассматрииаемые ниже С. э. р. относятся к группе систем, обеспечивающих отыскание локального экстремума). 5) По количестиу упраиляющих иоздействий С. э. р. разделяют на одномерные и многомерные. 6) По наличию дополнительных условий бывают системы с поиском экстремума в открытой области и системы с поиском экстремума и закрытой области, т. е. при наличии ограничений на управляющие иоздейстиия. 7) По характеру работы во времени С. э. р. разделяют на непрерыиные и дискретные (импульсные). Несмотря на многие преимущестиа, присущие С. э. р. разомкнутого типа (иысокое быстродействие, отсутствие поисковых движений и т. д.) область применения их ограничена лишь теми случаями, когда все осн. возмущения, дейстиующие на объект управления, могут быть измерены. Поэтому большее распространение получили замкнутые С. э. р.

Рассмотрим принцип дейстиия одного из простейших классои С. э. р. автоколебательного типа (рис. 3), т. е. таких систем, у которых требуемый для определения оценки градиента целеиой ф-ции поисковый сигнал образуется за счет возбуждения в системе режима аитоколебаний. На рис. 3 (СМ —

сервомотор с передаточной ф-цией ЗУ — запоминающее устройство (или элемент задержки), триггер со счетным входом, ИЭ — импульсный элемент, период повторения которого равен Т. Приращение управляющего воздействия и на такте работы системы (регулирования закон) имеет вид

где — порог срабатывания триггера, а величина постоянного «шага» системы. Выбор знака или определяется видом экстремума: минимумом или максимумом соответственно. Если объект экстрем, регулирования имеет экстремум типа максимума, то движению к экстремуму соответствует значение Как только возникает импульс отрицательной полярности, превышающий величину е, триггер изменяет свое состояние и в соответствии с (2) изменяет знак приращения . В такой системе при неподвижной точке экстремума возникает режим автоколебаний. Характерной особенностью режима автоколебаний в С. э. р. как дискретного, так и непрерывного действия является то, что в силу наличия в них нелинейного звена с четной характеристикой происходит удвоение частоты колебаний выходной координаты объекта. Поэтому для обеспечения возможности существования автоколебаний в замкнутой С. э. р. необходимо наличие звена, в котором происходит обратный процесс преобразования частоты. Таким звеном в системе (рис. 3) является описывающееся ур-нием (2) звено, выполняющее роль своеобразного делителя частоты.

Такой же принцип возбуждения автоколебаний в замкнутой С. э. р. лежит в основе построения и многих др. систем такого рода, в т. ч. и систем непрерывного действия. Осн. вопросами теории С. э. р. этого класса являются вопросы определения условий существования автоколебаний и исследование зависимости их параметров от параметров объекта. При случайном характере изменения сигналов в таких системах может возникать квазиавтоколебательный режим, и одной из осн. задач также остается изучение условий существования этого режима. Для улучшения параметров режима автоколебаний в релейно-импульсных С. э. р. вводят первых разностей показателя экстремума, т. е. используют закон регулирования вида

Введение нескольких разностей в закон регулирования с помощью дискретного фильтра позволяет скомпенсировать инерционность объекта управления.

Одним из наиболее широко распространенных способов получения оценки градиента целевой ф-ции является использование внеш. генератора поискового периодического сигнала, подаваемого на вход объекта экстрем, регулирования (рис. 4, а), и последующего синхронного детектирования сигнала на выходе объекта С. э. р. с синхронным детектором. На рис. ГПК — генератор поисковых колебаний,

СМ — сервомотор с передаточной ф-цией

Принцип работы таких С. э. р. легче объяснить на простейшей модели объекта в виде

(рис. см. скан)

5. Блок-схема многомерной непрерывной системы экстремального регулирования с синхронными детекторами.

6. Блок-схема статистически-оптимальной системы экстремального регулирования.

Если , а ур-ние синхронного детектора имеет вид , то , где

квазипериодический сигнал, для подавления которого в системе (рис. 4, а) используется фильтр низких частот ФНЧ. Если пренебречь составляющей то подача сигнала на выход сервомотора обеспечивает движение к точке экстремума со скоростью, пропорциональной градиенту ф-ции Точное аналитическое исследование динамики системы с учетом нелинейных квазипериодических составляющих сигнала затруднительно. На рис. 4, б представлена структурная схема дискретного аналога схемы, представленной на рис. 4, а, закон регулирования которой имеет вид Здесь 1-й член описывает пробные периодические движения, подаваемые на вход объекта от внеш. генератора, а второй член представляет собой выходной сигнал разностного синхронного детектора. В описанной импульсной С. э. р. с синхронным детектором пробное и рабочее движение совершаются в одно и то же время. К этому классу относится и С. э. р. с двумя пробными шагами, в которой каждое рабочее движение выполняется после свершения двух пробных движений. Закон регулирования такой системы имеет вид

где переменный коэфф., равный 1 при -четных и 0 — при -нечетных.

При создании, настройке и эксплуатации С. э. р. возникают задачи синтеза оптимальных в определенном смысле С. э. р. (либо выбора их оптимальных параметров), исследования устойчивости и влияния внеш. помех и возмущений. Поскольку С. э. р. — нелинейные динамические системы с нелинейностями, имеющими экстрем, характеристики, то для решения всех этих задач созданы спец. методы и приемы, отличающиеся от применяемых для исследования обычных линейных и нелинейных систем автомат, регулирования. Динамика замкнутых С. э. р. описывается нелинейными дифференциальными (для непрерывных систем) или разностными (для дискретных систем) ур-ниями. Рассматривая достаточно малые отклонения от положения экстремума, можно линеаризовать соответствующие ур-ния, пренебрегая нелинейными членами, и тогда ур-ния динамики С. э. р. вырождаются в обычные дифф. (разностные) ур-ния с постоянными коэфф. Это позволяет значительно упростить исследования устойчивости таких систем. Кроме того, рассмотрение динамики С. э. р. с синхронным детектором в рамках линейных разностных ур-ний позволит применить дискретный аналог метода Винера — Колмогорова для синтеза статистически-оптим. дискретного фильтра, обеспечивающего обращение в минимум квадратичного функционала потерь по заданным спектральным (корреляционным) характеристикам случайных помех. При исследовании импульсных С. э. р., находящихся под воздействием случайных возмущений и помех, как явтоколебателыгого гипа, гак и с синхронным детектором, когда можно пренебречь влиянием инерционности объекта управления, анализ этих систем можно провести, используя простые Маркова цепи. При этом получаются простые соотношения, позволяющие оценить точность работы С. э. р. в условиях помех и выбрать оптим. параметры настройки экстремального регулятора. Кроме гармонических пробных сигналов, в качестве поисковых сигналов можно использовать и любые др. периодические ф-ции времени либо случайные сигналы, спектральная плотность которых отлична от нуля в полосе пропускания инерционного объекта управления.

Свойство ортогональности тригонометрических ф-ций позволяет использовать синхронные детекторы с кратными частотами поисковых движений для нахождения оценок градиента в многомерных С. э. р. Структурная схема соответствующей многомерной С. э. р. приведена на рис. 5, где объект управления представлен одной из своих простейших схем: линейной многомерной частью и нелинейным звеном, выходная величина которого Ф является ф-цией переменных На каждый г-вход объекта подается поисковый гармонический сигнал с частотой Выходной сигнал объекта содержит совокупность гармоник поисковых сигналов, а также их высшие и комбинационные гармоники. На синхронные детекторы СД, подаются опорные сигналы соответствующих частот со, и выходной сигнал объекта ф. Благодаря упоминавшемуся уже выше свойству ортогональности тригоном. ф-ций квазипостоянная составляющая на выходе каждого определяется приближении) только величиной и знаком I-й составляющей градиента целевой ф-ции ф. Выходные сигналы фильтров низких частот ФНЧ, н- ФНЧП управляют сервомоторами . В том случае, когда ф-ция в достаточно малой окрестности точки экстремума может быть аппроксимирована квадратичной формой да поведение всей замкнутой системы (см. рис. 5) в приближении может быть сведено к линейной системе дифф. ур-ний, анализ и синтез которых производится стандартными приемами.

Описанные выше С. э. р. имеют постоянную, заранее постулированную структуру. Для простейшего случая, когда одномерный объект экстрем, регулирования аппроксимируется параболой 2-го порядка с постоянной крутизной, соответствует звену 1-го порядка, а сигналы V и X являются винеров-скими процессами, т. е. где шумы», б — аддитивная помеха типа «белого шума» (рис. 6), на основе теории оптим. фильтрации Р. Калмана и Р. Бьюсв Робертс решил задачу структурного синтеза С. а. р., обеспечивающую

минимум функционала

Полученная в результате решения этой задачи структурная схема С. э. р. (рис. 6) состоит из модели объекта регулирования (звенья 1 и 2), интеграторов 3 и синхронных детекторов 4. В качестве поискового сигнала используется гармонический сигнал, амплитуда в частота которого определяется спектральными плотностями возмущений и параметрами объекта. Сигналы гармонические сигналы той же частоты, что и , а сигнал имеет удвоенную частоту; кроме того, сигналы содержат постоянную составляющую. Константа А равна оценке функционала J и определяется из решения ур-ний оптим. фильтрации. Из структурной схемы (рис. 6) видно, что структурные схемы рассмотренных ранее С. э. р. (рис. 4 и 5), предложенные на чисто эвристической основе, являются частными случаями статистически оптимальной С. э. р. Так, в частности, если возмущением можно пренебречь по сравнению с возмущением X, То С. э. р., приведенная на рис. 6, вырождается в обычную С. э. р. с синхронным детектором, которая описана выше.

Для того класса объектов экстрем, регулирования, для которого статистические характеристики случайных помех и возмущений заданы полностью и при целевой ф-ции в виде полного риска, т. е. матем. ожидания отклонения текущего значения показателя экстремума от его максимально возможного значения, А. А. Фельдба ум развил общий подход к нахождению оптим. управления, базирующийся на методах теории статистических решений и динамического программирования — теорию дуального управления. Эта теория является наилучшим инструментом в тех случаях, когда задана априорная плотность распределения внеш. воздействия и параметров объекта, а целевой ф-цией является средний риск. Достоинством такого подхода является то, что он носит объективный характер и не требует инженерной интуиции и эвристических рассуждений для нахождения закона управления С. э. р. Вместе с тем этот способ решения оказывается весьма сложным и применяется лишь для построения С. э. р. либо в простых случаях безынерционных объектов, либо при выполнении некоторых упрощающих допущений об объекте.

Если известно выражение, которым можно аппроксимировать экстремальную характеристику объекта, то имеется возможность построить т. н. экстраполяционную С. э. р., в которой после нескольких пробных шагов вычисляется положение точки экстремума, и тогда С. э. р. может достичь экстремума с помощью одного рабочего шага. Естественно, что при наличии случайных помех, искажающих выход объекта, а также при отличии модели экстремальной характеристики объекта от реальной процесс поиска экстремума состоит из нескольких итераций.

Много усилий было приложено для исследования возможности построения т. н. беспоисковых С. э. р., т. е. систем, у которых градиент целевой ф-ции определяется без приложения к объекту спец. поисковых движений. Одна из возможностей построения таких С. э. р. заключается в использовании подстраивающейся модели объекта экстрем, управления, иначе говоря, сначала решается задача идентификации нелинейного и в общем случае — нестационарного динамического звена, а затем аналитически либо в ускоренном масштабе времени с помощью поиска непосредственно на известной матем. модели объекта отыскивается и переносится на объект найденное требуемое значение управляющих воздействий. Решение задачи идентификации нелинейного объекта беспоисковым методом возможно при использовании ф-ций чувствительности, определяемых с помощью модели чувствительности. А это в свою очередь требует исчерпывающих сведевий о структуре изучаемого объекта.

При решении вырожденной задачи экстрем, регулирования, т. е. задачи управлении безынерционным нелинейным объектом, положение точки экстремума характеристики которого хотя и не известно, но остается неизменным, и при учете лишь аддитивно действующих на объект управления случайных помех, с успехом могут быть использованы различные методы решения задач оптимизации, такие, напр., как стохастической аппроксимации методы, случайного поиска методы и т. д. В частности, установлено, что при возрастании количества управляющих воздействий методы случайвого поиска экстремума для достаточно. широкого класса объектов управления оказываются предпочтительнее в смысле быстроты отыскания точки экстремуму по сравнению с различными модификациями градиентных методов.

Выше были описаны в основном С. э.. р. замкнутого типа. Широко применяются и комбинированные С. э. р., содержащие и линейные, и нелинейные связи по возмущению, когда могут быть измерены осн. возмущения. Такие системы объединяют преимущества замкнутых и разомкнутых С. э. р., т. е. быстродействие и точность поддержания экстремума. Показано, что в комбинированных С. э. р. можно достичь инвариантности систем автоматического управления, или, по крайней мере, астатизма порядка.

Лит.: Красовский А. А. Динамика непрерывных самонастраивающихся систем. М., 1963 [библиогр. с. 455—4651; Кунцевич В. М. Импульсные самонастраивающиеся и экстремальные системы автоматического управления. К., 1966 [библиогр. с. 266—279]; Фельдбаум А. А. Основы теории оптимальных автоматических систем. М., 1966 [библиогр. с. 594— 618]; Растригин Л. А. Статистические методы поиска. М., 1968 [библиогр. с. 370—376]; Автоматическая оптимизация управляемых систем. Пер. с англ. М., 1960; Самонастраивайщиеся системы. Справочник. К., 1969 [библиогр. с. 527—528].

В. М Кунцевич, А. А. Туник

1
Оглавление
email@scask.ru