Главная > Основы автоматического регулирования и управления
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

§ 11.4. МЕТОД ПОСЛЕДОВАТЕЛЬНОЙ ОПТИМИЗАЦИИ

Допущением, которое справедливо для достаточно широкого круга практических задач и позволяет построить методы синтеза алгоритмов управления, является ограничение искомых законов управления такими, характер которых полностью определяется конечным числом, неизвестных параметров. Типичным примером является линейный закон управления (11.3) полностью определяемый значениями передаточных чисел Нелинейные законы управления достаточно хорошо могут быть заданы, например, коэффициентами разложений нелинейных выражений в степенные ряды.

Пусть искомый закон управления определяется набором из параметров . Так, для линейного закона управления . В этом случае искомый закон управления представляется в виде набора выражений, зависящих от фазовых координат помех неизвестных параметров Подставляя эти выражения в уравнения (11.1), получаем

В силу непрерывной зависимости от параметров решение системы

11.56) может быть представлено в виде

После подстановки решения (11.57) в выражения для критерия оптимальности (11.4) и ограничений (11.5) задача оптимизации закона управления сводится к отысканию значений неизвестных при которых достигает экстремума критерий оптимальности

и выполняются ограничения

Сформулированная таким образом задача является задачей отыскания условного экстремума функции переменных.

Если условия (11.59) и (11.60) определяют замкнутую область в -мерном пространстве, является непрерывной функцией, то в силу теоремы Вейерштрасса функция обладает наибольшим и наименьшим значениями, которые достигаются либо внутри области, определяемой условиями (11.59) и (11.60), либо на ее границе. В первом случае экстремум функции достигается или в стационарной точке, в которой все первые производные одновременно обращаются в нуль:

или в точке, где одна или несколько производных терпят разрыв.

Функция может быть многоэкстремальной, т. е. иметь несколько локальных максимумов и минимумов. Поэтому при отыскании минимума (максимума) функции следует найти все точки локальных минимумов (максимумов) и выбрать из них точку, соответствующую глобальному минимуму (максимуму). Необходимое условие локального минимума имеет вид

а необходимое условие локального максимума записывается в виде

Типичными для большинства технических задач являются случаи, когда экстремум достигается в стационарной точке или на границе области, определяемой ограничениями (11.5) и (11.6). Для сведения второго случая к первому можно использовать функции нагружения (штрафные функции). Суть этого приема заключается в построении такой функции, экстремум которой достигается лйшь при выполнении ограничений. Пусть, например, критерий оптимальности оценивает точность управления, а ограничения заданы условиями

Тогда вместо минимума критерия I отыскивается минимум некоторого нового функционала, например,

где - весовые коэффициенты.

Недостаток этого метода заключается в том, что в зависимости от вида функционала и выбора весовых коэффициентов можно получить различные решения задачи оптимизации, не совпадающие в общем случае с решением исходной задачи. Положительной чертой метода является наглядность отыскания нужного решения, так как достаточно проверить стационарные точки функционала

Строгое решение сформулированной задачи может быть найдено с помощью методов нелинейного программирования, так как задача отыскания экстремума нелинейной функции многих переменных (11.58) при ограничениях (11.59) и (11.60) есть задача нелинейного программирования. Решение задачи нелинейного программирования обладает характерным свойством, сформулированным в теореме Куна—Таккера 162]. Пусть для определенности нужно найти минимум критерия оптимальности (11.58). Рассмотрим наряду с функционалом I обобщенную функцию Лагранжа

По условию теоремы Куна—Таккера, для того чтобы при некоторых значениях критерий принимал минимальное значение при ограничениях (11.59), (11.60), необходимо существование таких множителей Лагранжа

для всех удовлетворяющих ограничениям (11.60) и условиям

Это означает, что решение задачи нелинейного программирования и множители Лагранжа образуют седловую точку функции Лагранжа. Таким образом, искомое решение задачи минимизации критерия при ограничениях (11.59) и (11.60) должно в силу

теоремы Куна—Таккера удовлетворять условию седловой точки которое может быть записано в виде системы уравнений:

Найти оптимальные значения коэффициентов закона управления непосредственно из условий седловой точки (11.62) можно лишь в некоторых задачах, так как в общем случае частные производные в левых частях уравнений являются нелинейными функциями от Это обстоятельство не позволяет получить выражения для искомых коэффициентов в аналитической форме и заставляет пользоваться численными методами оптимизации. В задачах оптимизации алгоритмов управления оказался весьма удобным метод последовательной оптимизации, сводящий общую задачу нелинейного программирования к последовательности более простых задач.

Идея этого метода заключается в замене исходной задачи нелинейного программирования последовательностью задач квадратичного программирования, методика решения которых разработана наиболее подробно. Это объясняется тем, что при решении задач квадратичного программирования можно использовать методы линейного программирования, в частности, симплексный метод, широко используемый при решении экономических задач и задач исследования операций.

Пусть заданы некоторые исходные значения оптимизируемых коэффициентов Тогда в окрестности этих значений критерий оптимальности можно заменить приближенным выражением

и использовать приближенные выражения для ограничений:

(верхний индекс «(0)» означает, что соответствующая функция вычисляется при исходных значениях оптимизируемых коэффициентов).

Ограничения на коэффициенты сохраняются в прежнем виде:

Задача отыскания экстремума квадратичной функции (11.63) при линейных ограничениях (11.64) и (11.65) есть задача квадратичного программирования. Решая ее одним из известных способов, получают первое приближение искомых коэффициентов. После этого записывают новые приближенные выражения для критерия оптимальности и ограничений и, решая задачу квадратичного программирования, находят второе приближение Процесс продолжается до тех пор, пока результаты двух последних приближений не будут отличаться на пренебрежимо малую величину.

При линейных функциях рассмотренный процесс последовательной оптимизации непосредственно следует из применения метода Ньютона для решения системы нелинейных уравнений (11.62), определяющих седловую точку функции Лагранжа. Поэтому, строго говоря, сходимость последовательных приближений гарантируется лишь при достаточной близости начального приближения к искомому оптимальному решению. Однако при решении практических задач весьма быстрая сходимость обеспечивается и при нарушении этого условия.

Чтобы получить приближенные выражения для критерия оптимальности и ограничиваемых функций на шаге последовательной оптимизации, необходимо иметь их значения при найденных на предыдущем шаге коэффициентах и значения математических ожидании частных производных Поскольку функционалы зависят от параметров состояния и управляющих воздействий то

Сходимость метода незначительно изменяется, а сложность вычислений заметно уменьшается, если в правой части выражения (11.68) отбросить члены, содержащие вторые производные

Тогда для решения задачи квадратичного программирования достаточно иметь частные производные и их произведения Для отыскания частных производных необходимо решить систему уравнений чувствительности (см. гл. 10):

и вычислить производные от управляющих воздействий:

Система уравнений для произведений частных производных имеет вид

Как видно из формул (11.63), (11.64), (11.66)-(11.68), в приближенные выражения для критерия оптимальности и ограничиваемых функционалов входят только математические ожидания функций чувствительности и их произведений. Для отыскания этих математических ожиданий в каждый момент времени можно воспользоваться системой дифференциальных уравнений для моментов. Этот путь приводит к необходимости решения достаточно громоздкой системы дифференциальных уравнений. Поэтому часто более удобно отыскивать нужные величины, многократно решая уравнения чувствительности (11.69) совместно с уравнениями управляемого процесса (11.1) при различных реализациях входящих в эти уравнения случайных функций, т. е. использовать метод статистических испытаний. Для сокращения объема вычислений при выборе реализаций целесообразно воспользоваться каким-либо из приближенных методов, описанных в гл. 9, например методом Б. Г. Доступова [221. Найденныедля моментов времени значения математических ожиданий функций чувствительности и их произведений используются при отыскании решения задачи квадратичного программирования.

Введем для краткости следующие обозначения:

Подставляя выражения (11.66), (11.67) и (11.68) в (11.63) и (11.64) и используя условия (11.65), получаем для первого шага последовательной оптимизации следующую задачу квадратичного программирования:

найти экстремум квадратичного критерия оптимальности

при линейных ограничениях

Сформулированную задачу можно решать различными методами. Одним из наиболее наглядных является метод Била, представляющий собой обобщение симплексного метода линейного программирования 162].

Categories

1
Оглавление
email@scask.ru