Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике 2.4. МЕТОДЫ ОЦЕНИВАНИЯ ПО НАСТРАИВАЕМОЙ МОДЕЛИНечетные и четные функции ошибокСхема, изображенная на фиг. 2.1, б, может быть использована для такой настройкимодели чтобы ее передаточные характеристики в некотором смысле приближались к передаточным характеристикам объекта Центральной частью фиг. 2.1, б является блок, помеченный символом В этом блоке обрабатывается поступающая информация. Ошибку можно определить как — а критерий ошибки — как минимизацию любого четного функционала от этой ошибки, например
где, как и раньше, параметр рассматриваемого объекта, соответствующий параметр модели. Выбор четного функционала приводит к такой зависимости между и значением настраиваемого параметра которая показана на фиг. 2.4. Таким образом, мы подходим к различию между так называемыми управлениями по «нечетным» и по «четным» функциям [7]. Рассмотрим глаз человека как пример, иллюстрирующий оба механизма управления (фиг. 2.5, а). Радужная оболочка управляет уровнем освещенности сетчатки как самая обычная система управления: если уровень освещенности слишком высок, сигнал ошибки приводит к сужению зрачка, и наоборот. Знак ошибки непосредственно указывает направление изменения размеров зрачка (фиг. 2.5, б). Сигнал ошибки сводится к пулю. Хрусталик управляет фокусировкой изображения. Здесь сигнал ошибки ужо не меняет знака при перестройке фокусного расстояния хрусталика от наблюдения удаленных предметов для наблюдения близких предметов и наоборот. Четкость изображения как функция аккомодации хрусталика и, следовательно, сигнала ошибки имеет экстремум (фиг. 2.5, в). Мы сталкиваемся с ситуацией, (кликните для просмотра скана) (кликните для просмотра скана) (кликните для просмотра скана)
Фиг. 2.8. аналогичной схеме с настраиваемой моделью. Эта ситуация типична для адаптивных и экстремальных регуляторов. На фиг. 2.6 проводится сравнение целей оценивания параметров, оптимизации и адаптации. На фиг. 2.7 показано главное отличие обычного управления от управления экстремального типа. Будем называть эти два типа систем с обратной связью, подчеркивая их основное отличие, системами с нечетной функцией (ошибки) и системами с четной функцией (ошибки). Из фиг. 2.8 видно, что если известен знак второй производной (минимум или максимум функции), то для системы с четной функцией ошибки требуется по меньшей мере два наблюдепия, чтобы определить по ним направление движения к экстремуму. Для того чтобы управлять, необходимо сжать информацию о двух или большем числе наблюдений, представив ее в виде одного числа. Такая редукция данных превращает четную функцию ошибки в нечетную функцию ошибки. После редукции, используя эту нечетную функцию ошибки, можно применять обычный принцип управления с обратной связью. Направление оптимальной настройки указывается знаком первой производной по Для непрерывных (по времени) сигналов, используя выражение (2.16), находим
Ни ни нельзя измерить непосредственно без дополнительных приспособлений. Некоторые из приемов получения желаемой информации будут рассмотрены в дальнейшем. Если удается найти эти частные производные, то для определения наилучшего значения можно использовать градиентные методы (см. гл. 5). Для выборочных сигналов в том случае, когда выбранное описание адекватно представляет поведение исследуемого объекта, паходим (см. фиг. 2.3)
и, следовательно, ошибка определится как
Таким образом, квадратичная форма
достигает минимума при Снова нужно определить Предполагая, что можно вычислить, приходим к задаче об отыскании способа автоматической настройки параметра Имеется несколько путей решения этой задачи. Настройка может быть непрерывной и дискретной. Непрерывная схема настройки. Хорошая стратегия получается, если положить
Такой выбор приводит к градиентному методу. коэффициент усиления, от которого зависит скорость сходимости (настройки). Будет показано, что коэффициент можно выбирать как постояппым, так и зависящим от времени, он может быть скалярным или или матрицей или . Строго говоря, при определепии градиента величина должна быть неизменной. В непрерывной схеме настройки это требование не выполняется. Поэтому уравпение (2.20) лишь приближенно описывает динамику настройки в том случае, когда настройка цроисходит относительно медленно. Дискретная схема настройки. Упомянутая трудность определения градиента не возникает, если пользоваться дискретной схемой: измерение градиента при постоянном настройка новое измерение градиента и т. д. Подобная задача рассматривается в теории стохастической аппроксимации [21] и приводит к следующему алгоритму:
где вектор параметров модели после настройки; значение функционала на наборе ошибок; коэффициент усиления, определяющий скорость сходимости алгоритма. На простом примере снова можно продемонстрировать связь между методами с настраиваемой моделью и использованием явных математических выражений. Допустим, что критерием настройки является
Из. уравнения (2.9) видно, что после настройки оптимальное значение параметра определится как
Это оценка по методу наименьших квадратов при условии, что проведена априорная настройка модели и имеется последовательность выборочных значений ошибки. Для последующих настроек из уравнения (2.21) находим
Также можно оценить степень «неопределенности» этой оценки Точно так же в задачах настройки можно использовать критерий Сходимость получаемых процедур Осуждается в гл. 5. Методы получения частных производных или градиентовВ принципе имеются следующие подходы: а) Использование коэффициентов влияния параметров или коэффициентов чувствительности параметров. В последние годы этот способ вызвал большой интерес (см. гл. 9). Идею метода можно объяснить на простом примере, принадлежащем Мейссингеру [14]. Рассмотрим модель первого порядка с одним неизвестным параметром и выходным сигналом
Ошибка Отсюда Так как нас интересует поведение модели на всей временной оси начальные условия не имеют значения. Запишем формально
Оставим только члены первого порядка малости. Величину производной можно определить, продифференцировав по дифференциальное уравнение (2.22):
Меняя порядок дифференцирования и делая замену находим
Это уравнение называется уравнением чувствительности по Для переменного величина является оценкой градиента который в этом случае зависит от времени. Уравнения (2.22) и (2.25) могут быть набраны в виде схемы генерации функции изображенной на фиг. 2.9. Можно также набрать схемы, соответствующие уравнениям (2.17) и (2.20) или (2.21), которые бы при некоторых
Фиг. 2.9.
Фиг. 2.10. ограничениях обеспечивали сходимость выходного сигнала к параметру Подробно это обсуждается в гл. 9. б) Использование двух моделей с параметрами Оценку первой производной по можно найти, если использовать дне модели с параметрами соответственно. Разность выходных сигналов этих моделей дает величину которую можно использовать как оценку в уравнениях (2.17) и (2.20) или (2.21) (фиг. 2.10). Этот метод также рассматривается в гл. 9. в) Использование модели с возмущаемым параметром. Этот метод основывается на соотношении
из которого следует, что если величина параметра модели определяется возмущением, заданным известной
Фиг. 2.11. функцией времени — пробным сигналом, а возникающее возмущение производной может быть измерено, то можно получить информацию о величине (фиг. 2.11). Этот метод рассматривается в гл. 9. г) Использование обобщенной модели. Очевидно, что перечисленные методы вычисления или их оценок предъявляют серьезные требования к технической реализации или машинным процедурам. Эти трудности возрастают, если определению подлежит целый ряд параметров. Вообще говоря, для каждого оцениваемого параметра необходима еще одна модель или еще один возмущающий пробный сигнал. Поэтому полезно остановиться на случае, когда ошибка является линейной функцией настраиваемых параметров:
В этом случае имеем
т. е. коэффициенты чувствительности входят в модель в явном виде. Этот случай представлен на фиг. 2.12. Входной сигнал и стационарен и в большинстве случаев
Фиг. 2.12. считается случайным процессом. Блоки представляют собой операторы (например, передаточные функции для линейных систем, нелинейные операторы). Эти блоки вместе с «потенциометрами» и сумматором образуют обобщенную модель объекта. Потенциометры позволяют осуществлять настройку положительных и отрицательных значений коэффициентов. Выходную ошибку будем называть обобщенной ошибкой. В дальнейшем читатель оценит удобство модели, которая приводит к ошибке, линейной по оцениваемым параметрам. На фиг. 2.13, а — в приводятся конкретные примеры:
Отметим, что а) является частным случаем б), а б) — частным случаем в). Для обобщенной модели вовсе не обязательно, чтобы связь между входом и выходом модели была линейной. Уже из фиг. 2.12 видно, что операторы могут быть нелинейными. Фиг. 2.13. (см. скан) На фиг. 2.13, а приводится пример системы, в которой ошибка нелинейна относительно оцениваемых параметров:
Здесь является динамическим оператором модели, а векторы параметров.
|
1 |
Оглавление
|