5.2.3. Схема нейронного управления

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

5.2.3. Схема нейронного управления

Способность нейронных сетей к обучению и обобщению оказалась интересной для многих приложений. Одним из простейших подходов к реализации нейронного управления стал

инверсно-прямой подход [16], [17]. В соответствии со схемой обобщенного обучения, рассмотренной в разделе 4.2.1, многослойная нейронная сеть сначала обучается автономно по алгоритму обратного распространения [18] для построения инверсной динамической модели объекта управления.

В исследовании [19], выполненном авторами данной работы, установлено, что количество задержанных сигналов от объекта управления, используемых на этапе обучения в качестве элементов входного вектора нейросетевой модели, влияет на процесс изучения контроллером инверсной модели объекта управления. Это, в свою очередь, влияет на характеристики нейроконтроллера в оперативном режиме. Теоретически эти процессы можно описать следующим образом.

Рассмотрим линейный динамический объект управления с одним входом и одним выходом, без помех. Предположим, что он описывается дискретным уравнением

где у и — выходной и входной сигналы объекта управления соответственно. Здесь — коэффициенты знаменателя, — коэффициенты числителя, — время запаздывания (или временная задержка), — номер отсчета. Модель нейронной сети для инверсной динамической модели объекта управления представляет собой нелинейную функцию содержащую задержанные входные и выходные сигналы объекта управления в соответствии с оценкой порядка и временной задержкой объекта управления:

где — выходной сигнал нейронной сети, представляющий собой управляющий входной сигнал для объекта управления. При оперативной реализации системы нейронного управления действительный выходной сигнал объекта управления

заменяется желаемым выходным сигналом в качестве одного из элементов входного вектора нейронной сети.

На данной основе разработаны нейросетевые модели объекта управления (инверсная и прямая); при этом использовалась математическая модель объекта управления пониженного порядка [20]. Хотя нейронные сети могут обучаться модели объекта управления, не используя предварительное математическое моделирование [8]-[10], тем не менее, было бы неправильно при разработке контроллеров игнорировать информацию об объекте управления, если такая информация есть. Более того, на основе такой информации можно избежать ненужных операций, выполняемых методом проб и ошибок [19].

Обучение инверсной нейросетевой модели производилось с использованием выборки обучающих образцов, взятых из данных о реакции разомкнутой системы управления. В некоторых разработках [8]-[10], [21] обучающие образцы выбирались путем «зондирования» объекта управления случайными сигналами. В реальном времени такой метод нецелесообразен, так как изменения температуры происходят медленно. В связи с тем, что разомкнутая система является устойчивой, вместо случайных сигналов выполнялась подача плавно нарастающего сигнала непосредственно на исполнительное устройство (в пределах ограничений, установленных для входа этого устройства). Из данных о реакции системы был выбран набор обучающих образцов «вход-выход», как показано на рис. 5.2.2.

Было обнаружено, что нейросетевая модель, имеющая 8 скрытых нейронов, может изучать инверсную модель объекта управления. При этом используется два элемента входного вектора: текущего выхода объекта управления и задержанного выхода полученных по математической модели объекта управления пониженного порядка. Прямая нейросетевая модель разрабатывалась аналогично, однако в этом случае входные обучающие образцы представляли собой выборку из входных сигналов объекта управления и задержанных выходных величин, а выходные образцы — из соответствующих

Рис. 5.2.2. Характеристика «вход-выход» разомкнутой системы управления температурой водяной ванны, полученная при подаче плавно нарастающего сигнала непосредственно на исполнительное устройство. Из этой характеристики получена выборка из семи обучающих образцов «вход-выход».

действительных значений выхода объекта управления. Обе модели настраивались, как показано нарис. 4.2.5; такая конфигурация допускает последующее оперативное обучение для дальнейшего улучшения характеристик моделей.

Для схемы обобщенного автономного обучения сигнал обратного распространения между выходным и скрытым слоями можно выразить в виде

где — заданный (целевой) образец, — действительный выход нейронной сети. Сигнал между скрытым и входным слоями выражается следующим образом:

Здесь — производная от функции где

Веса связей между входным и скрытым слоями корректируются в соответствии с выражением

а между скрытым и выходным слоями — по формуле:

где — скорость обучения, — коэффициент мгновенного значения и ускорения соответственно. Уравнения (5.2.5) и (5.2.6) представляют собой модифицированные формы обобщенного дельта-правила [22].

Для схемы оперативного обучения веса связей нейроконтроллера корректируются на основе ошибки, определяемой как

где и у — заданный и фактический выход объекта управления соответственно. Эта ошибка распространяется через эмулятор. Таким образом, сигнал на выходе контроллера можно выразить следующим образом:

где и — соответственно входной и выходной сигналы нейронов выходного слоя контроллера. Верхний индекс Е обозначает эмулятор, контроллер. Сигнал ошибки между скрытым и входным слоями контроллера выражается следующей формулой:

где — выходной сигнал нейронов скрытого слоя контроллера. В данной схеме веса связей нейронного эмулятора не

сохраняются постоянными, а корректируются в оперативном режиме. Это делается путем обратного распространения ошибки Е через эмулятор при каждом отсчете времени. Здесь ошибка Е определяется в виде

где у и у — выходы действительного объекта управления и эмулятора, соответственно.

Обратное распространение сигналов ошибки для эмулятора аналогично автономному обучению при использовании только одной сети. Схему оперативного обучения для нейронного управления можно представить в виде следующего алгоритма.

Шаг 1. Прочитать выход процесса у и сравнить его с желаемым опорным значением

Шаг 2. Вычислить величину сигнала ошибки между выходным и скрытым слоями нейроэмулятора.

Шаг 3. Вычислить величину сигнала ошибки между скрытым и входным слоями нейроэмулятора.

Шаг 4. Вычислить величину сигнала ошибки между выходным и скрытым слоями нейроконтроллера.

Шаг 5. Вычислить величину сигнала ошибки 8 между скрытым и входным слоями нейроконтроллера.

Шаг 6. Скорректировать веса связей для нейроконтроллера (между выходным и скрытым и между скрытым и входным слоями).

Шаг 7. Сравнить выход нейроэмулятора у и фактический выход объекта управления у.

Шаг 8. Скорректировать веса связей для нейроэмулятора (между выходным и скрытым и между скрытым и входным слоями).

<< Предыдущий параграф

Следующий параграф >>

Оглавление