Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
5.2.3. Схема нейронного управленияСпособность нейронных сетей к обучению и обобщению оказалась интересной для многих приложений. Одним из простейших подходов к реализации нейронного управления стал инверсно-прямой подход [16], [17]. В соответствии со схемой обобщенного обучения, рассмотренной в разделе 4.2.1, многослойная нейронная сеть сначала обучается автономно по алгоритму обратного распространения [18] для построения инверсной динамической модели объекта управления. В исследовании [19], выполненном авторами данной работы, установлено, что количество задержанных сигналов от объекта управления, используемых на этапе обучения в качестве элементов входного вектора нейросетевой модели, влияет на процесс изучения контроллером инверсной модели объекта управления. Это, в свою очередь, влияет на характеристики нейроконтроллера в оперативном режиме. Теоретически эти процессы можно описать следующим образом. Рассмотрим линейный динамический объект управления с одним входом и одним выходом, без помех. Предположим, что он описывается дискретным уравнением
где у и
где заменяется желаемым выходным сигналом На данной основе разработаны нейросетевые модели объекта управления (инверсная и прямая); при этом использовалась математическая модель объекта управления пониженного порядка [20]. Хотя нейронные сети могут обучаться модели объекта управления, не используя предварительное математическое моделирование [8]-[10], тем не менее, было бы неправильно при разработке контроллеров игнорировать информацию об объекте управления, если такая информация есть. Более того, на основе такой информации можно избежать ненужных операций, выполняемых методом проб и ошибок [19]. Обучение инверсной нейросетевой модели производилось с использованием выборки обучающих образцов, взятых из данных о реакции разомкнутой системы управления. В некоторых разработках [8]-[10], [21] обучающие образцы выбирались путем «зондирования» объекта управления случайными сигналами. В реальном времени такой метод нецелесообразен, так как изменения температуры происходят медленно. В связи с тем, что разомкнутая система является устойчивой, вместо случайных сигналов выполнялась подача плавно нарастающего сигнала непосредственно на исполнительное устройство (в пределах ограничений, установленных для входа этого устройства). Из данных о реакции системы был выбран набор обучающих образцов «вход-выход», как показано на рис. 5.2.2. Было обнаружено, что нейросетевая модель, имеющая 8 скрытых нейронов, может изучать инверсную модель объекта управления. При этом используется два элемента входного вектора: текущего выхода объекта управления
Рис. 5.2.2. Характеристика «вход-выход» разомкнутой системы управления температурой водяной ванны, полученная при подаче плавно нарастающего сигнала непосредственно на исполнительное устройство. Из этой характеристики получена выборка из семи обучающих образцов «вход-выход». действительных значений выхода объекта управления. Обе модели настраивались, как показано нарис. 4.2.5; такая конфигурация допускает последующее оперативное обучение для дальнейшего улучшения характеристик моделей. Для схемы обобщенного автономного обучения сигнал обратного распространения между выходным и скрытым слоями можно выразить в виде
где
Здесь
Веса связей между входным и скрытым слоями корректируются в соответствии с выражением
а между скрытым и выходным слоями — по формуле:
где Для схемы оперативного обучения веса связей нейроконтроллера корректируются на основе ошибки, определяемой как
где
где
где сохраняются постоянными, а корректируются в оперативном режиме. Это делается путем обратного распространения ошибки Е через эмулятор при каждом отсчете времени. Здесь ошибка Е определяется в виде
где у и у — выходы действительного объекта управления и эмулятора, соответственно. Обратное распространение сигналов ошибки для эмулятора аналогично автономному обучению при использовании только одной сети. Схему оперативного обучения для нейронного управления можно представить в виде следующего алгоритма. Шаг 1. Прочитать выход процесса у и сравнить его с желаемым опорным значением Шаг 2. Вычислить величину сигнала ошибки Шаг 3. Вычислить величину сигнала ошибки Шаг 4. Вычислить величину сигнала ошибки Шаг 5. Вычислить величину сигнала ошибки 8 между скрытым и входным слоями нейроконтроллера. Шаг 6. Скорректировать веса связей для нейроконтроллера (между выходным и скрытым и между скрытым и входным слоями). Шаг 7. Сравнить выход нейроэмулятора у и фактический выход объекта управления у. Шаг 8. Скорректировать веса связей для нейроэмулятора (между выходным и скрытым и между скрытым и входным слоями).
|
1 |
Оглавление
|