Главная > Генетические алгоритмы, искусственные нейронные сети и проблемы виртуальной реальности
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

6. ВИРТУАЛЬНАЯ РЕАЛЬНОСТЬ И ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ

На рис. 31 представлено концептуальное решение разрабатываемой нами системы управления на базе ИНС с блоком обучения, реализующим ГА для поиска оптимальных параметров сети [33, 34]. Мы назвали нашу систему интеллектуальной, потому что она обладает одним из важнейших атрибутов интеллекта, а именно — способностью к построению прогноза, осуществляемого виртуальным трактом управления.

Любопытно происхождение слова виртуальный. Оно берет свои истоки от латинского vir — мужчина. Римляне образовали от него другое слово — virtus, которое служило для обозначения совокупности всех превосходных качеств, присущих мужчинам (физическая сила, доблестное поведение, моральное достоинство). Из латинского слово проникает в старофранцузский, а в XIII веке — из французского в английский язык.

В современном английском слово virtual приобрело дополнительный оттенок "но не существующий в действительности". В толковом словаре [35] читаем:

Virtual — being in essence or effect but not in fact or name (существующий в понятии или производящий эффект, но не существующий в действительности и не имеющий названия) Между тем, такое значение сосуществует наравне с прямо противоположным. Англо—русский словарь [36] дает перевод virtual как фактический. Большой физический словарь [37] просто приводит почти противоположные значения — эффективным, действующий; эквивалентным; фактический, — полагаясь на нашу сообразительность и умение ориентироваться в контексте.

Рис. 31. Концептуальный проект САУ с блоком обучения на основе ГА

Последнее время все большую популярность в научной литературе приобретает устойчивое словосочетание виртуальная реальность. Впервые этот термин появился в лексиконе разработчиков компьютерных программ, предназначенных для наземного обучения космонавтов навыкам автономной работы в открытом космосе. С изобретением шлема и перчатки, пришедшим на смену дисплею и джойстику, зрительная и моторная компоненты интерактивной компьютерной имитации значительно усовершенствовались, существенно расширив границы применимости разработанных систем в качестве тренажеров для летчиков—истребителей и представителей других экзотических профессий. Воздействуя одновременно на несколько каналов поступления информации в мозг (зрение, слух, вестибулярный аппарат, тактильные ощущения), современные

компьютерные системы виртуальной реальности способны активно влиять на сознание и подсознание и порождать у испытуемого ощущение своей причастности к разворачивающемуся перед его глазами сценарию. Через компьютерные игры новая технология выплеснулась в мир, породив целое новое направление в видео.

Мы немного по—другому трактуем это понятие. Если задуматься, виртуальная реальность существует в каждом из нас. Одной из задач, подсознательно решаемых индивидуумом на протяжении всей жизни, является построение и уточнение картины мира, определение своего положения в нем и выработка стратегии собственного поведения. Мы не только моделируем для себя окружающий мир, но и как бы со стороны наблюдаем себя в этом мире, моделируя самих себя.

Исходя из таких представлений об интеллекте человека, мы подошли к проектированию системы управления. Внешним миром для нее служит объект, нейроконтроллер является ее телом, а виртуальный канал управления, содержащий модель объекта и модель нейроконтроллера — ее "мозгом", местом, где система моделирует себя в окружающем мире.

Подготовка системы к работе происходит следующим образом. Мы предполагаем, что с самого начала нам доступна априорная информация о поведении объекта в различных режимах. Тогда задачей первого этапа является переработка этой информации в библиотеку тренировочных шаблонов, на основании которой затем синтезируется нейроэмулятор объекта. Когда интегральная ошибка, генерируемая эмулятором, снижается до заданного предела, параметры нейроэмулятора копируются в блок тренировки нейроконтроллера. Здесь с участием эталонной модели происходит оценка различных стратегий управления объектом, рассматриваются и сравниваются между собой различные сценарии будущего. Как только удается достичь выполнения виртуальным трактом требований эталонной модели, параметры виртуального контроллера сбрасываются на исполнительный контроллер, после чего система может приступать к работе.

При изменении характеристик объекта происходит естественное снижение качества управления. По мере увеличения расхождения в текущем поведении объекта с ожидаемым система получает возможность понять, что объект изменился. Новые переходные характеристики пополняют библиотеку тренировочных шаблонов, после чего параметры нейроэмулятора корректируются. Далее все происходит как и ранее. Когда подгонка эмулятора осуществлена, начинается корректировка параметров нейроконтроллера, завершающаяся изменением параметров исполнительного контроллера.

Трудно рассчитывать, что за один такой цикл обучение закончится, так как новая информация об изменившемся объекте вряд ли может претендовать на достаточную полноту. Логично предположить, что после первой

тренировки эмулятор не будет точно описывать объект, а поэтому и синтезированный с его помощью контроллер не сможет справиться с задачами управления. Тем не менее, очевидно, что новый контроллер будет генерировать хоть и не оптимальное, но все—таки новое управление, которое вскроет новые особенности поведения объекта. Новая информация даст возможность снова расширить библиотеку шаблонов, дотренировать нейроэмулятор и нейроконтроллер и обновить параметры исполнительного контроллера.

Так система сама изучает объект и постепенно совершенствует свои способности к управлению. Наверное, спектр количественных изменений характеристик объекта всегда ограничен определенными рамками, вне которых исчезает качественная определенность объекта как такового. Поэтому, когда эти возможности в процессе эксплуатации объекта исчерпаются, система станет робастной, то есть приобретет способность управлять объектом при любых обстоятельствах.

Пугающие трудности синтеза нейроэмулятора даже в off-line режиме, встретившиеся нам, главным образом, при определении объемов информации об объекте, достаточном для синтеза его нейросетевой модели, не смогли охладить наш энтузиазм в отношении столь фантастической концепции интеллектуализации. Конечно, она порождает много дополнительных вопросов о соотношении темпов эволюции и адаптации в on-line режиме, о принципиальной сходимости алгоритма адаптации, содержащего две, вложенные одна в другую, процедуры оптимизации. Тем не менее мы верим, что ГА обладают достаточной поисковой мощью, чтобы справиться с такими проблемами при существующем уровне развития персональных компьютеров.

Возвращаясь к трем вопросам, поставленным в разделе по моделированию, мы можем дать четкий ответ пока только на первый из них.

Да, нейросетевые модели динамических объектов могут быть настолько точными, что нейроконтроллер, синтезированный с использованием нейроэмулятора, оказывается способным управлять самим объектом без каких—либо дополнительных настроек.

Мы провели последовательно три однотипных эксперимента с тестовым объектом при разных значениях Z в уравнении (8), в процессе которых сначала синтезировали нейроэмулятор объекта (см. Приложения 2— 4), а потом с помощью нейроэмулятора — нейроконтроллер. На заключительном этапе эксперимента нейроконтроллер опробовался на самом объекте. К нашему удовлетворению, во всех трех случаях нейроконтроллер смог управлять объектом без снижения качества по сравнению с работой в составе виртуального канала.

Эти эксперименты оказались полезными совершенно в неожиданном плане. Они продвинули вперед наше понимание того, что следует считать объективным критерием адекватности модели объекта. Действительно, точность модели можно считать удовлетворительной только в том случае, если построенный с ее помощью контроллер оказывается способен управлять объектом.

Следует признать, что синтез виртуального тракта системы управления оказался не таким простым делом, как могло показаться вначале. Достаточно сказать, что наша первая попытка организовать его путем тривиальной стыковки нейроконтроллера и нейроэмулятора, предварительно синтезированных на классической модели объекта (см. Приложение 1 и Приложение 3), натолкнулась на неожиданные препятствия. Они не стали работать вместе, и мы не сразу догадались почему.

Дело оказалось в том, что когда мы синтезировали контроллер на объекте, нас интересовал только выход объекта, но не контроллера. Это было особенностью применяемой методики, так как ошибка в выходе объекта использовалась для обучения, что же касается контроллера, то мы и не пытались понять, какое управление он должен генерировать, чтобы заставить объект вести себя требуемым образом.

Как следствие, мы не контролировали и никак не ограничивали амплитуду выхода контроллера, которая, как видно из рисунка 32, достигала значения 5 при единичном задании . Вот такое управление и не смог отрабатывать нейроэмулятор, поскольку он обучался на входных воздействиях до 1. Точно повторяя поведение объекта управления при амплитудах входного воздействия меньше 1, эмулятор практически не работал при больших амплитудах. Рис. 33 показывает, как катастрофически ухудшается качество его работы уже при входном сигнале равном 4.

Рис. 32. Выходной сигнал нейроконтроллера (кривая 1), обученного по дифференциальным уравнениям объекта, при единичной амплитуде сигнала задания, (кривая 2 — выход объекта)

Рис. 33. Работа нейроэмулятора при больших значениях амплитуды входного воздействия (кривая 1 — входной сигнал; 2 — реакция объекта; 3 — реакция нейроэмулятора)

Впрочем, на самом деле ничего удивительного в этом нет, мы просто «избалованы» линейными классическими моделями. То, что они достоверно описывают реальный объект только в узком диапазоне рабочих условий, часто ставится им в вину при решении практических задач. Но в самом моделировании, как в нашем случае, их поведение безупречно, и нейросетевым моделям трудно соревноваться с ними.

Возвращаясь к проблеме синтеза виртуального тракта, отметим следующее.

Во—первых, хотя обучение нейроконтроллера ведется по выходной координате эмулятора, необходимо ограничивать амплитуду управляющего сигнала, генерируемого контроллером, верхней границей допустимого диапазона входных воздействий эмулятора. В описываемых экспериментах эта граница составляла 1.

Во—вторых, из двух возможных способов ограничения — жесткого среза амплитуды выходного сигнала либо более мягкого штрафования за превышение разрешенного уровня — более предпочтителен второй. Он дает возможность генетическому алгоритму ранжировать популяцию с учетом этого признака и постепенно избавляться от тех решений, которые генерируют слишком сильное управление.

Используя эти дополнения к методике, а также ограничив величину задания мы и синтезировали три нейроконтроллера, о которых говорилось выше. Параметры одного из них представлены в Приложении 5, а его выход при входном задании — на рисунке 34.

Рис. 34. Выход виртуального нейроконтроллера при задании 0,5

Конечно, выполненные эксперименты не доказывают исключительных адаптивных свойств интеллектуальной системы. Каждый раз мы сами организовывали сбор информации об объекте, требующейся для синтеза эмулятора, действуя по предварительно выверенному плану. Для того, чтобы убедиться в способности системы сделать это самостоятельно, нужно распараллелить три задачи — формирование библиотеки тренировочных шаблонов, тренировка эмулятора, тренировка контроллера, после чего суметь правильно распределить ресурсы вычислительной системы и организовать обмен данными между ними. Современные операционные системы (Windows NT, Windows 95) обладают возможностями для решения

таких проблем даже на однопроцессорных машинах, и мы намерены реализовать их в ближайшем будущем.

В завершение хотелось бы процитировать Р. Докинза, прочтение книги [38] которого оказало огромное влияние на ход наших мыслей на протяжении последних 2—х лет. Он пишет: «Эволюция способности к моделированию, очевидно, привела в конечном итоге к субъективному осознанию. Почему это должно было произойти, представляется мне глубочайшей тайной, стоящей перед современной биологией. Нет оснований полагать, что электронные компьютеры действуют осознанно, когда они что—нибудь моделируют, хотя нам приходится допускать, что в будущем они, возможно, будут осознавать свои действия. Быть может, осознание возникает тогда, когда модель мира, создаваемая мозгом, достигает такой полноты, что ему приходится включать в нее модель самого себя».

Представляется, что человечество вплотную подошло к разрешению этой задачи.

Categories

1
Оглавление
email@scask.ru