4.2.2.6. Синтез оптимального обучения
Суть этапа синтеза заключается в определении управления
реализация которого в объекте дает возможность добиться заданной цели управления, — если, разумеется, модель объекта верна. Делается это следующим образом.
Целевые функционалы в (4.2.1) определены на наблюдаемых состояниях Т объекта, т. е. цель
имеет вид
Подставляя в выражение (4.2.18) полученную модель
приходим к многокритериальной задаче оптимизации
где
— множество допустимых управлений, определяемое следующими соотношениями:
При решении этой задачи прежде всего следует осуществить свертку экстремальных целей (4.2.19), для чего необходимо иметь дополнительные сведения о весомости целей. В результате получаем стандартную вариационную задачу:
где
— скалярная функция свертки экстремальных критериев, a U - оптимальное управление. Если целевые критерии являются функциями, то задача (4.2.21) является задачей математического программирования.
Решение задачи (4.2.21) при известном состоянии среды X не представляет принципиальных трудностей. Однако следует помнить, что эта задача для достаточно сложных объектов управления обычно является многоэкстремальной и овражной, что заставляет использовать для ее решения специальные методы поисковой оптимизации — например, методы случайного поиска [161, 166].
В процессах обучения синтез оптимального обучения производится аналогично путем решения оптимизационной задачи (4.2.21), причем здесь
— обучающая информация, оптимальная для данного ученика. В этом проявляется индивидуальность процесса обучения по описанной схеме.