§ 1.13. Задача оптимизации при случайном и управляемом терминальном моменте
В ряде прикладных задач возникает необходимость выбора управления из условия минимизации среднего терминального риска если — первый момент выполнения некоторого условия, положенного на фазовые координаты системы. В задачах управления движением значительный практический интерес имеет, например, случай, когда случайный момент достижения минимума заданной функцией фазовых координат Приведем примеры подобных постановок.
Пусть выбирается система управления ракетой из условия возможно более точного попадания в цель. Тогда естественно минимизировать среднее значение терминальной функции потерь от промаха — минимальной дальности между ракетой и целью. Терминальным моментом является момент достижения величиной текущей дальности минимума. Текущая выражается через фазовые координаты: Поэтому в данном случае момент достижения функцией минимума.
Другой пример получим, рассматривая задачу стыковки космических кораблей. Здесь в терминальный момент момент достижения минимума дальности между кораблями — должны быть малы как дальность так и величина вектора скорости относительного движения V, являющаяся функцией вектора фазовых координат: Поэтому Здесь, как и в предыдущем примере, момент достижения минимума функцией
Дифференцируя по функцию получим, учитывая уравнение (1.1):
где вектор градиента функции Потребуем, чтобы функция имела единственный минимум. Для этого достаточно монотонного изменения функции для чего необходимо отсутствие явной зависимости от вектора белых шумов Поэтому
Задачу оптимизации рассмотрим при точном измерении векторов Строго говоря, терминальный момент определяется условием Однако из-за дискретности измерений терминальным моментом считаем момент
в который первый раз выполнится условие
Малая величина выбирается из эвристических соображений. Эта величина должна быть достаточно велика, чтобы обеспечить в некоторый момент выполнение (1.109) с учетом скачков величин возникающих как из-за дискретности моментов так и из-за возможных скачков векторов управлений. С другой стороны, величина должна быть мала, чтобы обеспечить выполнение условия (1.109) в единственный момент Впрочем, невыполнение последнего условия, как следует из излагаемых, ниже соображений, не должно сильно влиять на величину среднего риска. Величины а и в неравенстве (1.107) выбираются из соображений грубой оценки пределов изменения возможных величин
Определим функцию условием при при Справедливо равенство
и, следовательно, рассмотренные ранее рекуррентные уравнения должны определить оптимальные управления из условия минимизации среднего риска вида
где
Последнее управление, влияющее на есть поэтому в
Алгоритм управления наряду с реализацией синтезированных управлений должен в моменты измерений проверять условие (1.109) и при его выполнении вырабатывать команды прекращать управление. Заметим, что если величина 8 в (1.109) окажется такова, что условие (1.109) выполнится для нескольких последовательных, моментов, то качество управления не должно ухудшаться. В этом случае управление минимизирует среднее значение суммы нескольких функций потерь, векторы аргументов