или
где
— математическое ожидание.
Из (11.46) можно сделать вывод о том, что получение функции качества в детерминированном виде связано с необходимостью вычисления интеграла либо при жестких ограничениях на характер случайных воздействий
либо при известных вероятностных характеристиках изменения таких воздействий. Однако обычно имеется только информация об отдельных реализациях случайной функции
.
При поиске экстремума дифференцируемой функции качества
все
частных производных
должны обращаться одновременно в нуль, т. е.
В результате замены
на
условия экстремума принимают следующий вид:
или, учитывая линейность операций, можно записать
Осуществляя итеративную процедуру стохастической аппроксимации, определяем состояние х, соответствующее экстремальному значению
, постепенно приближаясь к нему:
Таким образом, при отсутствии точного знания функции качества
следует заменить ее стохастической оценкой
и далее оперировать с этой оценкой при поиске точки экстремума х.
В том случае, если
представима в виде скалярной функции скалярного аргумента х и случайного параметра
процедура стохастической аппроксимации сводится к процедуре определения корня этой скалярной функции или к так называемой процедуре Роббинса—Монро.
Пусть
где
— скалярная функция от параметра состояния х
Рис. 11.11
В пределе при
статистическая оценка
совпадает с направлением градиента функции качества, поэтому рабочий шаг производится в направлении полученной оценки
где
- норма вектора статистического градиента; а — величина рабочего шага.
Таким образом, в случайном поиске по статистическому градиенту число точечных измерений статистической оценки градиента может быть меньше по сравнению с методами стохастической аппроксимации