или
где — математическое ожидание.
Из (11.46) можно сделать вывод о том, что получение функции качества в детерминированном виде связано с необходимостью вычисления интеграла либо при жестких ограничениях на характер случайных воздействий либо при известных вероятностных характеристиках изменения таких воздействий. Однако обычно имеется только информация об отдельных реализациях случайной функции .
При поиске экстремума дифференцируемой функции качества все частных производных должны обращаться одновременно в нуль, т. е.
В результате замены на условия экстремума принимают следующий вид:
или, учитывая линейность операций, можно записать
Осуществляя итеративную процедуру стохастической аппроксимации, определяем состояние х, соответствующее экстремальному значению , постепенно приближаясь к нему:
Таким образом, при отсутствии точного знания функции качества следует заменить ее стохастической оценкой и далее оперировать с этой оценкой при поиске точки экстремума х.
В том случае, если представима в виде скалярной функции скалярного аргумента х и случайного параметра процедура стохастической аппроксимации сводится к процедуре определения корня этой скалярной функции или к так называемой процедуре Роббинса—Монро.
Пусть
где — скалярная функция от параметра состояния х
Рис. 11.11
В пределе при статистическая оценка совпадает с направлением градиента функции качества, поэтому рабочий шаг производится в направлении полученной оценки
где - норма вектора статистического градиента; а — величина рабочего шага.
Таким образом, в случайном поиске по статистическому градиенту число точечных измерений статистической оценки градиента может быть меньше по сравнению с методами стохастической аппроксимации