4.1.3. Стохастическое накопление
Воспользуемся для вычисления градиента его стохастической оценкой (3.3.28), рассмотренной в § 3.3. Эту оценку можно определить как оценку с центральной пробой:
Естественно рассмотреть и стохастическую оценку градиента с парными пробами:
Здесь
реализация единичного случайного вектора, равномерно распределенного по всем направлениям пространства адаптируемых параметров
Рассмотрим оценку (4.1.24). Пусть параметр пробного шага
мал, а функция качества достаточно гладка, чтобы линейное
представление (4.1.11) было адекватным. Тогда, подставляя (4.1.11) в (4.1.24), получаем с учетом (4.1.1):
Используем стохастические свойства этой оценки. Начнем со свойств суммы
которая образует оценку (4.1.25):
Рассмотрим проекцию
на градиентное направление:
где
— направление градиента:
а
— его модуль:
Введем
— угол между векторами
и
Тогда (4.1.28) записывается в виде
Известно [161], что распределение случайного угла
имеет вид
где
— гамма-функция.
Определим основные статистические характеристики проекции
Математическое ожидание:
где
откуда окончательно получаем
Дисперсия
В процессах адаптации реальных объектов важно, чтобы вероятность неудачного шага была меньше заданной, т. е.
где
— заданная вероятность неудачного шага. Легко заметить, что вероятность (4.1.38)
При достаточно большом
(как обычно и
бывает при адаптации) сумма
распределена нормально, что позволяет легко определить вероятность
где Ф — интеграл Лапласа [42].
Как видно, располагая информацией о значениях
, легко с помощью накопления объемом
реализовать выполнение условия (4.1.38).
Дискретный вариант адаптации, когда каждый адаптируемый параметр варьируется на двух уровнях, рассмотрен в работе [182], а релаксация — в [267].