7.2.2. Доказательство сходимости метода Роббинса — Монро
Сходимость метода Роббинса — Монро доказывается следующим образом. Представим случайную величину
в виде суммы двух: слагаемых: функции регрессии
и шума у. Тогда (7.33) можно переписать следующим образом:
где
Из определения функции регрессии
в (7.32) следует, что
— случайная величина с нулевым математическим ожиданием
Кроме того, разумно предположить, что дисперсия
ограничена
и что
статистически независимы.
Рассмотрим разность между корнем уравнения регрессии 0 и его оценкой 0. Из (7.40) следуем что
Возводя (7.44) в квадрат и вгшв математическое ожидание от обеих частей, получим
Повторяя
раз (начиная с
и суммируя, получим
Предположим, что функция регрессии также ограничена в интересующей нас области
Тогда левая часть (7.46) ограничена выражением
Рассмотрим по отдельности каждый член неравенства (7.48). Во-первых, так как
— положительное число, а
— конечное, то левая часть (7.48) ограничена снизу. Первый член правой части (7.48) конечен в силу условия (7.36).
Вспомним (см. рис. 7.3), что функция регрессии удовлетворяет следующим условиям:
поэтому
и
Рассмотрим теперь следующее утверждение:
Если (7.52) не выполняется, тогда, вследствие условия (7.35), последний член неравенства (7.48) стремится к
Но это
противоречит тому, что левая часть неравенства (7.48) ограничена снизу. Следовательно, утверждение (7.52) должно быть выполнено. Так как условие (7.50) выполняется для всех
, утверждение (7.52) эквивалентно утверждению:
Таким образом, сходимость с вероятностью 1 доказана. Доказат тельство сходимости в среднем квадратичном здесь не приводится.