Главная > Стохастическая аппроксимация
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

6. Различные модификации метода Роббинса — Монро

Двухступенчатый метод. Кохран и Дэвис [1], обрабатывая статистически результаты биологических экспериментов, показали, что можно уменьшить среднеквадратичную ошибку оценки, используя двухступенчатую процедуру стохастической аппроксимации. Математически это сформулировано Вентером [1], доказавшим сходимость последовательности оценок к искомому значению с вероятностью единица. (См. задачу 1.)

Ускоренная стохастическая аппроксимация. Если оценка величины 0 находится в окрестности 0, то, применяя метод Роббинса-Монро, можно ожидать, что в большинстве случаев она будет флуктуировать близ 0. Если же оценка не находится в окрестности 0, то нет оснований ожидать, что это будет так. Используя эту идею, Кестен [1] предложил метод ускоренной стохастической аппроксимации, который сформулирован в задаче 3.

Блюм и Буркхольдер разработали свои итерационные методы и доказали сходимость с вероятностью единица. Одель [1] предложил выбирать коэффициенты на основании наблюдаемых значений У.

Стохастическая аппроксимация при наличии тренда. Дупач [3] модифицировал метод Роббинса — Монро для случая, когда оптимальное значение меняется в процессе аппроксимации. Этот

результат формулируется в задаче 6 и может быть доказан обычным методом.

Модификация Фабиана. Фабиан [1] предложил следующим образом изменить этот метод. Рекуррентное соотношение для процедуры Роббинса — Монро может быть переписано так:

Из него видно, что направление шага процесса аппроксимации определяется в соответствии с , а длина шага равна Такой выбор приемлем, если для больших значений можно ожидать большие значения однако это не гарантируется предположениями, в которых применяется метод Роббинса — Монро. Таким образом, можно изменить рекуррентное соотношение следующим образом:

Вместо умножения на предлагается умножать его на а). Эта процедура оказывается полезной при условии, что оценка находится в окрестности 0, а больше 1.

7. Задачи

(см. скан)

(см. скан)

(см. скан)

(см. скан)

(см. скан)

(см. скан)

(см. скан)

(см. скан)

1
Оглавление
email@scask.ru