Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
4. Об оптимизации процесса стохастической аппроксимацииДля процедур Роббинса — Монро и Кифера-Вольфовица сходимость процесса стохастической аппроксимации с вероятностью единица и в среднеквадратичном доказывается при довольно широких предположениях относительно входящих в эти процедуры коэффициентов. Требуется лишь сходимость и расходимость некоторых рядов, члены которых зависят от коэффициентов процедуры. Однако скорость сходимости существенно зависит от выбора этих коэффициентов. Поэтому можно ставить задачу об оптимальном в том или ином смысле выборе коэффициентов. Оценка скорости сходимости процедуры Роббинса — Монро в среднеквадратичном и некоторые результаты по ее оптимизации получены в работе Шметтерера [3]. Им рассмотрена следующая схема. Пусть
и
При этом
Функция
Для некоторого
а для
Обозначим Шметтерер [3] доказал следующее утверждение: Теорема 4.1 (Шметтерер). В принятых предположениях имеет место оценка
где При доказательстве теоремы 4.1 получена оценка
и показало, что она не может быть улучшена. Из теоремы 4.1 непосредственно следует, что всегда можно выбрать В работе Дупача [2] показано, что если к условиям теоремы 4.1 добавить предположение о существовании
в предположении, что в окрестности точки максимума
ожиданием которого является максимизируемая функция регрессии, а символ
В (4.2) В предположении, что функция
причем в этих условиях выбор
Дупач в той же работе [2] дал оценку скорости сходимости многомерного процесса Роббинса-Монро для случая линейной функции регрессии. При некоторых условиях эта оценка имеет вид
Весьма интересной является работа Стратоновича [3]. Он исследовал возможности получения итерационных алгоритмов для отыскания корня уравнения регрессии по наблюдениям за реализациями случайной величины при различных значениях параметра. Для получения алгоритмов использовалось разложение функции регрессии в ряд Тейлора. Каждый из алгоритмов определяется несколькими первыми членами ряда. Показано, что процедура Роббинса — Монро соответствует в этой схеме случаю, когда в разложении Тейлора сохраняются лишь линейные члены. Стратонович показал, что если в его схеме удерживать также члены более высокого порядка, то можно получить итерационные алгоритмы, которые дадут большую скорость сходимости, чем обычная процедура Роббинса — Монро. Методика Стратоновича применима не только для случая одномерной процедуры Роббинса — Монро, но и к случаю многомерной процедуры, а также к отысканию экстремума функции регрессии.
|
1 |
Оглавление
|