Главная > Стохастическая аппроксимация
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

Дополнение. ОБЗОР НЕКОТОРЫХ НОВЫХ РЕЗУЛЬТАТОВ В СТОХАСТИЧЕСКОЙ АППРОКСИМАЦИИ

Э. М. Вайсборд, Д. Б. Юдин

Проблематика стохастической аппроксимации представляет большой интерес для теоретической статистики, для решения экстремальных задач в условиях неполной информации и для разнообразных приложений в естественных и технических науках.

Этим можно объяснить внимание, уделяемое специалистами разного профиля задачам и методам стохастической аппроксимации. Число публикаций по теории и приложениям стохастической аппроксимации растет из года в год. Особенно сильно увеличился поток работ по стохастической аппроксимации после того, как выяснилось, сколь плодотворно использование ее идей и методов в исследовании моделей адаптации и обучения.

В монографии Вазана отмечено большинство работ по стохастической аппроксимации, опубликованных до 1967 г. В настоящем обзоре кратко изложены основные результаты некоторых исследований, проведенных главным образом в последние годы.

В своем обзоре мы останавливаемся на результатах, относящихся к теоретической стороне метода стохастической аппроксимации, а работы, в которых излагается применение этого метода в различных областях техники, биологии, кибернетики ввиду их многочисленности, подробно не рассматриваем и просто ограничиваемся их упоминанием.

1. Одномерная стохастическая аппроксимация

В последние годы был опубликован ряд работ, в которых усиливаются некоторые важные результаты

по стохастической аппроксимации, совершенствуются вычислительные процедуры, обнаруживаются и устраняются некоторые погрешности в известных утверждениях. Кроме того, получены некоторые результаты, обобщающие схемы стохастической аппроксимации и расширяющие область ее приложения.

В работах Красулиной [5], [6] показано, что в итерационных процессах стохастической аппроксимации можно ослабить требование существования ограниченной дисперсии исследуемой случайной величины. Достаточно потребовать лишь существования у соответствующей случайной величины ограниченного момента порядка При этом сохраняется сходимость с вероятностью единица к корню функции регрессии для процесса Роббинса — Монро и к максимуму этой функциигдля процесса Кифера — Вольфовица. Вместо сходимости в среднеквадратичном доказывается сходимость с моментом

Гладышев используя теорию полумартингалов, несколько усиливает результаты Роббинса и Монро [1]. Ему удается отказаться от предположения о равномерной ограниченности дисперсии случайной величины, потребовав лишь, чтобы порядок ее роста на бесконечности был не больше двух.

Красулина [3], уточняя результат Фабиана [1], исследовала сходимость процесса Монро для случая, когда функция регрессии имеет несколько корней. Оказывается, что при соответствующих условиях последовательность, порождаемая этим процессом, сходится к одному из таких корней, который является устойчивым в аналогичном детерминированном процессе.

Теорема 1.1 (Красулина). Пусть и удовлетворяются следующие условия:

1) Функция а меняет знак в точках т. е. уравнение имеет конечное число корней При этом для для

2) Существует такое х, что а для для Здесь

множество корней функции расстояние от точки х до этого множества.

a - произвольная случайная величина.

4) Пусть при этом

где некоторое число.

Тогда при данном

где 0 — множество корней уравнения в которых функция убывает, а при

Брусин [1] рассмотрел задачу стохастической аппроксимации, в которой аргумент функции регрессии не является непосредственно параметром управления, а связан с параметром управления некоторым линейным разностным уравнением. Было показано, что и в этом случае алгоритм типа Роббинса — Монро обеспечивает сходимость по вероятности к корню функции регрессии.

Теорема 1.2 (Брусин). Пусть

Здесь константы, переменные скалярные величины, которая, вообще говоря, нелинейная функция, — случайная величина. Предположим, что:

1) Существует такое число 0, что а при

2) Функция ограничена константой

3) Для любого существует такое что если

4) Нули полинома расположены внутри единичного круга.

7) - знакопостоянная последовательность, знак которой определяется константами

Тогда последовательность определяемая из уравнения (1.1) через управляющую последовательность которая в свою очередь определяется рекуррентным соотношением

сходится по вероятности к корню 0 уравнения

Брусин доказал также аналог теоремы 1.2 для случая непрерывного времени.

В работах Красулиной [5] и Гладышева получены некоторые результаты об асимптотическом поведении последовательностей в процессе Роббинса — Монро, обобщающие в определенном смысле результаты Сакса [1].

Фабианом [1] был предложен в свое время алгоритм, который позволяет использовать в процессе Роббинса — Монро вместо полной невязки а между наблюденным и желаемым значением случайной величины лишь знак этой нрвязки. В работе Аведьяна показано, что вывод Фабиана о сходимости соответствующей последовательности к корню уравнения регрессии правомерен только тогда, когда

помеха имеет распределение, медиана которого совпадает с математическим ожиданием.

В работе Волвертона и Роугена приведено уточнение теоремы Дворецкого из § 8 его работы [1]. Волвертон и Роуген обнаружили в доказательстве этой теоремы у Дворецкого ошибку, состоящую в том, что из условия делается вывод о равномерной ограниченности всех частичных произведений В предположении равномерной ограниченности этих произведений теорема Дворецкого верна. В противном случае теорема, вообще говоря, не верна. Волвертон и Роуген приводят пример, доказывающий это.

В ряде работ предлагаются различные модификации метода «вверх и вниз». В работе Шпрингера излагается некоторая новая процедура для отыскания максимума функции регрессии в одномерном унимодальном случае. Моделирование на ЦВМ дало возможность автору сравнить предлагаемую процедуру с ранее известными и выявить определенные ее преимущества.

В работе улучшается процедура метода «вверх и вниз», что позволяет ускорить процесс вычисления процентили распределения. Исследуемая процедура зависит от нескольких параметров. С помощью моделирования процесса на ЦВМ Щи исследует влияние каждого параметра на характеристики процедуры.

Значительный интерес представляет работа Бунке в которой дана некоторая общая схема построения случайной последовательности, сходящейся к данному числу. Полное описание схемы довольно сложно. Используя частные варианты этой схемы, можно получить случайные последовательности, аппроксимирующие медиану функции распределения; корень уравнения где однозначно определяемая медиана случайной величины максимум функции где имеет тот же смысл, что и выше.

1
Оглавление
email@scask.ru