Главная > Стохастическая аппроксимация
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

2. Многомерная стохастическая аппроксимация

Результаты, аналогичные теореме 1.2, получены Брусиным [2] для случая многопараметрического управляемого объекта как для непрерывного, так и для дискретного времени.

В работе Красулиной [7] рассмотрена задача отыскания с помощью процесса стохастической аппроксимации наибольшего собственного значения и собственного вектора, соответствующего этому значению, симметрической положительной матрицы, являющейся математическим ожиданием некоторой случайной матрицы.

Теорема 2.1 (Красулина). Пусть последовательность независимых одинаково распределенных случайных матриц, а где А — симметрическая положительная матрица, и пусть

Определим последовательность случайных векторов рекуррентно следующим соотношением:

Предположим, что выполняются следующие условия:

1) , где нормированный собственный вектор матрицы А, соответствующий собственному числу

Тогда с вероятностью единица, где случайный собственный вектор матрицы А, соответствующий собственному числу Кроме того, с вероятностью единица

Аналогичные результаты получены Бензекри [1], использовавшим метод стохастической аппроксимации для некоммутативной нормированной алгебры линейных операторов на нормированном конечномерном пространстве. Бензекри показал, что, применяя процесс ортогонализации, можно получить с помощью стохастической аппроксимации не только максимальное собственное значение и соответствующий ему собственный вектор, но и следующие по величине собственные значения матрицы с соответствующими им собственными векторами.

Гладышев указывает, что результаты по асимптотической нормальности одномерной последовательности процесса Роббинса — Монро остаются справедливыми в аналогичной формулировке и для многомерной последовательности.

В работе устанавливается связь между оценкой по методу максимального правдоподобия, оптимальной фильтрацией и стохастической аппроксимацией для решения следующей задачи.

Пусть где А — данная -матрица, х - неизвестный -вектор, случайный -вектор с нулевым математическим ожиданием и с где I — единичная матрица, символ Кронекера, -вектор наблюдений. Требуется определить по наблюдаемым векторам оптимальную в некотором смысле оценку неизвестного вектора показывает, что уточнение, которое вносит в оценку по методу максимального правдоподобия или по методу оптимальной фильтрации после наблюдений (для данной задачи оценки, получаемые этими двумя методами, совпадают) наблюдение, приводит к процессу стохастической аппроксимации.

В работе Альберта отмечается, что задача оценки параметра с помощью стохастической аппроксимации сводится к оценке решения нелинейного разностного уравнения со случайным возмущающим членом. Указывается аналогия между рекурсивными методами оценки параметра функции регрессии и

итерациоными методами минимизации детерминированных функций. Сравниваются градиентный метод оценки и метод Калмана — Бьюси для оценки параметра функции регрессии

Условия сходимости случайных процессов, определяемых процедурами стохастической аппроксимации, можно рассматривать как условия устойчивости (в том или ином вероятностном смысле) решений стохастических дифференциальных или разностных уравнений. Поэтому для исследования сходимости процессов стохастической аппроксимации можно использовать методы исследования устойчивости решений стохастических уравнений, в частности, аналоги прямого метода Ляпунова., В этом направлении ряд результатов получил Морозан Основную роль в доказательстве результатов Морозана играет следующая теорема.

Теорема 2.2 (Морозан). Пусть последовательность борелевских, функций, последовательность случайных векторов, Пусть и

где непрерывные и возрастающие функции, а

Тогда с вероятностью единица Конкретизируя условия теоремы 2.2, Морозан доказал несколько утверждений о сходимости с вероятностью единица случайной последовательности векторов? получаемых в некоторых процессах стохастической аппроксимации, к корню многомерной функции регрессии или к максимуму функции регрессии.

Исследуя устойчивость стохастических дифференциальных уравнений, Хасьминский [1] получил ряд

результатов для стохастической аппроксимации в случае непрерывного времени.

Интересные результаты общего характера получены в этом направлении в работе Бравермана и Розоноэра Они рассматривают случайный процесс с дискретным временем. Здесь вектор (конечномерный или бесконечномерный), дискретное время. Изменение процесса во времени происходит согласно уравнению

где случайный вектор, появляющийся на каждом шаге в соответствии с некоторым неизвестным заранее условным распределением вероятностей не зависящим явно от некоторые детерминированные функции, а члены числовой последовательности. Предполагается, что принтом выполняются следующие условия:

1) Иногда вместо 2) используется более слабое условие 3):

Браверман и Розоноэр вводят в рассмотрение последовательности функций

от возрастающего с ростом числа векторных аргументов являющихся реализациями случайного процесса Устанавливаются соотношения для функций которые гарантируют стремление к нулю в том или ином смысле по крайней мере одной из случайных последовательностей или

Последовательность аналогична функции Ляпунова в прямом методе Ляпунова, а последовательность аналогична производной функции Ляпунова.

Для использования полученных условий сходимости в конкретных задачах стремятся подбирать эти функции так, чтобы из сходимости этих функций

к нулю в том или ином смысле следовала сходимость в том же смысле случайного процесса Во многих случаях такой подбор не вызывает затруднений.

Большую роль в теоремах Бравермана и Розоноэра играет следующее условие:

Условие А. Математические ожидания существуют и

Здесь - числовые последовательности, такие, что выполняется условие некоторая случайная последовательность.

Определение. Последовательность функций называется бесконечно большой, если любая последовательность для которой существует и конечен, ограничена.

Браверман и Розоноэр доказывают ряд теорем о сходимости к нулю в том или ином вероятностном смысле процессов, получаемых из процедур стохастической аппроксимации. Из этих утверждений могут быть получены теоремы Дворецкого [1], Гладышева [11, Блюма [2]. При этом стоит отметить, что некоторые из этих теорем применимы не только к конечномерным векторам но и к бесконечномерным. Приведем следующие две теоремы, характерные для работы Бравермана и Розоноэра.

Теорема 2.3. Пусть задан случайный процесс определяемый уравнением (2.1), и последовательность скалярных функций удовлетворяющих следующим условиям:

1) Выполняются условие А, условие

где некоторые константы, а такая случайная последовательность, что

Тогда и последовательность случайных величин стремится к нулю по вероятности.

Теорема 2.4. Пусть векторы входящие в соотношение (2.1), являются конечномерными размерности Пусть дважды непрерывно дифференцируемая неотрицательная функция и функции и определяются равенствами

причем предполагается, что это определение корректно. Пусть выполнены условия:

где с — некоторые константы. Кроме того, предполагается существование математических ожиданий

Тогда при вектор X с вероятностью единица стремится к

Если функция бесконечно большая,

то утверждение теоремы имеет место и в случае, когда условие 4 теоремы заменяется более слабым условием.

1
Оглавление
email@scask.ru