Главная > Стохастическая аппроксимация
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

5. Непараметрический метод «вверх и вниз» (Дерман [2]).

Пусть случайная величина, такая, что где функция распределения. Иногда представляет интерес, как в экспериментах по оценке интенсивности реакции, оценить данную квантиль по наблюдениям, распределённым подобно при условии, что выбор х осуществляется экспериментатором. Процедура для оценки медианы дана в § 2.2.

Процесс стохастической аппроксимации является общей схемой, которая может быть использована для оценки, любой квантили и не включает никаких предположений относительно параметров . В этом методе предполагается, однако, что областью возможных экспериментальных значений для х является действительная прямая. Но на практике оказывается, что это не так. Ограничения, подобные, например, тому, что х является результатом некоторой процедуры счета, как правило, сужают область экспериментальных значений х до множества чисел вида

Будем рассматривать непараметрическую процедуру для оценки любой квантили на основании интенсивности реакции, когда экспериментальные значения х ограничены числами вида

Для удобства положим Предположим, что нужно оценить значение такое, что

Если или или то изменения, которые необходимо внести в алгоритм, очевидны. Экспериментальная процедура при этом такова. Выберем произвольно. Определим рекуррёнтно

где означает единичную или нулевую реакцию на Оценка для 0, основывающаяся на наблюдениях, является наиболее часто встречающимся значением х, если такое значение единственно, и средним арифметическим наиболее часто встречающихся уровней, если такое значение не единственно. Докажем следующее утверждение:

Теорема. Если строго возрастает - для то

Пусть неприводимая марковская цепь без поглощающих состояний и со стационарными вероятностями перехода такими, что

Пусть единственное решение системы уравнений

Так как неприводима и состояния не являются нулевыми, то система (3) имеет такое единственное решение. Величины играют роль стационарных безусловных вероятностей, т. е. если то для любого

Лемма 1. Если для некоторого и вероятность является невозрастающей по для то и решение системы (3) является невозрастающим по для Аналогично, если для некоторого вероятность является неубывающей по для то и решение является неубывающим по для

Доказательство. Пусть для некоторого или для

Известно, что

Однако ясно, что Тогда из соотношения (4) и из сделанных нами предположений вытекает, что

и потому Остальная часть доказательства проводится тем же способом.

Обозначим через количество индексов таких, что Для справедливости еле дующей леммы не нужно требовать выполнения условия (2).

Лемма 2. Пусть В — множество состояний, таких, что для Тогда для любого

Доказательство. Так как существует конечное множество А состояний с В с. А, такое, что Из усиленного закона больших чисел для марковских цепей следует, что

и более общее утверждение:

Пусть — любое такое число, что

и пусть означает событие для всех Из предыдущего замечания и монотонности следует, что Поэтому существует такое, что для всех Аналогично, так как А конечно, существует такое, что

и М такое, что

Пусть Отсюда следует, что

Поскольку произвольно, имеем

В силу последнего утверждения существует. Применяя аналогичные рассуждения к конечному множеству В] состояний, которые имеют вторые по величине значения мы приходим к выводу, что

можно заменить на Лемма доказана.

Доказательство теоремы. Пусть марковскаядепь, определенная равенством (1), т. е. пусть если Вероятности перехода имеют вид

Цепь, очевидно, неприводима, и можно показать, что состояния будут непоглощающими.

Числа [0] означает наибольшее целое число, меньшее или равное 0) могут быть выбраны в качестве бис, фигурирующих в лемме 1. Из этой леммы и условия строгой монотонности для

ясно, что либо [0], либо либо оба они одновременно принадлежат множеству В леммы 2, но никакие другие состояния этому множеству принадлежат. Таким образом, согласно лемме 2, наиболее часто встречающимися состояниями для достаточно больших будут с вероятностью 1 или [0] или [0] или одновременно оба этих состояния. В любом случае разность между 0 и [0] или [0] или средним арифметическим двух этих чисел меньше 1. Теорема доказана.

Рассмотрим применение метода Дермана и оценим характер сходимости метода в этом частном случае.

1
Оглавление
email@scask.ru