Главная > Стохастическая аппроксимация
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

4. Применение стохастической аппроксимации к задаче надежности

В рассматриваемой ниже задаче исследуется «система» или «объект» с «временем жизни», имеющим функцию распределения Система инспектируется в моменты времени Если при проверке обнаруживается, что система бездействует, то ее ремонтируют (или заменяют); в противном случае ничего не делают. Общая задача состоит в выборе плана инспектирования, т. е. в выборе последовательности некоторым оптимальным способом. Определяется критерий оптимальности и доказывается, что план стохастической аппроксимации удовлетворяет этому критерию. Описанная задача исследовалась Вентером и Гаствиртом [1].

Пусть система имеет экспоненциальное распределение времени жизни с неизвестным параметром т. е.

Предполагается, что существуют известные константы к и такие, что

Пусть определены временные интервалы между моментами инспектирования

Пусть произвольная последовательность случайных величин, совместное распределение любого

конечного числа которых не зависит от . Возьмем и определим итеративно равенством

для Здесь каждое является случайной величиной с условным распределением (при данных определяемым формулой

Это означает, что если инспектирование обнаруживает, что система бездействует, и в противном случае. Пусть в соотношении (3) является действительной функцией от функционально не зависимой от Интуитивно ясно, что цосле инспектирований следующий промежуток времени между инспектированиями зависит от прошлых наблюдений (эта зависимость выражается функцией поскольку введена для дополнительной рандомизации). Класс всех таких планов инспектирования обозначается через а общий элемент этого класса — через

а) Максимизация информации. Средняя информация, получаемая из плана I после инспектирований, определяется следующим образом:

где функция правдоподобия для наблюдений

Пусть

называется предельной средней информацией, получаемой из плана Задача состоит в том, чтобы путем разумного выбора I максимизировать Этот метод эффективной оценки Я хорошо известен в литературе по теории надежности.

(кликните для просмотра скана)

так как функция максимизируется при Отсюда следует сформулированный результат.

Равенство в (7) достигается тогда и только тогда, когда вероятностью единица для каждого т. е. если бы было известно, то оптимальный план инспектирований в смысле максимизации для каждого был бы планом периодических инспектирований с интервалами между инспектированиями, равными Однако в классе (т. е. когда X неизвестно) не существует оптимального плана, дающего равенство в соотношении (7).

Определим критерий оптимальности, учитывающий информацию относительно X, которую мы получаем при проведении инспектирования.

Определение. План инспектирований I называется адаптивным (относительно если

Теперь мы определим план стохастической аппроксимации и покажем, что он является адаптивным.

b) План стохастической аппроксимации. Следующий план (обозначаемый через основывается на методе Роббинса — Монро; в нем используется тот факт, что соответствует -процентили экспоненциального распределения независимр от

Определение. Выберем произвольное после того как определены положим для

Теорема. План является адаптивным,

Доказательство. Достаточно показать, что

Положим

из этого следует, согласно теореме (см. Лоэв стр. 407), что

Предположим, что для некоторого со для которого имеет место утверждение (14), можно найти последовательность такую, что

Тогда будет показано, что

Пусть достаточно мало, так что

Существует целое такое, что

и

Пусть фиксировано. Рассмотрим поведение Предположим, что (аналогичные рассуждения будут справедливы и в противоположном случае). Из (12) имеем

Если то, используя это неравенство с заменой на получим

Повторяя эти рассуждения, находим, что если

то

Предположим, что Тогда

Теперь применим те же самые рассуждения, но начиная с вместо Отсюда следует, что для всех

и соотношение (16) доказано.

Чтобы завершить доказательство, надо показать, что Тк для почти всех является предельной точкой последовательности Зафиксируем и пусть подпоследовательность, сходящаяся, скажем, где Предположим, что случай аналогичен рассматриваемому.

Пусть таково, что . Существует такое, что

и

Пусть Тогда из (12) для получаем, что

Если то можно повторитьрассуждения и получить следующее:

Если снова то можно опять повторить приведенные выше рассуждения. Имеем

Поэтому существует такое целое что в то время как Тогда, из (12) получаем, что

т. е.

Отсюда для любого существует такое, что т. е. имеет своей предельной точкой. Теорема доказана.

Изложенное выше является одной из иллюстраций эффективного применения метода стохастической аппроксимации для решения прикладных задач. Мы снова вернемся к этому вопросу в главе об асимптотической нормальности и обсудим его значение и полезность.

1
Оглавление
email@scask.ru