Главная > Статистический синтез при априорной неопределенности и адаптация информационных систем
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

16.3. АДАПТИВНАЯ ЗАДАЧА ОБСЛУЖИВАНИЯ

В качестве еще одного примера управляемого многошагового процесса принятия решений рассмотрим следующую задачу обслуживания, которая может иметь различные практические приложения. Пусть имеется объектов, каждый из которых может находиться в одном из двух состояний.

Будем характеризовать эти состояния признаками нуль и единица. Тогда на любом шаге состояние объекта будем обозначать где или Состояние будем считать желательным, а состояние нежелательным; кроме того, будем предполагать, что первоначально (при ) все объекты находятся в нежелательном состоянии, т. е.

На каждом шаге для каждого объекта выделяется некоторое количество средств обслуживания Если объект на шаге находился в желательном состоянии то независимо от выделенных для него средств он и останется в этом состоянии. Если же (т. е. объект был в нежелательном состоянии), то в результате использования средств обслуживания он может перейти в желательное состояние 0. Этот переходосуществляется с некоторой вероятностью зависящей от количества выделенных средств

Таким образом, условные вероятности состояний объекта на шаге могут быть записаны в следующей форме;

Выбор значений для -шагового процесса обслуживания и представляет собой задачу статистического решения. Будем считать, что целью процесса обслуживания является минимизация количества объектов, оставшихся в нежелательном состоянии после шагов, и что потери также зависят от суммарного расхода средств обслуживания. Этим предположениям соответствует следующая функция потерь:

Будем считать также, что состояния объектов наблюдаются без ошибок, т. е. имеется совокупность данных наблюдения

где для любых

Тогда совокупность данных наблюдения описывается теми же распределениями вероятности (16.3.1), что и величины а необходимые для использования рекуррентных соотношений (16.1 3) распределения вероятности получаются из (16.3.1) простой заменой на и фактически зависят только от

Конечный апостериорный риск для функции потерь (16.3.2) равен

и зависит фактически только от результатов последнего наолюдения — совокупности величин характеризующих состояния объектов на шаге.

Для дальнейшей когкрегизации задачи нужно определить зависимость вероятности от пэитем будем считать, что из-за имеющейся априорной неопределенности эта зазясчмэггь язвэгтнэ не точно, а лишь параметрически, что и вынуждает использовать адаптивный байесов подход. Предположим, что зависимость вероятности от может быть аппроксимирована экспоненциальной функцией вида

с некоторым неизвестным коэффициентом у в показателе экспоненты, и рассмотрим сначала неадаптивный вариант задачи, предполагая, что имеет заданное значение.

Подставляя (16.3.6) в (16.3.5) и производя минимизацию по получаем оптимальные значения

что можно записать в виде единого выражения

При этом мы предполагаем, В противном случае оптимальное правило решения заключается в выборе всех значений нулевыми, т. е. в отказе от обслуживания из-за высокой относительной стоимости обслуживания.

С учетом (16.3.8) минимальный апостериорный риск получается равным

Усредняя его при фиксированных значениях получаем апостериорный риск на шаге

Повторяя процедуру минимизации получаем оптимальные значения

и минимальное значение апостериорного риска

Продолжая эту последовательность усреднений и минимизаций, получаем для любого следующие оптимальные значения:

и минимальное значение риска

где величины определяются рекуррентным соотношением

При небольших значениях величины легко рассчитываются по рекуррентному соотношению (16.3.15) непосредственно. В частности,

а при больших значениях имеет место достаточно точное приближенное выражение

что дает возможность определить все решения с помощью (16.3.13) и (16.3.18).

Соответствующее адаптивное правило решения при неизвестном значении у определяется следующим образом:

где оценка максимального правдоподобия параметра у на шаге, а начальное приближение для значения этого параметра, выбираемое исходя из имеющихся ограниченных априорных сведениях о возможной области его значений.

Рекуррентные соотношения для оценок максимального правдоподобия параметра у принимают в данном случае следующую форму:

где

число объектов, находящихся на шаге в состоянии с признаком единица.

Совместно с этими рекуррентными соотношениями пргвило (16.3.19) полностью определяет адаптивный байесов алгоритм обслуживания с целевым назначением, соответствующим функции потерь (16.3.2).

1
Оглавление
email@scask.ru