Выбор значений
для
-шагового процесса обслуживания и представляет собой задачу статистического решения. Будем считать, что целью процесса обслуживания является минимизация количества объектов, оставшихся в нежелательном состоянии после
шагов, и что потери также зависят от суммарного расхода средств обслуживания. Этим предположениям соответствует следующая функция потерь:
Будем считать также, что состояния объектов наблюдаются без ошибок, т. е. имеется совокупность данных наблюдения
где для любых
Тогда совокупность данных наблюдения
описывается теми же распределениями вероятности (16.3.1), что и величины
а необходимые для использования рекуррентных соотношений (16.1 3) распределения вероятности
получаются из (16.3.1) простой заменой
на
и фактически зависят только от
Конечный апостериорный риск
для функции потерь (16.3.2) равен
и зависит фактически только от результатов последнего наолюдения — совокупности величин
характеризующих состояния объектов на
шаге.
Для дальнейшей когкрегизации задачи нужно определить зависимость вероятности от
пэитем
будем считать, что из-за имеющейся априорной неопределенности эта зазясчмэггь язвэгтнэ не точно, а лишь параметрически, что и вынуждает использовать адаптивный байесов подход. Предположим, что зависимость вероятности
от
может быть аппроксимирована экспоненциальной функцией вида
с некоторым неизвестным коэффициентом у в показателе экспоненты, и рассмотрим сначала неадаптивный вариант задачи, предполагая, что
имеет заданное значение.
Подставляя (16.3.6) в (16.3.5) и производя минимизацию по
получаем оптимальные значения
что можно записать в виде единого выражения
При этом мы предполагаем,
В противном случае оптимальное правило решения заключается в выборе всех значений
нулевыми, т. е. в отказе от обслуживания из-за высокой относительной стоимости обслуживания.
С учетом (16.3.8) минимальный апостериорный риск
получается равным
Усредняя его
при фиксированных значениях
получаем апостериорный риск на
шаге
Повторяя процедуру минимизации
получаем оптимальные значения
и минимальное значение апостериорного риска
Продолжая эту последовательность усреднений и минимизаций, получаем для любого
следующие оптимальные значения:
и минимальное значение риска
где величины
определяются рекуррентным соотношением
При небольших значениях
величины
легко рассчитываются по рекуррентному соотношению (16.3.15) непосредственно. В частности,
а при больших значениях
имеет место достаточно точное приближенное выражение
что дает возможность определить все решения
с помощью (16.3.13) и (16.3.18).
Соответствующее адаптивное правило решения при неизвестном значении у определяется следующим образом:
где
оценка максимального правдоподобия параметра у на
шаге, а
начальное приближение для значения этого параметра, выбираемое исходя из имеющихся ограниченных априорных сведениях о возможной области его значений.
Рекуррентные соотношения для оценок максимального правдоподобия параметра у принимают в данном случае следующую форму:
где
число объектов, находящихся на
шаге в состоянии с признаком единица.
Совместно с этими рекуррентными соотношениями пргвило (16.3.19) полностью определяет адаптивный байесов алгоритм обслуживания с целевым назначением, соответствующим функции потерь (16.3.2).