Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Глава 16. УПРАВЛЯЕМЫЕ МНОГОШАГОВЫЕ ПРОЦЕССЫ ПРИНЯТИЯ РЕШЕНИЙ С АДАПТАЦИЕЙ16.1. ВВОДНЫЕ ЗАМЕЧАНИЯВ гл. 2 была рассмотрена задача оптимизации многошагового управляемого процесса принятия решений, в котором принимаемое на Изложенный в § 2.7 математический аппарат в сочетании с развиваемыми в настоящей книге методами преодоления априорной неопределенности обладает весьма большой универсальностью и дает возможность решить задачи оптимизации для многих достаточно широких по своей постановке классов систем и процессов. Приведем некоторые примеры этих классов. а. Управление объектом. Общая схема системы управления показана на рис. 16.1. Она содержит объект управления, текущее состояние которого и управляющих воздействий
Рис. 16.1. Структурная схема системы управления объектом: 1 — объект управления; 2 — датчики информации об объекте управления; 3 — устройство формирования управляющих воздействий.
Рис. 16.2. Структуриая схема системы управления процессом наблюдения: 1 — источники получения даниых наблюдения; 2 — устройство формирования основного решения. 3 — устройство формирования управляющих воздействий Связь текущего состояния Априорная неопределенность для этого класса задач возникает по двум причинам: из-за неполного знания структуры и характеристик объекта управления и из-за неполного описания статистической зависимости данных наблюдения б. Управление процессом наблюдения при принятии решений. Обширный класс задач соответствует информационным системам, назначение которых состоит в принятии на основе некоторой совокупности данных наблюдения как непосредственно, так и через основные решения (если эти основные решения также принимаются по шагам). Соответствующая связь показана на рис. 16.2 пунктиром. Априорная неопределенность для этого класса задач связана с незнанием функций правдоподобия в. Управление объектом и источниками получения информации о его состояниях. Объединением двух рассмотренных случаев получается более общий класс управляемых многошаговых процессов, соответствующий системам, в которых мы имеем возможность управлять состояниями некоторого объекта и датчиками информации об этих состояниях. Общая схема такой системы получается из схемы рис. 16.1, если замкнуть обратную связь с устройства формирования управляющих воздействий на датчики информации, а ее статистическое описание соответствует общему случаю § 2.7. Именно такая схема наиболее адекватна црактическим потребностям и соответствует широчайшему спектру задач — от задачи управления движением космического аппарата и средствами наблюдения за его движением до задачи управления производством (предприятия, отрасли и т. д.) и средствами получения информации о ходе производственного процесса. Оптимизация управляемого многошагового процесса принятия решения представляет собой, пожалуй, наиболее трудную задачу теории статистических решений даже в чисто байесовом варианте. Эта трудность обусловлена тем, что в общем случае описанная в § 2.7 процедура не разбивается на совокупность задач по независимому выбору решений на отдельных шагах. Требуется решать всю задачу целиком, начиная с конца, и выбрать сначала Несмотря на отмеченные трудности, в настоящее время известно достаточно много результатов в области оптимизации управляемых многошаговых процессов принятия решения. Большинство из них относится, правда, к случаю, когда процесс изменения параметров информации и управления), как и в других случаях, являются основой для соответствующих адаптивных правил решения в условиях априорной неопределенности. В случае параметрической априорной неопределенности, в соответствии с общими положениями гл. 6, адаптивное байесово правило решения для многошаговой задачи получается заменой неизвестных значений параметров, входящих в обычное байесово правило решения, их оценками. При этом, разумеется, эти оценки должны быть согласованы со структурой многошагового процесса принятия решений в том смысле, что они должны производиться только с использованием тех данных наблюдения, которые имеются к очередному шагу. Рассмотрим, что меняется в основных рекуррентных соотношениях § 2.7 при наличии априорной неопределенности и как следует дополнить эти соотношения, чтобы получить процедуру построения необходимых оценок неизвестных параметров. Пусть введенные в § 2.7 для описания многошагового процесса условные плотности вероятности значений
Тогда на основании общих принципов адаптивного байесова подхода, изложенных в гл. 6, будем иметь вместо рекуррентных соотношений § 2.7 следующую систему рекуррентных соотношений для апостериорных рисков, из которой определяется последовательность оптимальных решений
или
где
В регулярном случае оценка максимального правдоподобия
и в отличие от неуправляемых процессов зависит также от последовательности решений
|
1 |
Оглавление
|