Главная > Оптимальные решения
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

Лекция 17. Принятие решения на основе полезности

На практике случаются ситуации, когда необходимо принимать важное решение и ошибки должны быть как можно меньше. В этих обстоятельствах необходимо провести пробный, маломасштабный (в сравнении с принимаемым решением) эксперимент и получить дополнительную информацию для принятия решения. Например, предприниматель хотел бы организовать добычу нефти на некотором участке земли. Однако, у него нет большой уверенности, что на нем есть достаточное количество и качество нефти. Перед ним проблема: организовать ли промысел нефти или нет?

Очевидно, что для организации промысла нефти необходимо оборудование, жилье для рабочих, трубопроводы и т.д. Это требует больших денежных вложений. А если нефти не окажется в нужном количестве и качестве, предприниматель понесет убытки. С другой стороны, если нефть есть, а он не решился организовать промысел, он упустить прибыль. Ситуация сложная. В этих условиях необходимо с малыми затратами получить дополнительную информацию о возможных запасах нефти на участке путем ограниченного пробного бурения, и далее с учетом результатов пробы принять решение.

Формализуем такой класс задач принятия решения с пробным экспериментом [9].

Введем пространство действий А: исследователь намерен выбрать единственное действие из области допустимых действий

Пространство состояний исследователь полагает, что последствие выбранного действия а зависит от состояния природы или которое не может быть точно предсказано.

Очевидно, что А эквивалентно рассмотренным ранее двум решениям относительно значения параметра или

Семейство экспериментов для получения дальнейшей информации о предположительности каждого состояния или можно провести эксперимент из области допустимых экспериментов Е, или не проводить таковой

Пространство исходов эксперимента каждому возможному исходу каждого из допустимых экспериментов или поставлен в соответствие элемент При этом при исход при исход благоприятствующий или исход благоприятствующий Напомним, что результаты случайны, но мы полагаем, что при состоянии природы более вероятно получить исход чем и наоборот.

Априорные вероятности соответственно состояний

Априорные вероятности получить исход при эксперименте и состоянии :

И, наконец, заданы платы П за эксперимент и за предпринимаемые далее действия или

Общая проблема принятия решений состоит в следующем: заданы . Как исследователю выбрать а затем, имея наблюденное значение выбрать действие а, чтобы максимизировать ожидаемую полезность? Под полезностью понимается стоимость эксперимента и последствий выбранного действия.

Для конкретности, рассмотрим следующую задачу. Исследователю необходимо провести сложный физический эксперимент, для чего необходимо собрать соответствующую установку из многих разных приборов. Перед включением того или иного прибора в установку исследователь может его гарантированно отрегулировать, послав на завод или в соответствующую мастерскую. Однако это потерянное время и денежные затраты на оплаты регулировки. Можно не регулировать, но, если прибор на самом деле неисправен, установка даст при проведении физического эксперимента неверный результат и введет исследователя в заблуждение. Это приведет к большим потерям.

Исследователь может провести быстрый и простой тест на приборе перед постановкой его в установку. Это быстрее и дешевле регулировки, но нет гарантии полной исправности прибора (как при регулировке).

Итак, что делать: регулировать приборы или нет?

Исходные данные рассматриваемой задачи даны в таблице 17.1.

Таблица 17.1. Исходные данные

Отметим, что можно назначить плату, точнее, выигрыш за действие при условии Это положительная плата за выигрыш во времени при сборке установки.

Априорные вероятности даны в таблице 17.2.

Таблица 17.2. Априорные вероятности

При заданных исходных данных решение задачи выглядит следующим образом (рис. 17.1).

Шаг 1.

Мы находимся в начальной точке 1 и можем либо не проводить тестирования (пробного эксперимента) и попасть в точку 2, либо проводить тестирование - точка 3.

Шаг 2.

Из точки 2 мы, имея формально результат пробного эксперимента попадаем в точку 2.0 (два - ноль). Из точки 3 мы попадем либо в точку 3.1, либо 3.2.

Шаг 3.

Из точки 2.0 мы проходим в точки 2.0.1 или 2.0.2, из точки 3.1 - в 3.1.1 или 3.1.2, из точки 3.2 - в 3.2.1 или 3.2.2.

Шаг 4.

Из 2.0.1 при приходим в точку 2.0.1.1 или при в точку

Из 2.0.2 - в точки 2.0.2.1 или 2.0.2.2

Шаг 5.

Из 3.1.1 - в точки 3.1.1.1 или 3.1.1.2.

Из 3.1.2 - в точки 3.1.2.1 или 3.1.2.2.

Из 3.2.1 - в точки 3.2.1.1 или 3.2.1.2.

Из 3.2.2 - в точки 3.2.2.1 или 3.2.2.2.

Таким образом описаны все возможные маршруты. Наша задача выбрать такой маршрут, при котором в среднем затраты будут наименьшими.

Вначале вычислим вероятность получения тех или иных результатов экспериментов:

(кликните для просмотра скана)

за решение с учетом апостериорных вероятностей реализации и

Точка 2.0.1

(см. скан)

Имея средние платы за решения при том или ином результате эксперимента мы выбираем в зависимости от результата минимальную плату и соответствующее ей решение. Обозначим минимальную плату .

Точка 2.0

Минимальная плата и ей соответствует решение

Точка 3.1

(см. скан)

Имея минимальные платы при тех или иных результатах эксперимента вычислим среднюю плату за маршрут из точки 1 в сторону или Обозначим соответствующую плату (это средняя минимальная плата за проведение эксперимента или с последующим движением по оптимально выбираемым маршрутам с минимизацией возможных потерь за счет выбора или )

Точка 2

Точка 3

Теперь картина возможных последствий наших решений ясна. Находясь в точке 1 и ставя задачу выбора такого решения, при котором потери минимальны при неизвестном случайном значении мы из точки 1 должны пойти в точку 3. При этом нас ожидают потери Если бы мы выбрали точку 2, то

Из точки 3 мы в зависимости от результата эксперимента или должны выбрать решение:

при - решение

при - решение

Таким образом, решение нашей задачи:

- эксперимент (тестирование) в рассматриваемой нами задаче проводить и в зависимости от результата эксперимента или выполнить действия (принять решение) При этом в среднем наши затраты за проводимые нами действия составят - 72.3.

Отметим, что если по услоёиям задачи заданы другие исходные данные, то и результат будет иной. Например, пусть в рассмотренной нами задаче при прочих равных условиях изменились значения

(см. скан)

В этом случае пробный эксперимент (тестирование) не проводится, а принимается решение и наши затраты в среднем составят -90.

Рассмотренная нами задача, очевидно, не зависит от конкретного физического содержания. Мы рассмотрели гипотетическую ситуацию о сборе установки из разных приборов для проведения физического эксперимента. С таким же успехом, можно рассмотреть задачу, пойти на спектакль в театр, зная о нем по слухам и рискуя впустую потратить время и деньги на билеты. И тому подобные задачи. Главное в них: необходимо принять решение и совершить действия с возможными неприятными последствиями (затратами) из-за неполного знания ситуации (параметра ) Улучшить знание 0 поможет простой приемлемый по стоимости эксперимент. После получения в результате эксперимента дополнительной информации о 0 мы более уверено выбираем свои действия.

1
Оглавление
email@scask.ru