Главная > Энциклопедия кибернетики. Т.2
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

— задача, возникающая при необходимости действовать в ситуации, известной не полностью. Формулируют ее

обычно, как задачу поиска единственного наилучшего (в каком-нибудь смысле) решения на заранее заданном мн-ве допустимых решений. Осн. трудность состоит в том, что последствия, связанные с принятием того или иного решения, зависят от неизвестной ситуации. Степень неприемлемости этих последствий принято измерять в условных единицах — потерях, которые, по предположению, может понести активное лицо, т. е. тот, кто принимает решение. Осн. исходной информацией, необходимой для решения задачи, является ф-ция потерь, представляющая собой зависимость потерь от двух аргументов: решения и ситуации. Осн. шаг при решении задачи состоит в преобразовании ф-ции потерь в ф-цию риска, отражающую зависимость степени риска, на который идет активное лицо, уже только от одного аргумента — от принимаемого решения. Способ такого преобразования неоднозначен и зависит от выбранного активным лицом критерия риска. От этого же критерия зависит и смысл выражения «наилучшее решение»: наилучшим наз. решение, минимизирующее риск. Применимость различных критериев риска зависит от характера неопределенности ситуации. Подробно изучены два типа таких неопределенностей: неопределенность состояния природы и неопределенность целенаправленного противодействия. Задачи, связанные с неопределенностями 1-го и 2-го типов, изучают соответственно теория статистических решений и игр теория. Неопределенность состояния природы имеет, в свою очередь, две осн. разновидности: когда о фактическом состоянии природы не известно ничего, кроме мн-ва, из которого оно может быть выбрано; когда известно распределение вероятностей (или ф-ция плотности вероятности) на мн-ве возможных состояний природы.

Формально задача ставится следующим образом. Пусть А — мн-во допустимых решений, в — мн-во возможных ситуаций, функция потерь, т. е. числовая ф-ция, определенная на мн-ве А X в всех пар вида где решение, ситуация (число наз. потерей, сопутствующей решению а при ситуации ). Зафиксировав некоторое решение из двуаргументной ф-ции получим новую (одноаргументную) ф-цию определенную на мн-ве и отражающую зависимость потери от ситуации при заданном и фиксированном решении а. Обозначим эту новую ф-цию через . Тогда всякое преобразование ф-ции потерь в ф-цию риска может быть осуществлено применением к всевозможным ф-циям вида а пробегает мн-во А) некоторого функционала 2. Результат применения функционала к ф-ции представляет собой число и наз. риском, связанным с решением а. Наилучшим решением, если оно существует, наз. такое а е А, которое минимизирует риск во мн-ве решений А, т. е. удовлетворяет требованию р

Если мн-во А конечно, для него может быть определено понятие рандомизированного решения (в таких случаях решения из А наз. детерминированными). Рандомизирован и решением, заданным на мн-ве А, наз. всякую неотрицательную числовую ф-цию , определенную на мн-ве А и удовлетворяющую требованию множество А непрерывно, сумма заменяется интегралом). Число тогда вероятностью детерминированного решения а относительно рандомизированного решения q. Практическое применение всякого рандомизированного решения состоит в том, что бросают жребий, определяющий, какое детерминированное решение из А следует в данном случае принять, причем применение рандомизиронанного решения q требует такой организации бросания жребия, чтобы детерминированное решение а в нем выпадало с вероятностью q (а). Обозначим мн-во всех рандомизированных решений, заданных на мн-ве А, через А. Оченидно, для каждого найдется такое эквивалентное ему рандомизированное решение , относительно которого вероятность детерминированного решения а равна 1. Поэтому мн-во А можно рассматривать как результат пополнения мн-ва А, а, следовательно, имеет смысл поставить задачу поиска наилучшего решения уже во мн-ве А. Для этого необходимо продолжить ф-цию потерь с мн-ва пар вида на мн-во пар вида потерей, сопутствующей решению при ситуации число Справедливость соотношения для любой пары показывает, что ф-ция потерь является продолжением ф-ции потерь ф. Если для детерминированных решений уже был выбран критерий риска, а, следовательно, и функционал 2, то с помощью этого же функционала для рандомизированных решений может быть определена ф-ция рисков риском, связанным с рандомизированным решением , наз. число Наилучшее рандомизированное решение определяется как решение, минимизирующее риск.

Важный общий вывод, касающийся любых критериев риска, состоит в следующем: каким бы ни был функционал 2, имеет место соотношение

Т. о., пополнение множества А не может повредить при решении задачи. Однако ответ на вопрос, принесет ли пополнение реальную пользу (т. е. можно ли знак заменить знаком ), зависит уже от используемого критерия риска. Наибольшее распространение

получили два таких критерия риска: критерий минимакса и критерий Байеса. Использование критерия минимакса не требует никакой информации о ситуации (за исключением указания мн-ва возможных ситуаций). Поэтому этот критерий может применяться при любой рассмотренной неопределенной ситуации (а для неопределенности противодействия он является даже единственным приемлемым критерием из известных). Функционал для него имеет вид а риск , связанный с решением , определяется соотношением . Во многих практически важных случаях (напр., когда мн-ва конечны) наилучшее детерминированное решение а удовлетворяет условию Для критерия минимакса пополнение мн-ва А оказывается существенным, т. е. позволяет, как правило, получать более выгодные решения. Критерий Байеса может быть использован только при такой неопределенности ситуации, когда известно распределение вероятностей (или ф-ция плотности вероятности) на мн-ве в всех возможных ситуаций. Пусть для всякого вероятность ситуации 0. Тогда функционал имеет вид (читается «математическое ожидание по распределению ), а риск определяется по отличие от критерия минимакса, критерий Байеса безразличен к пополнению мн-ва А, т. е. введение рандомизированных решений не дает никакого выигрыша.

Рассмотренная задача принятия решений является одновременно самой простой и самой важной. ее осн. задачей. Изучались всевозможные обобщения и усложнения этой задачи. Один из вариантов усложнения связан с использованием при выборе наилучшего решения результатов каких-нибудь наблюдений. При такой постановке задачи нужно искать уже не наилучшее решение (осн. задача), а наилучшую стратегию (или решающее правило), представляющую собой зависимость наилучшего решения от результатов наблюдения (стратегическая задача). Пусть Z — мн-во возможных результатов наблюдения и пусть известны вероятности условные (или плотности вероятностей) для всех . Детерминированной (смешанной) стратегией наз. всякое отображение s мн-ва Z во мн-во детерминированных решений А (соответственно — во мн-во рандомизированных решений . Мн-во S всех смешанных стратегий можно рассматривать как результат пополнения мн-ва S всех детерминированных стратегий детерминированное, рандомизированное решение). Стратегическая задача (поиск наилучшей стратегии во мн-ве S или во мн-ве S) может быть сведена к осн. задаче. Роль решений в этой осн. задаче играют стратегии из мн-иа S, а роль ф-ции потерь играет ф-ция определяемая из условия: для каждой пары где s — стратегия, 0 — ситуация, исходная ф-ция потерь. Критерий Байеса дает еще один способ сведения стратегической задачи к основной. Пусть для всех и известны вероятности Тогда, если полученный результат наблюдения есть , то, рассматривая вероятности как априорные, можно получить апостериорные вероятности для всех по ф-ле Байеса (отсюда и название — «критерий Байеса»)

После этого для каждого результата наблюдения решают его основную задачу: на мн-ве А ищут наилучтее решение вероятностью ситуации при этом принимается апостериорная вероятность ). Этим способом можно получить наилучшую стратегию (это будет ф-ция ставящая в соответствие каждому результату наблюдения z наилучшее решение ), причем она будет совпадать с наилучшей стратегией, найденной первым способом. При условии, что риск в данный момент времени зависит от последствий, обусловленных решением в предыдущие моменты времени, и критерий оценки качества принимаемых решений представляет собой некоторый функционал, определенный на всем интервале принятия решений, возникает многошаговая задача принятия решений. Если решения определяют выбор управляющего воздействия и принимаются в условиях неопределенности или неполноты информации, то соответствующую многошаговую задачу наз. задачей управления в условиях неопределенности (см. Дуальное управление и У правление с адаптацией). Задачи принятия решений в условиях неопределенности возникают в самых различных областях человеческой деятельности: в экономике, биологии, технике, медицине и т. д.

Лит.: Блекуэлл Д., Гиршик М. А. Теория игр и статистических решений. Пер. с англ. М., 1958 [библиогр. с. 351—359]; Вильямс Дж. Д. Совершенный стратег или Букварь по теории стратегических игр. Пер. с англ. ВД., 1960 [библиогр. с. 265— 266]; Льюс Р. Д., Райфа X. Игры и решения. Пер. с англ. М., 1961 [библиогр. с. 608—625]; Чернов Г., Мозес Л. Элементарная теория статистических решений. Пер. с англ. М., 1962.

Н. М. Дивук, В. И. Иваненко.

1
Оглавление
email@scask.ru