2.2. ПОТЕРИ
Рассмотрим вопрос об оценке последствий, к которым приводит выбор того или иного решения. Очевидно, что эти последствия разумно оценивать по степени соответствия их поставленной цели. Это позволяет по крайней мере в принципе для каждого из возможных альтернативных решений указать получающийся в результате принятия этого решения эффект и ввести для него количественную меру, задающую выигрыш или потери от принятия данного решения. Соответствующая мера называется функцией потерь (выигрыша) и определяется для каждого из возможных в данной задаче решения. Для определенности в дальнейшем будем пользоваться, как правило, понятием потерь, в связи с чем будем считать, что выбранное решение приводит к наиболее благоприятным последствиям, если оно минимизирует величину этих потерь. При использовании понятия выигрыша минимизация заменяется на максимизацию.
Пусть - значение функции потерь для данного решения. Если бы последствия решений и и их количественная мера зависели только от и, то, очевидно, вопрос о выборе оптимального решения решался бы тривиально: нужно было бы выбрать то решение и, для которого функция ( имеет наименьшее значение. На самом деле последствия принятия решения и связанные с ними потери зависят еще от ряда факторов и могут существенно изменяться в зависимости от реально складывающейся ситуации. Например, последствия от принятия решения о наличии отражающего объекта при радиолокационном обнаружении или о приемке партии продукции различаются в зависимости от того, есть ли объект на самом деле или нет и доброкачественна ли партия продукции или содержит брак.
Таким образом, функция потерь зависит от некоторых параметров описывающих неопределенность в величине потерь при принятии данного решения и характеризующих реальную ситуацию, в которой или относительно которой принимаются решения. Эти параметры образуют некоторое множество такое, что для каждого и можно по крайней мере в принципе определить значение функции потерь , описывающей последствия принятия решения и в данной ситуации Параметры могут иметь столь же или еще более многообразную природу, что и решения и. Они могут быть дискретными и непрерывными величинами, векторами, процессами, состояниями и т. д. При этом независимо от их конкретной природы параметры можно считать случайными элементами множества на котором определена некоторая (известная или неизвестная) вероятностная мера. Во многих случаях структура множества соответствует структуре множества решений Так, для дискретного пространства (случай А § 2.1), когда решение заключается в выборе одной из возможных альтернатив, во многих задачах последствия выбора и соответствующая
им функция потерь зависят только от выбранного решения и истинной ситуации, число которых конечно. Например, в задаче распознавания требуется по данным наблюдения х принять решение о том, что наблюдаемый объект относится к одному из заданных классов с номером а истинная ситуация может заключаться в том, что этот объект относится к классу с номером Потери зависят от выбранной альтернативы и истинной ситуации а неизвестный параметр X — это просто номер характеризующий истинную ситуацию. При этом функция потерь где номер решения, номер истинной ситуации.
Аналогично в задачах с непрерывным множеством решений (случай Б § 2.1) параметры к по своей структуре часто идентичны решениям и. Так, в задачах оценки к — это неизвестное истинное значение оцениваемого параметра, решение и — его оценочное значение, а потери обычно зависят от их разности, т. е. . В общем случае структуры множеств могут быть различными.
Функция потерь представляет собой априорную оценку последствий принятия решения и в ситуации, характеризуемой некоторыми не наблюдаемыми непосредственно параметрами k. Эта априорная оценка может зависеть и от ожидаемых значений наблюдаемых данных поскольку получение тех или иных значений может быть связано с различными затратами. Поэтому, вообще говоря, функция потерь где совокупность имеющихся при принятии решения наблюдаемых данных, множество возможных значений этой совокупности.
Как уже отмечено ранее, данные наблюдения могут иметь самую различную физическую природу и соответствовать различному объему входной информации. Это могут быть величины, векторы, процессы и т. д. Весьма существенны два обстоятельства:
— наблюдаемые данные из-за стохастической сущности процесса наблюдения имеют вероятностный характер;
— эти данные всегда в той или иной степени связаны с ненаблюдаемыми параметрами к, характеризующими ситуацию, в которой принимается решение, и влияющими на последствия от его принятия. Только при наличии взаимосвязи между ненаблюдаемыми параметрами к и наблюдаемыми данными эти последние имеют ценность с точки зрения возможности уменьшения неопределенности значений к и ожидаемых потерь от принятия решения.
Эти обстоятельства позволяют ввести для описания данных наблюдения условную вероятностную меру, зависящую от и заданную на множестве Как функция параметров эта мера (чаще соответствующая ей плотность вероятности в случае существования последней) называется функцией правдоподобия. В практических задачах условная вероятностная мера может быть как полностью известна для всякого значения 1, так и быть заданной лишь частично, например с точностью до ряда дополнительных параметров, посредством набора выборочных значений наблюдавшихся в прошлом в аналогичных ситуациях, или еще каким-либо способом.