3.3.2. «Рабочеподобное» обучение
Этот несколько необычный термин используется для случая, когда эмпирические данные
являются итогом серии действий, каждое из которых происходит в ситуации, соответствующей значению
и сопровождается получением некоторой совокупности данных наблюдения и принятием решения
причем
выбирается из того же множества решений
что и решение и в рабочей ситуации Пои таком способе получения эмпирических данных может встретиться несколько характерных случаев.
1. Потери для всех
определяются той же функцией потерь, что и в рабочей ситуаций. но несущественны, а сами решения
выбираются независимо от нас. Это соответствует использованию чужого опыта в ситуациях, аналогичных интересующей нас рабочей ситуации, о котором мы получаем информацию, но за который в каждом случае принятия решения расплачивается кто-то другой.
Очевидно, что этот случай
отличается принципиально от простого обучения, поскольку платись 33 последствия приходится только один раз — в рабочей ситуации. Аожет измениться только содержание информации, заключенной в
Наряду с рассмотренным ранее, каждая из составляющих
может содержать в себе решение
и величину потерь
соответствующую этому решению и значению параметра
(известному либо нет), характеризующему
ситуацию. Эти сведения довольно содержательны с точки зрения возможности решения задач синтеза систем, когда априори функция потерь
т. е. критерий качества системы, не задана или известна неполностью. Эмпирические данные
для различных
позволяют с той или иной степенью полноты восстановить зависимость функции потерь или апостериорного риска от своих аргументов для принятия оптимального решения и в рабочей ситуацич. В отношении постановки задачи отыскания правила решения в этом случае имеет место все сказанное в п. 3.3.1в.
2. Для всех
и в рабочей ситуации решения
выбираются независимо, причем решение
выбирается из условия минимума ожидаемых потерь для функции
а решение и — для функции
Функции
могут быть как одинаковыми с
так и различными. Независимый выбор решений означает требование локальной оптимальности для каждого элемента серии
и рабочей ситуации. Любая из составляющих
может иметь то же содержание, что в п. 1, т. е. наряду с данными
подобными х, содержать сведения о
Довольно часто совокупность
представляет собой упорядоченную последовательность. В этом случае каждое очередное решение
может зависеть от всех
подобно тому, как решение и в рабочей ситуации может использовать
3. Следующим характерным случаем является такой, когда последовательность решений
и решение и в рабочей ситуации объединены единой целью, количественным выражением которой является функция потерь
и требуется минимизировать общий риск, соответствующий этой функции
При этом решения
уже не могут приниматься независимо, а выбор частных решений
в процессе набора эмпирических данных должен обеспечивать как уменьшение риска в каждой
ситуации, так и его минимальное значение в конечной рабочей ситуации.
Обычно серия
представляет в этом случае упорядоченную последовательность, что соответствует возможности выбора решения
зависящего от всех предыдущих значений
и соответственно
Составляющие эмпирической последовательности
могут иметь ту же природу, что и выше, а сама последовательность решений
и представляет собой многошаговый процесс, описанный в § 2.7.
Два наиболее типичных случая задания меры потерь соответствуют аддитивной функции потерь, когда
и функции потерь, не зависящей от
, т. е.
Последняя сосредоточивает все внимание при выборе решений
в процессе набора эмпирических данных на обеспечении минимальных потерь в рабочей ситуации. Естественно, что для функции потерь (3.3.7) зависимость в выборе решений
будет только тогда, когда эмпирические данные действительно имеют ценность, т. е. существует априорная неопределенность, связанная с незнанием или неполным знанием функции правдоподобия
и априорного распределения
или имеется статистическая зависимость между
. В противном случае, как следует из общих выражений гл. 2, многошаговый процесс принятия решений распадается на отдельные независимые шаги и выбор последовательности решений
не влияет на выбор решения и в рабочей ситуации.
В заключение отметим, что, как и в разд. 3.3.1, при наличии эмпирических данных может быть различная степень априорной неопределенности в отношении статистического описания
от полного незнания их распределений вероятности до полного статистического описания; и как и в предыдущих случаях, чрезвычайно удобно параметрическое описание с использованием имеющихся физических представлений и соответствующих им закономерностей.