15.6. БАЙЕСОВСКИЕ МЕТОДЫ ДЛЯ МОДЕЛЕЙ, СОДЕРЖАЩИХ МНОГО ПАРАМЕТРОВ
15.6.1. НЕПРИЕМЛЕМОСТЬ «СОВЕРШЕННО РАСПЛЫВЧАТЫХ» АПРИОРНЫХ СПЕЦИФИКАЦИЙ
Одно из заключений общего характера, которое можно сделать на основании рассмотренных примеров, состоит в следующем. Хотя концептуально байесовский подход сильно отличается от стандартных статистических методов, на практике результаты, полученные с его помощью, зачастую незначительно отличаются от тех, что дает применение стандартных процедур. В частности, как было показано, именно так обстоит дело в случае большинства стандартных вероятностных моделей, содержащих один или два неизвестных параметра, когда первоначальные представления не очень строго определены по сравнению с объемом информации, заключенной в данных.
Конечно, нельзя утверждать, что даже в случае моделей, содержащих только один или два параметра, байесовские «ответы» будут всегда совпадать с небайесовскими. Этого не произойдет, когда в распоряжении имеется мало данных, а априорная информация играет существенную роль.
Однако если модель содержит много параметров, то даже выборка, кажущаяся большой, в действительности может содержать реально не слишком много «ошеломляющих» данных относительно неизвестных аспектов модели, так как информация в ней «разбросана» по многим параметрам. С другой стороны, если модель содержит много параметров, типичной оказывается ситуация, когда имеется существенная для анализа информация относительно зависимостей между параметрами. В конце концов, параметры «отражают» обычно нечто «реальное», и вполне вероятно, что индивидуальные «реальные» характеристики сильно взаимосвязаны или их нельзя все вместе рассматривать в одной модели.
В таких ситуациях присваивание независимых, расплывчатых априорных представлений каждому параметру обычно не может считаться правильной формой выражения априорной информации. Тем не менее сохраняется соответствие между типичными небайесовскими процедурами и байесовскими процедурами, выведенными на основании даже такой априорной спецификации. Отсюда следует, что в многопараметрических случаях должны существовать возможности для обнаружения байесовских форм выводов, в значительной мере отличающихся от стандартных форм.
15.6.2. ПРОСТЫЕ ПРИМЕРЫ
Предположим, данные состоят из к групп наблюдений по
наблюдений в каждой группе и можно принять допущение, что все наблюдения независимые и нормально распределенные с одинаковой дисперсией (известной или неизвестной, что не имеет значения) и неизвестными математическими ожиданиями в каждой из групп
Каким образом следует оценивать параметры, когда заданы такие предположения?
Стандартные процедуры (например, метод наименьших квадратов [см. раздел 3.5.2] или метод максимального правдоподобия [см. раздел 3.5.4]) привели бы к использованию выборочных средних
где
в качестве оценок
Они могли бы считаться решениями и с байесовской точки зрения, если бы совместная априорная спецификация для
имела бы следующий вид:
так что представления о любом из отдельных параметров
не зависят от представления о других
это означает, что все
рассматриваются как несвязанные параметры;
б) любая
соответствует расплывчатой априорной спецификации.
Возникает вопрос о реалистичности такой формы априорной спецификации. Анализ конкретных примеров, общую структуру которых можно представить в виде к групп по
наблюдений в каждой, говорит о том, что она нереалистична.
Предположим, что наблюдения касаются урожайности определенной сельскохозяйственной культуры, при этом группы соответствуют слегка различающимся условиям произрастания. Далее предположим, что имеется двадцать групп
по два растения в каждой
В этом случае интуитивно кажется, что гораздо большая чувствительность достигается при оценивании
с помощью оценки вида
где
— среднее по совокупности всех групп
Эта оценка является взвешенным средним информации, содержащейся только в
группе
и получаемой из всего множества данных информации
Она отражает ощущение, что
мало по сравнению с
Следовательно, может оказаться, что пользоваться информацией, основанной только на двух наблюдениях, неэффективно, если в действительности предполагается, что последствия, связанные с различными условиями произрастания, должны быть только слегка различными. Вес
должен отражать соотношение величин к и
а также служить некоторой мерой того, насколько похожими нам кажутся эти группы.
В качестве еще одного примера рассмотрим ситуацию, когда, как выявилось, наблюдения внутри каждой группы повторяются, являясь наблюдаемыми откликами на стимул с заданным уровнем, причем уровень стимула фиксирован для каждой группы, но возрастает по мере того, как мы продвигаемся от первой группы к
(например, между уровнями задаются соотношения
Структура «стимул-отклик» может относиться к связям между удобрениями и урожайностью культур, между дозами лекарств и темпами выздоровления пациентов, между сенсорными воздействиями и физиологическими реакциями и т. д. [ср. с разделом 6.6].
В большинстве подобных ситуаций область изменения уровней стимулов охватывает такой диапазон, о котором известно, что в его пределах наблюдаются тенденции усиления, выравнивания и, наконец, ослабления отклика в результате усиления стимула. Если снова взять
то многие будут интуитивно испытывать неудовлетворение из-за того, что приходится использовать
для оценки истинного отклика
соответствующего стимулу
Некоторые могут предпочесть, например, подбор кривой квадратического типа при помощи графика
вместо
чтобы затем использовать подобранное значение, соответствующее
в качестве оценки. Другие могут отдать предпочтение среднему этого подобранного значения и среднего для группы
при этом в общем случае относительные значения весов будут зависеть от к и
Выбор этих конкретных примеров в действительности не относится к существу проблемы. Обстоятельство, которое хотелось бы отметить, заключается в том, что основополагающие характеристики реальной ситуации могут преподнести информацию, совершенно отличную от той, которая подразумевалась в понятиях «независимые, расплывчатые априорные» представления. Вывод из байесовского анализа состоит в том, что знания взаимосвязей, существующих между параметрами в соответствии с их смысловым значением, следует инкорпорировать в модель с помощью априорного распределения. В математическом виде это означает использование иерархической модели типа
в которой на первом этапе устанавливаются соотношения между параметрами и наблюдениями, на втором выявляется природа взаимосвязей, существующих между параметрами, и на третьем включается в рассмотрение числовая информация (если таковая имеется), касающаяся общего вида взаимосвязей, заданных на втором этапе.
В качестве примера можно смоделировать ситуацию типа «стимул—отклик», рассматривая [см. раздел 1.4.2, п.1)]
В этом случае на втором этапе будет представлена информация о том, что истинные значения отклика лежат на квадратической кривой, в то время как на третьем будет указано на неопределенность точного числового выражения этой кривой.
Можно показать, что апостериорное среднее для
, в такой модели принимает вид
где
обозначают квадратическую кривую, подобранную методом наименьших квадратов с помощью значений
Введение в основные понятия байесовских иерархических моделей можно найти в статьях [Lindley and Smith (1972)] и [Smith (1973)]. В работе [Harrison and Stevens (1976)] содержится хорошее введение в приложение этих идей к моделям временных рядов.
15.7. ЛИТЕРАТУРА ДЛЯ ДАЛЬНЕЙШЕГО ЧТЕНИЯ
(см. скан)