15.6. БАЙЕСОВСКИЕ МЕТОДЫ ДЛЯ МОДЕЛЕЙ, СОДЕРЖАЩИХ МНОГО ПАРАМЕТРОВ

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

15.6. БАЙЕСОВСКИЕ МЕТОДЫ ДЛЯ МОДЕЛЕЙ, СОДЕРЖАЩИХ МНОГО ПАРАМЕТРОВ

15.6.1. НЕПРИЕМЛЕМОСТЬ «СОВЕРШЕННО РАСПЛЫВЧАТЫХ» АПРИОРНЫХ СПЕЦИФИКАЦИЙ

Одно из заключений общего характера, которое можно сделать на основании рассмотренных примеров, состоит в следующем. Хотя концептуально байесовский подход сильно отличается от стандартных статистических методов, на практике результаты, полученные с его помощью, зачастую незначительно отличаются от тех, что дает применение стандартных процедур. В частности, как было показано, именно так обстоит дело в случае большинства стандартных вероятностных моделей, содержащих один или два неизвестных параметра, когда первоначальные представления не очень строго определены по сравнению с объемом информации, заключенной в данных.

Конечно, нельзя утверждать, что даже в случае моделей, содержащих только один или два параметра, байесовские «ответы» будут всегда совпадать с небайесовскими. Этого не произойдет, когда в распоряжении имеется мало данных, а априорная информация играет существенную роль.

Однако если модель содержит много параметров, то даже выборка, кажущаяся большой, в действительности может содержать реально не слишком много «ошеломляющих» данных относительно неизвестных аспектов модели, так как информация в ней «разбросана» по многим параметрам. С другой стороны, если модель содержит много параметров, типичной оказывается ситуация, когда имеется существенная для анализа информация относительно зависимостей между параметрами. В конце концов, параметры «отражают» обычно нечто «реальное», и вполне вероятно, что индивидуальные «реальные» характеристики сильно взаимосвязаны или их нельзя все вместе рассматривать в одной модели.

В таких ситуациях присваивание независимых, расплывчатых априорных представлений каждому параметру обычно не может считаться правильной формой выражения априорной информации. Тем не менее сохраняется соответствие между типичными небайесовскими процедурами и байесовскими процедурами, выведенными на основании даже такой априорной спецификации. Отсюда следует, что в многопараметрических случаях должны существовать возможности для обнаружения байесовских форм выводов, в значительной мере отличающихся от стандартных форм.

15.6.2. ПРОСТЫЕ ПРИМЕРЫ

Предположим, данные состоят из к групп наблюдений по наблюдений в каждой группе и можно принять допущение, что все наблюдения независимые и нормально распределенные с одинаковой дисперсией (известной или неизвестной, что не имеет значения) и неизвестными математическими ожиданиями в каждой из групп Каким образом следует оценивать параметры, когда заданы такие предположения?

Стандартные процедуры (например, метод наименьших квадратов [см. раздел 3.5.2] или метод максимального правдоподобия [см. раздел 3.5.4]) привели бы к использованию выборочных средних где в качестве оценок Они могли бы считаться решениями и с байесовской точки зрения, если бы совместная априорная спецификация для имела бы следующий вид:

так что представления о любом из отдельных параметров не зависят от представления о других это означает, что все рассматриваются как несвязанные параметры;

б) любая соответствует расплывчатой априорной спецификации.

Возникает вопрос о реалистичности такой формы априорной спецификации. Анализ конкретных примеров, общую структуру которых можно представить в виде к групп по наблюдений в каждой, говорит о том, что она нереалистична.

Предположим, что наблюдения касаются урожайности определенной сельскохозяйственной культуры, при этом группы соответствуют слегка различающимся условиям произрастания. Далее предположим, что имеется двадцать групп по два растения в каждой В этом случае интуитивно кажется, что гораздо большая чувствительность достигается при оценивании с помощью оценки вида где — среднее по совокупности всех групп Эта оценка является взвешенным средним информации, содержащейся только в группе и получаемой из всего множества данных информации Она отражает ощущение, что мало по сравнению с Следовательно, может оказаться, что пользоваться информацией, основанной только на двух наблюдениях, неэффективно, если в действительности предполагается, что последствия, связанные с различными условиями произрастания, должны быть только слегка различными. Вес должен отражать соотношение величин к и а также служить некоторой мерой того, насколько похожими нам кажутся эти группы.

В качестве еще одного примера рассмотрим ситуацию, когда, как выявилось, наблюдения внутри каждой группы повторяются, являясь наблюдаемыми откликами на стимул с заданным уровнем, причем уровень стимула фиксирован для каждой группы, но возрастает по мере того, как мы продвигаемся от первой группы к (например, между уровнями задаются соотношения Структура «стимул-отклик» может относиться к связям между удобрениями и урожайностью культур, между дозами лекарств и темпами выздоровления пациентов, между сенсорными воздействиями и физиологическими реакциями и т. д. [ср. с разделом 6.6].

В большинстве подобных ситуаций область изменения уровней стимулов охватывает такой диапазон, о котором известно, что в его пределах наблюдаются тенденции усиления, выравнивания и, наконец, ослабления отклика в результате усиления стимула. Если снова взять то многие будут интуитивно испытывать неудовлетворение из-за того, что приходится использовать для оценки истинного отклика соответствующего стимулу Некоторые могут предпочесть, например, подбор кривой квадратического типа при помощи графика вместо чтобы затем использовать подобранное значение, соответствующее в качестве оценки. Другие могут отдать предпочтение среднему этого подобранного значения и среднего для группы при этом в общем случае относительные значения весов будут зависеть от к и

Выбор этих конкретных примеров в действительности не относится к существу проблемы. Обстоятельство, которое хотелось бы отметить, заключается в том, что основополагающие характеристики реальной ситуации могут преподнести информацию, совершенно отличную от той, которая подразумевалась в понятиях «независимые, расплывчатые априорные» представления. Вывод из байесовского анализа состоит в том, что знания взаимосвязей, существующих между параметрами в соответствии с их смысловым значением, следует инкорпорировать в модель с помощью априорного распределения. В математическом виде это означает использование иерархической модели типа

в которой на первом этапе устанавливаются соотношения между параметрами и наблюдениями, на втором выявляется природа взаимосвязей, существующих между параметрами, и на третьем включается в рассмотрение числовая информация (если таковая имеется), касающаяся общего вида взаимосвязей, заданных на втором этапе.

В качестве примера можно смоделировать ситуацию типа «стимул—отклик», рассматривая [см. раздел 1.4.2, п.1)]

В этом случае на втором этапе будет представлена информация о том, что истинные значения отклика лежат на квадратической кривой, в то время как на третьем будет указано на неопределенность точного числового выражения этой кривой.

Можно показать, что апостериорное среднее для , в такой модели принимает вид

где обозначают квадратическую кривую, подобранную методом наименьших квадратов с помощью значений

Введение в основные понятия байесовских иерархических моделей можно найти в статьях [Lindley and Smith (1972)] и [Smith (1973)]. В работе [Harrison and Stevens (1976)] содержится хорошее введение в приложение этих идей к моделям временных рядов.

15.7. ЛИТЕРАТУРА ДЛЯ ДАЛЬНЕЙШЕГО ЧТЕНИЯ

(см. скан)

<< Предыдущий параграф

Следующий параграф >>

Оглавление