Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике 15.5. БАЙЕСОВСКИЙ ВЫВОД ДЛЯ НЕКОТОРЫХ ОДНОМЕРНЫХ ВЕРОЯТНОСТНЫХ МОДЕЛЕЙ15.5.1. ВЫВОДЫ В СЛУЧАЕ БИНОМИАЛЬНОГО РАСПРЕДЕЛЕНИЯ И БЛИЗКИХ К НЕМУ РАСПРЕДЕЛЕНИЙЕсли у обозначает число успешных результатов при независимых испытаниях, в каждом из которых существует в шансов на успех, то в случае, когда заранее фиксируется, получим вероятностную модель с биномиальным распределением
Предположим, что априорные представления относительно в заданы в виде плотности Тогда апостериорная плотность [см. раздел 15.3.1] задается с помощью
Как отмечалось при общем обсуждении теоремы Байеса в непрерывном случае, вид можно легко получить численными методами для любого варианта Однако это станет слишком трудоемким процессом, если мы захотим исследовать, как изменяется при различных вариантах выбора так как придется проводить отдельные вычисления для каждой спецификации. Более того, простое построение кривой численными методами не может привести к аналитическому пониманию того, каким образом «взаимодействуют» данные и априорные представления при формировании вида апостериорных представлений. В силу этих причин интересно изучить конкретное математическое выражение (одновременно удерживая в памяти практические подходы к оцениванию действительного вида которые обсуждались в разделе 15.3.2). Чтобы получить математические выражения, обеспечивающие понимание этого взаимодействия как на теоретическом, так и на практическом уровне, желательно обнаружить семейство функций плотностей вероятностей, которое можно использовать при изменении небольшого числа параметров для генерации априорных суждений с различной формой функции плотности, чтобы адекватно отразить многие виды суждений. При биномиальном распределении нам потребуется семейство функций, определенных на интервале 00 1 и заданных в виде функций с небольшим числом параметров, которые можно изменять, чтобы получить несколько видов функций с гибкими свойствами. Таким семейством функций является семейство бета-функций [см. II, раздел 11.6], определенных при с помощью
где — гамма-функция [см. IV, раздел 10.2], обладающая свойством Так как есть плотность, то поэтому
Рис. 15.5.1. Примеры плотностей бета-распределения: Изменяя можно генерировать семейство функций, вид которых меняется в очень широком диапазоне. На рис. 15.5.1 показаны примеры некоторых из них. При работе за дисплеем компьютера в интерактивном режиме оказалось возможным опрашивать индивида, чтобы обнаружить, можно ли его представления относительно в (а если да, то для каких ) адекватно отобразить с помощью плотности, имеющей вид бета-функции. При конкретном выборе значений теорема Байеса, записанная в виде пропорции, дает
Оценивая интеграл, получим
Теперь мы располагаем интересным результатом. Апостериорная плотность также имеет форму бета-функции, но вместо априорных параметров она включает параметры Схематически это можно записать так:
Из этого результата следует очень простое правило усовершенствования представлений в случае вероятностной модели с биномиальным распределением, когда априорные представления отражены в виде плотности, имеющей вид бета-функции. Проведенный выше анализ оказывается тогда достаточным в качестве единственного решения при любом выборе и для любых данных . Например, можно непосредственно задать расположение правдоподобных интервалов, обратившись к таблицам значений бета-распределений. Если же величина
имеет -распределение [см. раздел 2.5.6, б)], то можно пользоваться таблицами -распределения. Когда обозначают верхнюю и нижнюю процентные точки уровня для -распределения [см. раздел 2.5.6, а)], апостериорный правдоподобный интервал уровня для в задается с помощью
Поскольку нижние процентные точки -распределения не табулируются, удобно воспользоваться тем, что нижняя точка уровня распределения равняется величине, обратной значению верхней точки уровня -распределения [см. раздел 2.5.6, а)]. Если обозначить последнее как то при правдоподобный интервал для в можно переписать в виде
Пример 15.5.1. Если то величина подчиняется апостериорному распределению вида Например, при получим , таким образом, апостериорный -ный правдоподобный интервал для в будет иметь вид
(Отметим, что этот интервал не является интервалом наивысшей апостериорной плотности, так как в стандартных таблицах не приводятся верхние и нижние значения, рассчитанные на таком базисе, за исключением случаев симметричной функции плотности. В таблицах для статистиков байесовского направления [см. Isaacs, Christ, Norvick and Jackson (1974) - G] содержатся результаты для получения интервалов наивысшей апостериорной плотности. Однако чаще всего результаты оказываются очень похожими.) Некоторое представление о способе, которым при получении апостериорных выводов комбинируются априорная информация и информация, содержащаяся в данных, можно получить при изучении вида точечной оценки , найденной в виде среднего апостериорного распределения. Апостериорное среднее задается с помощью
где используются результаты, установленные выше для интеграла такого типа и для гамма-функции. При более внимательном изучении становится видно, что его выражение можно переписать в виде
где При этом выявляется, что среднее апостериорного распределения будет взвешенным средним двух величин: Первая из них фактически оказывается средним априорного распределения (что можно показать с помощью непосредственных расчетов или вывести дедуктивно исходя из вида апостериорного среднего при вторая — «естественная» оценка в, основанная только на данных (являющаяся также оценкой максимального правдоподобия и НОМД). Таким образом, в апостериорной оценке соединяется то, что нам сообщают данные с «наилучшими предположениями», существовавшими у нас до того, как мы увидели данные По мере того как увеличивается объем данных, т. е. становится все больше, вес связанный с оценкой, основанной на данных, становится больше:
И наоборот, если данные отсутствуют, т. е. то приходится пользоваться априорной оценкой (так как Поэтому адаптация формы апостериорной оценки происходит способом, который интуитивно ясен, если принимать в расчет объем имеющихся данных, видоизменяющих априорные представления. В дополнение к результирующей характеристике апостериорной плотности, полученной с помощью точечной оценки, можно проанализировать, что происходит с «разбросом» апостериорного распределения, когда увеличивается. Если мы собираемся оценивать размах с помощью дисперсии апостериорного распределения, то нам потребуется выражение дисперсии бета-распределения с параметрами Применяя стандартные методы для нахождения дисперсии [см. раздел 10.4.1], легко показать, что она будет равняться
Когда дисперсия, выраженная таким образом, явно стремится к . Поэтому независимо от выбора конкретного априорного вида по мере того, как увеличивается объем данных, кривая представлений становится все более сконцентрированной вокруг апостериорного среднего. Последнее в свою очередь больше напоминает (как было видно ранее), и поэтому неважно, какой вариант конкретного вида априорного бета-распределения был принят. В любом случае мы будем во все большей степени приходить к убеждению, что значение истинного шанса на успех в лежит «очень близко» к наблюдаемой частоте успешных исходов Если у и становятся очень большими по сравнению с то апостериорная плотность приобретает вид (приближенно) бета-распределения с параметрами Таким образом, воздействие большого объема данных выразится в том, что разнообразие различных априорных представлений (отображенных с помощью многих вариантов выбора сведется к апостериорному единодушию во мнениях. Это обстоятельство играет ключевую роль в ответе на обвинения в отсутствии «объективности» в байесовских методах вследствие вторжения «субъективности» априорных представлений. Для последователей байесовского подхода кажется естественным рассматривать субъективные представления в качестве первичных, а «объективное согласие» — как особую ситуацию, возникающую, когда объем доступных данных достаточно велик, чтобы возобладать над априорными представлениями всех заинтересованных и стать доминирующим, приводя к преобразованию их в апостериорные представления единого вида. Когда количество данных недостаточно велико, чтобы обеспечить такой тип согласования мнений, статистик байесовского направления считает вполне правильным, что априорные представления оказывают влияние на апостериорные выводы. Если условия для достижения согласия не удовлетворяются, то стремление создать видимость существования «объективного» ответа не может считаться похвальным. Все, что может сделать статистик в таких случаях, — это отразить разнообразие различных видов априорных представлений. Тогда читатель (научного доклада) или клиент (консультант по вопросам статистики) сможет оценить собственное отношение к данным, выяснив, какой именно из результатов анализа соотношения между конкретными априорными и апостериорными представлениями лучше всего соответствует его собственному априорному представлению. Такое отображение результатов анализа можно существенно облегчить, применяя математические (но не чисто численные) методы с использованием гибкого, хорошо интерпретируемого семейства априорных распределений. Если удается обнаружить семейство, которое: а) достаточно богато, чтобы с его помощью можно было бы представить большинство форм кривых, соответствующих априорным представлениям, встречающимся на практике, и б) прекрасно согласуется с видом правдоподобия, так что легко можно идентифицировать математический вид описания апостериорной плотности, то процесс вывода оказывается полностью завершенным после того, как будет отмечено, каким образом преобразуются параметры априорной плотности в параметры апостериорной плотности. В случае плотности в виде бета-распределения видно, что априорные параметры преобразуются в апостериорные параметры при этом роль данных в подобном преобразовании отражается посредством достаточных статистик и у. Теперь предположим, что, получив в результате наблюдений у успешных исходов при испытаниях, мы захотели предсказать число успешных исходов, которые будут получены при последующих независимых испытаниях. Если X обозначает число будущих успешных исходов, то статистик, пользующийся байесовским подходом, захочет рассчитать
Проведя простой расчет, эти вероятности можно задать в виде
что дает нам пример прогнозного распределения [см. раздел 15.4.4]. Предполагая, что в рассматриваемом случае в имеет априорное бета-распределение получим при
Пример 15.5.2. Если благодаря чему можно исходить из того, что — однородная функция плотности на интервале (0,1), и если мы можем рассматривать вероятность того, что единственное последующее испытание закончится успешным исходом, то, воспользовавшись фактом, что можно упростить, чтобы получить
Обсуждавшиеся в этой главе результаты получены на основе биномиальной вероятностной модели. Однако, как отмечалось в разделе 15.4.6, такие модели, как отрицательная биномиальная, приводят к аналогичному виду при любом выборе
|
1 |
Оглавление
|