Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
9.2. ФАКТОРИЗАЦИЯ ПРАВДОПОДОБИЯ ДЛЯ МОНОТОННЫХ ПОЛИНОМИАЛЬНЫХ ДАННЫХ9.2.1. ВведениеВ этом и следующем разделах мы предполагаем, что: 1) частоты в полных данных 2) механизм порождения пропусков пренебрежим в смысле, указанном в гл. 5. Следовательно, правдоподобие для вероятностей
по отсутствующим данным. МП-оценки Альтернативу модели, определяемой предположением 1, задает предположение, что частоты Для полных данных правдоподобие (9.1) дает МП-оценку
с асимптотический дисперсией
Нашей целью является получение аналогичных величин по неполным данным. В этом разделе мы обсудим структуры неполных данных частного вида, которые приводят к явным МП-оценкам. 9.2.2. МП-оценивание для монотонных структурПроиллюстрируем сначала МП-оценки в простом случае двумерной таблицы сопряженности с дополнительной таблицей по одному фактору. Пример 9.1. Двумерная таблица сопряженности с дополнительной одномерной подтаблицей. Рассмотрим две категориальные переменные: Данные состоят из Для обозначения суммирования по индексам
Рис. 9.1. Данные из примера 9.1 Как в примере 6.1, мы будем работать с другим набором параметров
где первое слагаемое — логарифм правдоподобия полиномиального распределения маргинальных частот
Итак, (9.2) — это факторизация правдоподобия вида (6.1) с
поэтому
Значит, согласно МП-оценке в Пример 9.2. Монотонные двумерные дискретные данные. Мы численно проиллюстрируем результаты примера 9.1 на данных табл. 9.1, где
Таблица 9.1. (см. скан) Пример со структурой данных на рис. 9.1 Условные вероятности отнесения к категориям
Сочетание этих оценок дает вероятности в (9.3):
В отличие от них оценки по полностью классифицированным наблюдениям равны:
Оценки пропуска Обобщения этого примера на случай других монотонных структур можно получить с помощью аналогичной факторизации правдоподобия. Пример 9.3. Анализ шестифакторной таблицы. Фухс [Fuchs (1982)] представляет данные Protective Services Project for Older Persons - долговременного исследования 165 людей, предпринятого для оценки влияния социальных условий на состояние здоровья (табл. 9.2). Исследователи собирали данные по шести дихотомическим переменным: Если опустить информацию о психическом состоянии одного человека в табл.
Наблюденные частоты для оценивания трех распределений в правой стороне приведены в табл. 9.3,а). Вычисленные ожидаемые частоты, равные оценке вероятности для ячейки, умноженной на 164 (суммарный объем выборки), приведены в табл.
Замена D - жив на D - умер дает ожидаемую частоту
Следовательно, ожидаемая условная вероятность выжить для людей из опытной группы старше 75 лет мужского пола с хорошим физическим и психическим состоянием равна (см. скан) (см. скан) Пример 9.4. Таблицы грубой и точной классификации. Данные в табл. 9.4,а) и б), представленные и проанализированные в [Hocking and Oxspring (1974)], иллюстрируют другую ситуацию, в которой можно вычислять МП-оценки, факторизуя правдоподобие. В табл. 9.4 содержатся данные об использовании лекарств для лечения проказы. 196 пациентов были классифицированы по степени инфильтрации и по общему клиническому состоянию после определенного времени со дня начала приема лекарств. Дополнительные данные о 400 других пациентах, грубо классифицированных по улучшению здоровья, приведены в табл. 9.4,6). Такого рода данные естественны в крупных диспансерных обследованиях, в которых подобные детальные результаты можно получить для небольшой группы, а грубо классифицированные данные можно собрать для большей группы людей без особых затрат. Правдоподобие факторизуется в соответствии с совместным распределением объединенных частот из двух таблиц, классифицированных, как табл. 9.4,6), для всех 596 пациентов и условным распределением степени улучшения (сильное, умеренное, слабое) при заданном улучшении и степени инфильтрации для 196 пациентов. Полученные МП-оценки вероятностей в ячейках приведены в табл. 94,в), так что виден ход вычислений. Совместные вероятности инфильтрации и грубо классифицированного клинического состояния получены объединением данных из а) и б), что дает значения в последних двух столбцах и первые факторы первых трех столбцов. Последние умножаются на условные вероятности степени улучшения, вычисленные по первым трем столбцам а). В частности, значение в левом верхнем углу равно 9.2.3. Оценивание точности МП-оценокАсимптотическую ковариационную матрицу, соответствующую МП-оценкам (9.3), можно получить, вычисляя информационную матрицу для параметров в форме под факторизованное правдоподобие, обращая эту матрицу, а затем проводя преобразование параметров для исходного вида методом, описанным в разделе 6.1. Можно также непосредственно вычислить дисперии и ковариации. Например, чтобы вычислить асимптотическую дисперсию
где
(см. скан) Простые выкладки дают
где
Левая сторона (9.4) записана в измененном виде, чтобы показать, что байесовский анализ асимптотической апостериорной дисперсии яд дает аналогичные результаты. Для ковариаций получаем
Если данные ОПС, то с, мал и (9.4) сводится к выражению, аналогичному (6.14):
В этом выражении Пример 9.5 (продолжение примера 9.2). Применим эти формулы к оценкам
Аналогично из (9.5) получаем, что оценка асимптотической дисперсии МП-оценки
Итак, уменьшение дисперсии за счет использования дополнительных маргинальных частот мало. Тем не менее данные скорее всего не ОПС, как указано в примере 9.2. Поэтому
Заменяя (9.5) на более точную формулу (9.4), получаем для дисперсии
Значит, метод максимального правдоподобия дает значительно более точную оценку
|
1 |
Оглавление
|