Главная > Статистический анализ данных с пропусками
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

12.2. БАЙЕСОВСКИЕ МОДЕЛИ ДЛЯ ДАННЫХ ОБСЛЕДОВАНИЯ С ПРОПУСКАМИ

Для изложения переменные удобно разделить в обследовании на две группы где присутствует у всех объектов выборки, а У подвержена пропускам. Структура пропусков в У описывается матрицей индикаторов пропусков где если зарегистрировано, и в противном случае. Представим схематично данные на рис. 12.2, как в [Little (1982)]. Значения присутствующие в выборке, обозначим а исключенные значения Включенные значения можно

Рис. 12.2. Данные выборочного обследования с монотонной структурой пропусков

далее разбить на присутствующие и отсутствующие Заштрихованная область, на диаграмме представляет данные Значения индикаторов рключения в выборку и пропусков показаны на диаграмме как блоки нулей и единиц. Объекты расположены по строкам, так что первые объектов содержат все переменные, следующие объектов включены в выборку, но неполны, а остальные объектов не вошли в выборку.

На диаграмме показан частный случай с монотонной структурой пропусков в У, обсуждавшейся в гл. 6. В этом случае все множество данных также имеет монотонную структуру: присутствуют полностью и наблюдается больше наблюдается больше У Как указано в гл. 6, вывести эффективные методы обработки пропусков легче при монотонной, чем при более общей структуре, хотя теория, излагаемая ниже, рассматривает самую общую ситуацию. Частный случай монотонной структуры возникает при пропуске всего объекта, когда все частично наблюдаемые переменные отсутствуют у некоторых объектов и когда нет полностью наблюдаемых переменных

В чисто байесовской модели задают совместное распределение условно по Это распределение можно определить как произведение условных распределений

Первый фактор в правой части (12.7) совершенно аналогичен первому фактору в (12.1) с заменой Последний фактор в (12.7) аналогичен второму в (12.1) и заменой У на и дополнительным условием по которое появляется из-за возможных пропусков выводы могут зависеть от структуры пропусков). В связи с этим дополнительным условием при возможности пропусков мы будем говорить, что механизм извлечения выборки игнорируем, если зависит только от наблюдаемых значений

Наконец, второй фактор в (12.7) новый и представляет механизм пропусков — условное распределение при заданных Факторизация (12.7) имеет такую же общую форму, что и факторизация (11.3) для неигнорируемых пропусков, с дополнительным фактором, отражающим выборочный механизм.

Теперь выводы о параметрах популяции следуют из присутствующих значений и условного распределения отсутствующих значений заданных присутствующих значениях:

Здесь в явном виде представлено, что апостериорное распределение (12.9) условно по и кроме Это дополнительное условие часто игнорируют, даже сталкиваясь с пропусками, и строят байесовские выводы с помощью распределения

Следуя [Rubin (1976), (1987)] и определению из раздела 12.1, мы будем говорить, что механизмы извлечения выборки и пропусков одновременно игнорируемы, если распределения (12.9) и (12.10) совпадают. Достаточным условием для игнорируемости механизма пропусков при игнорируемости выборочного механизма является независимость распределения при заданных от отсутствующих значений

Если верны это уравнение и (12.8), то

поэтому (12.9) равно (12.10).

Детальное изложение условий игнорируемости механизмов извлечения выборки и пропусков дано в [Little (1982)]. Перефразируя формулировки, мы можем сказать, что при случайном выборе эти механизмы игнорируемы, если распределение пропусков не зависит от значений признаков, отсутствующих у некоторых объектов. В частности, предполагается, что пропуск не зависит от отсутствующей переменной внутри подклассов, определенных значением переменных плана и полностью наблюдаемых переменных Эти условия сходны с условием ОС и условием раздельности параметров из предыдущих глав, налагаемых в рамках теории правдоподобия. Это соответствие обсуждается в [Rubin (1978), гл. 2].

В следующем разделе мы опишем методы, основанные на модели с распределением в виде (12.9), которая построена в предположении игнорируемости механизмов выбора и пропусков. Почти все аналитические процедуры с обработкой пропусков в выборочных обследованиях, применяемые на практике, опираются, по сути, на это предположение.

1
Оглавление
email@scask.ru