Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
12.4. МНОГОКРАТНОЕ ЗАПОЛНЕНИЕПод многократным заполнением мы будем понимать процедуру замены каждого пропущенного значения на вектор Многократные подстановки были впервые предложены в [Rubin (1978)], хотя эта идея появилась в [Rubin (1977)]. В [Rubin (1987)] на высоком уровне дается полное обсуждение этого вопроса. Можно рекомендовать также работы [Rubin (1986); Herzog and Rubin (1983); Li (1985); Schenker (1985); Rubin and Schenker (1986)]. Метод потенциально применим во многих областях. Особенно многообещающе он выглядит в сложных обследованиях, в которых трудно аналитически модифицировать общепринятые методы анализа полных данных на случай пропусков. Ниже мы коротко обсудим многократное заполнение и продемонстрируем его применение. Как уже указывалось в гл. 2—4, заполнение пропусков широко используется в приложениях. Очевидным практическим преимуществом однократного заполнения является возможность применять обычные методы анализа для полных данных. Заполнение обладает еще одним достоинством в тех частых случаях, когда сбор и анализ данных проводится разными лицами или учреждениями (например, Бюро переписи и университетским ученым-социологом), поскольку при сборе данных можно получить информации больше и лучше по качеству, чем при анализе. Например, в некоторых случаях можно использовать информацию, закрытую по условиям конфиденциальности (например, почтовые индексы домов, в которых проживают опрашиваемые), для получения подстановок для пропусков (например, годового дохода). Очевидным недостатком однократного заполнения является то, что подстановка одного значения, рассматриваемого как известное, т. е. без специальных поправок, не может отразить выборочный разброс при какой-либо модели пропусков или неопределенность выбора правильной модели пропусков. Многократные подстановки обладают достоинствами однократного заполнения, но лишены его недостатков. Точнее, если Теоретически многократное заполнение надо проводить в соответствии со следующей схемой. Для каждой из рассматриваемых моделей Переход от обычного анализа к анализу многократно заполненных данных проводится довольно прямолинейно. Во-первых, каждое заполненное множество данных анализируется с помощью одного и того же метода для полных данных, который применялся бы при отсутствии пропусков. Пусть
Вариабельность, соответствующая этой оценке, имеет две компоненты: средняя дисперсия внутри одной подстановки
и дисперсия между различными подстановками
(при векторном
где
где число степеней свободы
основано на аппроксимации Сэтертуэйта [Rubin and Schenker (1986); Rubin (1987)]. Интересно заметить, что Если в в Несмотря на то что многократное заполнение наиболее естественно объясняется при байесовском подходе, можно показать, что получаемые выводы обладают хорошими свойствами с частотной точки зрения. Например, как показано в [Rubin and Schenker (1986)], во многих случаях интервальные оценки, получаемые только по двум заполнениям, близки по накрытию к номинальным уровням при рандомизационном подходе. Пример 12.5. Выводы по расслоенной случайной выборке при многократном заполнении (продолжение примеров 12.1. и 12.2). Чтобы проиллюстрировать многократное заполнение, исследуем среднее популяции У по расслоенной случайной выборке, используя модель из примера 12.1. При полных данных выводы о У следует строить, опираясь на утверждение
Допустим теперь, что в
Из (12.13), (12.20) и (12.23) получим дисперсию — сумму двух компонент, отраженных в (12.25):
Из (12.21) и (12.22) получаем, что окончательные выводы Пример 12.6. Получение многократных подстановок для расслоенной случайной выборки с игнорируемыми пропусками (продолжение примера 12.5). Поскольку многократные подстановки вычисляются по предикторному распределению, интуитивно напрашивается метод получения подстановок с подбором, при котором пропущенные значения случайно извлекаются из множества присутствующих значений в одном слое. Используя утверждения в [Rubin (1979); Herzog and Rubin (1983)], можно показать, что при бесконечном Сначала рассмотрим метод, основанный на неявной модели, названной в [Rubin and Schenker (1986)] приближенным байесовским бутстрепом. Независимо для В этом же смысле пригоден также выбор многократных подстановок с помощью явной нормальной модели из примера 12.2, где значения
|
1 |
Оглавление
|