Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
3.4. ЗАПОЛНЕНИЕ ПРОПУСКОВ3.4.1. ВведениеВ методах полных наблюдений и доступных наблюдений данные с пропусками Заполнение — это общий и гибкий метод решения задач при наличии пропусков в наблюдениях. Тем не менее ему присущи недостатки. В [Dempster and Rubin (1983)] отмечается: «Идея заполнения и соблазнительна, и опасна. Исследователь может успокоиться и прийти к приятному выводу, что в конце концов его данные не содержат пропусков. Опасность этого подхода в том, что он не позволяет отличать ситуации, где задача не очень трудна и может быть корректно решена таким способом, от ситуаций, где обычные оценки по реальным и подставленным данным сильно смещены». В разделе 3.4 мы обсудим некоторые простые методы заполнения и задачу оценивания среднего и ковариационной матрицы 3.4.2. Заполнение безусловными среднимиСамый простой вид. заполнения — это оценка отсутствующих значений где 3.4.3. Заполнение условными средними. Метод БакаБолее перспективным способом заполнения пропусков выглядит подстановка средних, условных по присутствующим в наблюдении переменным. Если переменные Вычисление регрессионных уравнений для различной структуры пропусков может показаться затруднительным, но на деле оно относительно просто, если использовать оператор свертки, обсуждаемый в разделе 6.5. Метод Бака для двух переменных проиллюстрирован на рис. 3.1. Точки, отмеченные знаком
Рис. 3.1. Метод Бака для двух переменных Средние по присутствующим и подставленным с помощью этого метода значениям — состоятельные оценки средних при ОПС и слабых предположениях относительно моментов распределения [см. Buck (1960)]. Они состоятельны, когда механизм порождения зависит от наблюдаемых переменных, хотя в этом случае для состоятельности оценок нужны дополнительные условия. Допустим, для данных на рис. 3.1 присутствие Данные, заполненные по методу Бака, обеспечивают разумные оценки средних, в частности, если приемлемо предположение о нормальности наблюдений. Выборочная ковариационная матрица по заполненным данным занижает величину дисперсий и ковариаций, хотя и не так сильно, как при подстановке безусловных средних. рассмотрим, например, выборочную дисперсию
где В общем случае выборочная дисперсия по данным, заполненным по методу Бака, — оценка заниженная на На первый взгляд кажется, что для регрессионного заполнения методом Бака нужно, чтобы переменные 3.4.4. Другие подходыЕсли мы примем условие ОПС и будем пренебрегать разбросом оценок Эти обстоятельства служат основанием для поиска другого подхода, когда подстановки выбираются случайным образом из всего распределения допустимых значений, а не из его центра. Один из путей реализации этой идеи — добавление к условному среднему подходящих возмущений. Методы такого типа часто используются в выборочных обследованиях. Мы отложим их обсуждение до гл. 4 и 12. В целом трудно рекомендовать какой-либо из обсуждавшихся простых методов, поскольку 1) они ненадежны; 2) для них часто требуется введение специальных поправок, чтобы получить удовлетворительные оценки; 3) трудно определить ситуации, когда эти методы приемлемы, а когда — нет. Кроме того, с помощью этих методов нельзя получить простые верные решения, если требуется установить точность оценок, как при интервальном оценивании. В гл. 2 мы видели это в частном случае пропусков в одной переменной. Главной целью этой книги (гл. 5—12) является целостное описание методов обработки данных с пропусками, основанных на построении статистической модели порождения данных и пропусков. Методы, базирующиеся на этой теории, надежны в том смысле, что в четко оговоренных условиях они обладают оптимальными статистическими свойствами, по меньшей мере асимптотически. Эти методы не требуют специальных поправок ни для точечных, ни для интервальных оценок, и ситуации, в которых они применимы, явно задаются описанием моделей. На практике мы редко знаем точную модель, поэтому можно пытаться перебирать различные модели. ЛИТЕРАТУРА(см. скан) ЗАДАЧИ(см. скан)
|
1 |
Оглавление
|