Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
11.5. ПРЕДИКТОРНЫЙ БАЙЕСОВСКИЙ ПОДХОД К АНАЛИЗУ СМЕЩЕНИЙ ПРИ ПРОПУСКАХПри этом подходе к смещению за счет пропусков, предложенном Рубином [Rubin (1977)], строят модель распределения для объектов с пропусками и без пропусков с отдельными параметрами, как в (11.4) и связывают параметры подходящим байесовским априорным распределением. Неигнорируемый пропуск связан с априорно фиксированными параметрами, а оставшиеся параметры распределения оцениваются с помощью соответствующего байесовского апостериорного распределения. Влияние пропуска оценивается интервалом, основанным на распределении, предсказывающем гипотетическую статистику для полных данных при заданных присутствующих значениях. Основная идея иллюстрируется в следующем простом примере. Более общий случай, описанный Рубином, представлен в примере 11.7. Пример 11.6. Чувствительность выборочного среднего к неигнорируемым пропускам. В простой случайной выборке по переменной
где
априорное распределение
при некотором значении
Если Влияния пропусков можно оценить по предикторному распределению у при заданных
В этом уравнении последний член не зависит от объема выборки. Он отражает неопределенность неигнорируемой компоненты модели. Считая априорное распределение
Отсюда
Это уравнение соответствует формуле (2.1) в статье Рубина при Заметим, что при больших Пример 11.7. Чувствительность выборочного среднего к неигнорируемым пропускам при наличии сопеременных. Существенное развитие предыдущего примера мы получим, если включим в модель сопеременные
где
где
при любом В предложении равномерного априорного распределения
где
Здесь
Последний член представляет поправку на сопеременные (на различие средних X в выборках отвечающих и неотвечающих). Длину интервала
определяют 3 компоненты. Первая, — относительная дисперсия, возникающая за счет недостатка информации о возможном равенстве коэффициентов регрессии У на Поучительно исследовать эти Выражения, когда объем выборки отвечающих стремится к бесконечности. Компонента Пример 11.8. Приложение результатов из примера 11.7. Рубин иллюстрирует метод с помощью данных обследования 660 школ. В 472 школах заполнили анкету о дополнительных занятиях (для отстающих) с 80 вопросами. Были выбраны 21 зависимая переменная Зависимые переменные характеризовали дополнительные занятия по частоте их проведения и лежали в диапазоне от О (никогда) до 1 (всегда). Ограниченная шкала затрудняет интерпретацию переменных со средними на концах отрезка, поэтому мы ограничим внимание на семи переменных, лежащих в середине шкалы. Выбранные зависимые переменные соответствовали частоте: 17В: дополнительных занятий, проводимых в часы школьных занятий; 18А: дополнительных занятий, проводимых за счет занятий общественными науками, иностранными языками и/или научных исследований; 18В: дополнительных занятий, проводимых за счет занятий по математике; 23А: дополнительных занятий с разбиением отстающих на группы по уровню занятий; 23С: дополнительных занятий с разделением учащихся на группы по интересам; 32А: дополнительных занятий с использованием, кроме основного пособия, других учебников; 32D: дополнительных занятий с материалами, подготовленными преподавателем. Сопутствующие переменные X в исследовании описывали успехи в школе и социально-экономическое положение учащихся. Табл. 11.3 представляет значение статистик Таблица 11.3. (см. скан) Значения статистик для 7 переменных в обследовании школ Значения Основное влияние на длину интервала оказывает величина Таблица 11.4. (см. скан) Длина Этот пример наглядно демонстрирует возможное влияние смещения из-за пропусков и степень того, как смещение зависит от величин типа
|
1 |
Оглавление
|