Главная > Статистический анализ данных с пропусками
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

12.5. НЕИГНОРИРУЕМЫЕ ПРОПУСКИ

До сих пор мы рассматривали модельный подход к пропускам в обследованиях, основываясь на предположении об игнорируемости пропусков, т. е. подразумевалось, что объекты с пропуском и без пропуска с одинаковыми значениями зарегистрированных переменных не различаются систематически по значениям переменных, отсутствующих у объектов с пропусками. Таким образом, предполагалось выполненным условие ОС. С помощью моделей неигнориру-емых пропусков, аналогичных моделям из гл. 11, можно применять модельный подход к обследованиям с пропусками, которые предполагаются неигнорируемыми. По сути, в примерах 11.5 и 11.7 использованы модели неигнорируемых пропусков для данных из реальных обследований.

При неигнорируемых пропусках возникает важный вопрос: является ли целью статистического анализа: 1) дать единственный верный вывод или 2) выявить чувствительность выводов к неигнорируемым пропускам, делая несколько выводов, каждый из которых справедлив для предполагаемой модели пропусков. Естественно, получение единственного верного вывода в общем случае очень трудная задача, поскольку обычно на практике нет убедительных фактов, исходя из которых можно было бы определить одну точную модель пропусков. Следовательно, исследование чувствительности выводов, верных при различных условиях, — намного более реальная цель по сравнению с получением единственного верного вывода, хотя и менее удовлетворительная. В примере 11.7 проводилось такое исследование чувствительности. Многократное заполнение при подстановке вместо пропусков значений, вычисленных по разным моделям, служит удобным способом выявления чувствительности выводов к этим моделям.

Пример 12.7. Модели весовых групп с неигнорируемыми пропусками. Допустим, что, как и в примере 12.3, группы для взвешивания выбраны таким образом, чтобы в группе распределение было одинаковым для объектов с пропуском и без пропусков — нормальным со средним и дисперсией Однако в отличие от примера 12.3 переменная, по которой определяются весовые группы,

зарегистрирована только для объектов выборки без пропусков. Например, пусть пропуск игнорируем внутри категорий дохода, а доход зарегистрирован у отвечающих, но не у отказывающихся отвечать. Тогда нам известно число респондентов в группе, но не известно число отказывающихся дать ответ табл. 12.1.

Таблица 12.1. (см. скан) Выборка, классифицированная по наличию пропуска и по переменной весовых групп, известной только для респондентов (в скобках указаны ненаблюдаемые величины)

Мы хотим оценить среднее популяции

где, как и ранее, доля популяции и среднее в группе. Если бы объемы выборок в каждой группе были известны, мы могли бы оценить У с помощью оценки весовых групп:

Вместо этого мы оценивали У апостериорным средним

где оценка частоты в группе. Оценивание очень чувствительно к априорным условиям, что можно легко увидеть из табл. 12.1, если заметить, что проблема состоит в распределении отказавшихся отвечать по весовым группам. Предположение об игнорируемости соответствует независимости строк и столбцов в этой таблице и ведет к оцениванию среднего популяции средневыборочным у по респондентам.

Пусть априорная вероятность присутствия значения ответа в группе. Примем (нереалистичное) предположение, что известны. Считая распределение частот в таблице полиномиальным, а

априорное распределение вероятностей групп — равномерным, мы получим

Поэтому один из подходов основан на том, чтобы определить возможные значения вероятностей ответа, а затем вычислить оценку У, подставляя (12.27) в (12.26). По сути, оценка У зависит от относительных разностей вероятностей ответа, поэтому надо определить не величин. Выбирая различные значения и вычисляя соответствующие оценки, мы выявили чувствительность оценки к априорным предположениям о механизме пропусков.

Пример 12.8. Модели неигнорируемых пропусков для частично классифицированных таблиц сопряженности. Модели неигнорируемых пропусков при категориальных переменных рассмотрены в разделе 11.6. В [Little (1982)] представлены МП-оценки для модели, связанной с обсуждавшейся в [Pregibon (1977)] моделью для задачи с непрерывными и категориальными переменными. Здесь мы опишем частный случай этой модели, когда пропуски содержатся только в одной категориальной переменной.

Допустим, что мы имеем объектов, классифицированных по категориальным переменным объектов, классифицированных только по Пусть обозначает условную вероятность, что случайно выбранный объект популяции имеет значение при заданных значениях сопеременных При игнорируемом механизме пропусков шаг ЕМ-алгоритма состоит в приписывании доли подмножества частично классифицированных объектов со значениями к группе где обозначает оценку на итерации (подробности даны в гл. 9). Таким образом, шансы отнести объект к группе против группы равны

Допустим теперь, что априорные шансы отнести объект с пропуском к категории против равны Апостериорные шансы вычисляются по теореме Байеса как априорные шансы, умноженные на (12.28). Значит, чувствительность оценки к неигнорируемым пропускам можно легко исследовать как априорные шансы, когда оценивание проводится с помощью ЕМ-алгоритма или с помощью многократного заполнения при различных предположениях об априорных шансах.

1
Оглавление
email@scask.ru