Главная > Статистический анализ данных с пропусками
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

4.3. КВАЗИРАНДОМИЗАЦИОННЫЕ ВЫВОДЫ ПО ДАННЫМ С ПРОПУСКАМИ

Ключевое положение рандомизационного подхода — известное распределение вероятностей, определяющее, какие значения наблюдаются, а какие — нет, теряет свою силу при наличии пропусков. Для примера допустим, что объектов извлечены при простом случайном выборе, и положим

и

Значения присутствуют в том случае, если Теперь невозможно определить статистику, которая является функцией присутствующих значений и несмещенной оценкой среднего популяции по отношению к распределению Например, Кокрен [см. Cochran (1963)] показал, что среднее присутствующих значений

смещенная оценка У с приближенным смещением

где доля объектов в популяции, дающих ответ (отклик), и среднее объектов популяции, не дающих ответа. При отсутствии информации мы не можем в ввести поправку на это смещение.

Для преодоления таких затруднений существуют два способа: делается некоторое модельное предположение относительно части популяции, не дающей отклика (например, что средние У в частях популяции, дающих ответ и не дающих, равны), или делают предположение о распределении без каких-либо предположений о распределении У в популяции. Первый, путь связан с построением моделей для значений у и, значит, с модельным подходом к обследованиям при отсутствии пропусков. Второй путь, с привлечением распределения более прямое обобщение рандомизационных выводов на случай пропусков. Для него мы будем использовать термин квазирандомизационный подход, следуя [Oh and Scheuren (1983)].

Составляющими элементами квазирандомизационного подхода являются: 1) известное распределение значений, извлекаемых в выборку при отсутствии пропусков; 2) предполагаемое распределение индикаторов ответа при заданных (это распределение строится, как правило, на предположении, что внутри каждой отдельной подгруппы популяции присутствие откликов у объектов соответствует второму этапу равновероятного случайного выбора); 3) функция от присутствующих значений — приближенно несмещенная оценка изучаемого параметра при повторном выборе из совместного распределения функция от присутствующих значений — приближенно несмещенная оценка дисперсии при повторном выборе из распределения Доверительные интервалы для можно строить по как и ранее, в предположении нормальности.

В дальнейшем в этой главе будет рассматриваться квазирандомизационный подход. Модельный подход будет обсуждаться в гл. 12.

Пример 4.1. Отсутствие ответа как пример случайного подвыбора. Рассмотрим популяцию объема респондентами. Извлечена простая случайная выборка объема в которой

ответ дали респондентов. Допустим, что распределение при заданных I и исследуемых переменных У определяется выражением

Заметим, что это распределение не зависит от значений так что выполняется ОПС. Вероятность получения ответа равна и она не зависит от извлекаемых объектов или значений признаков. Пусть Распределение при условии есть

что является распределением простой случайной выборки объема Отсюда -ный доверительный интервал для среднего популяции У есть где и среднее и дисперсия среди ответивших.

В основе (4.5) лежит сильное предположение о независимости от и У:

Это обозначение независимости из [Dawid (1979)]. На практике такое предположение часто нереалистично. Оценка взвешенных групп, обсуждаемая в следующем разделе, ослабляет предположение ОПС и приводит к необходимости его выполнения только внутри подгрупп популяции, так что выполняется ОС, а не ОПС.

1
Оглавление
email@scask.ru