4.3. КВАЗИРАНДОМИЗАЦИОННЫЕ ВЫВОДЫ ПО ДАННЫМ С ПРОПУСКАМИ
Ключевое положение рандомизационного подхода — известное распределение вероятностей, определяющее, какие значения наблюдаются, а какие — нет, теряет свою силу при наличии пропусков. Для примера допустим, что
объектов извлечены при простом случайном выборе, и положим
и
Значения
присутствуют в том случае, если
Теперь невозможно определить статистику, которая является функцией присутствующих значений
и несмещенной оценкой среднего популяции
по отношению к распределению
Например, Кокрен [см. Cochran (1963)] показал, что среднее присутствующих значений
смещенная оценка У с приближенным смещением
где
доля объектов в популяции, дающих ответ (отклик), и
среднее объектов популяции, не дающих ответа. При отсутствии информации
мы не можем в
ввести поправку на это смещение.
Для преодоления таких затруднений существуют два способа: делается некоторое модельное предположение относительно части популяции, не дающей отклика (например, что средние У в частях популяции, дающих ответ и не дающих, равны), или делают предположение о распределении
без каких-либо предположений о распределении У в популяции. Первый, путь связан с построением моделей для значений у и, значит, с модельным подходом к обследованиям при отсутствии пропусков. Второй путь, с привлечением распределения
более прямое обобщение рандомизационных выводов на случай пропусков. Для него мы будем использовать термин квазирандомизационный подход, следуя [Oh and Scheuren (1983)].
Составляющими элементами квазирандомизационного подхода являются: 1) известное распределение
значений, извлекаемых в выборку при отсутствии пропусков; 2) предполагаемое распределение индикаторов ответа
при заданных
(это распределение строится, как правило, на предположении, что внутри каждой отдельной подгруппы популяции присутствие откликов у объектов соответствует второму этапу равновероятного случайного выбора); 3) функция
от присутствующих значений — приближенно несмещенная оценка изучаемого параметра
при повторном выборе из совместного распределения
функция
от присутствующих значений — приближенно несмещенная оценка дисперсии
при повторном выборе из распределения
Доверительные интервалы для
можно строить по
как и ранее, в предположении нормальности.
В дальнейшем в этой главе будет рассматриваться квазирандомизационный подход. Модельный подход будет обсуждаться в гл. 12.
Пример 4.1. Отсутствие ответа как пример случайного подвыбора. Рассмотрим популяцию объема
респондентами. Извлечена простая случайная выборка объема
в которой