4.3. КВАЗИРАНДОМИЗАЦИОННЫЕ ВЫВОДЫ ПО ДАННЫМ С ПРОПУСКАМИ
Ключевое положение рандомизационного подхода — известное распределение вероятностей, определяющее, какие значения наблюдаются, а какие — нет, теряет свою силу при наличии пропусков. Для примера допустим, что объектов извлечены при простом случайном выборе, и положим
и
Значения присутствуют в том случае, если Теперь невозможно определить статистику, которая является функцией присутствующих значений и несмещенной оценкой среднего популяции по отношению к распределению Например, Кокрен [см. Cochran (1963)] показал, что среднее присутствующих значений
смещенная оценка У с приближенным смещением
где доля объектов в популяции, дающих ответ (отклик), и среднее объектов популяции, не дающих ответа. При отсутствии информации мы не можем в ввести поправку на это смещение.
Для преодоления таких затруднений существуют два способа: делается некоторое модельное предположение относительно части популяции, не дающей отклика (например, что средние У в частях популяции, дающих ответ и не дающих, равны), или делают предположение о распределении без каких-либо предположений о распределении У в популяции. Первый, путь связан с построением моделей для значений у и, значит, с модельным подходом к обследованиям при отсутствии пропусков. Второй путь, с привлечением распределения более прямое обобщение рандомизационных выводов на случай пропусков. Для него мы будем использовать термин квазирандомизационный подход, следуя [Oh and Scheuren (1983)].
Составляющими элементами квазирандомизационного подхода являются: 1) известное распределение значений, извлекаемых в выборку при отсутствии пропусков; 2) предполагаемое распределение индикаторов ответа при заданных (это распределение строится, как правило, на предположении, что внутри каждой отдельной подгруппы популяции присутствие откликов у объектов соответствует второму этапу равновероятного случайного выбора); 3) функция от присутствующих значений — приближенно несмещенная оценка изучаемого параметра при повторном выборе из совместного распределения функция от присутствующих значений — приближенно несмещенная оценка дисперсии при повторном выборе из распределения Доверительные интервалы для можно строить по как и ранее, в предположении нормальности.
В дальнейшем в этой главе будет рассматриваться квазирандомизационный подход. Модельный подход будет обсуждаться в гл. 12.
Пример 4.1. Отсутствие ответа как пример случайного подвыбора. Рассмотрим популяцию объема респондентами. Извлечена простая случайная выборка объема в которой