Глава 4. ПРОПУСКИ В ВЫБОРОЧНЫХ ОБСЛЕДОВАНИЯХ
4.1. ВВЕДЕНИЕ
Проблема неполных данных в выборочных обследованиях отличается от проблем, которые мы рассматривали в гл. 2 и 3, по двум главным аспектам. Во-первых, изучаемая популяция (явно) конечна, и поэтому оцениваемые величины, например средние или суммы, в популяции часто являются характеристиками конечной популяции. Во-вторых, при проведении анализа определяющее значение традиционно имеет метод сбора данных. В большинстве работ по пропускам в выборочных обследованиях принят рандомизационный подход к выводам, когда параметры популяции считаются фиксированными и выводы строятся исходя из распределения, соответствующего методу извлечения выборки. В отличие от этого подхода выводы, рассматриваемые в гл. 5—12 этой книги, основаны на статистической модели для значений переменных, и метод получения. выборки «участвует» в анализе, лишь косвенно влияя на выбор моделей. Эту главу мы начнем с показа различия между двумя этими подходами как для полных данных, так и для данных с пропусками. Затем обсудим общепринятые методы обработки пропусков, широко обсуждаемые в литературе по подходу от рандомизации. Более полное изложение проблемы пропусков данных в обследованиях с точки зрения и рандомизации, и моделирования см. в [Madow, Olkin, Nisselson and Rubin (1983), т. 2].