Глава 3. БЫСТРЫЕ МЕТОДЫ ОБРАБОТКИ МНОГОМЕРНЫХ ДАННЫХ С ПРОПУСКАМИ
3.1. ВВЕДЕНИЕ
В гл. 2 обсуждался анализ данных с пропусками только в одной выходной переменной Y, линейно зависящей от полностью наблюдаемых предикторных переменных. В этой главе мы рассмотрим три быстрых метода решения более общей задачи, когда пропуски
содержатся в нескольких переменных: анализ комплектных наблюдений, анализ доступных наблюдений и простые методы заполнения. В [Afifi and Elashoff (1966)] приведен обзор более ранних работ по пропускам, содержащий описание некоторых из обсуждаемых здесь методов. Хотя эти методы включены в статистическое программное обеспечение и широко используются, мы в целом не рекомендуем применять какой-либо из них, за исключением частных случаев, когда доля пропусков ограничена. Методы, описанные в части II настоящей книги, обеспечивают более обоснованные решения в более общих условиях.
Рассмотрим прямоугольную матрицу данных где значение переменной для наблюдения, При отсутствии пропусков многие виды многомерного статистического анализа основаны на начальном сведении данных к вектору выборочных средних и выборочной ковариационной матрице где Таким образом, при наличии пропусков" важно уметь вычислять Мы рассмотрим быстрые методы анализа данных с пропусками в основном для этой задачи.
Как было подчеркнуто в гл. 1, свойства любого метода обработки пропусков сильно зависят от механизма порождения пропусков. За исключением особо оговоренных случаев, методы этой главы непригодны, когда выполняется только условие ОС, а не ОПС (напомним, что условие ОС означает зависимость пропусков от наблюдаемых, а не от отсутствующих данных). Напротив, методы из части И, основанные на правдоподобии, применимы при менее жестком условии ОС, что очень существенно для многих практических приложений.