В частности, Литтл и Рубин [Little and Rubin (1983)] показали, что он не обладает оптимальными свойствами, присущими МП-оцениванию, за исключением тривиальной асимптотики, когда доля пропусков с увеличением объема выборки стремится к нулю.
5.4.2. Некоторые сведения о методе
Классический пример рассматриваемого подхода — обработка отсутствующих значений при дисперсионном анализе, где отсутствующие выходные переменные
интерпретируются как параметры и оцениваются вместе с параметрами модели, чтобы в процессе анализа можно было использовать эффективные с вычислительной точки зрения методы (см. гл. 2). Сравнительно недавно этот подход предлагался в [DeGroot and Goel (1980)] как один из возможных способов анализа смешанной двумерной нормальной выборки, где отсутствующими данными являются индексы, по которым связываются в пары значения двух переменных, причем все парные комбинации предполагаются равновероятными. Пресс и Скотт [Press and Scott (1976)] описывают байесовский анализ неполной многомерной нормальной выборки, который эквивалентен максимизации
в (5.17) по (в, Vmis). Бокс и его коллеги [Box, Draper and Hunter (1970)], а также Бард [Bard (1974)] предлагали этот же подход в более общей постановке: вектор средних многомерного нормального распределения подчинялся уравнению регрессии.
Формально истинным правдоподобием от в, основанным на наблюденных данных
при выполнении условия ОС является
определенное в (5.10). Функция
не является правдоподобием, поскольку в ее аргументы входят случайные величины
имеющие согласно модели некоторое распределение, и их, следовательно, нельзя рассматривать как фиксированные параметры. С этой точки зрения метод максимизации
по в и по
не является методом максимального правдоподобия.
Рассматривая в и
как параметры, сталкиваются с такой серьезной проблемой, как увеличение числа параметров с ростом числа наблюдений. Максимизация
обеспечивает оптимальные свойства, присущие МП-оценкам, лишь когда доля пропусков стремится к нулю с ростом объема выборки. Параметр в, напротив, не зависит от объема данных, и поэтому, грубо говоря, имеют место обычные асимптотики при максимизации
если количество информации увеличивается с объемом выборки. Указанный недостаток интерпретации
как параметров хорошо иллюстрируется в простых примерах, приведенных в следующем разделе.
5.4.3. Примеры
Пример 5.16. Одномерная нормальная выборка с пропусками. Допустим, что
состоит из
реализаций нормальной случайной величины со средним
и дисперсией
представляет
наблюденных значений,
представляет
отсутствующих значений, для которых верно ОС. Параметр
предполагается раздельным с параметрами механизма пропусков. Тогда
откуда следует, что
Значит,
идентично правдоподобию для выборки объема
без пропусков из нормального распределения. Согласно примеру 5.7 максимизация
по
ведет к ОМП
С другой стороны,
Это выражение надо максимизировать по в и по
Максимизируя второй фактор в (5.21) по
получаем решение:
где
максимизирующее значение
Из примера 5.1 следует, что решениями для и
будут:
Подставляя (5.22) в (5.23) и сравнивая результат с (5.20), находим
Таким образом, мы получили МП-оценку среднего, но оценкой дисперсии стала ОМП, умноженная на долю присутствующих
значений. Если доля пропусков существенна (например,
), то оценка дисперсии
сильно смещена, и при это смещение сохраняется, если только не выполняется асимптотика
Более естественные асимптотики сохранили бы фиксированное значение
при увеличении объема выборки.
Пример 5.17. Допустим, мы добавили в предыдущий пример множество значений сопеременной X, присутствующих во всех
наблюдениях. Предположим, что значение У в
наблюдении при значении сопеременной
распределено нормально со средним
и дисперсией
Обозначим
Для того чтобы получать оценки максимального правдоподобия
максимизирующие
можно применить метод наименьших квадратов к
комплектным наблюдениям. Оценки
получаемые при максимизации
совпадают с ОМП, однако, как и в примере 5.16, оценкой дисперсии становится МП-оценка, умноженная на долю присутствующих значений.
Пример 5.18. Экспоненциальная выборка с цензурированными значениями. В примерах 5.16 и 5.17 оценивание с помощью максимизации
по крайней мере приводило к разумным оценкам параметров положения, хотя оценки параметров масштаба требовали поправок. Тем не менее можно привести примеры, когда сильно смещены и оценки параметров положения. Рассмотрим, как в примере 5.14, цензурированную выборку из экспоненциального распределения со средним в, где
представляет
присутствующих значений, находящихся левее точки цензурирования
представляет
отсутствующих (цензурированных) значений, превышающих с. ОМП в — это
Максимизация
в (5.18) по в и по
(положим
равным нулю) приводит к тому, что цензурированные значения У оцениваются величиной с, а оценкой в является
Итак, в этом случае оценка среднего несостоятельна, если только доля пропусков не стремится к нулю при увеличении объема выборки.
Как показано в [Press and Scott (1976); Little and Rubin (1983)], смещенные оценки параметра положения могут получаться при максимизации
и в задачах, связанных с нормальным распределением.