11.4.3. Заполнение «пропусков» и оценивание параметров с помощью метода максимального правдоподобия.
Оценки «неподвижной точки». Разобьем матрицу X на две части
с совместным распределением, зависящим от вектора параметров . В дальнейшем под понимается вектор средних значений и ковариационная матрица, Y представляет собой комплектные объекты и известные признаки в некомплектных объектах, a Z - совокупность пропущенных значений. Пусть теперь требуется найти оценку 0, которая максимизирует логарифм функции правдоподобия (см. § 8.2) при фиксированном Y. Получить такую оценку прямыми вычислениями трудно. С другой стороны, значительно проще найти значение, которое максимизирует логарифм функции правдоподобия при произвольном заполнении пропусков. Если теперь рассматривать Z как случайную величину с некоторым законом распределения (зависящим от Y), то можно найти и значение , которое максимизирует математическое ожидание .
Рассмотрим один из способов осуществления этого подхода [95].
Пусть — плотность условного распределения Z при заданных , а обозначает . Тогда
(11.72)
Выберем теперь некоторое начальное значение для параметров что полностью определяет плотность и возьмем математическое ожидание от обеих частей (11.72), интегрируя их с плотностью
или в других обозначениях:
Определим теперь значение , которое максимизирует левую часть этого выражения. Величина зависит от так что можно написать
Это уравнение представляет собой преобразование вектора в вектор .
Оценкой «неподвижной точки» для назовем такое значение 0, что
(11.73)
а уравнение (11.73) назовем уравнением неподвижной точки.
Отметим следующие основные свойства оценок типа «неподвижной точки», связывающие их с оценками максимального правдоподобия для
1. Пусть есть оценка максимального правдоподобия по измеренным наблюдениям. Тогда удовлетворяет уравнению (11.75): т. е. принадлежит множеству оценок «неподвижной точки».
2. Если есть дифференцируемая функция, то любая оценка типа «неподвижной точки» (т. е. любое решение уравнения ) является либо точкой максимума, либо стационарной точкой функции правдоподобия
Пусть теперь X — выборка из нормального закона распределения. Пусть, как и в п. 11.4.2, есть множество номеров признаков, измеренных для объекта — множество известных значений признаков и
Уравнениями «неподвижной точки» в этом случае будут [951:
(11.75)
Для определения оценок максимального правдоподобия (неподвижной точки) выбирается начальное значение (например, оценки (11.68), (11.69)) и организуется циклическая процедура до тех пор, пока между оценками на последовательных итерациях не будет значимых различий.