11.4.2. Использование главных компонент.
Нижеследующий подход применим как для оценки пропусков в матрице данных, так и для оценки значений главных компонент у некоторого объекта с пропущенными значениями.
Предположим, что каким-либо способом получены оценки векторов коэффициентов главных компонент например, как собственных векторов матриц (11.67)
или (11.69). Тогда из свойств главных компонент следует, что
где — случайная величина, характеризующая погрешность представления (11.71); значения главных компонент, которые необходимо оценить.
Во многих случаях несколько первых главных компонент (q р) в разложении (11.71) обеспечивают малую величину нормы погрешности
Пусть теперь есть множество из номеров измеренных признаков у объекта Тогда для оценивания главных компонент, используя в левой части (11.71) только измеренные значения, имеем систему из линейных уравнений относительно q неизвестных:
Эта система решается методом наименьших квадратов, что дает систему нормальных уравнений
где -матрица размера с элементами — оценка вектора q первых главных компонент; вектор размерности q с компонентами
Так как векторы взаимно ортогональны, то матрица V заведомо невырождена, если т. е. число измеренных признаков больше, чем число оцениваемых главных компонент. В работе [115] показано, что если для оценки коэффициентов векторов главных компонент используется матрица (11.69), то оценки будут несмещенными. Подставляя теперь полученные оценки в (11.71), можно получить и оценки пропусков в векторе