17.3. МУЛЬТИПЛИКАТИВНЫЕ МОДЕЛИ И ТЕОРЕМА ЭКАРТА—ЮНГА
Линейные модели являются основными для многих стандартных типов статистического анализа. Они изучаются уже около 200 лет [см. гл. 8, 10, 11, 12]. Теория мультипликативных моделей гораздо менее освоена и сравнительно мало известна, хотя эти исследования начаты более 50 лет назад. Их место в данной главе оправдывается тем, что анализ простой мультипликативной модели методом наименьших квадратов естественно приводит к теореме Экарта—Юнга, а она является фундаментальной для некоторых методов, обсуждаемых далее.
Рассмотрим таблицу
наблюдений
и предположим, что мы хотим подогнать под данные мультипликативную модель
где
— независимые и одинаково распределенные
ошибки. Как и линейная модель, эта модель переопределена, и можно оценить только разности между значениями параметров. Однозначные оценки можно получить, только если зафиксировать начало координат для каждого множества оценок. Как обычно, мы полагаем начало координат в центре тяжести конфигурации, т. е.
Эти ограничения не являются существенными, но они имеют преимущество единообразного представления всех параметров, что приводит
нас к алгебраически упорядоченной схеме. Оценки, полученные методом наименьших квадратов, следующие:
где
(точка) означает среднее по соответствующему индексу,
— матрица остатков с элементами
и
Оценки линейных параметров
настолько же точные, как и для линейной модели. Два уравнения для оценок мультипликативных параметров могут быть записаны в виде
где
— собственные векторы матриц
и
отмасштабированные таким образом, что собственное значение
Остаточная сумма квадратов равна
Для ее минимизации за X берется наибольшее собственное значение матрицы
Тогда собственные векторы матриц
и
могут быть выражены одновременно как сингулярные векторы матрицы
в виде
где
— ортогональная матрица размерности
, а
— ортогональная матрица размерности
— матрица размерности
содержащая ненулевые (и положительные) элементы только для
Обозначим эти «диагональные» значения через
где
и предположим, что они упорядочены:
— невырожденные значения матрицы
Тогда
и
— собственные векторы, соответствующие собственным значениям
и следовательно, у — первый столбец матрицы
а у — первый столбец матрицы V. Так же, как аддитивные параметры определены с точностью до аддитивной константы, мультипликативные же параметры определены с точностью до мультипликативной константы. Поэтому у и -у могут быть заменены на
для любой ненулевой мультипликативной константы.
Если
то мы имеем ровно
ненулевых сингулярных значений. Если мы хотим оценить дополнительную пару мультипликативных членов
то 8 и
определяются второй парой
сингулярных векторов матрицы
соответствующих сингулярному значению
Поскольку матрицы
и V ортогональны,
ортогонален у, а
ортогонален у. Третья и последующие пары мультипликативных членов могут быть оценены по третьей и последующим парам сингулярных векторов. Этот результат эквивалентен утверждению, что
наилучшая в смысле наименьших квадратов матрица ранга
соответствующая
может быть получена как
где
та же Е, но с
для
Результат справедлив для любой прямоугольной матрицы
Впервые он был доказан Экартом и Юнгом [см. Eckart and Young (1936)]. Теорема Экарта—Юнга является фундаментальным результатом, который лежит в основе многих наших последующих рассмотрений.
Дальнейшее развитие мультипликативной модели здесь мы обсуждать не будем, дадим лишь некоторые краткие комментарии.
В предыдущем изложении предполагалось, что любой из аддитивных параметров
может быть опущен, но для оставшихся сохраняются оценки наименьших квадратов, и эти оценки могут использоваться для определения матрицы остатков
Тогда теорема Экарта—Юнга утверждает, что мультипликативные константы оцениваются из разложения матрицы
нового вида по сингулярным значениям. Однако теперь суммы по строкам и столбцам матрицы
одновременно не обращаются в нуль, и, следовательно, соотношения
не могут выполняться одновременно. Все эти варианты простой мультипликативной модели порождают разложения с ортогональными членами. Их анализ может быть сведен к дисперсионному анализу. Такой дисперсионный анализ отличается от анализа для соответствующей линейной модели в основном количеством степеней свободы, сязанных с мультипликативным(и) членом(ами) и тестами на значимость.
Использование трех или более индексов расширяет модель в двух направлениях. Либо допускаются дополнительные произведения пар параметров, либо допускаются произведения более двух параметров. Расширенные модели первого типа естественны, но модели второго типа порождают много затруднений, связанных, в частности, с вопросом единственности и с проблемами оценивания. Более подробное изложение содержится в [Gower (1977)]. В разделе 17.12 обсуждается одна простая модель с тремя входами.