Глава 10. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ И АНАЛИЗ СТАТИСТИЧЕСКИХ ЭКСПЕРИМЕНТОВ: ВЫРОЖДЕННЫЕ МОДЕЛИ, МНОЖЕСТВЕННЫЕ КРИТЕРИИ
10.1. ВЫРОЖДЕННЫЕ МОДЕЛИ
10.1.1 ВВЕДЕНИЕ
Во всех методах, обсуждавшихся в гл. 8, предполагалось, что основная модель имеет полный ранг, т. е. что матрица А имеет ранг равный числу подлежащих оценке параметров, или, что эквивалентно, матрица А А не вырождена. Многие важные модели, в частности из области планирования эксперимента, — это вырожденные модели, в которых матрица А имеет ранг Следовательно, матрица размера вырождена, поскольку ее ранг точно такой же, что и у матрицы А.
В некоторых примерах [см. примеры 8.2.6, 8.2.10, 8.2.14 и 8.3.8] мы рассматривали планы односторонней (однофакторной) классификации с моделью
Такая параметризация приводит к модели полного ранга (здесь ). Ее матрица плана А рассматривалась в примере 8.2.6, а матрица где — число наблюдений в группе с номером . Ясно, что такая параметризация чувствительна. Действительно, есть групп наблюдений, которые соответствуют каждому из условий (обработок), а модель выделяет по одному параметру на каждую обработку.
Существует, правда, заманчивая альтернатива: выражается как
т. е. рассматривается как заданная константа а, одинаковая для всех обработок, и некоторое отклонение от а, характеризующее обработку. Эта параметризация обладает симметрией, но здесь
появляются параметров, хотя понятно, что мы фактически можем оценить только I из них. У нас появился лишний параметр. Дело в том, что формула
явно не имеет смысла, поскольку она эквивалентна выражению
при любом значении а. Правда, ей можно придать смысл, налагая на линейное ограничение. Наипростейшее из приемлемых ограничений заключается в том, чтобы для каждой группы, содержащей одинаковое число наблюдений, положить
Этим при желании можно было бы воспользоваться для выражения одного из через остальные и подстановки полученного значения в нашу формулу
На практике часто предпочитают сохранять «избыточную» форму с соответствующим дополнительным линейным ограничением в роде (Этот подход обсуждается более подробно в разделе 10.1.2.) Таким образом, наша модель принимает вид
(вместе с наложенным на линейным ограничением). Переход к матричным обозначениям дает
или более подробно:
(см. скан)
где включает компонентов, а матрица А имеет порядок — общее число наблюдений. Поскольку первый столбец матрицы А представляет собой сумму всех остальных столбцов, ранг , таким образом, мы имеем вырожденную модель (в данном случае ).
Имея вырожденную модель для которой ранг матрицы мы всегда можем выбрать новые параметры так, чтобы для получилась модель полного ранга Эти новые параметры, которые можно выбрать различными способами, оказываются независимыми линейными функциями от Так, например, начав с вырожденной формулировки для односторонней классификации, приведенной в (10.1.3), мы можем ввести новые параметры
и пересчитать модель в невырожденную форму, приведенную в (10.1.1). Другая репараметризация рассматривается в (10.1.5). Тогда модель можно анализировать стандартными методами, обсуждавшимися в гл. 8.
Однако, как замечено ранее, иногда есть причины для того, чтобы предпочесть вырожденную модель модели полного ранга. Так, в ситуации планирования эксперимента модель обычно получается перепараметризованной, поскольку это наиболее естественный способ описания задачи, и параметры, используемые в такой модели, допускают простую интерпретацию с точки зрения данного исследования. Отсюда проистекает интерес к приложению метода наименьших квадратов непосредственно к вырожденной модели.