9.11. КОММЕНТАРИИ
На ряде специально рассмотренных примеров мы видели, что дисперсионный анализ при необходимости может быть выполнен с использованием стандартных регрессионных процедур. Если модель исследуется тщательно и надлежащим образом репараметризована, то таблицу дисперсионного анализа получают подобным же образом и для других моделей. Надлежащий выбор фиктивных переменных является решающим для удачного представления результатов и позволяет заметно упростить вычисления. Однако многие репараметризации представляют самостоятельную ценность при работе с фиктивными переменными; при этом в определенных ситуациях некоторые репараметризации оказываются проще других. Чем более сложный план, тем более сложной будет регрессионная обработка и тем больше размеры матрицы Могут потребоваться значительные усилия, но если план стандартный и все данные имеются в наличии (т. е. нет пропущенных наблюдений), они, как правило, невелики. На практике лучше прибегать к соответствующей вычислительной процедуре дисперсионного анализа или к машинной программе, если она есть. Тем не менее полезно установить связь между этими двумя методами анализа по следующим причинам:
1. Надо акцентировать внимание на том, что в задачах дисперсионного анализа непременно присутствует модель.
2. Остатки в случае модели дисперсионного анализа играют ту же роль, что и остатки в регрессионном анализе, и они должны
исследоваться, чтобы извлечь содержащуюся в них информацию о возможной неадекватности модели. (По-видимому, в большинстве случаев дисперсионного анализа молчаливо предполагается, что. модель выбрана правильно.)
3. Если некоторые из наблюдений, необходимых для дисперсионного анализа, отсутствуют, то зачастую их удается «оценить» с помощью стандартных формул. Если же это неудобно или отсутствует слишком много наблюдений, то обычно данные можно анализировать с помощью регрессионной процедуры, как это было показано выше, но при условии вычеркивания из матрицы X строк, для которых нет результатов наблюдений.
(Термин «оценены» взят в кавычки, поскольку никакое оценивание в действительности не проводится. «Оценки» — это просто включаемые в рассмотрение числа (исходя из вычислительных целей), чтобы получить те же оценки параметров, которые могут быть получены на основе неполных данных с помощью несимметричного и зачастую трудного анализа.)
Упражнения
(см. скан)