11.3.2. Множественная корреляция
Выражение (П4.1.11) для остаточной суммы квадратов после подгонки линии регрессии имеет вид
или, воспользовавшись (11.3.4) и (11.3.5), его можно переписать в виде
Равенство (11.3.6) показывает, что остаточную сумму квадратов можно записать как разность между полной, или выходной, суммой квадратов и некоторой положительной величиной, называемой регрессионной суммой квадратов. Если регрессионную сумму квадратов записать в виде
и доли полной суммы квадратов, то (11.3.7) перейдет в
причем
называется квадратом множественного коэффициента корреляции выхода
и
входов. Дисперсию выхода можно записать и по-другому:
Из (11.3.9) мы видим, что дисперсию выхода можно разложить на регрессионную сумму квадратов, представляющую ту часть выхода, которая может быть «учтена», или предсказана, по входам, и обусловленную шумом остаточную сумму квадратов, которую нельзя предсказать по входам. Таким образом, квадрат множественного коэффициента корреляции представляет собой ту долю дисперсии выхода, которую можно учесть, зная входы.
Из (11.3.7) и (11.3.8) мы видим, что множественный коэффициент корреляции можно оценить из уравнения
Если подставить сюда
из уравнения (11.3.5), то получим другую форму выборочного множественного коэффициента корреляции
где
— матрица ковариаций всех
переменных (одного выхода и
входов), а
— матрица ковариаций одних входов. Равенство (11.3.11) можно записать также через соответствующие корреляционные матрицы
Пример. При
равенство (11.3.10) переходит в
Пользуясь выражением (11.3.12), получаем
Выборочная теория множественных коэффициентов корреляции. Для применения выборочного подхода заменим в приведенных выше формулах все выборочные величины на соответствующие им случайные величины. Заметим, что эти случайные величины предполагаются гауссовскими, так же как и остаточные ошибки
в (11.3.1). Тогда равенство (11.3.9) представляет собой разложение на
Таким образом, если верна нулевая гипотеза, согласно которой все параметры
в модели (11.3.1) равны нулю, то случайная величина, соответствующая выборочной величине
будет распределена как
Доверительные интервалы. В общем случае, когда параметры модели отличны от нуля, совместная доверительная область для них дается неравенством (П4.1.14), которое в новых обозначениях имеет вид
где
выборочная оценка остаточной дисперсии. Например, при
доверительная область для
выглядит следующим образом:
Формулы для теоретических величин. Полученные выше формулы были выведены с помощью выборочных функций. При надлежащей интерпретации они применимы также и к теоретическим величинам. Так, например, вместо (11.3.8) мы будем иметь
где
— теоретический множественный коэффициент корреляции.