Корреляция и регрессия
Допустим, что имеются данные
Применяя уравнение (1.6.5), мы можем получить
а если постулировать модель
то можно получить и оценку коэффициента регрессии
по уравнению (1.2.9). Раньше мы подчеркивали тот факт, что
представляет собой меру линейной зависимости между
Теперь же перейдем к вопросу о том, как связаны между собой
Прежде всего отметим, что форма уравнения (1.6.5) не изменится, если перенести начало координат или изменить масштабы для
Сравнивая уравнение (1.6.5) при замене
на
с уравнением (1.2.9), мы видим, что
где суммирование ведется по
Иными словами,
это «взвешенный» вариант величины
причем «взвешивание» происходит с помощью отношения «разброса»
к «разбросу»
Если мы запишем
то
Таким образом,
весьма близки, но интерпретируются по-разному. Коэффициент
измеряет связь между
в то время как
измеряет величину изменения переменной У, которую можно предсказать, если изменение переменной X равно единице. В более общих задачах коэффициенты регрессии тоже связаны с корреляциями типа (1.6.5), но более сложным образом (см. параграф 5.4).
Приведем еще два соотношения:
только для случая подбора прямой, где
множественный коэффициент корреляции, квадрат которого равен:
по определению из параграфа 1.4. Кроме того,
т. е.
равно корреляции между имеющимися наблюдениями
и предсказанными значениями У Уравнение (1.6.10) справедливо для любой линейной регрессии с любым числом предикторов (тогда как уравнение (1.6.8) верно только для уравнения прямой). Читатель сможет лучше понять эти соотношения, выполнив соответствующие алгебраические упражнения (см. решение упражнения 16 из гл. 1).