Частные корреляции
Корреляции играют важную роль в различных методах выбора предикторов, обсуждаемых в гл. 6. В некоторых из них мы хотим добавлять независимые переменные одну за другой в выбранную модель. Первый предиктор, включаемый в выбранную модель, — это переменная, наиболее сильно коррелирующая с т. е. переменная
для которой наибольший из всех Пусть для простоты это будет Построим модель
Затем построим новые переменные используя остатки от регрессии на т. е. остатки от подобранной модели остатки от регрессии на остатки от регрессии на соответственно. Новая зависимая переменная имеет значения, содержащие остатки от регрессии на (т. е. используют приведенную выше модель Аналогичная работа была проделана в параграфе 4.1 при
Значения новой зависимой переменной и новых независимых переменных представляют собой доли соответствующих векторов исходных данных, которые не зависят от значений переменной Теперь мы можем получить новое множество корреляций, которые используют переменные со звездочками. Они называются частными (парциальными) корреляциями, могут записываться, например, как имея смысл корреляции переменных а читаются так: «частная корреляция переменных после исключения влияния (снятия) переменной На второй стадии процедуры отбора мы будем включать в модель переменную для которой коэффициент частной корреляции с без учета (т. е. ) оказался наибольшим; другими словами, будем выбирать переменную наиболее коррелированную с после того, как эффект исключен из обеих переменных Если отобранная таким образом вторая переменная есть, скажем, то на третьей стадии процедуры отбора рассматривается частная корреляция вида т. е. корреляция между: 1) остатками регрессии на и 2) остатками регрессии на Этот процесс можно продолжать сколько угодно. Квадраты значений таких частных корреляций можно увидеть в распечатках из приложения Б. (Квадраты используются, когда в знаках нет нужды.)
Если потребуется, то частные корреляции можно выразить через обычные. Например,
Правда, такие формулы нужны редко.