11.1.5. ЛИНЕЙНЫЙ ПРЕДИКТОР И ФУНКЦИЯ СВЯЗИ
Линейный предиктор играет ключевую роль в теории и приложениях линейных моделей. Отношение между зависимыми и объясняющими переменными определено посредством лишь линейного предиктора. Это одна из объединяющих тем в теории линейных моделей. Значения
определяют значение предиктора
которое в свою очередь определяет плотность
и тем самым относительные вероятности различных значений
Схематически
Предиктор задается равенством
где
— фиксированные параметры. Важно отметить, что:
а) все объясняющие переменные являются количественными; поэтому если используются неколичественные переменные (например, цвет), они должны быть предварительно перекодированы в числовые коды;
б) объясняющие переменные являются количественно взаимозаменяемыми; например, если
то возрастание
на одну единицу эквивалентно возрастанию
на четыре единицы. В этом смысле переменные могут быть заменены друг другом;
в) коэффициенты
в линейном предикторе могут интерпретироваться как частные производные
Это означает, что если значение
возрастает точно на одну единицу, в то время как остальные переменные сохраняют свои значения,
линейный предиктор изменяется на
единиц. (Это может быть как реалистичной интерпретацией, так и нереалистичной. В примере с объемом древесины, если радиус ствола дерева увеличивается, то, вероятно, возрастает и его высота.)
Ожидаемое значение У связано с линейным предиктором
посредством функции связи
. В некоторых случаях известны естественные кандидаты на роль
в других выбор может быть более или менее произвольным. В регрессионном, дисперсионном и ковариационном анализе естественным кандидатом является тождественная функция, а при анализе таблиц сопряженностей — логарифм.
Интересным примером является экспоненциальное распределение [см. II, раздел 11.2]. Оно иногда используется, когда зависимая переменная представляет собой «время жизни» некоторого наблюдения. Если плотность
есть
то
Двумя кандидатами является тождественная функция
и обратная с
. В первом случае среднее время жизни линейно зависит от объясняющей переменной. Во втором средний темп смерти есть линейная функция объясняющей переменной. Оба предположения осмысленны, хотя они имеют недостаток, заключающийся в том, что левая часть уравнений связи должна быть положительной, в то время как правая может принимать и отрицательные значения. (По этой причине на практике часто применяют функцию связи вида
Функцию связи не следует путать с преобразованием зависимой переменной. Другими словами, модель, в которой
имеет плотность
— не то же самое, что модель, в которой
имеет плотность
Эти модели могут даже не быть близкими друг к
ДРУГУ.