5.8.5. t-КРИТЕРИЙ ДЛЯ ПРОВЕРКИ ЗНАЧИМОСТИ КОЭФФИЦИЕНТА РЕГРЕССИИ В ПРОСТОЙ ЛИНЕЙНОЙ МОДЕЛИ
Предположим, мы измеряем рост х и вес у каждого из
индивидуумов, так что получены данные
Это может быть также ростом х отца и ростом у его старшего сына или температурой х, до которой нагревается сталь, и результирующим растяжением у и т. д. Наблюдения
можно считать независимыми реализациями пары случайных величин (X, У). Часто полезно исследовать одно или оба условных математических ожидания
Они называются соответственно регрессией Y на
и регрессией X на
Во многих ситуациях одна, а то и обе регрессии оказываются линейными функциями. В случае анализа взаимосвязи между ростом отцов (X) и ростом сыновей
например, регрессия
булет (при разумной аппроксимации) линейной функцией от
скажем,
[см. примеры 4.5.3 и 4.5.4]. Если на плоскость нанести точки
то получится полоса, указывающая линейный тренд. Чтобы оценить
удобнее представить уравнение прямой в виде
где
так что
. Оценка
методом наименьших квадратов [см. гл. 8] приводит к таким результатам:
для а и
для
. Если условное распределение У при заданном
для каждого х можно считать нормальным с параметрами
, то
представляют собой реализации независимы нормальных случайных величин с параметрами
. В таком случае подходящей оценкой
служит
поскольку
и
оказываются независимыми реализациями распределения Стьюдента, причем каждая из них обладает
степенями свободы. Поэтому с помощью распределения Стьюдента можно построить критерии значимости, позволяющие получить ответы на вопросы:
значимо ли а отличается от принятого значения
параметра а?