дисперсии и моменты. Можно показать, что их средние значения будут:
где если
случайная величина, то
обозначает ее среднее или математическое ожидание. Положим, что ошибки
независимые случайные величины с распределением
Тогда можно показать, что если
то величина
умноженная на свое число-степеней свободы (в данном случае на единицу), следует
-распределению с тем же самым числом степеней свободы. Более того,
тоже следует
-распределению с
степенями свободы. Так как эти две случайные величины независимы, то из статистической теории вытекает, что отношение
подчиняется
-распределению с (здесь)
степенями свободы при условии, что
Этот факт можно теперь использовать как критерий выполнимости равенства
Мы сравним отношение
со
-ной табличной точкой
-рас-пределения, чтобы посмотреть, можно ли на основе имеющихся данных рассматривать
как число, отличное от нуля.
Пример (продолжение). Из табл. 1.5 мы видели, что искомое отношение
Если мы посмотрим процентные точки
-распределения, то увидим, что
-ная точка
Так как расчетное значение F превышает критическое значение F из таблицы (т. е.
то мы отбрасываем гипотезу
с риском ошибиться не более чем в
случаев.
(Примечание. В частном случае при построении прямой этот
-критерий для «регрессии» точно такой же, как
-критерий для
приведенный выше. По этой причине отношение
(по определению
)
в силу уравнения (1.4.4). Так как величина
есть квадрат величины
то и результат проверки будет тем же. Если рассматривается больше коэффициентов регрессии, то общий
-критерий для регрессии, являющийся обобщением рассматриваемого здесь, не соответствует
-критерию для коэффициента. Однако критерии для индивидуальных коэффициентов можно построить или в форме
или
опираясь на аналогичные рассуждения,
-критерий часто встречается в машинных программах.)
В нашем примере наблюдаемое значение F было
Заметим, что
Это, с учетом ошибки округления, равно значению
Объясняемая доля разброса
Мы определили, что
где оба суммирования ведутся по
от 1 до
Тогда
измеряет «долю общего разброса относительно среднего
объясняемую регрессией». Ее часто выражают в процентах, умножая на 100. Фактически
это корреляция (см. (1.6.5)) между
и его обычно называют множественным коэффициентом корреляции.
Пример (продолжение). Из табл. 1.5 имеем:
Таким образом, полученное уравнение регрессии,
на
объясняет общий разброс данных относительно среднего
Коэффициент
самое большее может достигнуть величины 1 (или
когда все значения X различны. Ну а если в данных есть повторяющиеся опыты, то, как показано в параграфе 1.5, величина
не может достигнуть 1, как бы хороша ни была модель. Это обусловлено отнюдь не качеством модели, а объясняется вариацией в данных из-за «чистой» ошибки опыта (ошибки воспроизводимости). Алгебраическое доказательство приведенного факта дается в решении упражнения 13 из гл. 1.