Стандартное отклонение углового коэффициента ... доверительный интервал для ...
Мы знаем, что 1
(так как второй член числителя сокращается
Далее, дисперсия некоторой функции
равна:
если
попарно некоррелированы и
константы. Кроме того, если
то
В выражении для
так как X, можно рассматривать как константы. Отсюда после преобразований
(Примечание. Интересно следствие этого результата. Допустим, что перед сбором некоторых данных мы хотим подобрать значения
при которых проводятся наблюдения
причем таким образом, чтобы
минимизировалось. Тогда Х? надо выбирать так, чтобы максимизировалось
Теоретический ответ на этот вопрос таков, что значения
должны будут стремиться
. В практической интерпретации это значит, что
должны локализоваться на границах области, где реализуется эксперимент. Если, например, мы хотим реализовать четыре опыта, то их следует провести по два на каждой границе. Этот результат имеет смысл и верен, если предварительные надежды на существование модели первого порядка абсолютно справедливы, причем во всей возможной области значений
Если это не так, а в практике такие модели никогда не бывают верными, то результат может оказаться совсем ошибочным. Дж. Боксом и Н. Дрейпером (Journal of the American Statistical Association, 1959, 54, p. 622-654) было практически показано, что если «область интереса»
есть (с учетом масштаба) интервал
и если
а мы хотим подобрать прямую, но допускаем, что «истинная» модель может иметь второй порядок, то подходящее значение для
не бесконечность, а число, несколько большее, чем
где
число факторов, включенных в модель, если только модель близка к правильной или ошибка не очень велика. Общая мораль: выводы, полученные при минимизации дисперсии ошибки, правильны только тогда, когда постулируемая модель корректна, и они могут быть ошибочными во многих практических задачах планирования эксперимента.)
Стандартное отклонение
есть корень квадратный из дисперсии, т. е.
Если о неизвестна и мы применяем вместо нее оценку
предполагая,
что модель корректна, то оценка стандартного отклонения
есть
В иной терминологии вместо оцениваемое стандартное отклонение говорят стандартная ошибка или что-нибудь еще в этом роде.
Если мы предполагаем, что разброс наблюдений относительно линии нормален, т. е. что ошибки
все принадлежат некоторому нормальному распределению,
то можно показать, что
-ные доверительные интервалы для
получаются, если вычислить
где
— это
точка
-распределения с
степенями свободы (они основаны на числе степеней свободы, с которым найдена оценка
С другой стороны, если это целесообразно, мы можем проверить нуль-гипотезу о том, что
равно
где
частное значение, которое может быть нулем, против альтернативы, что отлично от
(обычно пишут:
против
Для этого надо вычислить
и сравнить 111 с
из таблицы
-критерия с
степенями свободы — числом, на котором основана оценка
. В таком виде критерий будет двусторонним со 100 а
-ным уровнем значимости. Продолжим вычисления для нашего примера.
Пример (продолжение, см. табл. 1.1)
Положим
так что
Тогда
-ные доверительные границы для
будут
или
, что дает интервал,
. Словом, истинное значение
лежит в интервале (от — 0,1015 до — 0,0581) и это установлено с
-ной доверительной вероятностью.
Теперь можно проверить нуль-гипотезу о том, что «истинное» значение — нуль или, иными словами, что между температурой
воздуха и количеством использованного пара нет линейной зависимости. Запишем (используя
):
и далее
Так как
превосходит соответствующее критическое значение
то
отвергается. (Фактически 7,60 превышает даже
. Мы выбрали здесь двусторонний 95 %-ный критерий именно так, чтобы доверительный интервал и
-критерий имели один и тот же уровень вероятности. В этом случае можно фактически проверить гипотезу, просто выясняя, как описано выше, включает ли доверительный интервал нуль.) В нашем случае надо отбросить мысль о том, что между
не может быть линейной связи.
Если бы оказалось, что наблюденное значение
стало меньше критического значения, мы не смогли бы отвергнуть гипотезу. Заметим, что мы избежали слова «принять», так как обычно нельзя принять гипотезу. Более того, мы можем только сказать, что на основе определенных данных наблюдений ее не удается отвергнуть. Однако может случиться так, что, располагая другим массивом данных, мы обнаружим факты, противоречащие нашей гипотезе и тем самым отвергающие ее.
Если, например, мы видим человека, который плохо одет, то мы можем выдвинуть гипотезу,
«Этот человек беден». Если этот человек ходит пешком, чтобы сэкономить на автобусе, или не завтракает ради экономии, мы не имеем оснований для отбрасывания этой гипотезы. Дальнейшие наблюдения такого рода убедят нас, что
верна, но мы не можем, однако, ее принять, если не знаем всего об этом человеке. Причем даже одного-единственного наблюдения, говорящего против
скажем, что этот человек владеет банковским счетом на сумму 500 тыс. дол., будет достаточно, чтобы ее отвергнуть.
После того как мы получили доверительный интервал для
нет необходимости находить величину
для проверки гипотезы с помощью
-критерия. Достаточно исследовать доверительный интервал для и посмотреть, содержит ли он значение
Если это так, то гипотезу
нельзя отвергнуть, а если не так, то она отвергается. Это можно увидеть из уравнений (1.4.4),
отвергается при
-уровне, если
откуда следует, что
т. е., что
лежит за пределами, соответствующими уравнению (1.4.3).