Главная > Методы корреляционного и регрессионного анализа
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

8.4. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ ДЛЯ ОТДЕЛЬНЫХ ЗНАЧЕНИЙ ЗАВИСИМОЙ ПЕРЕМЕННОЙ у

Часто для исследователя представляет интерес доверительный интервал не для средних, а для индивидуальных значений зависимой переменной. В данном разделе речь пойдет об установлении доверительных границ, внутри которых с некоторой степенью достоверности, обусловленной заданным уровнем значимости а, будет расположено отдельное значение зависимой переменной, соответствующее значениям переменных Доверительные интервалы для отдельных значений зависимой переменной широко используются в прогнозировании. Поэтому в литературе их часто называют доверительными интервалами для прогнозов индивидуальных значений

Пусть имеются совместные наблюдения над переменными в точке , которые записываются в виде элементов вектора . Для гипотетического значения некоторого показателя (значения зависимой переменной), которое может реализоваться в будущем при некоторых заранее оговоренных условиях, имеющих наибольшую вероятность, используется термин «прогноз». Из сказанного следует, что прогноз связан с условным утверждением в том смысле, что он обусловлен значениями переменных

Рассмотрим вначале приближенный способ построения доверительных границ для Определив отклонения отдельных значений вычислим по ним среднее:

Формула (8.26) по своей структуре напоминает среднее линейное отклонение (см. раздел 1.5). При нанесении на график или для всех получим прямые, параллельные регрессионной прямой. Они представляют собой доверительные границы для всех наблюдений переменной у. Преимущество этого способа заключается в простоте вычислений. Но он обладает существенным недостатком: мы не можем указать степень достоверности соблюдения этих границ.

При другом способе построения доверительных границ для отдельного результата наблюдения учитывается стандартное отклонение остатков (стандартная ошибка остатков) Предполагая нормальное распределение остатков, получим следующие доверительные границы:

и доверительный интервал для прогнозов индивидуальных значений

где — квантиль нормального распределения при заданном уровне значимости а. Например, с вероятностью 0,95 можно ожидать, что фактическое значение при данных наблюдениях объясняющих переменных будет находиться внутри границ Возможна и такая интерпретация: если отдельное значение переменной у окажется вне этих границ, то с вероятностью 0,95 можно предположить, что это значение не принадлежит исследуемой совокупности, т. е. оно не типично для изучаемой связи.

Так как значения регрессии являются оценками, то по (8.27) мы получаем только приближенные выражения доверительных границ. При третьем способе построения доверительных границ для отдельного наблюдения исходят из оценки регрессии. Этот способ наиболее точный и математически корректный. Прогностическое значение переменной у можно представить в виде

Мы располагаем лишь его оценкой (значением регрессии) на основе построенной регрессии. Допущенная при этом ошибка определяется как разность:

Эта ошибка часто называется ошибкой прогноза, и для ее отличия от других типов ошибок мы вводим новое обозначение — . С учетом (8.29) имеем

или

Выражение в скобках в правой части равенства (8.32) представляет собой разность между истинным значением регрессии и его оценкой с которой мы познакомились в разделе 8.3. Второе слагаемое в правой части (8.32) — остаток оценки регрессии в точке Возведя в квадрат обе части равенства и определив математическое ожидание полученных выражений, найдем

где оценка дисперсии ошибки прогноза в точке оценка дисперсии значения регрессии в точке — дисперсия остатков.

Вместо подставим в (8.33) формулу (8.20) или (8.21) из раздела

8.3. В итоге при простой линейной регрессии получим следующее выражение для оценки дисперсии ошибки прогноза:

или

Для множественной линейной регрессии имеем

или

Теперь можно приступить к построению доверительных границ для отдельного наблюдения Поскольку величина

имеет -распределение с степенями свободы, аналогии с (8.11) запишем выражение доверительных границ для отдельного результата наблюдения

где — стандартное отклонение ошибки прогноза (корень квадратный из (8.34) или (8.35)), — квантиль -распределения при степенях свободы и уровнё значимости а. Доверительный интервал для прогностической оценки будет следующим:

Относительно этого интервала с вероятностью можно утверждать, что он содержит фактическое значение зависимой переменной соответствующее совместным наблюдениям над объясняющими переменными или в среднем (1 — а) 100% всех возможных значений соответствующих попадут в этот интервал.

При данном уровне значимости а ширина интервала прогноза снова зависит от объема выборки стандартной ошибки остатков стандартного отклонения объясняющей переменной и (это особенно следует здесь подчеркнуть) от совместных наблюдений над объясняющими переменными в точке Таким образом, наш вывод относительно ширины интервала совпадает с рассуждениями в разделах 8.2 и 8.3.

Рис. 23. Доверительные границы для истинных значений регрессии и для отдельных значений переменной у при простой линейной регрессии

Если нанести на график доверительные границы для прогнозов индивидуальных значений для всех то 45 они расположатся выше и ниже линии регрессии в виде ветвей гипербол, раничивая доверительную зону для Можно снова 25 убедиться в том, что при доверительный тервал для самый узкий. Чем дальше наблюдения объясняющих переменных удалены от своих средних, тем Гшире соответствующий интервал.

На рис. 23 видно, что доверительный интервал для прогнозов индивидуальных значений включает доверительный интервал для истинных значений регрессии.

Пример

Продолжим рассмотрение примера из раздела 8.3. Определим для зависимости производительности труда от уровня механизации работ доверительные границыдля отдельных значений

Таблица 17. Определение доверительных границ для прогнозов индивидуальных значений в случае простой линейной регрессии (см. скан)

В столбце 2 табл. 17 указаны стандартные отклонения ошибок прогноза для результатов наблюдений над переменной х, приведенных в столбце 2 табл. 16. Столбцы 4 и 5 табл. 17 содержат нижние и верхние доверительные границы для наблюдений Например, с вероятностью 0,95 можно ожидать, что фактическое значение зависимой переменной у для наблюдения будет находиться в интервале Другими словами, при заданной величине коэффициента механизации работ в среднем 95% значений переменной у следует ожидать в этом интервале. Если мы будем рассматривать другие предприятия этой отрасли промышленности, имеющие коэффициент механизации работ 32%, то с вероятностью 0,95 можно предполагать, что уровень производительности труда на этих предприятиях будет находиться в пределах между

В табл. 17 указаны также доверительные границы для значения переменной у в точках полученные путем интерполяции и экстраполяции значения объясняющей переменной Таким образом, можно оценить или предсказать уровень производительности труда на любом предприятии, однородном с исследованными, если известно значение показателя механизации работ на нем.

Categories

1
Оглавление
email@scask.ru