Главная > Методы корреляционного и регрессионного анализа
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

8.3. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ УСЛОВНОГО МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ

Как отмечалось ранее, значения регрессии являются по своему характеру усредненными величинами, подсчитанными на основании полученной эмпирической регрессионной связи при каждом фиксированном значении объясняющей переменной (см. раздел 2.3). Как все средние, каждое значение регрессии — случайная величина. Выборочные средние подвержены рассеянию вокруг среднего генеральной совокупности, которое в данном случае является истинным значением частного среднего исследуемой зависимой переменной (условное математическое ожидание). Воспользуемся формулой (2.74):

Рис. 22. Теоретическая и эмпирическая регрессионные прямые

В математической статистике под регрессией случайной переменной у на переменные понимают условное математическое ожидание Истинное значение регрессии генеральной совокупности в точке равно:

где вектор-строка матрицы X.

По (2.42) получаем:

где — оценка значения регрессии в точке полученная по методу наименьших квадратов при фиксированных значениях объясняющих переменных

Рассмотрим простую линейную регрессию. На диаграмме рассеяния, приведенной на рис. 22, изображена истинная (теоретическая) регрессионная прямая генеральной совокупности и эмпирическая регрессионная прямая, полученная в результате МНК-оценки функции

регрессии. В силу того что оценивание параметров осуществляется по результатам выборки, оценки содержат некоторую погрешность. Погрешность в значении приводит к параллельному смещению линии регрессии, а колеблемость оценки к вращению линии регрессии вокруг точки с координатами

Как видно из рис. 22, между истинным значением регрессии и его оценкой существует разность

Разделим эту разность на оценку стандартного отклонения значения регрессии

Эта величина имеет -распределение с числом степеней свободы При построении доверительного интервала для используется стандартное отклонение (см. формулу Оценка дисперсии значений простой линейной регрессии будет следующей:

Обобщая это выражение для множественной регрессии, запишем оценку дисперсии в матричной форме:

Извлекая из (8.20) и (8.21) корень квадратный, получим искомое стандартное отклонение значения регрессии

Из формулы (8.20) видно, что зависит от фиксированного значения объясняющей переменной х. Поэтому для каждого значения регрессии различны. При прочих равных условиях (одинаковые значение тем меньше, чем больше приближается к среднему х, и, наоборот, тем больше, чем дальше удалено от При получаем

В этой точке достигает минимума. При с учетом (3.45) имеем 2

Эти соображения сохраняют свою силу и для случая множественной линейной регрессии.

Теперь приступим непосредственно к построению доверительного интервала, который при заданном уровне значимости а покрывает истинное значение регрессии (условное математическое ожидание переменной Интервальная оценка истинных значений регрессии производится при фиксированных значениях объясняющих переменных Исходя из (8.11) получим доверительные границы для значения регрессии

где — корень квадратный из выражения (8.20) или (8.21), а — квантиль -распределения при заданном уровне значимости а и числе степеней свободы

Доверительный интервал для одного истинного значения регрессии при заданном уровне значимости а и фиксированных значениях объясняющих переменных будет следующим:

С вероятностью можно утверждать, что значение регрессии генеральной совокупности (истинное значение частного среднего зависимой переменной) при фиксированных значениях объясняющих переменных находится в этом интервале.

Решим подобную задачу для простой линейной регрессии. Определим доверительные границы для истинных значений регрессии при всех мыслимых значениях объясняющей переменной. Отложим вычисленные границы на графике вверх и вниз от соответствующих значений эмпирической (выровненной) линии регрессии. При соединении точек получим две гиперболы, между ветвями которых находится «коридор» с эмпирической линией регрессии. При прочих равных условиях доверительный интервал в точке для всех самый узкий. Чем дальше наблюдения над объясняющими переменными удалены от их средних, тем шире доверительный интервал.

Пример

Вернемся к примеру из раздела 2.4, где было построено уравнение линейной регрессии, выражающей зависимость производительности труда от уровня механизации работ. Определим доверительные границы для истинных значений регрессии при всех наблюдениях Составим рабочую таблицу, используя формулу (8.20). Для нашего примера Находим квантиль распределения Стьюдента при степенях свободы: В столбце 2 табл. 16 приведены значения переменной (наблюдения" в точках). В столбце 3 помещены вычисленные в разделе 2.4 значения регрессии. Столбец 5 содержит стандартные ошибки отдельных значений регрессии, а в столбцах 7 и 8 указаны соответственно нижние и верхние доверительные границы. Например, при уровня механизации работ

Таблица 16. Определение доверительных границ для истинных значений простой линейной регрессии (см. скан)

истинное значение регрессии генеральной совокупности с доверительной вероятностью 0,95 будет находиться в интервале

Как упоминалось раньше, регрессионный анализ нашел широкое применение в прогнозировании. Прогноз получают путем подстановки в регрессионное уравнение с численно оцененными параметрами значений объясняющих переменных. При этом утверждается, что данное соотношение между переменными с присущим ему разбросом фактических значений имеет место и при новых условиях. Прогностическая оценка может быть получена для значений, приходящихся на исследованный диапазон изменения объясняющих переменных (задача интерполяции), и для значений, выходящих за границы этого диапазона (задача экстраполяции). При экстраполяции действие найденного соотношения в виде уравнения регрессии распространяется за рамки тех условий, при которыхоно получено. Построенные доверительные интервалы для условных математическихожиданий можно также использовать в прогнозировании. Расчет доверительных интервалов позволяет определить область, в которой следует ожидать значение прогнозируемой величины.

Пусть требуется оценитьсредний уровень производительности труда на двух других однородных предприятиях той же отрасли промышленности по значениям коэффициента механизации работ (переменная

на основе регрессионного уравнения, построенного для 14 предприятий. Значения переменной х для этих двух предприятий приведены в табл. 16 в строках 15 и 16. Для получаем прогностическое значение в результате интерполяции, а для в результате экстраполяции.

На этом примере можно еще раз убедиться в том, что доверительный интервал при прочих равных условиях тем уже, чем ближе расположено к х, и, наоборот, доверительный интервал тем шире, чем наблюдение дальше удалено от х. Вычисленные доверительные границы для значений регрессий нанесены на график, приведенный в разделе 8.4 (см. рис. 23).

Categories

1
Оглавление
email@scask.ru