Глава 4. ДВЕ ПРЕДИКТОРНЫЕ ПЕРЕМЕННЫЕ
4.0. ВВЕДЕНИЕ
До сих пор мы подробно рассматривали линейную регрессионную модель первого порядка от одной переменной X
и показали, как просто можно выразить анализ в матричных терминах. Обычно в практике требуются более сложные модели. Они возникают во многих задачах, где не обойтись одной единственной независимой (или предикторной) переменной, чтобы лучше понять и (или) лучше предсказать данный отклик. Матричный подход, обсуждавшийся в конце гл. 2, позволяет нам получить общую методику, распространяющую результаты гл. 1 на более сложные линейные модели. В этой главе мы будем применять матричный анализ к линейной модели первого порядка в виде
Вернемся к примеру из гл. 1 (с данными из приложения А, см. кн. 2) и добавим теперь к модели еще фактор 6. А чтобы было ясно, какая из переменных модели рассматривается, будем использовать подстрочные индексы исходных переменных. Тогда наша модель примет вид
где
отклик, или количество пара, расходуемого в месяц;
фиктивная переменная, которая всегда равна единице;
среднемесячная температура воздуха
число рабочих дней в месяце.
Теперь можно построить следующие матрицы (полные данные для вектора
а также второго и третьего столбцов матрицы X приведены в приложении
в табл. 4.3):
где
Используя результаты из гл. 2, получим МНК-оценки для
где
вектор оценок элементов
при условии, что
не вырождена. Тогда
Приведем размеры матриц, построенных выше:
Перемножая матрицы в больших фигурных скобках, получим
Тогда
Затем, обращая матрицу [3 X 3], найдем:
Вычисление обратной матрицы можно проверить, перемножая
на исходную матрицу
что должно дать единичную матрицу
. Заметим, что так как обратная матрица (подобнопрямой) симметрична, то приводится только ее верхняя треугольная часть. Выполняя перемножение матриц, наконец, получим
Таким образом, имеем подобранное с помощью метода наименьших квадратов уравнение:
Фактически при проведении этих матричных операций на машине мы не получаем большей точности, чем следуя нашим путем. Основная причина здесь заключается в том, что могут быть большие ошибки округления, если придерживаться такой последовательности операций. Этот вопрос обсуждается в параграфе 5.5.
Для полноты картины приведем алгебраическую форму нормальных уравнений в случае двух независимых переменных:
Мы получили подобранное выше уравнение с помощью простых регрессионных вычислений. То же уравнение можно получить еще и с помощью последовательности простых линейных регрессий. Хотя практически это не лучший путь, рассмотрим в учебных целях, как этого добиться. Прежде чем исследовать подбор уравнения в параграфе 4.2, обсудим альтернативную процедуру.