Главная > Методы корреляционного и регрессионного анализа
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

5. НЕЛИНЕЙНАЯ РЕГРЕССИЯ

Между социально-экономическими явлениями и процессами не всегда существуют линейные соотношения, и часто эти соотношения нельзя упрощенно выразить линейными функциями из-за неоправданно больших ошибок, возникающих при этом. В таких случаях для описания зависимостей используют нелинейную корреляцию и регрессию. Как уже упоминалось, в зависимости от характера связи различают положительную равноускоренно и равнозамедленно возрастающую регрессию, отрицательную равноускоренно и равнозамедленно убывающую регрессию либо их комбинированные формы. Для оценки параметров регрессии будем применять метод наименьших квадратов, а для оценки интенсивности связи между явлениями — соответствующие показатели.

5.1. ПРОСТАЯ НЕЛИНЕЙНАЯ РЕГРЕССИЯ ПРИ НЕСГРУППИРОВАННЫХ ДАННЫХ

Для выбора и обоснования типа кривой регрессии нет универсального метода. Односторонняя стохастическая зависимость между явлениями может быть описана, например, с помощью полиномиальной регрессии:

либо с помощью гиперболической регрессии:

Применяются также степенная, показательная, логарифмическая и тригонометрическая функции. Подбор функции регрессии должен производиться с применением теории той конкретной науки, на базе которой возникает задача измерения связи между явлениями. Чаще всего используются семейства кривых, уравнения которых выражаются многочленами целых положительных степеней (полиномы вида (5.1)). Полином первой степени (прямая линия) не имеет изгибов. С помощью полинома второй степени можно передать одну точку поворота функции. Полином третьей степени отражает две точки поворота функции. О характере зависимости между экономическими явлениями часто судят по внешнему виду эмпирического графика регрессии. Однако при малом числе наблюдений этот путь приводит к неудовлетворительным результатам, так как резкие зигзаги эмпирической (ломаной) линии регрессии затрудняют выявление закономерности. В каждом случае следует проверять возможность применения линейной регрессии хотя бы на ограниченном участке изменения переменных. Далее мы будем более подробно обсуждать проблему проверки линейности, а также степени соответствия выбранной функции регрессии эмпирическим данным. И наконец, необходимо обращать внимание на то, чтобы оценки регрессии производились с достаточной степенью надежности. Информацию об этом дает нам коэффициент детерминации.

Мы различаем два класса нелинейных регрессий. К первому классу относятся регрессии, нелинейные относительно включенных в анализ объясняющих переменных но линейные по неизвестным, подлежащим оценке параметрам регрессии . Поэтому образующие этот класс нелинейные регрессии называют также квазилинейными регрессиями. Их преимущество состоит в том, что для них возможно непосредственное применение метода наименьших квадратов, а следовательно, остаются в силе все исходные предпосылки линейного регрессионного анализа и свойства МНК-оценок параметров регрессии (несмещенность, состоятельность, гомоскедастичность и т. д.). Используются те же самые критерии значимости, аналогично строятся доверительные интервалы и доверительные зоны.

Второй класс регрессий характеризуется нелинейностью по оцениваемым параметрам. Этот класс регрессий встречается довольно часто при исследовании экономических явлений. Однако он обладает существенным недостатком — не допускает применения обычного метода наименьших квадратов. Для решения получающейся при этом системы нелинейных уравнений привлекают итерационные методы либо прибегают к аппроксимации параметров искомой зависимости. Широко используется также линейное преобразование функции регрессии, которое позволяет применять к преобразованным параметрам статистические критерии линейной регрессии. Строгой теории нелинейной регрессии пока нет. Далее мы еще вернемся к этому вопросу.

Рассмотрим вначале простую квазилинейную регрессию. Пусть зависимость между двумя явлениями (у и х) представлена в виде параболы второго порядка (целой рациональной функции второй степени)

Здесь — выравнивающая постоянная, которая соответствует точке пересечения, кривой регрессии с осью — параметры регрессии, характеризующие зависимость переменной у от переменной х. Функция регрессии (5.3) линейна относительно параметров и нелинейна относительно объясняющих переменных х (квадратный трехчлен). Следовательно, мы имеем типичную функцию квазилинейной регрессии.

Для оценки параметров (5.3) методом наименьших квадратов нужно исходить из соотношения

где и — возмущающая переменная. Приравняв нулю частные производные от суммы по каждому из параметров (см. раздел 2.4), получим после некоторых преобразований следующие нормальные уравнения:

Как и в случае простой линейной регрессии (см. раздел 2.4), можно определить разделив обе части уравнения (5.5) на

Подставив (5.8) в (5.3), после простого преобразования получим

Выражения для параметров регрессии найдем путем решения системы нормальных уравнений

Подставляя в (5.3) вычисленные значения мы тем самым найдем оценку функции регрессии. После проверки значимости оценок параметров регрессии (см. раздел 8.7) при приемлемой величине коэффициента детерминации можно определить расчетные значения регрессии для анализа зависимости между экономическими явлениями.

Пусть исходя из логических рассуждений для описания зависимости используется гиперболическая форма связи

Применяя метод наименьших квадратов к (5.12), снова получим систему нормальных уравнений. Решая ее, находим

По формулам (5.13) и (5.14) мы вычисляем оценки параметров гиперболического уравнения регрессии.

Рассмотрим теперь в общем виде квазилинейную регрессию, т. е. функцию, нелинейную по объясняющим переменным, но линейную по оцениваемым параметрам:

где — функции от объясняющих переменных х. Они не содержат других параметров. Так, например, это могут быть функции вида или но не такие, как

(кликните для просмотра скана)

Продолжение табл. 8 (см. скан)

Применяя метод наименьших квадратов к (5.15), получим систему нормальных уравнений:

Из (5.16)-(5.18) можно вывести правило составления нормальных уравнений. Учитывая, что отдельные значения суммируются, уравнение (5.16) строится аналогично регрессии (5.15). Нормальные уравнения (5.17), (5.18) и т. д. получаются, если функцию регрессии (5.15) умножить соответственно на а затем просуммировать. Это правило можно сформулировать, рассматривая также нормальные уравнения для простой и множественной регрессии в разделах 2.4 и 2.7, а также систему (5.5)-(5.7).

Прежде чем перейти к примеру, составим сводку квазилинейных функций, применяемых в экономике (см. табл. 8).

Решая систему нормальных уравнений, мы находим параметры регрессии. Укажем еще один способ представления квазилинейных функций в виде линейной множественной регрессии. В этом случае часто говорят о функциональной регрессии. Так, например, сделав в полиноме второй степени

следующую замену:

можно записать его в виде:

Мы получили ту форму записи линейной множественной регрессии, которая была приведена в разделе 2.4. Следовательно, формулы из раздела 2.4 для определения коэффициентов множественной регрессии пригодны также с учетом (5.20) для нахождения параметров нелинейной простой регрессии.

Пример.

Пусть исследуется зависимость себестоимости единицы продукции от объема произведенной продукции по данным 15 предприятий (см. табл. 9).

Таблица 9. Себестоимость единицы продукции одного и того же вида и объем продукции на 15 предприятиях (см. скан)

Рис. 19. Зависимость между себестоимостью и объемом продукции

Из рис. 19 видно, что между себестоимостью и объемом произведенной продукции существует нелинейная связь. Выразим вначале зависимость между этими переменными уравнением параболы второго порядка, а затем гиперболическим уравнением, используя следующие значения:

Найдем оценки параметров полинома второй степени по (5.10), (5.11) и (5.8):

Уравнение регрессии примет вид

Подставляя в это уравнение значения х из табл. 9, получим расчетные значения регрессии, по которым построим кривую регрессии на рис. 19: Кривая регрессии пересекает ось у в точке с ординатой 11,87. Если воспользоваться данной кривой для прогноза, то можно увидеть, что уже при величине выпуска, равной 15 000 штукам, затраты в расчете на единицу продукции снова увеличатся. С экономической точки зрения это так же трудно объяснить, как и величину себестоимости в 11,87 марки при отсутствии выпуска продукции. Поэтому следует попытаться подобрать другую функцию регрессии, которая бы соответствовала эмпирическим данным и в то же время была экономически обоснована. Если выбрать для описания зависимости гиперболическую функцию

то по формулам (5.13) и (5.14) получим следующие оценки параметров:

Уравнение регрессии в этом случае будет иметь вид:

Расчетные значения регрессии, полученные после подстановки в это уравнение значений х, равны:

Соответствующая кривая регрессии изображена на рис. 19. С увеличением х величина себестоимости единицы продукции приближается к 0,87 марки. С уменьшением себестоимость единицы продукции возрастает. Для выражения зависимости себестоимости единицы продукции от объема продукции гиперболическая функция более пригодна, чем регрессия (5.1). Однако на некоторых участках переменной х функция (5.1) больше соответствует эмпирическим данным.

В нашем примере мы располагали относительно небольшим числом наблюдений. Поэтому оценки параметров регрессии могут иметь значительные отклонения случайного характера. Отсюда возникает необходимость проверки значимости уравнения регрессии, что будет обсуждаться в главе 8. Себестоимость является относительной величиной в статистическом смысле. В регрессионном анализе такие относительные величины создают особые проблемы, на которых мы более подробно остановимся в разделе 7.7.

В экономике довольно часто встречаются регрессионные зависимости, нелинейные относительно оцениваемых параметров. Использование этого класса регрессий связано с вычислительными трудностями, так как указанные регрессии не допускают непосредственного применения обычного метода наименьших квадратов. Для того чтобы сделать это возможным, исходные данные подвергают преобразованиям, главное назначение которых в линеаризации рассматриваемых зависимостей по оцениваемым параметрам. Так, например, путем логарифмического преобразования можно перейти от зависимости показательного типа к линейной:

Произведя в (5.23) замену получим

К уравнению (5.23а) применяем метод наименьших квадратов. При этом требование МНК будет сводиться к условию а не к условию Следовательно, для (5.23а) не является обязательным равенство

Для определения зависимости вида (5.22) нужно выполнить логарифмическое преобразование переменной у, т. е. прологарифмировать эмпирические значения Аналогичному преобразованию подвергают исходные данные при изучении зависимости вида После возведения в квадрат обеих частей уравнения перейдем к логарифмам. Введем следующие обозначения: В итоге получим: Оценки параметров А и В можно найти снова с помощью метода наименьших квадратов.

(кликните для просмотра скана)

Итак, некоторые функции с помощью преобразования переменных поддаются линеаризации относительно своих параметров. Параметры регрессии исходных функций находят путем обратных преобразований. Например, если исходная функция является показательной или степенной с дробным показателем, то оценки параметров этих регрессий находят путем потенцирования параметров линеаризованных зависимостей. Линеаризация связей дает возможность применять для нахождения оценок параметров метод наименьших квадратов. Но полученные оценки параметров исходных функций могут не обладать свойствами МНК-оценок. Разработаны способы уточнения этих оценок. Но мы не будем подробно это обсуждать и отсылаем заинтересованного читателя к специальной литературе.

Для наглядности наиболее часто встречающиеся в экономике нелинейные функции второго класса представлены в табл. 10. Особенно значительную роль они играют при изучении спроса. Из приведенных в таблице функций наибольшее затруднение при их определении вызывают оценки параметра а логистической функции и функции Гомперца, параметра с функции Джонсона и параметра функции Торнквиста типов. Так как параметр а указывает уровень насыщения, то обычно он заранее устанавливается исходя из логико-экономических соображений. Имеются также численные методы, с помощью которых можно вычислить это значение [125]. Другой способ заключается в определении уровня насыщения с помощью функции Торнквиста типа и подстановки этого значения в логистическую функцию. Но в любом случае мы должны исходить из экономического анализа явления.

Categories

1
Оглавление
email@scask.ru