Главная > Методы корреляционного и регрессионного анализа
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

4. ЛИНЕЙНАЯ КОРРЕЛЯЦИЯ

Как отмечалось в разделах, посвященных линейной регрессии и коэффициентам детерминации, при стохастических связях изменения в величинах зависимой переменной не полностью определяются влиянием изменений рассматриваемых объясняющих переменных. На изменения зависимых переменных оказывают влияние также другие, не учитываемые нами или скрытые от нас факторы и случайности. Чем больше изменения зависимых переменных обусловлены изменениями рассматриваемых объясняющих переменных, тем теснее, интенсивнее исследуемая связь между явлениями. Измерением степени, интенсивности, тесноты наблюдаемой связи мы хотим заняться и в последующих разделах. При этом мы снова будем основываться на количественных соотношениях, которые существуют между исследуемыми явлениями.

4.1. ПРОСТАЯ ЛИНЕЙНАЯ КОРРЕЛЯЦИЯ ПРИ НЕСГРУППИРОВАННЫХ ДАННЫХ

Если между двумя явлениями у их существует линейное стохастическое соотношение (корреляционная связь), линейная регрессия, то мы можем степень, интенсивность связи между обоими явлениями измерить с помощью коэффициента корреляции Для вывода формулы коэффициента корреляции воспользуемся методом, предложенным Бравэ и Пирсоном.

Пусть заданы значения переменных у их, между которыми существует линейное соотношение. Вычислим по ним средние значения у и х, а также отклонения Для получения безразмерной характеристики связи и исключения влияния рассеяния случайных переменных нормируем указанные отклонения, разделив их на стандартные отклонения Затем суммируем произведения полученных относительных отклонений:

Эта сумма будет тем больше, чем больше синхронности в смещении рядов наблюдений над переменными в одном или противоположных

направлениях. В обоих случаях большим отклонениям значений переменной у соответствуют большие отклонения значений переменной х. Если это соответствие отсутствует, то связь между исследуемыми переменными менее интенсивна. Кроме того, сумма произведений (4.1) зависит от числа пар наблюдений. Чтобы сделать показатель связи не зависящим от числа пар наблюдений, разделим выражение (4.1) на результате получим показатель, который называется простым линейным коэффициентом корреляции, коэффициентом парной корреляции, или кратко, коэффициентом корреляции:

Учитывая (1.13) из раздела 1.5, запишем формулу (4.2) в таком виде:

Из (4.3) видно, что коэффициент корреляции представляет собой отношение ковариации к произведению стандартных отклонений обеих переменных у и х, т. е. является стандартизованной ковариацией. В соответствии с определениями ковариации и соответствующих стандартных отклонений

Раскрыв в (4.4) скобки и выполнив некоторые простые преобразования, получим

Формула (4.5) удобна для практических вычислений. В ней содержатся только исходные данные и промежуточные результаты, которые можно заимствовать из рабочей таблицы, построенной для вычисления оценок параметров регрессии (см. раздел 2.4). Так же, как при проведении регрессионного анализа, при большом объеме наблюдений для вычисления коэффициента корреляции желательно применять КВМ. Коэффициент корреляции принимает значения в интервале

Значения коэффициент корреляции достигает, если между соответствующими отклонениями существует прямая связь, а значения если между ними существует обратная связь. Чем больше связь между этими величинами отклоняется от прямой или обратной, тем больше сумма приближается к нулю. При положительном коэффициенте корреляции говорят о положительной корреляции, при отрицательном — об отрицательной корреляции. Чем ближе коэффициент корреляции тем теснее, интенсивнее связь. При линейно-возрастающей функциональной зависимости между переменными у и при линейно-убывающей Чем ближе коэффициент корреляции приближается к нулю, тем слабее исследуемая связь. Но если между переменными существует нелинейное соотношение, то Если при практических исследованиях в результате вычислений получено то не надо торопиться с выводом об отсутствии связи между переменными. Мы можем лишь утверждать, что гипотеза о линейной связи на основе данного числового материала не подтверждается. Коэффициент корреляции не дает возможности ответить на вопрос, имеется ли нелинейная корреляция между переменными. Значение свидетельствует об отсутствии линейной связи, но вполне возможно, что при этом существует тесная нелинейная связь, даже нелинейная функциональная. Коэффициент корреляции позволяет делать вывод об интенсивности стохастической связи только при наличии линейных соотноше, между переменными. Как видно из структуры формул (4.3) и (4.4). при вычислении коэффициента корреляции безразлично, какая из ременных зависимая, а какая - объясняющая. Если мы поменяем местами у и х, то формула (4.4) не изменится. Следовательно, Итак, в случае линейной связи между двумя переменными имеется только один коэффициент корреляции. Отсюда непосредственно следует, что линейный коэффициент корреляции выражает взаимозависимость между переменными. Направление зависимости не отражается на его величине, т. е. он является симметричной функцией относительно и у. С помощью формулы (4.3) можно показать, что коэффициент корреляции не изменится, если переменные у их подвергнуть преобразованию или изменить их единицы измерения.

Пример 1

Вычислим по формуле (4.5) коэффициент корреляции для примера из раздела 2.4 (связь между производительностью труда и уровнем механизации работ), необходимые промежуточные результаты заимствуем из табл. 3 (см. раздел 2.4):

Пример 2

По той же формуле вычислим коэффициент корреляции для примера из раздела 2.5 (связь между объемом производства и основными

фондами):

В обоих примерах мы получили очень высокий коэффициент корреляции. Это свидетельствует о том, что связь между производительностью труда и уровнем механизации работ, а также, между объемом производства и основными фондами очень тесная, хотя и не функциональная. Очевидно, что к действию переменных примешивается влияние побочных факторов. Чем меньше это влияние и ограниченнее воздействие случайностей, тем больше приближается значение коэффициента корреляции к или — 1. Отсюда видна связь между величиной коэффициента корреляции и регрессией. Функция линейной регрессии отражает линейное соотношение между переменными тем лучше, чем больше коэффициент корреляции приближается к или этом смысле коэффициент корреляции часто служит критерием при выборе вида регрессии. С его помощью устанавливают, действительно ли переменная у зависит от х и в какой степени. Далее мы покажем, что коэффициент корреляции непосредственно связан с коэффициентом регрессии.

В заключение нам хотелось бы привести еще одну формулу коэффициента корреляции, которая часто встречается в литературе. Для этой цели перепишем (4.2) в следующем виде:

Подставив в (4.7) формулу (2.65) для стандартизованных переменных из раздела 2.7, получи.

Коэффициент корреляции, представленный в виде разделенной на суммы произведений стандартизованных значений переменных у и х называется корреляционным моментом Пирсона. Эта форма записи коэффициента корреляции представляет прежде всего теоретический интерес, но она мало пригодна для практических вычислений. Если коэффициент корреляции вычисляется при малом числе наблюдений, то необходимо проверять его значимость (об этом пойдет речь в разделе 8.5).

Корреляционный анализ применяется для решения и других задач, например для отбора факторов, оказывающих существенное влияние на экономический процесс. Дальнейшим развитием корреляционного исчисления следует считать факторный анализ, который исходит из корреляционной матрицы. Его основные задачи — выявление структуры взаимосвязи между переменными, выделение факторов, объясняющих

наблюдаемые связи переменных и снижение размерности исходного набора переменных. К сожалению, у нас нет возможности в рамках данной книги более обстоятельно осветить эти вопросы, поэтому отсылаем читателя к соответствующей литературе [67].

1
Оглавление
email@scask.ru