Главная > Методы корреляционного и регрессионного анализа
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

1.3. ПОНЯТИЕ КОРРЕЛЯЦИИ

Корреляция в широком смысле слова означает связь, соотношение между объективно существующими явлениямии процессами. Однако для раскрытия и исследования причинных связей в силу их многообразия недостаточно этого общего определения. Мало установить только наличие связи между двумя или несколькими явлениями. Кроме качественного экономического анализа, большое методологическое значение имеет правильный выбор вида и формы связи. Связи между явлениями и процессами могут быть различны по силе. При измерении степени интенсивности, тесноты, прямолинейности, четкости, строгости связи проблема корреляции рассматривается в узком смысле. Исходя из этого можно сделать следующее определение: если случайные переменные причинно обусловлены и можно в вероятностном смысле высказываться об их связи, то имеется корреляционная (стохастическая) связь, или корреляция.

Понятия регрессии и корреляции непосредственно связаны между собой. В то время как в корреляционном анализе оценивается сила стохастической связи, в регрессионном анализе исследуется ее форма. С помощью оценки значимости решают вопрос о реально объективном существовании связи. В корреляционном и регрессионном анализе много общих вычислительных процедур. Оба вида анализа служат для установления причинных соотношений между явлениями и для определения наличия или отсутствия связи. Итак, соотношение между регрессией и корреляцией условно можно представить в виде

функциональная и корреляционная связь — два основных типа вязи, определяющих соотношение между явлениями и процессами, при этом следует подчеркнуть, что любое причинное влияние может выражаться либо функциональной, либо корреляционной связью. Но не каждая функция или каждая корреляция соответствует причинной зависимости между явлениями. Приведем несколько примеров корреляционной связи в области экономики. Так, очевидно, что себестоимость продукции зависит от объема производства. Известно, что промышленные предприятия с одинаковым объемом производства имеют различную себестоимость продукции. Более того, наблюдается рассеяние величины себестоимости при фиксированных значениях объема производства. Это обусловлено тем, что в экономике действует сложный комплекс многочисленных взаимно переплетающихся причин. Так, на себестоимость наряду с объемом производства влияют еще другие факторы, такие, как потери от брака, ассортимент продукции, технология производства, используемое сырье, структура цен и т. д. Кроме того, на себестоимость оказывают влияние случайные факторы. В общем, существует такая тенденция: чем больше объем производства, тем больше полная себестоимость. Но эта тенденция проявляется только в большой совокупности предприятий. В единичном случае вполне может оказаться, что предприятие А с более высоким объемом производства по сравнению с предприятием В имеет более низкую полную себестоимость продукции. При рассмотрении единичных случаев наблюдается пестрая картина отдельных связей.

Между доходом и потреблением товаров на душу населения также существует корреляционная связь. Относительное потребление продовольственных товаров снижается с увеличением дохода. Но опять мы можем говорить только об общей тенденции. Различные привычки потребителей, неодинаковый ассортимент продовольственных товаров и т. д. могут привести к тому, что в отдельных случаях (т. е. у отдельных индивидов) с увеличением дохода будет повышаться относительное потребление продовольственных товаров.

Между производительностью труда и техническим уровнем производства существует корреляция. Однако технический уровень производства представляет собой только один из многих факторов, оказывающих влияние на производительность труда. Производительность труда, как и многие явления в экономике, — следствие совокупного действия комплекса причин. Причем взаимодействие отдельных компонентов различно. Факторы-причины имеют разное направление и характер влияния. Одна причина может усиливать или ослаблять действие других. Кроме того, причины имеют разную силу или степень воздействия. Если рассматривать только парную корреляцию между приведенными признаками-факторами, то причинно-следственный комплекс будет сильно упрощен. Чем шире охватывается причинно-следственный комплекс, тем глубже вскрываются связи. Это дает возможность всесторонне изучать причинные отношения между явлениями, устанавливая существенные в данных условиях причины и второстепенные.

Для эффективного изучения связей необходимо использовать совокупности, однородные в отношении тех признаков, связь которых изучается

Если определяют время, затраченное работником на выработку единицы изделия на предприятиях, различающихся между собой только техническим уровнем производства, то следует ожидать, что в этом случае будет очень тесная связь между этими признаками. Чем теснее связь между явлениями, тем, следовательно, больше исключается действие второстепенных причин и тем меньше сказываются случайные влияния. В результате корреляционная связь приближается к функциональной. Поэтому функциональная связь может рассматриваться как предельный случай корреляции. Между экономическими явлениями преимущественно действуют объективно существующие корреляционные связи. Однако и в экономике необходимо четко различать корреляционную и функциональную связь.

Корреляция между двумя переменными может перейти в функциональную связь, если несколько переменных, соединенных определенным образом, рассматривать одновременно.

Известно, что стоимость товара однозначно определяется средними общественно необходимыми затратами труда. Общеизвестно, что необходимые затраты труда включают количество вложенного овеществленного труда (X) и количество вложенного живого труда Итак, W связано как с X, так и с Y. Если мы исследуем связь между W и X или W и Y, то W принимает определенные значения при заданных значениях X или Y. В этом случае W можно рассматривать как случайную переменную в статистическом смысле. Между W и X, а также между W и Y существует корреляция. Однако если мы рассматриваем одновременно W, то W теряет свойства случайной переменной, и корреляционные зависимости в совокупности переходят в функциональную зависимость в форме Величина W является функцией от двух переменных X и Y и однозначно определяется ими.

Следует отметить, что иногда истинную функциональную связь трудно обнаружить из-за накладывающихся погрешностей измерения изменения условий реализации, ошибочного или формального рассмот рения причинных отношений. Неслучайные переменные, находящиеся в функциональной зависимости, преображаются в случайные, а связь начинает приобретать стохастический характер. Например, закон свободного падения выполняется точно только в безвоздушном простран стве. При отклонениях от этого условия закон проявляется в виде кор реляции.

В качестве другого примера приведем теорему Евклида. Предполо жим, мы ее забыли и хотим экспериментальным путем установить, в какой зависимости находится сумма углов многоугольника от числа сторон. С этой целью произведем сначала измерение углов в треугольниках. Их суммы отнюдь не будут представляться постоянными величи нами. Значения отдельных сумм будут колебаться вокруг 180°. Аналогично измерим и просуммируем углы в четырехугольниках, пяти угольниках и т. д. В результате погрешностей измерения, появляю щихся при неточной установке измерительных средств, вследствие ошибок при считывании показаний, а также из-за субъективных качеств экспериментатора и т. д. функциональная связь между суммой углов многоугольников и числом их сторон будет проявляться в виде корреляции

Однако вполне очевидно, что сумма углов в многоугольниках одного вида не является случайной переменной. Она только кажется таковой вследствие накладывающихся погрешностей измерения. В действительности же между числом сторон многоугольника и суммой его углов существует детерминированная связь, описываемая с помощью функции

Мы уже упоминали, что причинное влияние может быть выражено в виде функциональной или корреляционной связи. Но отсюда вовсе не вытекает обратное утверждение, что за любой корреляционной или функциональной связью скрывается причинная зависимость. Во-первых, это связано с многообразием форм причинно-следственных отношений; во-вторых, уже из определения функциональной и корреляционной связи видно, что речь идет об отражении количественной связи между явлениями или об оценке этой связи по числовым данным. Задача же научного исследования состоит в разыскании причинных зависимостей. Только знание истинных причин явлений позволяет правильно истолковывать наблюдаемые закономерности. Однако корреляция как формально-статистическое понятие сама по себе не вскрывает причинного характера связи. С помощью корреляционного анализа нельзя указать, какое явление принимать в качестве причины, а какое — в качестве следствия. Корреляция лишь дает оценку силы, или тесноты, связи.

Вопрос о наличии причинных отношений между явлениями в каждом конкретном случае решается исследователем исходя из логически-профессиональных рассуждений, которые должны по возможности предшествовать корреляционному анализу. Однако, по нашему мнению, последнее требование не должно быть обязательным условием, так как иногда объяснение причины и следствия можно получить только после эмпирического описания связи. Не приходится сомневаться, что в любом случае этот метод математической статистики служит весьма полезным инструментом для вскрытия связей между явлениями.

Во многих ситуациях относительно легко исходя из логически-профессиональных соображений объяснить, какие переменные представляют собой причину, а что является следствием. Так, существует корреляция между ростом производительности труда и повышением заработной платы. В общем случае рост производительности труда можно считать причиной повышения заработной платы. Но, с другой стороны, повышение заработной платы может быть материальным стимулом роста производительности труда. Между количеством осадков, количеством удобрений и урожайностью сельскохозяйственных культур также существует отчетливая корреляция. Здесь не возникает сомнений, какие переменные принять в качестве причины, а какую переменную считать следствием. Однако иногда трудно выяснить взаимоотношения между переменными. Так, Берксон утверждает, что, хотя между ростом

и весом людей существует отчетливая корреляция, нельзя делать заключение о биологической необходимости этой связи, так как неизвестно, сохранится ли корреляция между указанными переменными при осознанно измененной форме питания. Аналогичный вопрос встает при исследовании зависимости заболевания раком легких от курения. Хотя курение в вероятностном смысле оказывает влияние на образование рака легких, нельзя, однако, утверждать, что курение является причиной заболевания. Итак, установление корреляции не означает наличия причинной связи. Особенно это ярко видно на примерах с ложной корреляцией, о которой речь еще впереди.

Рассмотрим теперь различные виды корреляции.

а) Относительно характера корреляции различают:

положительную корреляцию. Она имеет место, если с увеличением или уменьшением значений одной переменной значения другой соответственно увеличиваются или уменьшаются. Положительная корреляция существует, например, между производительностью труда и заработной платой, между ростом и весом, между техническим уровнем производства и производительностью труда, между выполнением производственного плана и затратами рабочего времени, между объемом продукции и объемом импорта и т. д. Положительная корреляция называется также равнонаправленной (или прямой) корреляцией;

отрицательную корреляцию. При этом виде корреляции с увеличением или уменьшением значений одной переменной значения другой соответственно уменьшаются или увеличиваются. Отрицательная корреляция существует, например, между производительностью труда и стоимостью изделия, между объемом продукции и затратами на единицу изделия и т. д. Отрицательная корреляция называется также обратной.

б) Относительно числа переменных различают:

простую, или парную, корреляцию. Это корреляция между двумя переменными. Например, между доходом и потреблением, между прибылью и себестоимостью и т.д.;

множественную корреляцию. Это корреляция между более чем двумя переменными. Например, между производительностью труда уровнем механизации производства, квалификацией рабочих, уровнем использования машинного времени; между расходом энергии, объемом производства и температурой внешней среды. С помощью множест венной корреляции мы пытаемся охватить весь причинно-следственный комплекс. Особенно это важно в экономике, где отдельные явления как правило, представляют собой следствие не одной, а нескольких причин. Множественная корреляция служит отражением этих объективно существующих множественных связей. Установление этих связей, сопровождаемое их конкретным объяснением, раскрывает механизм явлений;

частную корреляцию. Это корреляция между двумя перемен ными при «фиксированном» влиянии остальных переменных, включенных в анализ. С помощью частной корреляции наиболее полно исследуется причинно-следственный комплекс и вскрывается внутренняя структура соотношений. Важность использования частной корреляции

вытекает из того факта, что, как правило, одновременно взаимодействуют несколько причин и оказывают совместное влияние на исследуемый признак. Если определять корреляцию между зависимой переменной (следствие) и каждой объясняющей переменной (причиной) по отдельности, то влияние остальных переменных будет сказываться на степени связности выделенных переменных. Это может привести к ошибочным заключениям. Так, при исследовании зависимости расхода пара от объема производства на одном из предприятий, изготавливающем сборные бетонные конструкции под открытым небом, была установлена отрицательная корреляция, т. е. с увеличением объема производства расход пара снижался. Но это явно парадоксальный вывод. Тщательный анализ показал, что другой фактор оказывает существенное влияние на потребление пара, а именно температура воздуха. При этом отрицательная корреляция между этими переменными настолько сильная, что вывод о наличии связи между расходом пара и объемом производства вполне может оказаться несостоятельным. Следовательно, прежде чем определять корреляцию между расходом пара и объемом производства, следует исключить влияние температуры воздуха на потребление пара. При определении корреляции между температурой воздуха и потреблением пара также следует исключить влияние объема производства на расход пара. В результате будем иметь две частные корреляции, каждая из которых указывает «чистую» стохастическую связь между двумя переменными при элиминировании влияния третьей.

в) Относительно формы связи различают:

ва) линейную корреляцию. При этом виде корреляции между исследуемыми переменными существуют линейные соотношения;

вб) нелинейную корреляцию. При этом виде корреляции между исследуемыми переменными существуют нелинейные соотношения.

г) Относительно типа соединения явлений различают:

га) непосредственную корреляцию. В этом случае исследуемые явления соединены между собой непосредственно. Объясняющая переменная оказывает прямое влияние на зависимую переменную. Непосредственная корреляция существует, например, между производительностью труда, техническим уровнем производства и производственными навыками рабочего; между производительностью труда и себестоимостью изделия; между наличием и оборачиваемостью оборотных средств; между потерями рабочего времени и объемом производства и т. д. В капиталистическом хозяйстве существует непосредственная корреляция между уровнем цен и соотношением спроса и предложения. Итак, непосредственная корреляция существует, если из одного явления логически вытекает другое, и для объяснения этой корреляции не нужно привлекать другие явления;

гб) косвенную корреляцию. О косвенной корреляции говорят, когда изучаемые переменные не имеют непосредственной причинно-следственной связи, а детерминируются общей для них причиной. Логически такую связь можно объяснить лишь с помощью других явлений. При косвенной корреляции существует опасность перехода на формальный путь исследования, что может привести к ложной корреляции. Так,

было установлено, что при принятии родов врачами доля мертворожденных детей в среднем больше, чем при принятии родов акушерками, работающими самостоятельно без помощи врача. Если исходя из этого сделали бы вывод, что врачи не должны привлекаться к родам, то, очевидно, это не способствовало бы снижению доли мертворожденных. Между долей мертворожденных и врачебной помощью существует только косвенная связь постольку, поскольку врачи большей частью лишь подключаются при тяжелых родах или осложнениях. Так логический анализ явлений помог объяснить корреляцию.

Существует тесная положительная корреляция между возрастом вступающих в брак мужчин и женщин. Никому не придет в голову идея считать возраст вступления в брак у женщин причиной возраста вступления в брак у мужчин и наоборот. Причина здесь кроется в исторически укоренившихся нормах поведения, в биологических процессах и т. д.

Очень наглядный пример косвенной корреляции дает статистика дореволюционной России. Была установлена тесная корреляция между числом пожаров в стране и размером урожая. В неурожайные годы число пожаров было довольно высоким. Очевидно, плохие урожаи никак нельзя считать причиной пожаров в зданиях, и, кроме того, невозможно бороться с пожарами с помощью агротехнических мероприятий. В действительности же здесь между приведенными переменными существует только косвенная связь. Как размеры урожая, так и число пожаров существенно зависят от третьего явления — метеорологических условий. Сильная засуха, естественно, приводит к плохому урожаю. Она же благоприятствует возникновению пожаров. Только поэтому проявляется связь между урожайностью в сельском хозяйстве и числом пожаров. Этот пример еще раз показывает, что содержательное объяснение исследуемых явлений необходимо для правильного истолкования корреляции.

Не каждую корреляцию можно отождествлять с причинной связью. Высказывание А. А. Чупрова о важности логически-профессионального истолкования связей имеет большое значение и для экономических исследований. «Мы видим, таким образом, насколько задача изучения взаимной зависимости между явлениями сложнее в действительности, нежели представляется тем, кто исходит из допущения, что либо X должен быть связан неразрывно с У, либо между X и Y не может быть никакой связи. Задача исследования не исчерпывается решением вопроса, есть ли связь. Должен быть установлен ее «закон», далеко не всегда сводящийся, как мы видели, к прямой пропорциональности, а могущий принимать форму функциональной зависимости любого вида. Должна быть так или иначе охарактеризована степень тесноты связи. И наконец, должен быть освещен характер связи: должен быть учтен вес тех «беспричинных встреч», которые способны порождать видимость связи между X и Y, перестающей сковывать их, как только мы выходим за пределы первоначального поля наблюдения. Задача истолкования подмеченной связи представляется нередко и наиважнейшей, и наитруднейшей. Обрабатывая сходным образом эмпирические данные, которые имеют совершенно одинаковый вид, исследователь

приходит в разных случаях к выводам, глубоко различным по их внутреннему смыслу... Правильное истолкование подмечаемой связи представляется особенно существенным, когда статистическое знание привлекается к обоснованию жизненно важных решений и практических мероприятий. Тут знание связей, остающихся без истолкования или неверно истолковываемых, часто хуже полного незнания. Недостаточное внимание к этому обстоятельству является одним из злейших статистических преступлений. Здесь и корень наиопаснейших для статистики нападок на нее» [126, с. 25—26];

гв) ложную корреляцию. Под ложной корреляцией (нонсенс-корреляцией) понимается чисто формальная связь между явлениями, не находящая никакого логического объяснения и основанная лишь на количественном соотношении между ними. Часто ложная корреляция возникает при изучении динамических рядов. Особенно это характерно для экономических явлений. При расположении материала по годам или месяцам легко обнаружить эволюторную компоненту, показывающую основную тенденцию ряда. При сопоставлении рядов такого типа необходимо (прежде чем устанавливать корреляцию между обоими рядами) исключить из них закономерные изменения уровня. Совпадение или противонаправленность эволюторных тенденций, не имеющих общего объяснения и не связанных общностью развития, может послужить причиной искусственной связи, лишенной смысла. Подобная связь ничего не дает для исследования причин, управляющих явлениями. Келлерер приводит пример такой связи: имеется тесная положительная корреляция между количеством импортируемых апельсинов и числом смертных случаев от онкологических заболеваний за последние 50 лет [71].

В связи с этим следует подчеркнуть, что при разыскании причинных связей необходимо учитывать продолжительность исследуемого периода. За время развития явления могут появиться новые факты, способствующие раскрытию причинных связей. Наилучшей иллюстрацией этого утверждения могло бы послужить изучение онкологических заболеваний. С каждым годом все более совершенствуется диагностика рака, используются новые лекарства и новое медицинское оборудование, что нельзя оставить без внимания при рассмотрении числа заболеваний раком во временной последовательности. Напомним известный в статистической литературе пример ложной корреляции между числом аистов, свивших гнезда в южных районах Швеции, и рождаемостью в эти же годы в Швеции. Вычисления, выполненные ради шутки, показали положительную корреляцию между этими явлениями. Приведенный пример еще разподтверждает, что причинная зависимость не может быть выведена ни из какого наблюдаемого совместного изменения явлений.

Проблема ложной корреляции возникает при использовании индексов, процентных чисел, а также когда к обеим сопоставляемым величинам добавляется или из каждой вычитается одна и та же величина. Ложная корреляция может возникнуть и в том случае, когда одна переменная входит в состав другой и тем самым формально обусловливает соответствие обеих переменных друг другу. Например, сопоставление

живого и овеществленного труда в расходах совокупного труда показало бы тесную связь. Но было бы ошибкой считать уменьшение доли живого труда в затратах совокупного труда причиной повышения доли овеществленного труда. В действительности же соотношение между затратами живого и овеществленного труда определяется уровнем производительности труда.

Цель приведенного описания типов корреляции — показать разнообразие взаимосвязей между явлениями. Но эти типы корреляции для лучшего их понимания были представлены изолированно. На практике чаще всего они встречаются комбинированно. Так, например, существует положительная линейная простая корреляция, положительная нелинейная множественная корреляция, отрицательная линейная частная корреляция и т. д. Если же речь идет о непосредственной или косвенной корреляции, то в каждом конкретном случае это следует пояснять особо. Ряд других понятий, связанных с корреляционным анализом, мы обсудим в последующих разделах.

Categories

1
Оглавление
email@scask.ru