7.5. СООТНОШЕНИЕ МЕЖДУ ЛИНЕЙНЫМ КОЭФФИЦИЕНТОМ КОРРЕЛЯЦИИ, ИНДЕКСОМ КОРРЕЛЯЦИИ И КОРРЕЛЯЦИОННЫМ ОТНОШЕНИЕМ
Линейный коэффициент корреляции является частным случаем индекса корреляции, когда связь между переменными х и у линейна.
В этом можно легко убедиться, подставив в (6.1) или (6.3) вместо его выражение для случая линейной зависимости (2.25). Выполнив затем соответствующие преобразования, получим формулу линейного коэффициента корреляции. Для линейной зависимости между переменными имеем связи с тем что корреляционное отношение можно вычислить только по сгруппированному числовому материалу, мы можем обсуждать вопрос о соотношении между ним и коэффициентом корреляции только при наличии сгруппированных исходных данных. Как известно, сумма квадратов отклонений отдельных значений переменной от среднего меньше, чем сумма квадратов отклонений от любого другого числа т. е.
т. е.
Для частных средних вычисленных по каждой группе значений объясняющей переменной, это свойство можно записать следующим образом:
Путем некоторых преобразований (7.16) с использованием разложения дисперсии на две составляющие (см. раздел 3.1, формула можно показать, что
Оба показателя тесноты связи только тогда равны, когда значения регрессии совпадают с частными средними т. е. линия регрессии проходит через частные средние.
При линейной корреляции частные средние приблизительно лежат на одной прямой. В этом случае коэффициент корреляции и корреляционное отношение принимают примерно одинаковые значения (см. пример в разделе 4.7). Следовательно, при линейной корреляции и приближенно равны. Чем больше различаются между собой и чем больше они отличаются от линейного коэффициента корреляции, характеризующего степень связи между теми же переменными, тем больше регрессионная зависимость отклоняется от линейного вида. Это позволяет величину разности между корреляционным отношением и линейным коэффициентом корреляции использовать в честве меры линейности корреляции и регрессии. Поскольку корреляционное отношение не может быть меньше индекса корреляции, разность между обоими показателями при нелинейной связи используется так же, как мера соответствия выбранной функции регрессии действительной зависимости. Если разность между обоими показателями велика, то следует попытаться подобрать другую кривую регрессии, которая ближе подходит к ломаной линии регрессии. Однако указанные разности между корреляционным отношением и коэффициентом корреляции, а такжде между корреляционным отношением и индексом корреляции являются только вспомогательными характеристиками оценки подбора функции регрессии. Решающая роль при выборе «наилучшей» из всех возможных функций регрессии принадлежит логически-профессиональному анализу объективно существующей зависимости между явлениями.