Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
ГЛАВА 3. СВЯЗАННЫЕ РАНГИ3.1. В практических приложениях методов, основанных на ранжировании, иногда сталкиваются со случаями, когда два или несколько объектов настолько подобны, что не удается отдать предпочтение одному из них. Когда исследователь ранжирует объекты на основе субъективных суждений, то это свойство (отсутствие предпочтений) связано с истинной их неразличимостью или неспособностью исследователя найти существующие различия. В этих случаях говорят, что такие объекты являются связанными. Расположение студентов в соответствии с их достоинствами или экзаменационными баллами является известным примером такого рода связей. 3.2. Метод, который мы примем для приписывания численных значений рангов связанным объектам, заключается в усреднении рангов, которые они имели бы, если были бы различимы. Например, если исследователь связывает третий и четвертый объекты, то каждому приписывается число 3.3. Теперь мы должны рассмотреть влияние связей на расчет В 1.9 было показано, что парам объектов приписывались значения, равные +1 и —1, в соответствии с тем, находились ли их ранги в полном соответствии друг с другом или нет. Если они связаны, то мы должны приписать им нулевую оценку, т. е. серединное значение между двумя этими величинами, которых следовало бы ожидать, если бы ооъекты не были связаны. Теперь легко определить величину При этом существуют две возможности: а) взять в качестве знаменателя б) заменить При отсутствии связей любое Если наблюдается связь
для связей в одной последовательности рангов и
для связей в другой последовательности. Теперь альтернативная форма коэффициента
До обсуждения других альтернативных форм рассмотрим простой пример. Пример 3.1 Пусть заданы две последовательности рангов:
Если не принимать во внимание связи, то обе последовательности имеют один и тот же порядок, корреляция здесь высокая. Рассматривая первый член в связи с остальными девятью, находим, что его вклад в
Если мы принимаем для определения
В соответствии с альтернативой
и для последовательности В:
Отсюда
Во всех случаях значения 3.5. Исходя из общих соображений, развитых в гл. 2, приемлемой формой коэффициента — действительной меры корреляции между двумя рядами шеел — является Предположим, что обе последовательности совпадают, последним членом каждой из них является
откуда
Следовательно, поскольку оценка равна здесь
При больших 3.6. Однако могут встречаться случаи, когда та будет представлять собой лучший измеритель, чем Рассмотрим случай, когда одна наша последовательность представлена натуральным числом чисел
тогда как
Например, при По-видимому, первая величина ближе к тому, что мы должны ожидать от меры согласия для такой объективной последовательности. Исследователь не получил ни одной неправильно расположенной пары и правильно ранжировал один член ряда. Однако он не в состоянии сделать выбор между первыми девятью членами, и величина 0,22 как мера его способности представляется заслуженной. С другой стороны, если первая последовательность не объективна, а является только выражением мнения другого исследователя, причем его оценки не обладают большей надежностью, то представляется, что значение 0,47 есть хорошая мера согласия. 3.7. Есть и другой интересный подход при рассмотрении проблемы связанных рангов. Предположим, что мы имеем дело с некоторым связанным множеством, состоящим из Если мы заменим некоторое связанное множество 3.8. Обратимся теперь к рассмотрению аналогичных проблем, связанных с коэффициентом ранговой корреляции
и Тогда получим:
Прежде чем мы докажем эти формулы, рассмотрим следующий пример. Пример 3.2. Возьмем опять две последовательности из примера 3.1
В первом ряду рангов имеется четыре связанные пары
Во втором — только одно множество связей, у которого
Находим также
Отсюда на основе (3.7) получим:
и на основе (3.8)
3.9. Полезно отметить, что (3.8) может быть представлено в форме
Таким образом, если
или приближенно:
Эта формула обычно и применяется при расчете Например, используя данные примера 3.2, находим по формуле
и по формуле (3.11)
формула (3.8) дает 0,9171. Все три результата равны при округлении до второго десятичного знака. 3.10. При выводе формул (3.7) и (3.8) мы воспользовались некоторыми результатами гл. 2. В 2.6 было показано, что Для множества несвязанных рангов сумма квадратов рангов равна
где
Если
Сейчас удобно (для читателя, который пропустил гл. 2) ввести понятие дисперсии. Эта величина определяется как средний квадрат отклонении совокупности значений от их средней арифметической. Это квадрат стандартного отклонения. Таким образом, дисперсия для несвязанной последовательности равна:
где суммирование производится по
Если две величины х и у измерены в виде отклонений от их средних, то подобным же образом можно определить их ковариацию,
то
Коэффициент корреляции
Легко проверить, что для случая, когда ранги не связаны, это дает величину
Это выражение легко преобразуется в (3.8). Формулу (3.7) для 3.11. То, что было сказано выше о различных обстоятельствах, в которых могут предпочитаться Если последовательность А остается постоянной, то средняя из ковариаций, исчисленных для всех Пример 3.3 Если две последовательности идентичны, то последний член в каждой из них имеет ранг
Таким образом, из (3.7) вытекает, что
Итак, различие между двумя видами 3.12. В психологии часто сталкиваются с проблемой, которая заключается в измерении взаимосвязи между двумя качественными характеристиками, одна из которых дает возможность осуществить ранжирование, а вторая — дихотомию, или группировку на две группы (класса), в соответствии с тем, обладают ли единицы наблюдения определенным свойством или нет. Обращаемся к следующему ранжированному ряду 15 девочек
Здесь нас интересует, имеется ли связь между полом и успехом на экзамене — действительно ли мальчики в среднем получили лучшие оценки, чем девочки, или наоборот. Вообразим, что деление по полу само является некоторым ранжированием. Обследование охватило 8 мальчиков и 7 девочек. Предположим теперь, что первые 8 членов ряда, ранжированного по полу, являются связями, то же самое справедливо для следующей группы из 7 членов. Действительное значение связанных рангов в первом случае составляет
Для данных последовательностей мы можем подсчитать теперь
и
Приведенная формула является одной из полезных форм коэффициента, измеряющего взаимосвязь в таблице Пример 3.5 Вернемся к данным примера 3.4. Предположив, что никтурию можно классифицировать только как нормальную и чрезмерную, получим следующие результаты (см. табл. 3.1) Таблица 3.1
На основе этих данных имеем:
что хорошо согласуется со значением 0,41, которое было получено в примере 3.4, Применение к порядковым таблицам взаимной сопряженности3.15. Идеей, подобной той, что мы применили при анализе таблицы Таблица 3.2 Степень зоркости 3242 мужчин в возрасте 30—39 лет [93]
Нас интересует взаимосвязь между степенями зоркости правого и левого глаза. Отметим, что строки и столбцы расположены в правильной последовательности. Теперь качество зрения (его зоркость) может рассматриваться для этих целей как признак, по которому человеку может быть приписан ранг; любой человек будет иметь ранги в двух последовательностях соответственно для правого и левого глаза. Мы можем рассматривать группировку по степеням зоркости как сравнительно интенсивное связывание 3242 рангов. Так, например, первые 1053 человека «связаны» в одну группу (по зоркости правого глаза), затем следующие 782, следующие 893 и, наконец, последние 514. Значение 3.16. Для того чтобы определить такой коэффициент, нам требуется сумма
Аналогично получим отрицательные вклады, связанные с элементами таблицы, находящимися ниже и левее данного элемента; например, оценка, относящаяся к элементу, лежащему в третьем столбце и второй строке, равна:
Никакие оценки не возникают в связи с нижней итоговой строкой таблицы. Находим:
Для знаменателя
Отсюда мера взаимосвязи определяется как:
3.17. Рассмотрим в качества меры взаимосвязи альтеонативный вариант—коэффициент та, который обладает одним весьма нежелательным свойством (разделяемым и некоторыми другими коэффициентами сопряженности), а именно коэффициент не может достигнуть единицы, если таблица не содержит равное число строк и столбцов. Для случаев, когда связи относительно редки, это не является серьезной помехой, однако для существенно связанных последовательностей может оказаться предпочтительнее применение коэффициента, который удовлетворяет этому условию Возьмем максимальную оценку, которую можно получить для
Когда
Отсюда немедленно следует:
В нашем примере
в то время как ранее была получена величина 3.18. Для таблицы с одинаковым числом строк и столбцов (как, например, в таблице
Знаменатель
отсюда БиблиографияСм. [96], [18], [118], [51], [52], [82], [114], [6]. Приложение к таблицам сопряженности признаков см. [58, vol. 2, ch. 32]. Другой тип коэффициентов
|
1 |
Оглавление
|