Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
§ 2. Расстояние между разнотипными признакамиПри корреляционном и регрессионном анализах, обработке групповых экспертных оценок и в других задачах анализа данных нужно уметь измерять расстояние между признаками (столбцами таблицы). В литературе известны методы измерения расстояния между однотипными признаками. Здесь мы опишем меру, пригодную для пар как однотипных, так и разнотипных признаков. Начнем с однотипных.
Если признаки Среди многочисленных мер расстояния между двумя признаками,
измеренными в шкале порядка, своей простотой и естественностью отличается мера
Кенделла — Кемени [98,99]. Для ее определения нужно перебрать все если то если то
Если упорядочивания всех пар одинаковы, то Мера расстояния между признаками, измеренными в шкале наименований,
определяется по правилу, аналогичному предыдущему: перебираются все сочетания
пар объектов если то если то
Величина Перейдем теперь к разнотипным парам признаков. Оба признака можно сделать однотипными, если один из них «обеднить» до более слабого или второй «усилить» («оцифровать» [60]) до более сильного. Сделаем то и другое и для каждого случая найдем меру расстояния по описанным выше методам. Общую меру расстояния между двумя разнотипными признаками будем определять как среднюю величину двух этих частных расстояний. Рассмотрим пару признаков (см. табл. 6), один из которых измерен в
сильной шкале Усиление («оцифровка») шкалы порядка
Таблица 6. Пример
усиления шкалы порядка
Примечание: а — протокол в исходных шкалах;
б — протокол, упорядоченный по Затем, начиная с первого объекта таблицы, ищутся блоки инверсий, т. е.
последовательности объектов, которые начинаются объектом После этого через коэффициент корреляции вычисляем расстояние Рассмотрим сочетание признаков Таблица 7. Пример
усиления и ослабления для шкал наименований
Примечание: а — исходный протокол; б — протокол в шкале наименований; в — протокол в сильной шкале. При усилении («оцифровке») номинального признака
По полученным
числовым значениям через корреляцию вычисляется мера Наконец, для пары признаков Таблица 8. Пример
усиления и ослабления для шкал наименований
Примечание: а — исходный протокол; б — протокол в шкале наименований; в — протокол в шкале порядка (нормированных рангов). При усилении
для серии из Отметим, что все использованные преобразования входят в группы допустимых преобразований для своих типов шкал, следовательно, величины полученных расстояний также инвариантны к допустимым преобразованиям оцениваемых признаков. Усиление и ослабление шкал вносят в некотором смысле симметричное искажение (добавление и потерю информации), так что усреднение получаемых частных мер после этих процедур можно считать оправданным. Применение указанных мер расстояния между объектами и между признаками позволяет использовать все то богатство математического обеспечения, которое было разработано для анализа таблиц данных с признаками, измеренными в сильных шкалах. При этом нужно к имеющимся программам добавить семантический блок, указывающий тип шкалы данного признака, и заменить блок определения расстояния в сильных шкалах на блок вычисления соответствующей меры из набора, описанного выше.
|
1 |
Оглавление
|