Главная > Факторный, дискриминантный и кластерный анализ
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

КЛАССИФИКАЦИЯ с помощью КАНОНИЧЕСКИХ ДИСКРИМИНАНТНЫХ ФУНКЦИИ

Классификация может быть проведена и с помощью канонических дискриминантных функций вместо использования исходных дискриминантных переменных. При этом применяются те же формулы (лишь заменяется X на ) и результаты классификации обычно бывают идентичными.

Если необходимо классифицировать большое число объектов методом расстояния и вероятностей, то, воспользовавшись дискриминантными функциями, можно значительно сократить количество работы. Вместо вычисления расстояний для переменных нам нужны только q канонических дискриминантных функций. Для этого обычно требуется меньшее число операций (даже с учетом вычисления самих функций). Однако если мы пользовались простыми классифицирующими функциями, то применение канонических дискриминантных функций повлечет за собой увеличение объема работ.

При определенных условиях употребление канонических дискриминантных функций приведет к несовпадению результатов классификаций (имеется в виду простая классифицирующая функция. - Примеч. ред.). Одним из таких условий является неравенство ковариационных матриц классов. Это происходит потому, что процедура получения канонических дискриминантных функций должна использовать внутригрупповую матрицу ковариаций, являющуюся взвешенным средним матриц ковариаций для отдельных классов. В данном случае преобразование не будет точным. К сожалению, нельзя указать, как сильно должны различаться матрицы классов, чтобы применение дискриминантных функций стало недопустимым.

Татсуока (1971; 232—233) описывает случай, когда процедура, использующая канонические дискриминантные функции, давала почти такие же результаты и ее можно было повторять до тех пор, пока ковариационные матрицы классов не становились «решительно» различными.

Другая ситуация, в которой две процедуры могут давать разные результаты, возникает, когда одна или несколько канонических функций игнорируются, так как не являются статистически значимыми. Хотя в этом примере некоторые объекты могут быть классифицированы по-разному, результаты, полученные с помощью канонических дискриминантных функций, будут более точными, поскольку уменьшается влияние выборочных флуктуаций.

Бардес в своем исследовании прибегла лишь к двум из трех дискриминантных функций и не делала никаких попыток привлечь априорные вероятности. Полученные ею данные показывают, что (позиция Айкена | группа 1) = 0,064. Это очень маленькая вероятность, отражающая положение позиции Айкена на самом краю группы 1. Вероятности для всех других групп, по существу, равны нулю. Поэтому мы отнесем позицию Айкена к группе 1, что согласуется с результатами, найденными с помощью простых классифицирующих функций. Возвращаясь к рис. 2, мы видим, что позиция сенатора Айкена, очевидно, находится ближе всего к центроиду группы 1 (крайняя правая точка внутри группы 1).

Теперь рассмотрим подробнее два объекта из группы 1, которые находятся почти на полпути от центроида группы 1 к центроиду группы 4. Этим объектам соответствуют позиции сенаторов: справа — Кейпхарта (республиканца, штат Индиана), слева — Ноуланда (республиканца, штат Калифорния). Здесь (группа 1 | позиция Кейпхарта) = 0,262, но (группа 41 позиция Кейпхарта) = 0,738. Отсюда следует, что, судя по результатам голосования, позиция Кейпхарта ближе к группе 4, несмотря на то, что первоначально на основе данных из первичного источника, Бардес отнесла его к группе 1. Для Ноуланда вероятность принадлежности его позиции к группе 1 равна 0,538, а к группе . Эти вероятности настолько близки, что нам трудно отдать предпочтение одной из них. Если объект находится на разграничительной линии, то иногда бывает желательным считать его неопределенным и неклассифицируемым. В действительности Бардес пересмотрела данные первичного источника о позиции Ноуланда и пришла к заключению, что они недостаточно определены, чтобы отнести позицию к какой-либо группе. Поэтому она исключила Ноуланда из дальнейшего анализа. Кроме того, были еще раз рассмотрены данные о Кейпхарте и решено, что его позиция лучше всего соответствует группе 4. Проделав эти исправления, Бардес вновь провела анализ и приступила к классификации позиций всех сенаторов уже с помощью новых дискриминантных функций.

1
Оглавление
email@scask.ru