Главная > Факторный, дискриминантный и кластерный анализ
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

РЕКОМЕНДАЦИИ ПО СОСТАВЛЕНИЮ ОТЧЕТОВ ОБ ИССЛЕДОВАНИЯХ, ИСПОЛЬЗУЮЩИХ КЛАСТЕРНЫЙ АНАЛИЗ

Цель нашей работы — помочь потенциальному пользователю освоить кластерный анализ и познакомить его с многообразием методов, литературой, программным обеспечением и терминологией. Надеемся, что после ее прочтения, специалисты смогут оценить достоинства и недостатки различных подходов и методов классификации. Здесь рассматриваются те проблемы и способы их устранения, о которых должен знать каждый пользователь программ кластерного анализа. Хотелось бы, однако, предложить несколько рекомендаций, которые вряд ли улучшат качество научных исследований, но все же дадут возможность сравнить результаты исследований, проведенных с помощью кластеризации.

1. Необходимо давать четкое описание метода кластеризации. Это поможет избавиться от жаргона в публикациях. Несомненно, одним из стандартов может служить книга Снита и Сокэл а (1973). В нашей работе мы следуем их терминологии и рекомендуем ее другим. Название метода должно сопровождаться соответствующими ссылками.

2. Необходимо четко указывать, какая мера сходства была выбрана (или статистический критерий, если используется итеративный метод). Как было показано в разд. II и III, выбор меры сходства может сильно повлиять на результат, полученный с помощью кластерного анализа. Если выбор меры сходства не указывается в сообщении, читатель не сможет определить, какое влияние оказал этот выбор на результат кластерного анализа.

3. Необходимо указывать, какой программой пользовался исследователь. Блэшфилд (1977) показал, что с помощью разных программ, работавших в полном соответствии с одним и тем же методом кластеризации и идентичными мерами сходства, были получены сильно различающиеся результаты. В Данном случае существенно отличались друг от друга формулы, по которым вычислялось евклидово расстояние. Хотя обе программы были вполне корректны, в одной из них не извлекается квадратный корень из выражения. К сожалению, при описании меры сходства в каждой программе употреблялся термин «евклидово расстояние».

4. Необходимо указать процедуры, которые применялись при определении числа кластеров. Эта рекомендация важна при попытке повторить исследование. Кроме того, очевидно, что простое утверждение: «Для анализа было выбрано решение, содержащее десять кластеров», никого не удовлетворит, пока не будут указаны причины такого выбора.

5. Необходимо привести убедительные свидетельства обоснованности решения кластерного анализа. Это, возможно, основной шаг при использование кластерного анализа и все же он редко применяется и пользователями программ метода, и потребителями отчетов.

Различные методы кластеризации приводят к разным результатам для одних в тех же данных, но следует доказать их достоверность.

Приложение.

Пример множества данных (данные о захоронениях).

С — ребенок; Т — подросток; А — взрослый; М — мужской пол; F — женский пол; N — не элитарный; Е — элитарный; 1 — присутствует; 0 — отсутствует.

1
Оглавление
email@scask.ru