Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Глава 8. Таксономические образы8.1. Логика таксономических образовКогда Карл Линней писал, что основная работа таксономиста состоит в разделении и обозначении — т. е. в разбиении на классы, семейства, порядки и присваивании им названий — он подчеркивал различие или несходство особей. В абстрактной формулировке, если особи представлены элементами Вопрос о том, как построить такие разбиения опорного пространства X, приобретает смысл, только когда мы задаем логическую структуру, посредством которой разбиения можно определить и проанализировать. Один из способов сделать это — задать множество Естественно, что такие описания, т. е. В, обычно стремятся сделать простыми. Например, мы можем потребовать, чтобы В состояли только из конъюнкций некоторых
где Это и есть логика признаков, введенная автором. Она позволяет построить математическую основу для анализа таких понятий, как кластеризация, размер кластера, разделенность кластеров. Она позволяет также придать точный смысл такому понятию, как «наиболее эффективная кластеризация для заданной вероятностной меры», т. е. сформулировать критерий эффективности так: «какое множество Е для заданного размера кластера обладает максимальной вероятностью?» Это задача об изопериметрической кластеризации, заслуживающая тщательного изучения. Мы не будем здесь этого делать, лишь выскажем следующую догадку. Мы думаем, что в примере, приведенном выше, если Перейдем теперь к иной, дополняющей предыдущую точке зрения: вместо разделения X на очень несхожие множества попытаемся установить связи между очень сходными элементами
Рис. 8.1.1 Для этого необходима, конечно, какая-то мера сходства между х и у, но в общем случае задать глобальную меру сходства нелегко. Чтобы найти подход к этой проблеме, рассмотрим ситуацию, изображенную на рис. 8.1.1, где для простоты мы выбрали Другими словами, мы устанавливаем родственность особей (объектов) цепным рассуждением. Цепь состоит из набора объектов, линейно упорядоченных и таких, что последовательные расстояния равны, самое большее, Этот тип цепного рассуждения основан на допущении о том, что «природа не делает скачков», т. е. вид состоит из особей, связанных друг с другом непрерывно, без скачкообразных переходов. Если отсутствуют надежные филогенетические данные, то некоторый принцип такого сорта представляется необходимым. Если
Рис. 8.1.2 Если X отлично от Следует заметить, что можно начать с пространства признаков очень высокой размерности и заменить его проекцией в пространство более низкой размерности, содержащее только существенные признаки, скажем определенные линейные комбинации исходных признаков. Такое сведение иногда можно получить анализом главных компонент. Во всяком случае, далее мы будем предполагать, что такое сведение уже сделано. Предположим теперь, что в X (пусть для простоты это опять будет вероятности этого события в качестве меры отсутствия родственности между и и Рассматривая различные пути, соединяющие и и
|
1 |
Оглавление
|