ПРИЛОЖЕНИЕ К ГЛАВЕ X. ЗАДАЧА ТАКСОНОМИИ
§ П.1. Задача классификации объектов
Пусть требуется разбить множество объектов
на такие подмножества
чтобы были выполнены следующие два условия:
1) подмножества не пересекались, т. е.
2) любой элемент из попадал в одно из подмножеств т. е.
и при этом каждое подмножество состояло лишь из «наиболее похожих элементов».
Иначе говоря, требуется при выполнении ограничений минимизировать некоторый функционал, заданный на множестве всех разбиений множества X и отражающий понятие качества разделения множества
Подмножества элементов являющиеся оптимальным решением такой задачи, называются таксонами, а сама задача разделения множества X на подмножества — задачей таксономии.
Таким образом, проблема состоит в том, чтобы выписать функционал, отражающий наши представления
о качестве разбиения множества, и найти разбиение, доставляющее минимум этому функционалу.
Проблема построения функционала является неформальной — каждый исследователь определяет свое понимание оптимального решения. Тем не менее существует «естественное» определение качества решения для частной постановки задачи таксономии — разбиения исходного множества X на заранее указанное число таксонов
В этом случае определяется число которое ставит в соответствие каждому подмножеству степень близости его объектов. С помощью величин образуется функционал
В теории таксономии приняты следующие характеристики близости объектов множества
1) средний квадрат уклонения от центра тяжести множеств
где число элементов множества центр тяжести множества элементы множества X,
2) средний квадрат уклонения между элементами множества
3) величина определителя матрицы рассеяния векторов множества
С помощью этих характеристик образуются функционалы
Здесь — определитель матрицы Существуют и другие функционалы, отражающие различное понимание качества решения частной задачи таксономии (число таксонов задано заранее). Эти функционалы приведены в работах [1, 2, 19].
Что же касается общей задачи таксономии (где число таксонов заранее неизвестно), то здесь нет достаточно широко принятых определений качества таксономии,