14.6. Пример: классификация лейкоцитов
На рис. 14.1 изображена диаграмма разброса значений двух признаков для изображений, полученных с помощью микроскопа. Данные взяты для образцов пяти обычных типов белых кровяных телец. Центроиды кластеров выделены подчеркиванием в каждом конкретном классе. Штриховые линии — это оптимальные границы между классами.
Ясно, что классификация только по этим двум признакам ненадежна. Необходимо ввести дополнительные признаки. Можно было бы, например, измерить яркость отдельных участков подкрашенных клеток в различных диапазонах спектра. Эти признаки сами по себе также не обеспечивают надежной классификации (рис. 14.2). Впрочем, можно построить четырехмерное пространство для всех четырех только что
Рис. 14.2. (см. скан) Диаграмма разброса яркостей цитоплазмы и ядра, измеренных через два различных фильтра. Центроиды отмечены подчеркиванием, штриховые линии показывают оптимальные границы между классами. Ясно, что надежная классификация, использующая только эти два признака, невозможна. (Перепечатано из работы [487].)
рассмотренных признаков. В результате показанные здесь образцы можно разбить на классы гиперплоскостями.