Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше
Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике
Глава 5 Распознавание образов
Методы
таксономии, описанные в предыдущей главе, позволяют создать начальную
классификацию заданного множества то объектов. Эту классификацию можно
зафиксировать для будущего по-разному, в зависимости от ее назначения.
Напомним, что по классификации задач анализа данных (гл. 2, §2) задача типа 1.3.Н или задача
таксономии заключается в предсказании всех элементов нового -го (классификационного)
столбца в шкале
наименований, в котором для каждого объекта , должен быть указывай номер его таксона
(класса) . Поэтому
наиболее распространенный способ представления результата таксономии состоит в
переформировании исходной таблицы данных путем собирания в отдельные слои всех
строк
(объектов), входящих в один и тот же -й таксон.
Для
более краткого представления основного содержания такой таблицы можно
записать, например, средние значения и дисперсию характеристик объектов
каждого таксона. Можно сохранить по одному или несколько типичных
представителей (прецедентов) из каждого таксона. Можно в пространстве характеристик
описать границы, которыми таксоны отделяются друг от друга.
Любое
из таких описаний представляет собой обобщенный образ каждого класса. Если
после этого предъявляется новый объект ,
не
участвовавший в таксономии, и требуется отнести его к одному из имеющихся
классов, то нужно проанализировать характеристики объекта и распознать
образ того класса , на который
данный объект наиболее похож. Такая процедура получила в литературе по анализу
данных название
распознавание образов
и соответствует задаче типа 1.1.Н, в которой требуется предсказать один элемент
в столбце, измеренном в шкале наименований. Ее решению посвящено большое число
работ (например, [26,62,63,69,94,132,140]). На вход алгоритма распознавания
обычно подается таблица данных, которая содержит объектов , описанных характеристиками . Характеристика
измерена в
номинальной шкале и отражает результат предварительно проведенной классификации
(таксономии). Эта таблица обычно носит название обучающая
выборка.
Процесс
распознавания включает в себя два основных этапа: этап обучения и этап принятия
решения или контроля. На первом этапе алгоритм должен обнаружить закономерную
связь между значениями описывающих характеристик и значением
целевой характеристики . Эта закономерность выражается в виде
решающего правила, с помощью которого на этапе контроля по характеристикам любого
объекта
можно
принимать решение о его принадлежности к одному из имеющихся образов.