Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике РезюмеМетоды выделения однородных групп объектов, иначе именуемые классификацией, условно объединяются в вероятностный, вариативный и структурный, иначе именуемый геометрическим, подходы. Исходные данные в задачах классификации могут быть представлены в виде матрицы именуемой матрицей «объект-признак», где представляет собой значение признака на объекте исследуемой совокупности объектов а также в виде матриц попарных расстояний или мер близости имеющих общее обозначение где величина характеризует отдаленность или близость объектов исходного множества и именуемых матрицами «объект-объект». Таким образом, при интерпретации объектов как точек в соответствующем пространстве признаков задача классификации заключается в разделении совокупности точек в пространстве на однородные классы таким образом, чтобы точки, принадлежащие одному классу, находились бы относительно близко друг от друга, а сами классы различались бы между собой. Полученные в результате разбиения группы именуются кластерами, классами, образами или таксонами, а методы их обнаружения соответственно называются кластерным анализом, автоматической классификацией, распознаванием образов с самообучением или численной таксономией. Методы автоматической классификации условно объединяются в эвристическое, иерархическое, оптимизационное и аппроксимационное направления, причем иерархические методы, в свою очередь, условно делятся на агломеративные и дивизимные методы. Любой задаче классификации зачастую оказывается свойственна нечеткость, значительно затрудняющая или вообще делающая невозможным получение решения. Понятие нечеткости является общенаучным и может быть определено как внешнее выражение качества внутренней основы явлений, специфика которого заключается в непрерывности перехода от отсутствия проявления к полному выявлению качества предметов, свойств и отношений реального мира, что находит свое отражение в познавательной и мыслительной деятельности индивида. При анализе форм нечеткости, свойственной процессу анализа данных, более уместным представляется использование понятия неопределенности, под которой следует понимать нечеткость соответствия математической постановки задачи анализа данных предметно-содержательной установке на цели исследования и исходным данным. Основными видами неопределенности в задачах автоматической классификации являются неопределенность целей исследования, включающая такие формы, как неясность и неточность, неопределенность характера результатов исследования, формами проявления которой являются неопределенность формы и взаимного расположения кластеров, неоднозначность числа кластеров и размытость природы искомой классификации, а также неопределенность как характеристика исходных данных, имеющая такие формы, как, опять же, неоднозначность числа кластеров, неоднозначность числа объектов исследуемой совокупности и неоднозначность, неточность либо неполнота значений в матрице исходных данных. Каждому из рассмотренных видов и форм неопределенности в задачах автоматической классификации соответствует определенная методология ее формализации или устранения. Краткое логико-гносеологическое рассмотрение вопроса о возможности применения теории нечетких множеств к решению задач кластер-анализа показывает, что эта теория оказывается гибким инструментом для представления данных, когда исходная структура оказывается нечеткой, и более адекватным аппаратом для представления непрерывных кластеров, чем теория вероятностей; кроме того, теория нечетких множеств позволяет воспроизводить человеческий подход к проблеме классификации и открывает богатые возможности для естественной интерпретации результатов процесса классификации. На содержательном уровне нечеткая модификация задачи автоматической классификации может быть сформулирована следующим образом: представить исходное множество объектов, структура которого характеризуется размытостью и информация о котором задана в виде матрицы «объект-свойство» или матрицы «объект-объект», заранее известным либо нет числом однородных, в некотором смысле, нечетких классов, адекватным образом. Адекватность представления исследуемой совокупности объектов нечеткими классами определяется целями исследования, видом искомой структуры классификации и содержательными рассмотрениями проблемы классификации в каждом конкретном случае.
|
1 |
Оглавление
|