Главная > Методы анализа данных. Подход, основанный на методе динамических сгущений
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

7.8. ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ

7.8.1. Определение новых семейств

Дискриминантный типологический анализ, начинающийся с априорного разбиения приводит к разбиению -классов которого определяются с помощью дискриминантных факторов (согласно функции т. е. Затем производят интерпретацию каждого класса (по отношению к типам, имеющимся априори), отсюда получают разбиение на классов может быть отлично от Каждый класс этого разбиения: совпадает с некоторым классом разбиения или содержится в некотором классе разбиения или, наконец, является объединением нескольких классов или подклассов разбиения

Дискриминантный типологический анализ, начинающийся с разбиения приводит к разбиению на классов. Классы разбиения которые остаются устойчивыми в процессе работы алгоритма, сохраняются. Другие классы преобразуются в более однородные. Возможно, что число дискриминантных осей при этом меняется.

Наконец, исходя из априорного разбиения множества на классов получают разбиение множества на классов и размерность такие, что:

классы допускают содержательную интерпретацию специалистом (возможно, что некоторые классы для этого подвергаются дискриминации второго уровня, см. 7.8.3);

устойчивость разбиения при дискриминантном типологическом анализе удовлетворительна. В частности, представительство индуцирует разбиение мало отличное от иначе говоря, представительство позволяет определить разбиение с помощью функции назначения

Разбиению множества соответствует его разбиение на категорий или форм, полученных из априорных семейств и выборки из которых разделены с помощью решающего правила определенного ниже.

7.8.2. Решающее правило R

Пусть и

Объект относятк семейству если

Имеем

Отсюда выводим согласно 7.3.3, что по правилу объект должен быть отнесен к семейству, центр которого является самым близким к нему (в смысле метрики в проекции (-ортогональной) на векторное подпространство порожденное отлично, следовательно, от классического линейного решающего правила).

Правило может быть дополнено визуализацией проекции классифицируемого объекта на подпространство порожденное В самом деле, проекция объектов из на позволяет определить граничные зоны между классами следовательно, между семействами Для объекта х, проекция которого на принадлежит граничной зоне, решающее правило ненадежно. В этом случае специалист может решить, куда отнести принимая во внимание апостериорный риск плохой классификации.

Можно также определить зону отказа от принятия решения, если специалист считает, что на стадии анализа предпочтительнее создать семейство нерасклассифицированных объектов, чем провести ненадежную классификацию и тем самым сильно увеличить риск. Этот прием особенно уместен в медицинских приложениях, где ошибка классификации может иметь весьма серьезные последствия, а плата за нее не может быть выражена в цифрах.

Решающее правило должно хорошо работать на экзаменационной выборке, т. е. на множестве объектов, не участвовавших в построении относительно которых точно известно, к какому семейству они принадлежат.

Использование правила оправдано для разбиения на категории, полученные в итоге дискриминантного типологического анализа, поскольку оно строится на основании результатов этого метода. Более того, это правило простое, непараметрическое и имеет то преимущество, что не подвержено влиянию шумовых параметров. В то же время дискриминантный типологический анализ можно рассматривать как метод дескриптивного и конструктивного (построение нового разбиения) дискриминантного анализа, а на стадии принятия решения применять правило Байеса.

7.8.3. Второй уровень дискриминации

Если специалист считает, что разбиение множества слишком агрегировано, то он может реализовать второй уровень дискриминации. Для каждой категории являющейся объединением семейств которые необходимо выделить, реализуют локальный дискриминантный анализ, в котором изучаемая популяция, а априори заданные семейства. Решающее правило представляется глобально в форме дерева.

1
Оглавление
email@scask.ru