Главная > Методы анализа данных. Подход, основанный на методе динамических сгущений
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

7.1.2. Отсрочка в обосновании априорного разбиения на семейства

Задание априорного разбиения выборочной совокупности основано на гипотезе о структуре данных. Желательно уметь выделять это разбиение локально, чтобы учитывать бесспорно однородные группы объектов. В многочисленных случаях возможность такого априорного разбиения допускают по разным причинам.

а) Поставленная задача может изучаться в соответствии с разными подходами. Например:

в контроле качества продукции типы продукции могут быть выделены априори из-за дефектов функционирования или дефектов производства (см. обработку банка промышленных данных в гл. 8);

в естественных науках к исследованию подходят с различных позиций — физики, химии, биологии

в медицине различают симптомы, причины, лечение и т. д.

Априорное выделение типов приводит к разбиению совокупности (на непересекающиеся классы), которое и определяет, вообще говоря, выбор подхода к задаче дискриминантного анализа. Если это не так, то приходится увеличивать число классов. Полученное при этом разбиение иногда субъективно, и, естественно, возникает желание иметь метод, допускающий отсрочку в окончательном выборе этого разбиения. В самом деле, возможно, что группа индивидуумов однородная и (или) изолированная в выборочной совокупности и отличная от каждого априорного класса, сможет получить интерпретацию при другом подходе.

б) Границы классов, определенных априори, могут быть произвольными (определяемыми порогами) или неточными. Например, при двух классах типа «присутствие — отсутствие» может не существовать объективной и точной границы. Определение априорных классов зависит, например, от выбора числового порога, если изучаемые данные получены в результате измерения, либо классификация индивидуумов в частности, выборочной совокупности) является результатом экспертной оценки. В последнем случае классификация может зависеть от эксперта и даже от порядка появления индивидуумов.

По этим причинам метод должен допускать отсрочку в окончательном задании границ классов. А именно может оказаться, что априорное разбиение слишком детальное, или, наоборот, слишком грубое в том смысле, что в граничных зонах между классами желательно ввести новые классы (которые, возможно, следует назвать «неопределенными»).

Когда априорное разбиение также спорно, предпочитают, вообще говоря, заменять дискриминантный анализ анализом главных компонент [2] или соответствий [11, а также классификацией. Но при таком подходе дискриминантные (или частично дискриминантные) параметры априорных классов и шумовые переменные имеют одинаковые веса. Априорные семейства при этом могут стать плохо распознаваемыми, и приходится сделать вывод, что признаки, характеризующие объекты не позволяют их классифицировать. Например, известно, что факторный дискриминантный анализ (ФДА) [81 дает лучшее, чем анализ главных компонент (АГК), разделение априорных классов. В самом деле, ФДА сгущения объектов, разделяемых на К классов, эквивалентен АГК сгущения центров тяжести классов (с метрикой определяемой матрицей, обратной к матрице ковариаций параметров) (111. Оси минимальной инерции сгущения которые несут мало информации с точки зрения дискриминации, могут быть осями с большой дисперсией сгущения В этом случае они будут мешать распознаванию априорных классов.

1
Оглавление
email@scask.ru