7.1.2. Отсрочка в обосновании априорного разбиения на семейства
Задание априорного разбиения выборочной совокупности
основано на гипотезе о структуре данных. Желательно уметь выделять это разбиение локально, чтобы учитывать бесспорно однородные группы объектов. В многочисленных случаях возможность такого априорного разбиения допускают по разным причинам.
а) Поставленная задача может изучаться в соответствии с разными подходами. Например:
в контроле качества продукции типы продукции могут быть выделены априори из-за дефектов функционирования или дефектов производства (см. обработку банка промышленных данных в гл. 8);
в естественных науках к исследованию подходят с различных позиций — физики, химии, биологии
в медицине различают симптомы, причины, лечение и т. д.
Априорное выделение типов приводит к разбиению совокупности
(на непересекающиеся классы), которое и определяет, вообще говоря, выбор подхода к задаче дискриминантного анализа. Если это не так, то приходится увеличивать число классов. Полученное при этом разбиение иногда субъективно, и, естественно, возникает желание иметь метод, допускающий отсрочку в окончательном выборе этого разбиения. В самом деле, возможно, что группа индивидуумов
однородная и (или) изолированная в выборочной совокупности
и отличная от каждого априорного класса, сможет получить интерпретацию при другом подходе.
б) Границы классов, определенных априори, могут быть произвольными (определяемыми порогами) или неточными. Например, при двух классах типа «присутствие — отсутствие» может не существовать объективной и точной границы. Определение априорных классов зависит, например, от выбора числового порога, если изучаемые данные получены в результате измерения, либо классификация индивидуумов в частности, выборочной совокупности) является результатом экспертной оценки. В последнем случае классификация может зависеть от эксперта и даже от порядка появления индивидуумов.
По этим причинам метод должен допускать отсрочку в окончательном задании границ классов. А именно может оказаться, что априорное разбиение слишком детальное, или, наоборот, слишком грубое в том смысле, что в граничных зонах между классами желательно ввести новые классы (которые, возможно, следует назвать «неопределенными»).
Когда априорное разбиение также спорно, предпочитают, вообще говоря, заменять дискриминантный анализ анализом главных компонент [2] или соответствий [11, а также классификацией. Но при таком подходе дискриминантные (или частично дискриминантные) параметры априорных классов и шумовые переменные имеют одинаковые веса. Априорные семейства при этом могут стать плохо распознаваемыми, и приходится сделать вывод, что признаки, характеризующие объекты
не позволяют их классифицировать. Например, известно, что факторный дискриминантный анализ (ФДА) [81 дает лучшее, чем анализ главных компонент (АГК), разделение априорных классов. В самом деле, ФДА сгущения объектов, разделяемых на К классов, эквивалентен АГК сгущения
центров тяжести классов (с метрикой определяемой матрицей, обратной к матрице ковариаций параметров) (111. Оси минимальной инерции сгущения
которые несут мало информации с точки зрения дискриминации, могут быть осями с большой дисперсией сгущения
В этом случае они будут мешать распознаванию априорных классов.