Дискриминантный анализ.
Выработка правила, позволяющего приписать некоторый элемент к одной из двух групп, является основной задачей дискриминантного анализа. При такой постановке вопроса должны иметься значения переменных для индивидуумов, полученные в результате наблюдений. Кроме того, должна быть известна принадлежность каждого индивидуума к одной из двух групп. К какой из этих двух групп теперь относить новые индивидуумы исходя из имеющейся информации? Вопрос упирается в подбор такой линейной комбинации переменных, которая бы оптимально разделила обе группы. В геометрических терминах задача сводится к определению положения новой оси Т, удовлетворяющего следующему условию: проекции индивидуумов двух заранее известных групп должны казаться возможно более разделенными. На рис. 2.12 графически представлено решение проблемы разделения в случае двух переменных и двух групп. Ни вдоль оси переменной ни вдоль оси переменной нельзя произвести разделение обеих групп, хотя в действительности индивидуумы обеих групп различны между собой. Надо найти такое положение новой оси Т, чтобы обе группы в проекции на нее казались бы полностью разделенными. Более подробноописание дискриминантного анализа имеется, например, у Линдера [190; 2], Коллера [176; 3], Андерсона и Бэнкрофта [6], Кендэла [172; 1], Кендэла и Стьюарта [173], Кули и Лонза [62], а также Андерсона [5; 4].
Процедура расчетов не ограничивается двумя группами индивидуумов, ее можно распространить на несколько групп в -мерном пространстве.
Существенное отличие от факторного анализа заключается в том, что в дискриминантном анализе определяется разделение точек, причем заранее уже известно, какие точки к какой группе должны относиться. С помощью факторного анализа в принципе такие группы можно найти.
Рис. 2.12. Геометрическая интерпретация задачи дискриминантного анализа. Проекции точек на оси дают два накладывающихся друг на друга распределения. При проекции точек на ось Т распределения обеих групп точек полностью разделены
Обычно в факторном анализе переменные рассматриваются как точки; при использовании так называемой -техники расчета (см. гл. 8.1) оси меняются и точками становятся индивидуумы. Скопление точек на рис. 2.12 неоднородно, оно состоит из двух различных облаков. Такие неоднородности оказывают влияние на коэффициенты корреляции и могут проявиться в виде факторов, как это будет показано ниже.
Из всего вышесказанного ясно, что дискриминантный анализ определенным образом связан с проблемой вращения, в которой также идет речь об установлении нового положения осей. При применении метода вращения, однако, заранее не известно, какие точки связаны друг с Другом. По-видимому является целесообразным при нахождении групп комбинировать оба метода.