18.4. Использование дополнительных (иллюстративных) переменных и объектов
При использовании методов РАД существует опасность обнаружить в данных такие структуры, которые связаны, скорее, со спецификой данной выборки, но в силу ее недостаточного объема не отражают каких-либо устойчивых закономерностей в генеральной совокупности. В случае, когда исследуемое множество объектов само представляет собой всю генеральную совокупность, такой проблемы не возникает, однако если результаты, полученные при изучении выборки, будут использоваться для работы с объектами, не входящими в нее, проблема становится серьезной.
Конечно, можно надеяться, что этап «подтверждающего анализа» должен отсеять неправомерные со статистической точки зрения выводы. Однако некоторые возможности такого отсева существуют и в РАД. Один из приемов, применяемый с этой целью, состоит в разделении объектов и переменных на две части — активные (объекты, переменные) и иллюстративные, экзаменующие. Разделение объектов на «обучение» и «экзамен» широко используется в дискриминантном (см. гл. 3) и регрессионном анализе. Использование иллюстративных переменных менее распространено. Применение иллюстративных переменных в кластер-анализе описано в § 12.4.
Помимо проверки устойчивости выделенных структур, использование дополнительных элементов помогает и в интерпретации результатов РАД.