6.2. Общая схема решения задачи автоматической классификации в рамках модели смеси распределений (сведение к схеме дискриминантного анализа)
Базовая идея, лежащая в основе принятия решения, к какой из k анализируемых генеральных совокупностей отнести данное классифицируемое наблюдение
, состоит в том, что наблюдение следует отнести к той генеральной совокупности, в рамках которой оно выглядит наиболее правдоподобным. Другими словами, если дано точное описание (например, в виде функций
плотности в непрерывном случае или полигонов вероятностей в дискретном) конкурирующих генеральных совокупностей, то следует поочередно вычислить значения функций правдоподобия для данного наблюдения X в рамках каждой из рассматриваемых генеральных совокупностей (т. е. вычислить значения
, и отнести X, к тому классу, функция правдоподобия которого максимальна.
Если же известен лишь общий вид функций
, описывающих анализируемые классы, но не известны значения, вообще говоря, многомерных параметров
и если при этом располагают так называемыми обучающими выборками, то данный случай лежит в рамках параметрической схемы дискриминантного анализа и порядок действий будет следующим (см. гл. 2 и 3): сначала по
обучающей выборке оцениваем параметр
а затем производим классификацию наблюдений, руководствуясь тем же самым принципом максимального правдоподобия, что и в случае полностью известных функций
.
В схеме автоматической классификации, опирающейся на модель смеси распределений, как и в схеме параметрического ДА, задающие искомые классы функции
также известны лишь с точностью до значений параметров. Но в схеме автоматической классификации неизвестные значения параметров
так же, впрочем, как и параметров
оцениваются не по обучающим выборкам (их нет в распоряжении исследователя), а по классифицируемым наблюдениям
с помощью одного из известных методов статистического оценивания параметров (метода максимального правдоподобия, метода моментов или какого-либо другого; см. о процедурах статистического оценивания параметров смеси в § 6.4). Начиная с момента, когда по выборке (6.7) сумели получить оценки
неизвестных параметров
модели (6.6) или
снова имеем схему дискриминантного анализа и собственно процесс классификации наблюдений (6.7) производим точно так же, как и в схеме параметрического ДА (т. е. относим наблюдение
к классу с номером
если
Итак, главное отличие схемы параметрического ДА от схемы автоматической классификации, производимой в рамках модели смеси распределений, - в способе оценивания неизвестных параметров, от которых зависят функции, описывающие классы. Но оценивание параметров в модели смеси-процесс неизмеримо более сложный, чем оценивание параметров по обучающим выборкам.