1.3. Два класса, заданные генеральными совокупностями
В параграфе рассматривается случай, когда классы описаны путем указания всех входящих в них наблюдений. Введенные ранее понятия — такие, как отношение правдоподобия, различные характеристики качества классификации, могут быть определены и в этом случае. Для описываемых ниже правил классификации подход с явным указанием возможных наблюдений более естествен. Эти правила (см. п. 1.3.2 — 1.3.5) не опираются прямо на отношение правдоподобия, но в простых случаях дают хорошее приближение к решающему правилу, построенному на его основе. Интерпретируемость полученных формул классификации часто служит залогом их успешною применения.
В этом смысле выделяются древообразные алгоритмы (см. п. 1.3.2), методы поиска характерных закономерностей (см. п. 1.3.4) и определение областей компетентности нескольких правил (см. п. 1.3.5).
1.3.1. Вычисление основных показателей.
С целью большей преемственности обозначении с последующими главами зададим классы с помощью последовательности пар
где
— вектор возможного значения наблюдения, а
если
принадлежит первому классу, и
если второму. Будем считать также, что новые наблюдения извлекаются наудачу и независимо друг от друга из ряда (1.46). Таким образом, априорная вероятность гипотезы
функция распределения X при гипотезе
будет
где
. Использованная при суммировании запись
означает, что для всех
имеем
. Отношение правдоподобия в точке X
Ряд излагаемых ниже методов опирается на функции потерь, введенные в п. 1.1.4. Они легко могут быть оценены по ряду (1.46). Так, например, определенная с помощью формул (1.31) и
вероятность ошибочной классификации запишется
В дальнейшем будем широко оперировать понятием условного математического ожидания, каждый раз подразумевая, что читатель самостоятельно может перейти от формулы типа (1.31) к (1.31").