4.4.1. Определения и обозначения
Понятие последовательности наблюдений было дано выше. Предполагается, что каждый член последовательности принадлежит точно одному из
классов. Существенное отличие от некоторых из наших предыдущих рассмотрений состоит в том, что считается, что никогда два класса не могут породить одинаковое наблюдение. Ранее мы предполагали только, что каждый класс характеризуется вероятностью, связанной с каждой точкой пространства описаний, а теперь требуем, чтобы каждая точка
относилась к единственному классу. Вместо правила обучения для последовательности
мы построим правило для
где
— это
-мерный вектор, полученный из
добавлением 1 в качестве
компоненты. Будем говорить, что
принадлежит классу
если
— описание объекта из класса
Очевидно, что правило для классификации
будет также классифицировать и
Классы называются отделимыми, если существует такое множество функций
что
тогда и только тогда, когда
принадлежит классу
Классы называются линейно отделимыми, если эти функции линейны:
Отметим, что это по существу те же определения, что и наши прежние определения отделимости и линейной отделимости, лишь с соответствующими изменениями в обозначениях. Если верно (71), то правило классификации
можно задать
-матрицей, строки которой представляют собой векторы
Тогда (71) удобно записать в виде скалярного произведения
Вообще говоря, уравнениям (70) и (71) удовлетворяет бесконечно много матриц
. В этом разделе мы будем предполагать, что некоторая матрица
существует (если явно не оговорено противное). Наша задача — показать, что определенные правила обучения приводят к удовлетворительному правилу классификации
Случай
особенно интересен по трем причинам: (1) он допускает подробный анализ, (2) часто встречается на практике и (3) это частный случай, к которому можно свести общий случай при
Предположим, что по крайней мере одно множество линейных функций
удовлетворяет уравнениям (70) и (71). Тогда разделяющая функция
существует и равна
Поэтому неравенство
справедливо тогда и только тогда, когда
принадлежит классу 1. Обозначим через и множества векторов, принадлежащих соответственно классам 1 и 2, и пусть
Неравенство