4.4.1. Определения и обозначения
 
Понятие последовательности наблюдений было дано выше. Предполагается, что каждый член последовательности принадлежит точно одному из  классов. Существенное отличие от некоторых из наших предыдущих рассмотрений состоит в том, что считается, что никогда два класса не могут породить одинаковое наблюдение. Ранее мы предполагали только, что каждый класс характеризуется вероятностью, связанной с каждой точкой пространства описаний, а теперь требуем, чтобы каждая точка
 классов. Существенное отличие от некоторых из наших предыдущих рассмотрений состоит в том, что считается, что никогда два класса не могут породить одинаковое наблюдение. Ранее мы предполагали только, что каждый класс характеризуется вероятностью, связанной с каждой точкой пространства описаний, а теперь требуем, чтобы каждая точка  относилась к единственному классу. Вместо правила обучения для последовательности
 относилась к единственному классу. Вместо правила обучения для последовательности  мы построим правило для
 мы построим правило для 
 
где  — это
 — это  -мерный вектор, полученный из
-мерный вектор, полученный из  добавлением 1 в качестве
 добавлением 1 в качестве  компоненты. Будем говорить, что
 компоненты. Будем говорить, что  принадлежит классу
 принадлежит классу  если
 если  — описание объекта из класса
 — описание объекта из класса  Очевидно, что правило для классификации
 Очевидно, что правило для классификации  будет также классифицировать и
 будет также классифицировать и  
 
 
Классы называются отделимыми, если существует такое множество функций  что
 что 
 
тогда и только тогда, когда  принадлежит классу
 принадлежит классу  Классы называются линейно отделимыми, если эти функции линейны:
 Классы называются линейно отделимыми, если эти функции линейны: 
 
Отметим, что это по существу те же определения, что и наши прежние определения отделимости и линейной отделимости, лишь с соответствующими изменениями в обозначениях. Если верно (71), то правило классификации  можно задать
 можно задать  -матрицей, строки которой представляют собой векторы
-матрицей, строки которой представляют собой векторы  Тогда (71) удобно записать в виде скалярного произведения
 Тогда (71) удобно записать в виде скалярного произведения 
 
Вообще говоря, уравнениям (70) и (71) удовлетворяет бесконечно много матриц  . В этом разделе мы будем предполагать, что некоторая матрица
. В этом разделе мы будем предполагать, что некоторая матрица  существует (если явно не оговорено противное). Наша задача — показать, что определенные правила обучения приводят к удовлетворительному правилу классификации
 существует (если явно не оговорено противное). Наша задача — показать, что определенные правила обучения приводят к удовлетворительному правилу классификации  
 
Случай  особенно интересен по трем причинам: (1) он допускает подробный анализ, (2) часто встречается на практике и (3) это частный случай, к которому можно свести общий случай при
 особенно интересен по трем причинам: (1) он допускает подробный анализ, (2) часто встречается на практике и (3) это частный случай, к которому можно свести общий случай при  Предположим, что по крайней мере одно множество линейных функций
 Предположим, что по крайней мере одно множество линейных функций  удовлетворяет уравнениям (70) и (71). Тогда разделяющая функция
 удовлетворяет уравнениям (70) и (71). Тогда разделяющая функция 
 
существует и равна 
 
Поэтому неравенство 
 
справедливо тогда и только тогда, когда  принадлежит классу 1. Обозначим через и множества векторов, принадлежащих соответственно классам 1 и 2, и пусть
 принадлежит классу 1. Обозначим через и множества векторов, принадлежащих соответственно классам 1 и 2, и пусть 
 
Неравенство 
