6.3.3. Алгоритм наименьшей среднеквадратичной ошибки
Алгоритм, построенный в п. 6.3.2, аппроксимирует плотность распределения в смысле минимизации абсолютной величины расхождения. С тем же успехом для построения алгоритма обучения можно воспользоваться аппроксимацией по критерию наименьшей среднеквадратичной ошибки (НСКО). Рассмотрим функцию критерия
Эта функция также, как и требуется, достигает минимума при правильной классификации всех образов.
Взяв частную производную функции критерия по вектору весов , получим
Положив и подставив эту функцию в общее выражение (6.3.8) для алгоритма, получим
где начальное значение весового вектора выбирается произвольным образом, а равно 1 или 0 в зависимости от того, входит образ в класс или нет. Отметим, что этот алгоритм также на каждом шаге итерации корректирует значения вектора весов но величины этих коррекций отличаются от коррекций, вводимых алгоритмом из множителями . НСКО-алгоритм сходится к решению, минимизирующему функцию критерия (6.3.16), при выполнении следующих условий (Блейдон [1967]):
1) элементы последовательности удовлетворяют условиям (6.2.5);
2) математические ожидания существуют и положительно определены;
3) математические ожидания существуют.
При разделении двух классов уравнение (6.3.18) принимает вид
где начальное значение вектора весов произвольно. Следует иметь в виду, что формулировка алгоритма предполагает, что решения принимаются на основе правила сформулированного в (6.3.15).
Пример. Решим тот же пример из воспользовавшись НСКО-алгоритмом. Пополненные образы образуют классы .
Положим и применим алгоритм (6.3.19); получим
На следующем шаге . Поэтому
Легко убедиться в том, что следующем шаге поскольку образ принадлежит классу так что
Рис. 6.5. Разделяющая граница, найденная с помощью метода наименьшей среднеквадратичной ошибки.
Продолжая эту процедуру и проверяя после каждого шага итерации правильность классификации всех образов с помощью
нового вектора весов, мы обнаруживаем, что НСКО-алгоритм сходится при определив вектор весов
Как и в предыдущем примере, разделяющая граница определяется уравнением т. е.
Образы, использованные в этом примере, и соответствующие разделяющие поверхности приведены на рис. 6.5.