§ 4. Теоремы об останове
Пусть одновременно с построением
разделяющей гиперплоскости будет выясняться качество построенной к данному
моменту гиперплоскости. Если оно высоко, то обучение прекращается; в противном
случае обучение продолжается. Таким образом, кроме алгоритма построения
разделяющей гиперплоскости имеется алгоритм проверки качества построенной
гиперплоскости. Будем пользоваться следующим критерием: процесс обучения
заканчивается, как только после некоторого (-го) исправления решающего правила
очередные элементов
обучающей последовательности не приводят к изменению решающего правила. Теория
останова, по существу, исследует два вопроса:
1)
какими должны быть величина , чтобы в случае, если останов
произойдет, можно было бы утверждать, что с заданной вероятностью качество
построенного решающего правила будет не хуже требуемого;
2)
на какой длине обучающей последовательности заведомо произойдет останов.
Ответ на эти два вопроса дают
следующие теоремы.
Теорема 4.1. Если в соответствии с
критерием останова процесс обучения закончится, то с вероятностью, большей , можно утверждать,
что построенное решающее правило характеризуется качеством при условии, что
,
где
; – любая константа,
большая 1; .
Доказательство. Пусть в процессе
обучения сменяются решающие правила
Оценим вероятность того, что
останов произойдет в тот момент, когда выбрано правило с качеством .
Пусть, например, после -го исправления
выбрано правило с
качеством ;
при этом условии вероятность того, что останов произойдет после -го (но до -го) исправления,
равна вероятности того, что за этим исправлением последует безошибочных опознаний, т. е.
.
Тогда вероятность того, что останов
произойдет после одного из исправлений, когда , оценивается так:
.
Таким
образом, справедлива оценка:
.
Выберем теперь функцию такую, что
. (4.5)
Из
равенства (4.5) может быть найдено, что
. (4.6)
Остается
определить величину .
Найдем ее из условия
,
т.
е.
,
где
.
Из
этого соотношения находим, что
. (4.7)
Таким
образом, из (4.6) и (4.7) следует, что при
(4.8)
вероятность
меньше
требуемой величины .
Оценка (4.8) справедлива для любого . В частности, при , откуда
.
Теорема доказана.
Теорема 4.2. Пусть конечно-сходящийся
алгоритм таков, что число коррекций не превосходит величину , а в качестве взята функция (4.8),
описанная в условии теоремы 4.1; тогда можно утверждать, что останов заведомо
произойдет на обучающей последовательности длины
.
Доказательство теоремы очевидно.
Для персептрона Розенблатта в
силу теоремы Новикова , поэтому останов произойдет на обучающей
последовательности длины
.
Существует некоторая тонкость в
понимании приведенных теорем об останове. Эти теоремы никак не гарантируют, что
после того, как будет сделано шагов, построенная разделяющая
гиперплоскость окажется требуемого качества. Теоремы гарантируют лишь то, что
до -гo шага обязательно произойдет
останов и что в момент останова построенная гиперплоскость окажется заданного
качества.
Если же алгоритм не остановить,
то, вообще говоря, может случиться, что последующие коррекции ухудшат качество
решающего правила и к -му шагу это качество будет ниже
требуемого.