Глава 5. НЕЕВКЛИДОВЫ ПАРАЛЛЕЛЬНЫЕ ПРОЦЕДУРЫ; ПЕРСЕПТРОН
5.0. Введение и исторические замечания
В этой главе мы рассмотрим несколько параллельных процедур распознавания образов и классификации, аналогичных изложенным в гл. 4, но без требования представлять объекты точками в евклидовом пространстве. Вместо этого будет предполагаться, что объекты описываются упорядоченным списком признаков, которыми они могут обладать или не обладать. Математически это означает, что будут обсуждаться процедуры классификации двоичных векторов. Двоичный вектор интерпретируется так: информация разряд содержит эквивалентна утверждению „присутствует (отсутствует) признак».
Рассматриваемая проблема имеет интересную историю. Она заняла значительное место в вычислительных науках после того, как Фрэнк Розенблатт, психолог Корнеллской лаборатории аэронавтики, описал машинно-ориентированную систему распознавания образов и классификации, которую он назвал персептроном (Розенблатт, 1958, 1962)). Персептрон был представлен частично как модель биологического распознавания образов, частично как предложение для построения ЭВМ специального назначения. Ученые ряда областей заинтересовались персептронами по разным причинам. Прежде всего надеялись на то, что анализ персептронов приведет к построению эффективных систем ввода зрительной информации для ЭВМ, причем это поддерживалось, безусловно, тем, что Розенблатт пользовался такими терминами, как „сетчатка" и „персептрон». Предполагаемая схема работы системы показана на рис. 5.1. Рассматриваемая сцена должна была предъявляться анализатору
признаков, который регистрировал бы присутствие или отсутствие определенных компонент сцены. Сами сцены должны были относиться к интересующим классам, например к изображениям мужчин и женщин. Система распознавания образов затем обучалась бы классификации двоичных записей, поступавших от рассматриваемой сцены из некоторого конкретного класса.
Возможности персептронов сводились к формированию определенных типов правил классификации. Розенблатт предложил особый вариант модели параллельного распознавания образов „пандемониума" Селфриджа (1959), описанной кратко в гл. 3. Это устройство вычисляет фиксированное множество функций объекта, подлежащего классификации, и затем — функцию, аргументами которой служат результаты предыдущих вычислений.
Рис. 5.1. Основные шаги распознавания персептроном зрительных образов.
Значение последней функции представляет результат классификации. Если эта функция является тестом, выясняющим, превосходит ли взвешенная сумма значений исходных функций некоторый порог, то перед нами — персептрон. Как мы увидим в дальнейшем, это ведет к точному математическому описанию.
На ранних этапах исследования персептронов было обнаружено, что применение в персептронах алгоритмов обучения дает удивительно мощные правила классификации. В силу этого много внимания было уделено „машинному обучению", понимаемому в том смысле, как оно описано в конце гл. 4.
Существенный шаг в новом направлении был сделан Минским и Пейпертом (1969), которые заинтересовались тем, каков вид правил классификации, которые можно было бы получить, предполагая, что персептрон может в конечном счете обучиться любому правилу классификации, использующему взвешенную сумму простейших признаков. В сущности Минский и Пейперт заменили вопрос „Насколько быстро персептрон может обучиться чему-то?" вопросом „Чему персептрон можно научить?". Ньюэлл, рецензируя книгу Минского и Пейперта, заметил, что аналогичное различие проводят психологи между обучением и функционированием. Нельзя обучиться ни одному действию, если нет возможности его выполнить. Таким образом, понимание работы Минского и Пейперта необходимо
каждому, кто имеет серьезные планы исследований в области распознавания образов. В последующих разделах этой главы мы приведем основные результаты Минского и Пейперта и попытаемся проиллюстрировать их метод анализа.