Главная > Энциклопедия кибернетики. Т.2
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

ЧИТАЮЩИЙ АВТОМАТ, оптическое читающее устройство

— устройство, осуществляющее автоматическое распознавание оптических изображений букв, цифр или других знаков, напечатанных или написанных на бумаге в форме, удобной для чтения этих знаков человеком. Ч. а. предназначены для автомат, ввода печатной или письменной информации в вычислительные машины или в другие системы переработки информации. Применение Ч. а. позволяет избежать больших затрат ручного труда, необходимого при вводе данных с помощью перфокарт или перфолент. На стадии исследования находятся в настоящее время Ч. а., распознающие не отдельные буквы, а сочетания нескольких соседних букв или целые слова, фразы, и т. п. Такие Ч. а. обеспечили бы более надежный ввод информации за счет избыточности текста.

Ч. а. должен для каждого знака вырабатывать код, соответствующий его наименованию в алфавите и не зависящий от несущественных особенностей конкретного изображения. Напр., если очередным символом на читаемом документе является буква , то автомат должен выдать код буквы «А» независимо от толщины линий изображения, от его расположения в поле зрения автомата и от различных дефектов (загрязнений, непропечаток и т. п.), если эти дефекты не делают изображение буквы «А» более похожим на какую-нибудь другую букву.

Вырабатываемые Ч. а. коды обычно реализуются в виде электр. сигналов. Таким образом, Ч. а. осуществляет преобразование изображения в злектр. сигнал. На первый взгляд такую же ф-цию выполняют телевизионная камера и фототелеграфный аппарат. Однако Ч. а. принципиально отличается от этих устр-в: Ч. а. не только преобразует изображение в электр. сигнал, но и существенным образом перерабатывает этот сигнал. Ч. а. отбраковывает сигналы, соответствующие посторонним изображениям, отбрасывает несущественные детали изображения и извлекает из изображения наиболее существенную информацию о его принадлежности к определенному классу, т. е. информацию об абстрактном образе этого изображения. Следовательно, Ч. а. осуществляет распознавание образов.

Принцип действия Ч. а. заключается в следующем. Механизм подачи документов (рис. ) отделяет очередной документ от стопки, содержащей несколько десятков или сотен документов, которые должны быть прочитаны. Чаще всего отделение документа осуществляется с помощью вакуумных присосок так же, как и в некоторых полиграфических машинах. Для чтения текста микрофильма применяют механизм подачи, подобный лентопротяжному устр-ву кинопроектора. Однако такие механизмы применяются редко, т. к. чтение документов, напечатанных на бумаге, в настоящее время применяется более широко по сравнению с чтением микрофильмов. Механизм подачи продвигает документ к сканирующему устр-ву, которое ищет строки документа и одно за другим развертывает изображения знаков в строке.

Процесс развертки так же, как и в телевизионных камерах, состоит в поочередном измерении «черноты», т. е. коэфф. поглощения света для отдельных очень маленьких, напр., размером 0,1 х 0,1 мм2, элементарных участков, на которые раскладывается изображение знака. Измерение черноты производится с помощью светочувствительных приборов: передающих телевизионных трубок, фотоумножителей, фотодиодов или др.

В последнее время вместо систем развертки часто применяют системы параллельной дискретизации, в которых с помощью многих светочувствительных элементов (фотодиодов) осуществляется одновременное измерение черноты многих элементарных участков изображения. Такая система напоминает по своему устройству сетчатку глаза. Всякое сканирующее устройство, как и искусственная сетчатка, в конечном итоге преобразует изображение в электр. сигналы, т. е. выполняет лишь простейшую ф-цию, свойственную телевизионной камере. Выбор того или иного способа преобразования не является существенным с точки зрения возможностей распознавания. Он влияет преимущественно на скорость работы Ч. а. и на объем входящей в его состав аппаратуры, причем увеличение скорости требует, как правило, увеличения объема аппаратуры.

Наиболее существенной частью Ч. а., которая определяет вероятность правильного распознавания, допустимые вариации начертания символов, требования к качеству печати и т.п., является распознающее устр-во. В большинстве современных Ч. а. такое устр-во сравнивает анализируемое изображение (или соответствующий ему сигнал) с некоторыми идеализированными, обобщенными изображениями — эталонами, которые являются типичными представителями изображений каждого класса. Обычно точное совпадение изображения с эталоном не требуется. Сравнение происходит путем вычисления величии, характеризующих сходство изображения с эталоном (см. Сходства критерии). Напр., в простейшем случае, когда чернота каждого элементарного участка принимает только два значения — «0» для белого участка и «1» для черного — роль такой величины может играть число элементарных участков, для которых чернота изображения и эталона совпадают.

Эталоны хранятся в распознающем устр-ве либо в виде записанных на магнитном носителе электр. сигналов, которые соответствуют

эталонным изображениям, либо реализуются в виде специальных электр. цепей, параметры которых характеризуют компоненты эталона. Такую цепь строят так, что, подавая на ее входы сигнал, соответствующий распознаваемому изображению, на выходе цепи получают новый сигнал, величина которого характеризует сходство, т. е. степень совпадения входного сигнала с эталоном.

Напр., если изображение представлено в виде электр. напряжений, получаемых одновременно с выходов многих фотоэлементов, то эталон можно реализовать в виде набора проводимостей, каждая из которых проводит ток от соответствующего фотоэлемента к общему узлу.

Схема читающего автомата.

Суммарный ток в этом узле равен скалярному произведению вектора напряжений (т. е. вектора, компонентами которого служат напряжения на выходах фотоэлементов) на вектор проводимостей. При соответствующей нормировке последнего ток пропорционален косинусу угла между этими векторами, т. е. характеризует их близость. В частности, число участков с одинаковой чернотой может быть представлено как скалярное произведение вектора изображения со специально построенным эталоном и реализовано с помощью подобной цепи. В распознающем устр-ве отыскивается эталон, сходство которого с данным изображением является наибольшим. Номер этого эталона или соответствующий код служит результатом распознавания и выдается из Ч. а. в вычислительную машину или на перфорирующее устр-во.

Распознавание знаков является частным случаем проблемы распознавания образов. Это одна из наиболее трудных проблем в современной кибернетике. Даже в простейшем случае распознавания печатных букв электр. сигналы, получаемые при развертке изображений одного класса, чрезвычайно разнообразны. Это обусловлено непостоянством толщины и контрастности линий, наличием случайных дефектов печати и загрязнений бумаги, непостоянством расположения изображений в поле зрения сканирующего устр-ва. Это разнообразие изображений приводит к необходимости либо разрабатывать сложные процедуры нормализации изображений, т. е. приведения к стандартному расположению, стандартным размерам и т. п., либо предусматривать по нескольку эталонов на каждый класс и производить сравнивание с каждым эталоном по нескольку раз при различных взаимных расположениях эталона и изображения. Первый из указанных путей приводит к сравнительно большой вероятности ошибок, т. к. нормализация, выполняемая до распознавания, при наличии случайных помех оказывается ненадежной. Второй путь приводит к снижению скорости распознавания и к усложнению устр-в. Более совершенные методы распознавания, свободные от обоих указанных недостатков, находятся в стадии исследований (см. Распознавание зрительных образов).

Современные Ч. а. существенно различаются но своим возможностям. Простейшие из них приспособлены лишь для чтения стилизованных шрифтов, т. е. шрифтов, в которых знакам придана специальная, несколько необычная форма с целью упрощения процесса автомат, распознавания. Такие Ч. а. требуют применения спец. пишущих машинок для заполнения читаемых документов, что существенно ограничивает сферу их применения. Более дорогими и сложными являются Ч. а., рассчитанные на распознавание шрифта обычной пишущей машинки. Наличие в алфавите похожих букв, таких как Ш-Щ, Э-3 и др., а также низкое качество изображений знаков.

характерное для обычной пишущей машинки, делают проблему получения высокой достоверности распознавания в этом случае очень трудной. Ч. а. этого типа по их сложности и стоимости можно сравнить с малыми ЦВМ, а их качество характеризуется вероятностью ошибок, которая большей частью лежит в пределах (для высокого качества печати) — (в подавляющем большинстве случаев).

Наиболее совершенными считаются многошрифтовые Ч. а., рассчитанные на чтение текстов, напечатанных различными типографскими или машинописными шрифтами. Такие Ч. а. имеют в своем составе оперативное запоминающее устройство, в котором хранятся эталоны одного или двух-трех шрифтов. Распознаваемый знак сравнивается с этими эталонами. Эталоны нескольких других шрифтов (до нескольких десятков различных шрифтов) хранятся на ленте магнитной или диске магнитном и по мере надобности быстро переписываются в оперативное запоминающее устр-во. Такие Ч. а. являются сложными и дорогими вычисл. устр-вами; их можно сравнивать с большими ЦВМ. Они могут воспринимать как простые документы типа банковских чеков, где читаемые знаки расположены в единственной строке, так и многострочные документы или страницы из книг и журналов. Перестройка Ч. а. для чтения документов другого типа, формата, шрифта осуществляется путем программного управления работой автомата. Программа его работы хранится на магнитной ленте или диске и так же, как в ЦВМ, вводится в оперативную память. Скорость работы Ч. а. этого типа (с учетом затрат времени на перемещение документа, поиск строк и т. п.) достигает нескольких сот знаков в 1 сек.

Создано также несколько образцов Ч. а. для распознавания рукописных знаков, прежде всего рукописных стилизованных цифр. Цифры должны быть написаны с определенными ограничениями, напр., вписаны в рамочки стандартного размера или даже написаны по заранее напечатанному на бланке трафарету (как это сделано для почтовых индексов на конвертах). Для распознавания рукописных знаков метод сравнивания с эталонами мало пригоден. Вместо непосредственного сравнивания используют различные методы анализа геом. структуры изображения. Несмотря на указанные ограничения стиля написания, разработанные методы распознавания рукописных знаков еще не позволяют получить такую высокую вероятность правильного распознавания рукописных знаков, как в случае распознавания их человеком. Наметившиеся новые пути решения проблемы распознавания позволяют рассчитывать на появление Ч. а., пригодных для надежного распознавания печатных знаков произвольных шрифтов, а также рукописных знаков.

Ч. а. применяют в тех случаях, когда требуется вводить в вычисл. машины большое количество документов. Ч. а. средней производительности может заменить труд нескольких десятков человек, работающих с обычными перфорирующими устр-вами. Поэтому сравнительно высокая стоимость Ч. а. быстро окупается. Даже в случае, когда документы нужно перепечатывать на машинке специально для Ч. а., использование Ч. а. оказывается оправданным в связи с тем, что ошибки можно отыскивать и исправлять непосредственно во вводимом в ЦВМ документе. В тех же случаях, когда документ с самого начала печатается шрифтом, пригодным для автомат, чтения, и после подписания или проверки определенными лицами должен быть введен в машину, экономическая эффективность применения Ч. а. очень велика. Примером такого документа может служить наряд на получение определенного товара со склада. Название товара, количество, стоимость, наименование получателя и др. данные могут быть сразу отпечатаны на пишущей машинке. После того, как на наряде поставлены все необходимые подписи, в т. ч. подпись получателя, человек, проверивший наличие всех подписей, может передать этот наряд для ввода в ЦВМ через Ч. а. Таким способом удобно вести учет выданных товаров и расчеты с получателями.

Ч. а. широко используются для обработки банковских чеков, различных счетов, заявок, статистических отчетов и т. п. Ч. а. другого типа, рассчитанные на чтение страниц с типографским текстом, используются при машинном переводе с одного языка на другой, реферировании автоматическом науч. статей, при лингвистических исследованиях и др. Сфера применения Ч. а. все более расширяется по мере повышения их качества и снижения стоимости.

Лит.: Автоматизация ввода письменных знаков в электронные вычислительные машины, т. 1—2. Вильнюс, 1969; Уилсон Р. Оптические читающие устройства. Пер. с англ. М., 1969.

В. А. Ковалевский.

1
Оглавление
email@scask.ru