§ 1.2. Основные задачи построения систем распознавания

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

§ 1.2. Основные задачи построения систем распознавания

Рассмотренный в § 1.1 пример свидетельствует о том, что распознавание сложных объектов и явлений требует создания специальных систем распознавания.

Система распознавания (распознающая система) — сложная динамическая система, состоящая в общем случае из коллектива подготовленных специалистов и совокупности технических средств получения и переработки информации и предназначенная для решения на основе специально сконструированных алгоритмов задач распознавания соответствующих объектов или явлений.

Каждая система распознавания приспособлена для распознавания только данного вида объектов или явлений (так, система, предназначенная для диагностики заболеваний, не умеет диагностировать отказы аппаратуры, а система, предназначенная для чтения букв русского алфавита, не умеет читать китайские иероглифы или ноты, и т. д.).

Рассмотрим основные задачи, возникающие в процессе проектирования и построения систем распознавания.

Задача 1. Задача состоит в подробном и тщательном изучении объектов, для распознавания которых предназначена проектируемая система. Ее цель — уяснить особенности изучаемых объектов и выяснить, что роднит и отличает их друг от друга.

Подобная работа лежала в основе классификации растительного и животного мира, проведенной К. Линнеем и Ч. Дарвином, и в составлении Д. И. Менделеевым периодической таблицы элементов.

Задача 2. Эта задача заключается в проведении классификации распознаваемых объектов или явлений. Основное в данной задаче — выбор надлежащего принципа классификации. Последний определяется требованиями, предъявляемыми к системе распознавания, которые, в свою очередь, зависят от того, какие решения могут приниматься по результатам распознавания системой неизвестных объектов и явлений.

Нумизмат при классификации может отнести юбилейные рублевые монеты, выпущенные в честь двадцатилетия победы над фашистской Германией, к одному классу, монеты того же достоинства, но отчеканенные в связи с пятидесятой годовщнной Советской власти, — к другому классу, а монеты, выпущенные к столетию со дня рождения В. И. Ленина, — к третьему классу, и т. д.

В то же время кассир или кассовый автомат отнесет все три юбилейные монеты к одному классу.

Пример. Пусть сторона А создает систему распознавания самолетов стороны В. Если в распоряжении стороны А нет выбора в организации мер противодействия самолетам стороны В, то стороне А при построении системы распознавания достаточно предусмотреть лишь два класса: самолеты стороны В, свои самолеты. Однако если сторона А располагает некоторым набором мер противодействия, то создаваемая ею система распознавания должна не только различать принадлежность самолетов той или другой стороне, но и классифицировать самолеты стороны В (напрнмер, истребители, бомбардировщики и т. п.).

Задача 3. Эта задача состоит в составлении словаря признаков, используемого как для априорного описания классов, так и для апостериорного описания каждого неизвестного объекта или явления, поступающего на вход системы и подлежащего распознаванию.

Признаки объектов могут быть подразделены на логические (детерминированные) и вероятностные (стохастические).

Логические признаки распознаваемых объектов можно рассматривать как элементарные высказывания, принимающие два значения истинности вида («да», «нет» или «истина», «ложь») с полной определенностью. К логическим признакам относятся прежде всего признаки, не имеющие количественного выражения. Эти признаки представляют собой суждения качественного характера типа наличия или. отсутствия некоторых свойств или некоторых элементов у распознаваемых объектов или явлений. В качестве логических признаков можно рассматривать, например, такие симптомы, используемые при медицинской диагностике, как боль в горле, кашель, насморк и т. д., тип двигателя у распознаваемого самолета — реактивный, турбовинтовой или поршневой, такие свойства объектов геологической разведки, как растворимость или нерастворимость в определенных кислотах или в некоторых смесях кислот, наличие или отсутствие запаха, цвета и т. д. К логическим можно отнести также признаки, у которых важна не величина признака у распознаваемого объекта, а лишь факт попадания или непопадания ее в заданный интервал. В пределах этих интервалов появление различных значений признаков у распознаваемых объектов предполагается равновероятным. На практике логические признаки подобного рода имеют место в таких ситуациях, когда либо ошибками измерений можно пренебречь, либо интервалы значений признаков выбраны таким образом, что ошибки измерений практически не

оказывают влияния на достоверность принимаемых решений относительно попадания измеряемой величины в заданный интервал. Например, в области технической диагностики решение о выходе из строя технических устройств принимается лишь тогда, когда фактические значения некоторых параметров (признаков) превышают заданные интервалы. Отклонение же значений параметров от номинала, не сопровождающееся выходом за пределы соответствующих интервалов, является информацией о том, что устройство функционирует нормально.

Вероятностные признаки — признаки, случайные значения которых распределены по всем классам объектов, при этом решение о принадлежности распознаваемого объекта к тому или другому классу может приниматься только на основании конкретных значений признаков данного объекта, определенных в результате проведения соответствующих опытов.

Признаки распознаваемых объектов следует рассматривать как вероятностные и в случае, если измерение их численных значений производится с такими ошибками, что по результатам измерений невозможно с полной определенностью сказать, какое численное значение данная величина приняла.

При разработке словаря признаков сталкиваются с рядом ограничений.

Ограничение 1. Оно состоит в том, что в словарь могут быть включены только признаки, относительно которых может быть получена априорная информация, достаточная для описания классов на языке этих признаков. Составленный из этих признаков словарь будем называть априорным.

Ограничение 2. Это ограничение связано с нецелесообразностью включения в словарь всех признаков, на которые не распространяется первое ограничение. Так, некоторые из признаков, относительно которых хотя и имеется достаточный объем априорных данных, включать в словарь признаков нет смысла, поскольку они либо совсем бесполезны при решении задачи распознавания, либо весьма мало полезны. О таких признаках говорят, что они малоинформативны, не обладают достаточными разделительными свойствами и качество их неудовлетворительно.

Пример. Пусть необходимо создать автомат, предназначенный для размена десятикопеечной монеты на две пятикопеечные монеты. Одна из основных частей этого автомата — система распознавания.

По габаритам десятикопеечная монета сходна с двухкопеечной монетой и отличается от других монет. Поэтому будем полагать, что в данном случае система распознавания должна давать ответ на вопрос о том, к какому классу (класс I — десятикопеечные монеты; класс II — двухкопеечные монеты) относится брошенная в автомат монета. После классификации возникает вопрос какие признаки монет следует использовать при построении системы распознавания. Круглая монета может быть охарактеризована следующими признаками: диаметр, толщина, вес, материал и рисунки (в том числе цифра), изображенные на одной и другой ее стороне. Поскольку автомат должен быть как можно проще и дешевле, то последние два признака использовать в нем нецелесообразно. Итак, остаются три признака: диаметр толщина вес Составим таблицу значений признаков для классов

Таблица 1.1 (см. скан)

Из таблицы видно, что признак не обладает разделительными свойствами и его использование в системе распознавания бесполезно, а признак качественнее, чем признак . В самом деле, значения признака для классов I и II отличаются примерно на признака же свыше чем на 11%. Таким образом, при построении системы распознавания в данном случае целесообразно использовать признак

Ограничение 3. Это ограничение связано с наличием или возможностью создания технических средств наблюдений, обеспечивающих на основе проведения экспериментов определение предварительно отобранных признаков.

Указанные ограничения часто превращают разработку словаря признаков в сложную задачу.

С задачей разработки словаря признаков связан вопрос о проектировании и создании специальных технических средств наблюдений, обеспечивающих определение признаков распознаваемых объектов. В каждом конкретном случае этот вопрос имеет свое решение. Общее состоит лишь в том, что эффективность практически любых систем распознавания в значительной мере определяется объемом и качеством измерительной информации о распознаваемых объектах. Это обусловливает необходимость создания таких средств наблюдений, которые позволяют с максимально возможной точностью определять наиболее информативные признаки. В связи с тем, что их выявление возможно лишь после описания классов на языке признаков и построения алгоритмов распознавания (см. гл. 4), выбор признакового пространства при проектировании системы распознавания представляет собой процедуру последовательных приближений.

При проектировании вначале на языке признаков априорного словаря производится описание классов и после выбора алгоритмов распознавания оценивается информативность каждого признака. В результате из рассмотрения исключаются наименее полезные признаки. Затем вновь формируется модель системы распознавания и анализируются качества оставшейся части признаков. После этого с учетом ограничений, накладываемых на создание технических средств получения апостериорной информации, окончательно решается вопрос о составе рабочего словаря признаков системы распознавания.

Задача 4. Задача состоит в описании классов объектов на языке признаков. Она не имеет однозначного решения и в зависимости

от объема исходной априорной информации для ее решения могут быть использованы методы непосредственной обработки исходных данных, обучения или самообучения (см. гл. 2).

Не останавливаясь на методах обработки априорной информации, рассмотрим, в чем состоит суть задачи описания классов. Пусть в словаре содержится упорядоченный набор параметров объектов или явлений — признаки Величины можно рассматривать как составляющие вектора характеризующего пространство признаков системы распознавания.

Множество упорядоченных чисел вида образует пространство признаков размерности а конкретные точки этого пространства представляют собой распознаваемые объекты.

Пусть произведено разбиение объектов на классы Требуется выделить в пространстве признаков области эквивалентные классам, т. е. характеризуемые следующей необходимой зависимостью: если объект, имеющий признаки относится к классу то представляющая его в признаковом пространстве точка принадлежит области

Помимо геометрической существует и алгебраическая трактовка задачи, которая состоит в следующем. Требуется построить разделяющие функции обладающие следующим свойством: если объект, имеющий признаки относится к классу то величина должна быть наибольшей. Она должна быть наибольшей и для всех других значений признаков объектов, относящихся к классу Если через обозначить вектор признаков объекта, относящегося к классу, то для всех значений вектора

Таким образом, в признаковом пространстве системы распознавания граница разбиений, называемая решающей границей между областями соответствующих классам выражается уравнением

На рис. 1.1 показано разбиение двумерного пространства признаков на области соответствующие классам (здесь 1 — решающая граница).

Если признаки распознаваемых объектов — логические и имеют количественные выражения, то для описания классов объектов на языке признаков необходимо (в предположении достаточности исходной информации) определить диапазоны значений признаков соответствующие классам При этом каждый из отрезков может рассматриваться как элементарное логическое высказывание А, В, С,... Если признаки распознаваемых объектов — суждения качественного характера, то каждый из них также рассматривается как элементарное логическое

высказывание Для описания классов на языке этих признаков необходимо выяснить, какими из них характеризуется каждый класс, после этого установить зависимости в форме булевых соотношений между признаками и классами

Если распределение объектов по областям -мерного пространства признаков для всех значений вероятностное, то для описания классов необходимо определить характеристики этих распределений: функции плотности вероятности значений параметров при условии, что объекты принадлежат классу априорные вероятности того, что объект, случайным образом выбранный из общей совокупности, окажется принадлежащим классу

Рис. 1.1

Выработка сведений о распознаваемых объектах и априорное описание классов — весьма трудоемкая часть в решении классификационных задач, требующая глубокого изучения свойств этих объектов.

Задача 5. Задача состоит в разработке алгоритмов распознавания, обеспечивающих отнесение распознаваемого объекта или явления к тому или другому классу или их некоторой совокупности.

Алгоритмы распознавания основываются на сравнении той или другой меры близости или меры сходства распознаваемого объекта с каждым классом. При этом если выбранная мера близости данного объекта с каким-либо классом превышает меру его близости с другими классами, то принимается решение о принадлежности этого объекта классу т. е. если

B алгоритмах распознавания наиболее распространены следующие меры близости:

1. Среднеквадратичное расстояние между данным объектом со и совокупностью объектов представляющих собой класс

причем метод измерения расстояния между объектами свободен для выбора.

В случае, если необходимо учитывать веса признаков объекта со и признаков объектов класса то может быть применена метрика следующего вида:

2. Риск, связанный с решением о принадлежности распознаваемого объекта к классу Пусть даны описания классов

и риски правильных и ошибочных решений, представляющие собой элементы платежной матрицы вида

По главной диагонали матрицы расположены потери при правильных решениях, а по обеим сторонам от нее — потери при ошибочных решениях. Если то такие отрицательные потери можно рассматривать как выигрыш при правильных решениях.

Пусть в результате экспериментов установлено, что значения признаков у распознаваемого объекта со составляют Обозначим это событие через Тогда величина условного риска, связанная с решением вида при условии, что имеет место событие будет

где условная апостериорная вероятность того, что в соответствии с теоремой гипотез или формулой Байеса [1]

Решение вида принимается в случае, если

Задача 6. Задача состоит в разработке специальных алгоритмов управления работой системы. Их назначение в том, чтобы процесс функционирования системы распознавания был в определенном смысле оптимальным и выбранный критерий качества этого процесса достигал экстремального значения. В качестве подобного

критерия может использоваться, например, вероятность правильного решения задачи распознавания, среднее время ее решения, расходы, связанные с реализацией процесса распознавания, и т. д. Достижение экстремальной величины названных критериев должно при этом сопровождаться соблюдением некоторых ограничивающих условий. Так, рационально потребовать, чтобы достижение максимальной вероятности правильного решения задачи распознавания осуществлялось в условиях ограничений либо на время решения задачи, либо на расходы, связанные с проведением экспериментальных работ. Минимизация среднего времени решения задачи или расходов на реализацию процедуры распознавания должна осуществляться в условиях достижения заданной вероятности правильного решения задачи и т. д.

Задача 7. Задача состоит в выборе показателей эффективности системы распознавания и оценке их значений. В качестве показателей эффективности системы могут рассматриваться вероятность правильных решений, среднее время решения задач распознавания, величина расходов, связанных с получением апостериорной информации, и т. д. Оценка значений выбранной совокупности показателей эффективности, как правило, проводится на основе экспериментальных исследований либо реальной системы распознавания, либо с помощью ее физической или математической модели.

<< Предыдущий параграф

Следующий параграф >>

Оглавление