Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
5.3.2. КЛАССИФИКАЦИЯ ПРИ НЕИЗВЕСТНОМ ЧИСЛЕ КЛАССОВВ общем случае заранее неизвестно, какое число классов в алфавите при заданных множествах обеспечит максимум эффективности РРЦ. Объясняется это тем, что рост числа распознаваемых классов, с одной стороны, повышает эффективность за счет повышения возможностей управления ею, а с другой — снижает эффективность вследствие уменьшения достоверности РРЦ. Поэтому при классификации одновременно с распределением объектов различных типов по классам необходимо решать задачу определения такого числа классов в алфавите, при котором эффективность РРЦ будет максимальна. Так сформулированная задача классификации формализуется аналогично тому, как это сделано в п. 5.3.1. Отличие состоит лишь в том, что необходимо изменять не только состав классов, но и их число в алфавите. Эту задачу можно решить с помощью алгоритма, приведенного в п. 5.3.1, применяя его многократно для различного числа классов. Однако, задавая число классов, нужно каждый раз определить начальную классификацию. Поскольку конечный результат применения алгоритма существенно зависит от начальной классификации, вероятность получения действительного максимума эффективности РРЦ с помощью такой процедуры снижается. В настоящее время общепринятой теории определения числа классов не существует. Известно несколько эвристических методов решения этой задачи [3, 25, 34]. К сожалению, почти все они основаны на свойстве разделимости классов, что снижает возможность их использования для классификации в рамках проблемы РРЦ. Исключение составляет описанный в [34] алгоритм последовательного уменьшения числа классов. Идея алгоритма основана на том, что из некоторого первоначально заданного алфавита исключается тот класс, распознавание объектов которого дает наименьший эффект. Объекты этого класса распределяются между оставшимися классами так, чтобы обеспечить максимум эффективности РРЦ. Эта процедура повторяется до тех пор, пока эффективность РРЦ возрастает. Рассмотренный алгоритм подобен алгоритму ISODATA [34], основанному на объединении и расщеплении классов. Отличается он тем, что в качестве критерия классификации использует не различимость классов, а эффективность РРЦ. Кроме того, фиксация класса, распознавание которого дает наименьший эффект, уменьшает число возможных вариаций уже на первом шаге. Достоинства алгоритмов подобного типа заключаются в их эффективности и в том, что вмешательство человека в их работу сводится к нимуму. Однако их применение не гарантирует действительного максимума эффективности РРЦ, который может быть получен только путем перебора всех возможных вариантов классификации. Но при большом числе типов объектов, как уже отмечалось ранее, такой перебор нереален. Поэтому при классификации неизбежно применение эвристических алгоритмов, которые следует строить так, чтобы на каждом шаге отбрасывалось наименьшее число вариантов, позволяющих найти классификацию, обеспечивающую действительный максимум эффективности. Рассмотрим алгоритм последовательного объединения классов, минимизирующий число отбрасываемых вариантов алфавитов на каждом шаге. Алгоритм, как и ранее рассмотренные, обеспечивает получение максимума эффективности РРЦ на каждом шаге, но, в отличие от них, зависит лишь от выбранного критерия эффективности. Предположим, что задано типов объектов. Сформируем алфавит из классов так, чтобы в первый класс входили объекты двух типов, во все остальные по одному. Число таких алфавитов составляет Если выбрать из них алфавит которому соответствует максимум эффективности РРЦ, то понятно, что он обеспечит действительный максимум эффективности при Применяя эту же процедуру, из получаем алфавитов, содержащих по класса, из которых доставит максимум эффективности РРЦ. На втором шаге часть вариантов алфавита, содержащего классов, не исследуется. Однако вероятность того, что среди них окажется алфавит, обеспечивающий большую эффективность РРЦ, чем мала, поскольку отброшенные на втором шаге варианты алфавита частично исследовались на первом. Эта вероятность тем меньше, чем ярче выражен Аналогично из получается алфавитов и так до тех пор, пока уменьшение числа классов объектов сопровождается повышением эффективности РРЦ. При таком алгоритме алфавитов исследуется число вариантов
где — число шагов алгоритма, — получаемое число классов, при котором эффективность РРЦ максимальна. Число бесполезно проверяемых вариантов можно сократить, если заранее запретить объединение в один класс объектов, для которых реакция существенно различна. На изложенном основан следующий алгоритм: 1. Наложить запрет на объединение в одном классе объектов конкретных типов. 2. Вычислить эффективность для случая, когда один класс алфавита включает объекты только одного типа. 3. Построить алфавитов так, чтобы в первый класс входили два типа объектов, а в остальные — по одному. 4. Выбрать алфавит из условия . Если максимум достигается при нескольких алфавитах, неопределенность разрешается произвольно. 5. Определить Если знак соответствует росту эффективности применить шаг 3 к алфавиту Процедура продолжается до тех пор, пока уменьшение числа классов сопровождается, ростом эффективности Понятно, что и этот алгоритм не гарантирует отыскание обеспечивающего действительный максимум эффективности РРЦ. Достоинство алгоритма состоит в том, что он позволяет направленно исследовать возможные варианты и ограничиваться анализом небольшого числа классификаций при минимальных потерях на каждом шаге. Однако обосновать допустимость применения такого алгоритма можно лишь результатами его экспериментальной проверки. Основной результат анализа классификации состоит в том, что ее необходимо проводить с учетом реальных возможностей устройств распознавания. Только при этом условии можно определить оптимальную классификацию, обеспечивающую максимум эффективности при функционировании которой используются: результаты РРЦ. Конечная достоверность распознавания приводит к тому, что существует не только оптимальное распределение объектов различных типов по классам, но и оптимальное число классов. При вероятности правильного распознавания оптимальное число классов обычно невелико и составляет . В тех случаях, когда число распознаваемых классов должно быть больше, необходимо увеличивать достоверность распознавания либо путем построения специализированных РЛС для РРЦ, либо специальными способами обработки информации. Эти пути можно использовать и совместно. Следует отметить, что при любой конечной достоверности распознавания значимость классификации не снижается. Глобальный максимум эффективности может обеспечить классификация, определенная в результате анализа всех возможных вариантов классификации. Если число типов объектов невелико и существует запрет на объединение объектов определенных типов в один класс, то задача полного перебора возможных вариантов классификации разрешима. Если объем необходимых вычислений велик, следует использовать поисковые алгоритмы, подобные описанным в пп. 5.3.1, 5.3.2. Однако нужно помнить, что их применение, как и любых других эвристических алгоритмов, не гарантирует глобального максимума эффективности Важным также является тот факт, что эффективность максимальна только при оптимальной классификации, соответствующей реальной обстановке. Этим обусловлена актуальность переклассификации на этапе планирования работы с учетом реального перечня объектов, которые могут быть предъявлены для РРЦ. Следовательно, на этапе разработки устройств РРЦ необходима классификация общего характера с возможностью ее изменения с учетом конкретной обстановки. При первклаесификации следует включать новые и исключать объекты тех типов, которые не будут наблюдаться в конкретной обстановке, и перегруппировывать типы объектов по классам так, чтобы обеспечить максимум эффективности МС в конкретных условиях.
|
1 |
Оглавление
|