Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
6.5.2. Построение последовательных правил решения по конечным выборкамАлгоритмы, изложенные в разд. 6.3, будут всегда формировать некоторое правило Один способ найти ответ на этот вопрос состоит в применении статистического анализа. В литературе можно почерпнуть довольно много если предположить, что 5, которая считается полученной из К сожалению, об аналогичных процедурах для определения доверительных интервалов в случае нелинейных правил известно мало. В предыдущем разделе мы советовали проводить проверку, чтобы быть уверенным в том, что та процедура классификации, которая диктуется правилом Хант и его коллеги (Хант, Марин и Стоун, 1966; Хант, 1967) провели эмпирические исследования, чтобы выяснить, насколько быстро сходятся к В этом эксперименте множество других экспериментах также рассматривалась связка эквивалентность, являющаяся отрицанием исключающего или, но в этом конкретном эксперименте эти две связки были неразличимы для алгоритма распознавания образов.) Правила изображены на рис. 6.6 в виде последовательных деревьев классификации. Они формулируются так: Рис. 6.6. (см. скан) Правила, примененные Хантом, Марином и Стоуном при исследовании сходимости.
Правило отрицание, Эксперимент проводился следующим образом. 1. Из 2. Объект выбирался из 3. Пусть 4. Если результаты классификации при помощи правил Цикл, состоящий из шагов 2—4, продолжался до тех пор, пока в выборке не оказывалось 10, 20, 30 или 100 объектов. Эксперимент повторялся 10 раз для каждого возможного правила
где К — число неверно классифицированных объектов в Интересен также вопрос, насколько большая выборка требуется для достижения заданного уровня точности, поскольку это непосредственно относится к задаче выделения правила в условиях ограниченной памяти. Дир и Хант (1968) заметили, что сдерживающий фактор в машинном распознавании образов зачастую связан не с числом экспериментальных точек, которые можно изучить, а с объемом машинной памяти, необходимым для работы алгоритма распознавания образов. Поскольку для программ последовательного распознавания образов нужны специфические записи об объектах, которые раньше добавлялись к выборке, то проблема достаточной свободной памяти для таких программ может оказаться серьезной. Поэтому при построении алгоритмов следует обращать внимание на экономное использование имеющегося объема машинной памяти.
Рис. 6.7. Коэффициент Для описания машинного запоминающего устройства, хранящего записи выборок, Дир и Хант ввели термин „банк памяти". Банк памяти можно организовать двумя способами. Можно рассматривать его как файл записей фиксированной длины, в котором в каждой записи отведено место для размещения описывающего объект. (Дополнительное место требуется еще для информации о длине записей. Более подробно см. Лефковиц (1968).) Дир и Хант обнаружили, что в работах по распознаванию образов, аналогичных работе Ханта и др., пробная гипотеза 1. Вместо предъявления фиксированного числа объектов осуществлялся несколько раз циклический проход по множеству из 256 объектов. Однако число объектов, которые можно было бы одновременно записать в память, ограничивалось. Считалось, что память состоит из фиксированного множества ячеек, каждая из которых способна хранить точно одну компоненту вектора, и запоминание данных модифицировалось следующим образом. 2. При предъявлении объекта и при его верной классификации (так, что 3. При предъявлении объекта и его неверной классификации запоминался весь вектор описания. После неверной классификации с помощью модифицированного алгоритма распознавания образов строилась новая пробная гипотеза Дир и Хант провели ряд экспериментов, подобных описанным в работе Ханта и др., но в них дополнительно применялись несколько более сложные правила классификации. Результаты экспериментов для правила Строго говоря, эти результаты показывают, что в определенной искусственной среде можно убедиться в сходимости. Однако этого мало. Поскольку среда и алгоритм распознавания образов корректно определены, то необходимо уметь доказывать теоремы вместо того, чтобы индуктивно делать выводы из экспериментальных наблюдений. Большинство экспериментальных работ по нелинейному распознаванию образов имеет ту же особенность, что и первые работы по персептронам: они привели к предположениям, которые позднее признали неверными или вводящими в заблуждение.
Рис. 6.8. Средние ошибки для задачи С другой стороны, сегодня у нас нет теорем для последовательного распознавания образов. Второе возражение по поводу искусственных экспериментов состоит в том, что они слишком искусственны. Даже если предположить, что результаты экспериментов заменены выводами об алгоритмах распознавания образов, работающих в искусственной среде, разве это говорит что-нибудь о более сложных „реальных" ситуациях распознавания образов? На такое возражение нет ясного ответа. Ведут ли к практическим применениям или уводят в сторону эксперименты с искусственными, полностью контролируемыми ситуациями, вот вопрос, на который предстоит дать ответ по мере накопления опыта.
|
1 |
Оглавление
|