Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике Глава 1. ВВЕДЕНИЕНесколько лет назад в воскресном выпуске газеты «Нью-Йорк тайме» был задан следующий вопрос: «Облегчит ли положение маклерских фирм, все служебные помещения которых переполнены документами, сокращенный рабочий день?» Далее сообщалось: «Профессор психологии Гарвардского университета предупреждает, что к 2000 году возможности человеческого мозга воспринимать информацию могут оказаться исчерпанными. Быть может, наименее способные из нас в каком-то смысле уже близки к этому пределу, — заявил он, — потребность же в тех, кто все еще в состоянии справляться с современным уровнем сложности, все время увеличивается». Впрочем, текущую прессу мало заботит информационный взрыв. В последнее время в нашем весьма сложном технологически ориентированном обществе создалось такое положение, при котором все большее количество людей и организаций занимаются обработкой информации и все меньшее — обработкой материальных объектов. Ощутимой стала потребность в более совершенных информационных системах, поскольку информация — ключевой элемент процесса принятия решений, а количество разнохарактерной и разной степени сложности информации, которую порождает наш мир, растет. Одной из важнейших задач, возникающих в связи с созданием современных информационных систем, является автоматизация процесса распознавания образов. Именно этой проблеме и посвящена наша книга. 1.1. ПРОБЛЕМА ОБРАБОТКИ ИНФОРМАЦИИПрогресс «технологической» цивилизации и развитие науки породили информационную проблему, с которой столкнулось сейчас человеческое общество. У первобытных людей такой проблемы не было. В самом деле, уровень развития общества можно оценить количеством генерируемой им информации и знания. Без информации цивилизация, как мы ее понимаем, существовать не может. Решение современных социальных проблем также зависит от разрешения информационной проблемы. Информационный взрыв — один из наиболее драматических вызовов, угрожающих нашему обществу в 1970-х и 1980-х годах, причем темп роста этой угрозы будет продолжать увеличиваться. Проблему информационного взрыва хорошо иллюстрирует следующая статистика. В 1830 г. выходило около 300 технических и научных журналов. Сегодня во всем мире на более чем 50 языках в год выходит свыше 60 000 журналов, содержащих около 2,5 миллиона статей. Ежегодно во всем мире выпускается в свет около 80 000 новых названий книг. Ежегодно через банки проходит около 20 миллиардов чеков, причем каждый обрабатывается 4—5 раз. Ведущие банки выполняют в день около 25 миллионов операций. Министерство почт Соединенных Штатов очень серьезно озабочено проблемой почтовой корреспонденции. В настоящее время в почтовых отделениях США за одну секунду обрабатывается около 27 000 единиц почтовых отправлений; это соответствует 84 миллиардам в год, а к 1980 г. ожидается увеличение этой цифры до 116 миллиардов. Главный почтмейстер заявил несколько лет назад в подкомитете конгресса: «Откровенно говоря, наше министерство состязается в скорости с надвигающейся катастрофой». В архивах федеральных служб Соединенных Штатов в настоящее время хранится более 200 миллионов отпечатков пальцев и около 150 миллионов счетов по выплатам в рамках системы социального обеспечения. В 1940 г. было зарегистрировано всего 15 миллионов налоговых деклараций — в 1973 г. Налоговое управление обработало уже свыше 100 миллионов налоговых деклараций и 360 миллионов единиц соответствующих документов. Налоговое управление ожидает, что к 1980 г. число налоговых деклараций достигнет 137 миллионов. Проблема объема операций осложняется еще и тем обстоятельством, что налоговая система в Соединенных Штатах регулируется довольно сложным законодательством и отражает постоянно увеличивающееся разнообразие финансовых сделок. Проблемы, встающие перед медициной в связи с информационным взрывом, аналогичны тем, которые сегодня возникают и в других направлениях деятельности общества. Врачи начинают ощущать, что они не в силах эффективно справляться с чудовищными информационными потоками, поступающими к ним при медицинском обслуживании населения и при исследовательской работе. Для того чтобы поставить правильный диагноз и назначить соответствующее лечение, врач должен опросить и обследовать пациента, провести лабораторные и другие исследования и зарегистрировать собранную информацию. Он должен отобрать, проверить и сопоставить полученные данные с собственным опытом и на этой основе поставить диагноз, идентифицирующий заболевание. Как при диагностике, так и при лечении врач постоянно занят анализом и обработкой информации, что и позволяет ему достичь соответствующие медицинские цели. Если бы в процессе повседневной работы он мог без чрезмерных сложностей использовать медицинскую информационную систему для выборки и хранения клинических данных, аналитические возможности и быстродействие такой системы способствовали бы расширению профессиональных возможностей врача. Применительно к обслуживанию пациентов медицинский работник смог бы молниеносно восстановить всю необходимую медицинскую информацию и информацию о способах лечения в форме, максимально удобной для эффективного использования. Сталкиваясь с нестандартным заболеванием, врач может захотеть получить таблицу статистических данных, содержащую сотни или тысячи наборов признаков, симптомов или результатов лабораторных анализов, характеризующих больных, которым был поставлен этот же диагноз. Клинические лаборатории нуждаются в автоматизированных системах, предназначенных для расшифровки рентгеновских снимков, идентификации клеточных препаратов, обработки кардиограмм при массовых кардиологических обследованиях и диагностики. Больницам нужны автоматизированные информационные системы, включающие информационно-поисковые подсистемы для историй болезни, подсистемы назначения процедур и подсистемы управления больницей. Медицинские информационные системы явятся для медиков средством, способствующим обострению их интуиции и расширению профессиональных возможностей. Промышленность сталкивается с насущной необходимостью улучшить информационные связи между предприятиями. Административный персонал и руководство компаний нуждаются в большем количестве информации о положении внутри компаний, результатах собственной деятельности и рынке, на который компания работает, причем информация нужна им своевременно — так, чтобы они могли найти наилучшее решение в условиях быстро меняющейся конъюнктуры. Информационные системы играют важную роль в процессах принятия решений, как на правительственном, так и на «деловом» уровне. Окончательная оценка таких решений всегда будет производиться человеком, однако появившиеся концепции и методы, предусматривающие использование вычислительных машин, обеспечивают выдвижение и оценку такого количества вариантов, какое ни один руководитель не мог осмыслить. Возможность использовать, кроме того, методы анализа риска позволяет руководителю оценивать потенциальную опасность, связанную с каждой из множества изучаемых стратегий. Информационные системы обеспечат руководителю возможность более ясно представлять результаты принимаемых им решений. Наше счастье, что цифровые вычислительные машины - одно из важнейших технических достижений XX в.- начинают заполнять все расширяющуюся информационную «брешь». Вычислительная машина, отметившая только что свой тридцатый день рождения, достигла совершеннолетия, пройдя за короткий срок путь от научного курьеза до существенного элемента человеческого существования. История человечества не знает технического достижения, которое в большей степени оказало бы непосредственное влияние на человека и его образ жизни. Вычислительные машины во многих отношениях изменили представление о времени, сместили общепринятые пределы и связи, регулирующие нашу жизнь и деятельность организаций, в рамках которых она протекает, ускорили темп перемен. Только представьте, что бы произошло, если бы разом были исключены все вычислительные машины из нашей жизни. Воздушное сообщение было бы повергнуто в хаос, банки оказались бы завалены необработанными документами, промышленное производство распалось бы и многое в нашей жизни из того, что мы привыкли считать само собой разумеющимся, вдруг неожиданно испарилось бы. Банковское дело претерпело много перемен со времени «банковских каникул» 1933 г. Эти перемены привели к так называемой «банковской революции». Электронная цифровая вычислительная машина хотя и не являлась ее причиной, но оказалась инструментом, использованным для ее ускорения. «Банковская революция» заключалась в признании банками существования розничного рынка — потребностей отдельных лиц — в отличие от приоритета, стандартно предоставлявшегося нуждам, связанным с деловой активностью, деятельностью крупных корпораций и отдельных бизнесменов. Эта «революция» привела к росту внимания, уделяемого индивидуальным счетам, взносам по банковским ссудам, кредитным карточкам и различным способам привлечения сбережения с соответственно различными процентными ставками. «Революция» породила и проблему «бумажного» взрыва. За последние 30 лет количество чеков, обработанных банками, возросло более чем в 15 раз. К концу 1950-х годов количество использовавшихся финансовых документов и подлежащих обработке чеков увеличилось в такой степени, что грозило задушить банковскую систему Соединенных Штатов. В этот момент на помощь пришли цифровые вычислительные машины. позволили банкам быстро и с приемлемыми затратами обрабатывать огромное количество финансовых документов, обеспечивая, таким образом, банкам возможность продолжения роста. Кроме того, вычислительные машины использовались в качестве мощного инструмента управления. Рост и ускорение оборота капиталов заставлял банки постоянно искать новые рынки и новых клиентов, что приводило к еще большему ускорению роста. Таким образом, появление вычислительных машин действительно обеспечило увеличение темпа «банковской революции». Именно информационная система сделала эту «революцию» необходимой. Проблемы, связанные со взысканием налогов, относятся к наиболее серьезным из вызванных бумажной бурей. Налоговое управление с нетерпением ждет появления вычислительных машин и систем, обладающих большим быстродействием, лучшими возможностями накопления и поиска информации и наделенных способностью эффективно распознавать символы. Необходима хорошая налоговая информационная система, которая не только обеспечивает возможность работы в естественном масштабе времени и произвольной выборки информации, но также благодаря наличию сети терминалов, снабженных дисплеями, позволяет любому местному отделению получать любую необходимую информацию буквально нажатием кнопки. Это не только даст возможность местным отделения своевременно отвечать на вопросы налогоплательщиков, но и приведет к уменьшению количества запросов налогоплательщикам, касающихся уже предоставлявшейся ими информации. Судя по всему, мы вступаем в эпоху, когда человек, приобретя в качестве нового партнера созданные им информационные системы, окажется в состоянии решать много более сложные, чем когда бы то ни было, задачи. Этот новый вид «сотрудничества» сделает общество более совершенным, а жизнь людей — лучшей. Одной из важнейших проблем, возникающих в связи с созданием современных полностью автоматизированных информационных систем, является автоматизация процесса распознавания образов — область, изучением которой занято множество исследовательских групп. В их состав входят инженеры, специалисты в области вычислительной математики, кибернетики и теории информации, физики, статистики, психологи, биологи, физиологи, медики и лингвисты. Каждая из таких групп посвящает свою работу какому-то определенному аспекту общей проблемы распознавания. Наша книга представляет собой попытку обсудить фундаментальные принципы, лежащие в основе разработки автоматических систем распознавания образов.
|
1 |
Оглавление
|