Пред.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Глава 1. ВВЕДЕНИЕНесколько лет назад в воскресном выпуске газеты «Нью-Йорк тайме» был задан следующий вопрос: «Облегчит ли положение маклерских фирм, все служебные помещения которых переполнены документами, сокращенный рабочий день?» Далее сообщалось: «Профессор психологии Гарвардского университета предупреждает, что к 2000 году возможности человеческого мозга воспринимать информацию могут оказаться исчерпанными. Быть может, наименее способные из нас в каком-то смысле уже близки к этому пределу, — заявил он, — потребность же в тех, кто все еще в состоянии справляться с современным уровнем сложности, все время увеличивается». Впрочем, текущую прессу мало заботит информационный взрыв. В последнее время в нашем весьма сложном технологически ориентированном обществе создалось такое положение, при котором все большее количество людей и организаций занимаются обработкой информации и все меньшее — обработкой материальных объектов. Ощутимой стала потребность в более совершенных информационных системах, поскольку информация — ключевой элемент процесса принятия решений, а количество разнохарактерной и разной степени сложности информации, которую порождает наш мир, растет. Одной из важнейших задач, возникающих в связи с созданием современных информационных систем, является автоматизация процесса распознавания образов. Именно этой проблеме и посвящена наша книга. 1.1. ПРОБЛЕМА ОБРАБОТКИ ИНФОРМАЦИИПрогресс «технологической» цивилизации и развитие науки породили информационную проблему, с которой столкнулось сейчас человеческое общество. У первобытных людей такой проблемы не было. В самом деле, уровень развития общества можно оценить количеством генерируемой им информации и знания. Без информации цивилизация, как мы ее понимаем, существовать не может. Решение современных социальных проблем также зависит от разрешения информационной проблемы. Информационный взрыв — один из наиболее драматических вызовов, угрожающих нашему обществу в 1970-х и 1980-х годах, причем темп роста этой угрозы будет продолжать увеличиваться. Проблему информационного взрыва хорошо иллюстрирует следующая статистика. В 1830 г. выходило около 300 технических и научных журналов. Сегодня во всем мире на более чем 50 языках в год выходит свыше 60 000 журналов, содержащих около 2,5 миллиона статей. Ежегодно во всем мире выпускается в свет около 80 000 новых названий книг. Ежегодно через банки проходит около 20 миллиардов чеков, причем каждый обрабатывается 4—5 раз. Ведущие банки выполняют в день около 25 миллионов операций. Министерство почт Соединенных Штатов очень серьезно озабочено проблемой почтовой корреспонденции. В настоящее время в почтовых отделениях США за одну секунду обрабатывается около 27 000 единиц почтовых отправлений; это соответствует 84 миллиардам в год, а к 1980 г. ожидается увеличение этой цифры до 116 миллиардов. Главный почтмейстер заявил несколько лет назад в подкомитете конгресса: «Откровенно говоря, наше министерство состязается в скорости с надвигающейся катастрофой». В архивах федеральных служб Соединенных Штатов в настоящее время хранится более 200 миллионов отпечатков пальцев и около 150 миллионов счетов по выплатам в рамках системы социального обеспечения. В 1940 г. было зарегистрировано всего 15 миллионов налоговых деклараций — в 1973 г. Налоговое управление обработало уже свыше 100 миллионов налоговых деклараций и 360 миллионов единиц соответствующих документов. Налоговое управление ожидает, что к 1980 г. число налоговых деклараций достигнет 137 миллионов. Проблема объема операций осложняется еще и тем обстоятельством, что налоговая система в Соединенных Штатах регулируется довольно сложным законодательством и отражает постоянно увеличивающееся разнообразие финансовых сделок. Проблемы, встающие перед медициной в связи с информационным взрывом, аналогичны тем, которые сегодня возникают и в других направлениях деятельности общества. Врачи начинают ощущать, что они не в силах эффективно справляться с чудовищными информационными потоками, поступающими к ним при медицинском обслуживании населения и при исследовательской работе. Для того чтобы поставить правильный диагноз и назначить соответствующее лечение, врач должен опросить и обследовать пациента, провести лабораторные и другие исследования и зарегистрировать собранную информацию. Он должен отобрать, проверить и сопоставить полученные данные с собственным опытом и на этой основе поставить диагноз, идентифицирующий заболевание. Как при диагностике, так и при лечении врач постоянно занят анализом и обработкой информации, что и позволяет ему достичь соответствующие медицинские цели. Если бы в процессе повседневной работы он мог без чрезмерных сложностей использовать медицинскую информационную систему для выборки и хранения клинических данных, аналитические возможности и быстродействие такой системы способствовали бы расширению профессиональных возможностей врача. Применительно к обслуживанию пациентов медицинский работник смог бы молниеносно восстановить всю необходимую медицинскую информацию и информацию о способах лечения в форме, максимально удобной для эффективного использования. Сталкиваясь с нестандартным заболеванием, врач может захотеть получить таблицу статистических данных, содержащую сотни или тысячи наборов признаков, симптомов или результатов лабораторных анализов, характеризующих больных, которым был поставлен этот же диагноз. Клинические лаборатории нуждаются в автоматизированных системах, предназначенных для расшифровки рентгеновских снимков, идентификации клеточных препаратов, обработки кардиограмм при массовых кардиологических обследованиях и диагностики. Больницам нужны автоматизированные информационные системы, включающие информационно-поисковые подсистемы для историй болезни, подсистемы назначения процедур и подсистемы управления больницей. Медицинские информационные системы явятся для медиков средством, способствующим обострению их интуиции и расширению профессиональных возможностей. Промышленность сталкивается с насущной необходимостью улучшить информационные связи между предприятиями. Административный персонал и руководство компаний нуждаются в большем количестве информации о положении внутри компаний, результатах собственной деятельности и рынке, на который компания работает, причем информация нужна им своевременно — так, чтобы они могли найти наилучшее решение в условиях быстро меняющейся конъюнктуры. Информационные системы играют важную роль в процессах принятия решений, как на правительственном, так и на «деловом» уровне. Окончательная оценка таких решений всегда будет производиться человеком, однако появившиеся концепции и методы, предусматривающие использование вычислительных машин, обеспечивают выдвижение и оценку такого количества вариантов, какое ни один руководитель не мог осмыслить. Возможность использовать, кроме того, методы анализа риска позволяет руководителю оценивать потенциальную опасность, связанную с каждой из множества изучаемых стратегий. Информационные системы обеспечат руководителю возможность более ясно представлять результаты принимаемых им решений. Наше счастье, что цифровые вычислительные машины - одно из важнейших технических достижений XX в.- начинают заполнять все расширяющуюся информационную «брешь». Вычислительная машина, отметившая только что свой тридцатый день рождения, достигла совершеннолетия, пройдя за короткий срок путь от научного курьеза до существенного элемента человеческого существования. История человечества не знает технического достижения, которое в большей степени оказало бы непосредственное влияние на человека и его образ жизни. Вычислительные машины во многих отношениях изменили представление о времени, сместили общепринятые пределы и связи, регулирующие нашу жизнь и деятельность организаций, в рамках которых она протекает, ускорили темп перемен. Только представьте, что бы произошло, если бы разом были исключены все вычислительные машины из нашей жизни. Воздушное сообщение было бы повергнуто в хаос, банки оказались бы завалены необработанными документами, промышленное производство распалось бы и многое в нашей жизни из того, что мы привыкли считать само собой разумеющимся, вдруг неожиданно испарилось бы. Банковское дело претерпело много перемен со времени «банковских каникул» 1933 г. Эти перемены привели к так называемой «банковской революции». Электронная цифровая вычислительная машина хотя и не являлась ее причиной, но оказалась инструментом, использованным для ее ускорения. «Банковская революция» заключалась в признании банками существования розничного рынка — потребностей отдельных лиц — в отличие от приоритета, стандартно предоставлявшегося нуждам, связанным с деловой активностью, деятельностью крупных корпораций и отдельных бизнесменов. Эта «революция» привела к росту внимания, уделяемого индивидуальным счетам, взносам по банковским ссудам, кредитным карточкам и различным способам привлечения сбережения с соответственно различными процентными ставками. «Революция» породила и проблему «бумажного» взрыва. За последние 30 лет количество чеков, обработанных банками, возросло более чем в 15 раз. К концу 1950-х годов количество использовавшихся финансовых документов и подлежащих обработке чеков увеличилось в такой степени, что грозило задушить банковскую систему Соединенных Штатов. В этот момент на помощь пришли цифровые вычислительные машины. позволили банкам быстро и с приемлемыми затратами обрабатывать огромное количество финансовых документов, обеспечивая, таким образом, банкам возможность продолжения роста. Кроме того, вычислительные машины использовались в качестве мощного инструмента управления. Рост и ускорение оборота капиталов заставлял банки постоянно искать новые рынки и новых клиентов, что приводило к еще большему ускорению роста. Таким образом, появление вычислительных машин действительно обеспечило увеличение темпа «банковской революции». Именно информационная система сделала эту «революцию» необходимой. Проблемы, связанные со взысканием налогов, относятся к наиболее серьезным из вызванных бумажной бурей. Налоговое управление с нетерпением ждет появления вычислительных машин и систем, обладающих большим быстродействием, лучшими возможностями накопления и поиска информации и наделенных способностью эффективно распознавать символы. Необходима хорошая налоговая информационная система, которая не только обеспечивает возможность работы в естественном масштабе времени и произвольной выборки информации, но также благодаря наличию сети терминалов, снабженных дисплеями, позволяет любому местному отделению получать любую необходимую информацию буквально нажатием кнопки. Это не только даст возможность местным отделения своевременно отвечать на вопросы налогоплательщиков, но и приведет к уменьшению количества запросов налогоплательщикам, касающихся уже предоставлявшейся ими информации. Судя по всему, мы вступаем в эпоху, когда человек, приобретя в качестве нового партнера созданные им информационные системы, окажется в состоянии решать много более сложные, чем когда бы то ни было, задачи. Этот новый вид «сотрудничества» сделает общество более совершенным, а жизнь людей — лучшей. Одной из важнейших проблем, возникающих в связи с созданием современных полностью автоматизированных информационных систем, является автоматизация процесса распознавания образов — область, изучением которой занято множество исследовательских групп. В их состав входят инженеры, специалисты в области вычислительной математики, кибернетики и теории информации, физики, статистики, психологи, биологи, физиологи, медики и лингвисты. Каждая из таких групп посвящает свою работу какому-то определенному аспекту общей проблемы распознавания. Наша книга представляет собой попытку обсудить фундаментальные принципы, лежащие в основе разработки автоматических систем распознавания образов.
|
1 |
Оглавление
|