Главная > Принципы распознавания образов
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

Глава 1. ВВЕДЕНИЕ

Несколько лет назад в воскресном выпуске газеты «Нью-Йорк тайме» был задан следующий вопрос: «Облегчит ли положение маклерских фирм, все служебные помещения которых переполнены документами, сокращенный рабочий день?» Далее сообщалось: «Профессор психологии Гарвардского университета предупреждает, что к 2000 году возможности человеческого мозга воспринимать информацию могут оказаться исчерпанными. Быть может, наименее способные из нас в каком-то смысле уже близки к этому пределу, — заявил он, — потребность же в тех, кто все еще в состоянии справляться с современным уровнем сложности, все время увеличивается». Впрочем, текущую прессу мало заботит информационный взрыв.

В последнее время в нашем весьма сложном технологически ориентированном обществе создалось такое положение, при котором все большее количество людей и организаций занимаются обработкой информации и все меньшее — обработкой материальных объектов. Ощутимой стала потребность в более совершенных информационных системах, поскольку информация — ключевой элемент процесса принятия решений, а количество разнохарактерной и разной степени сложности информации, которую порождает наш мир, растет. Одной из важнейших задач, возникающих в связи с созданием современных информационных систем, является автоматизация процесса распознавания образов. Именно этой проблеме и посвящена наша книга.

1.1. ПРОБЛЕМА ОБРАБОТКИ ИНФОРМАЦИИ

Прогресс «технологической» цивилизации и развитие науки породили информационную проблему, с которой столкнулось сейчас человеческое общество. У первобытных людей такой проблемы не было. В самом деле, уровень развития общества можно оценить количеством генерируемой им информации и знания. Без информации цивилизация, как мы ее понимаем, существовать не может. Решение современных социальных проблем также зависит от разрешения информационной проблемы. Информационный взрыв — один из наиболее драматических вызовов,

угрожающих нашему обществу в 1970-х и 1980-х годах, причем темп роста этой угрозы будет продолжать увеличиваться.

Проблему информационного взрыва хорошо иллюстрирует следующая статистика. В 1830 г. выходило около 300 технических и научных журналов. Сегодня во всем мире на более чем 50 языках в год выходит свыше 60 000 журналов, содержащих около 2,5 миллиона статей. Ежегодно во всем мире выпускается в свет около 80 000 новых названий книг. Ежегодно через банки проходит около 20 миллиардов чеков, причем каждый обрабатывается 4—5 раз. Ведущие банки выполняют в день около 25 миллионов операций. Министерство почт Соединенных Штатов очень серьезно озабочено проблемой почтовой корреспонденции. В настоящее время в почтовых отделениях США за одну секунду обрабатывается около 27 000 единиц почтовых отправлений; это соответствует 84 миллиардам в год, а к 1980 г. ожидается увеличение этой цифры до 116 миллиардов. Главный почтмейстер заявил несколько лет назад в подкомитете конгресса: «Откровенно говоря, наше министерство состязается в скорости с надвигающейся катастрофой».

В архивах федеральных служб Соединенных Штатов в настоящее время хранится более 200 миллионов отпечатков пальцев и около 150 миллионов счетов по выплатам в рамках системы социального обеспечения. В 1940 г. было зарегистрировано всего 15 миллионов налоговых деклараций — в 1973 г. Налоговое управление обработало уже свыше 100 миллионов налоговых деклараций и 360 миллионов единиц соответствующих документов. Налоговое управление ожидает, что к 1980 г. число налоговых деклараций достигнет 137 миллионов. Проблема объема операций осложняется еще и тем обстоятельством, что налоговая система в Соединенных Штатах регулируется довольно сложным законодательством и отражает постоянно увеличивающееся разнообразие финансовых сделок.

Проблемы, встающие перед медициной в связи с информационным взрывом, аналогичны тем, которые сегодня возникают и в других направлениях деятельности общества. Врачи начинают ощущать, что они не в силах эффективно справляться с чудовищными информационными потоками, поступающими к ним при медицинском обслуживании населения и при исследовательской работе. Для того чтобы поставить правильный диагноз и назначить соответствующее лечение, врач должен опросить и обследовать пациента, провести лабораторные и другие исследования и зарегистрировать собранную информацию. Он должен отобрать, проверить и сопоставить полученные данные с собственным опытом и на этой основе поставить диагноз, идентифицирующий заболевание. Как при диагностике, так и при лечении

врач постоянно занят анализом и обработкой информации, что и позволяет ему достичь соответствующие медицинские цели. Если бы в процессе повседневной работы он мог без чрезмерных сложностей использовать медицинскую информационную систему для выборки и хранения клинических данных, аналитические возможности и быстродействие такой системы способствовали бы расширению профессиональных возможностей врача. Применительно к обслуживанию пациентов медицинский работник смог бы молниеносно восстановить всю необходимую медицинскую информацию и информацию о способах лечения в форме, максимально удобной для эффективного использования. Сталкиваясь с нестандартным заболеванием, врач может захотеть получить таблицу статистических данных, содержащую сотни или тысячи наборов признаков, симптомов или результатов лабораторных анализов, характеризующих больных, которым был поставлен этот же диагноз. Клинические лаборатории нуждаются в автоматизированных системах, предназначенных для расшифровки рентгеновских снимков, идентификации клеточных препаратов, обработки кардиограмм при массовых кардиологических обследованиях и диагностики. Больницам нужны автоматизированные информационные системы, включающие информационно-поисковые подсистемы для историй болезни, подсистемы назначения процедур и подсистемы управления больницей. Медицинские информационные системы явятся для медиков средством, способствующим обострению их интуиции и расширению профессиональных возможностей.

Промышленность сталкивается с насущной необходимостью улучшить информационные связи между предприятиями. Административный персонал и руководство компаний нуждаются в большем количестве информации о положении внутри компаний, результатах собственной деятельности и рынке, на который компания работает, причем информация нужна им своевременно — так, чтобы они могли найти наилучшее решение в условиях быстро меняющейся конъюнктуры. Информационные системы играют важную роль в процессах принятия решений, как на правительственном, так и на «деловом» уровне. Окончательная оценка таких решений всегда будет производиться человеком, однако появившиеся концепции и методы, предусматривающие использование вычислительных машин, обеспечивают выдвижение и оценку такого количества вариантов, какое ни один руководитель не мог осмыслить. Возможность использовать, кроме того, методы анализа риска позволяет руководителю оценивать потенциальную опасность, связанную с каждой из множества изучаемых стратегий. Информационные системы обеспечат руководителю возможность более ясно представлять результаты принимаемых им решений.

Наше счастье, что цифровые вычислительные машины - одно из важнейших технических достижений XX в.- начинают заполнять все расширяющуюся информационную «брешь». Вычислительная машина, отметившая только что свой тридцатый день рождения, достигла совершеннолетия, пройдя за короткий срок путь от научного курьеза до существенного элемента человеческого существования. История человечества не знает технического достижения, которое в большей степени оказало бы непосредственное влияние на человека и его образ жизни. Вычислительные машины во многих отношениях изменили представление о времени, сместили общепринятые пределы и связи, регулирующие нашу жизнь и деятельность организаций, в рамках которых она протекает, ускорили темп перемен. Только представьте, что бы произошло, если бы разом были исключены все вычислительные машины из нашей жизни. Воздушное сообщение было бы повергнуто в хаос, банки оказались бы завалены необработанными документами, промышленное производство распалось бы и многое в нашей жизни из того, что мы привыкли считать само собой разумеющимся, вдруг неожиданно испарилось бы.

Банковское дело претерпело много перемен со времени «банковских каникул» 1933 г. Эти перемены привели к так называемой «банковской революции». Электронная цифровая вычислительная машина хотя и не являлась ее причиной, но оказалась инструментом, использованным для ее ускорения. «Банковская революция» заключалась в признании банками существования розничного рынка — потребностей отдельных лиц — в отличие от приоритета, стандартно предоставлявшегося нуждам, связанным с деловой активностью, деятельностью крупных корпораций и отдельных бизнесменов. Эта «революция» привела к росту внимания, уделяемого индивидуальным счетам, взносам по банковским ссудам, кредитным карточкам и различным способам привлечения сбережения с соответственно различными процентными ставками. «Революция» породила и проблему «бумажного» взрыва. За последние 30 лет количество чеков, обработанных банками, возросло более чем в 15 раз. К концу 1950-х годов количество использовавшихся финансовых документов и подлежащих обработке чеков увеличилось в такой степени, что

грозило задушить банковскую систему Соединенных Штатов. В этот момент на помощь пришли цифровые вычислительные машины. позволили банкам быстро и с приемлемыми затратами обрабатывать огромное количество финансовых документов, обеспечивая, таким образом, банкам возможность продолжения роста. Кроме того, вычислительные машины использовались в качестве мощного инструмента управления. Рост и ускорение оборота капиталов заставлял банки постоянно искать новые рынки и новых клиентов, что приводило к еще большему ускорению роста. Таким образом, появление вычислительных машин действительно обеспечило увеличение темпа «банковской революции». Именно информационная система сделала эту «революцию» необходимой.

Проблемы, связанные со взысканием налогов, относятся к наиболее серьезным из вызванных бумажной бурей. Налоговое управление с нетерпением ждет появления вычислительных машин и систем, обладающих большим быстродействием, лучшими возможностями накопления и поиска информации и наделенных способностью эффективно распознавать символы. Необходима хорошая налоговая информационная система, которая не только обеспечивает возможность работы в естественном масштабе времени и произвольной выборки информации, но также благодаря наличию сети терминалов, снабженных дисплеями, позволяет любому местному отделению получать любую необходимую информацию буквально нажатием кнопки. Это не только даст возможность местным отделения своевременно отвечать на вопросы налогоплательщиков, но и приведет к уменьшению количества запросов налогоплательщикам, касающихся уже предоставлявшейся ими информации.

Судя по всему, мы вступаем в эпоху, когда человек, приобретя в качестве нового партнера созданные им информационные системы, окажется в состоянии решать много более сложные, чем когда бы то ни было, задачи. Этот новый вид «сотрудничества» сделает общество более совершенным, а жизнь людей — лучшей. Одной из важнейших проблем, возникающих в связи с созданием современных полностью автоматизированных информационных систем, является автоматизация процесса распознавания образов — область, изучением которой занято множество исследовательских групп. В их состав входят инженеры, специалисты в области вычислительной математики, кибернетики и теории информации, физики, статистики, психологи, биологи, физиологи, медики и лингвисты. Каждая из таких групп посвящает свою работу какому-то определенному аспекту общей проблемы распознавания. Наша книга представляет собой попытку обсудить фундаментальные принципы, лежащие в основе разработки автоматических систем распознавания образов.

1
Оглавление
email@scask.ru