Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше
Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике
Заключение
В
заключение остановимся на нерешенных проблемах анализа данных и знаний. А
таковых больше, чем решенных.
Действительно,
достаточно сказать, что из 28 типов задач анализа данных, упомянутых в классификационной
таблице 1 главы 2, в той или иной степени проработаны чуть больше десятка.
Часть из них широко известны, алгоритмы их решения реализованы в виде программ,
которые часто используются для решения практических задач. Для других же
сформулированы лишь общие идеи методов их решения. Так что фронт работ по
освоению задач новых типов и по совершенствованию методов и алгоритмов решения
известных задач анализа данных очень большой.
Исследования
в этой области должны быть направлены на преодоление трудностей решения
реальных прикладных задач, проявляющихся в:
- многомерности
признакового пространства;
- разнотипности
измерительных шкал;
- большом
числе образов;
- очень
малых и очень больших объемах обучающих выборок;
- наличии
ошибок и пробелов в таблицах данных;
- наличии
неинформативных признаков;
- наличии
структурированных объектов.
Для
расширения областей применения методов распознавания в экономике, социологии,
психологии и т. п. необходимо развитие методов теории измерений,
ориентированных на измерение не физических, а «гуманитарных» характеристик.
Актуальной
проблемой является разработка методов анализа данных, основанных на гипотезах,
отличающихся от используемой до настоящего времени гипотезы компактности.
Необходимо
дальнейшее углубление связи между методами и системами искусственного
интеллекта и системами распознавания образов и анализа изображений. В
частности, актуальной является задача распространения методов анализа данных
на решение аналогичных задач анализа знаний, что позволило бы поднять уровень
развития искусственного интеллекта. В данной книге отмечены лишь некоторые
первые шаги в этом перспективном направлении.
Погружение
сферы анализа информации в мир многоагентских компьютерных сетей требует
больших научно-организационных усилий для продвижения методов анализа данных и
знаний в эту новую операционную среду. При этом могут оказаться полезными
методы системного анализа [133].
Многие
прикладники не знают, что из протекающего через их руки потока информации с
помощью современных методов анализа данных можно было бы получить «сухой
осадок» в виде в простых, «прозрачных» закономерностей или знаний. Эти знания
могут помочь разобраться в структуре информации, выявить относительную важность
ее различных частей, своевременно обнаружить факты, отклоняющиеся от общей
закономерности, получить сигнал о первых предвестниках изменений в поведении
наблюдаемого процесса. Поэтому распространение знаний о возможностях
обсуждаемых здесь методов, включение такого рода материалов в учебные программы
для студентов самого разного профиля также было бы своевременным и полезным.