Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике К читателюОсновные тенденции развития кибернетики в начале третьего тысячелетия можно выразить двумя словами: биологизация и гибридизация. Под биологизацией чаще всего понимается построение и исследование моделей поведения сложных объектов и способов управления ими на основе имитации механизмов, реализованных Природой в живых существах. Такой подход обусловлен тем фактом, что многие так называемые “классические” методы обработки информации воспринимаются в настоящее время как простейшие реализации универсальных способов функционирования биологических объектов. В качестве примеров можно привести последовательные алгоритмы фон Неймана (вырожденный случай параллельной обработки информации), а также двоичную логику (частный случай нечеткой логики). С другой стороны, стремительное увеличение вычислительных мощностей и развитие математического аппарата позволили подступиться к решению таких задач, размерность которых еще 5-10 лет назад была непреодолимым барьером для исследователя. Гибридизация, в свою очередь, состоит в совместном применении различных методов и/или моделей для обработки информации об одном и том же объекте Парадигма такого подхода основана на согласии с тем, что любая сколь угодно сложная искусственная модель реального объекта всегда будет примитивнее и проще оригинала, и только многоаспектное его изучение с последующей интеграцией получаемых результатов позволит обрести необходимые знания или приблизиться к оптимальному решению. Гибридный подход давно и эффективно используется в научных исследованиях (вспомним понятия корпускулярноволнового дуализма, микро- и макроэкономические исследования одних и тех же хозяйственных систем и т.п.). Предлагаемая вниманию уважаемого читателя книга видного польского ученого С. Осовского удачно иллюстрирует названные тенденции в одной из наиболее динамично развивающихся областей современной теории интеллектуальных вычислений (англ.: computational intelligence), связанной с построением и применением искусственных нейронных сетей. Сформированные в рамках этого направления многослойные сетевые модели, в качестве прототипа которых используются структуры и механизмы функционирования биологических нервных систем, все более серьезно рассматриваются в качестве методологического базиса для создания сверхскоростных технических устройств параллельной обработки информации. Представленный в книге материал можно рассматривать с трех точек зрения. Во-первых, это своего рода справочник по наиболее важным моделям нейронных сетей, написанный очень точным и корректным с математической точки зрения языком. Обширная библиография дополнительно обогащает семантику книги, превращая ее в своего рода путеводитель по первоисточникам. Во-вторых, это конспект лекций, стиль и характер которого свидетельствуют о богатом педагогическом опыте и мастерстве автора - профессора Варшавского политехнического университета. Большое количество примеров практической реализации сетей и их детальный анализ делают настоящее издание незаменимым учебным пособием для всех изучающих, преподающих и применяющих теорию искусственных нейронных сетей. В-третьих, книга содержит результаты собственной научной деятельности автора, который в силу личной скромности умалчивает о том, что многие описываемые в ней методы, структуры и алгоритмы (в частности, методы генерации градиента в многослойной сети на основе потоковых и сопряженных графов, метод обучения персептронной сети по алгоритму переменной метрики BFGS с направленной минимизацией, гибридный алгоритм обучения радиальных сетей, алгоритм обучения многослойного персептрона с обратной связью RMLP, гибридная сеть с самоорганизующейся и MLP-компонентой, структура и гибридный алгоритм обучения нечеткой сети TSK с самоорганизацией нейронов, а также многие другие) известны мировой научной общественности по имени их создателя С. Осовского. В разделе 1 обсуждаются биологические основы функционирования нейрона, базовая модель нейрона МакКаллока-Питса, а также виды межнейронных взаимодействий, позволяющие строить искусственную нейронную сеть. В разделе 2 представлены наиболее широко применяемые в настоящее время модели нейронов, в том числе модель персептрона, модель сигмоидального нейрона, адалайн, модель Хебба, инстар и оутстар, а также модель WTA. Рассматриваются важнейшие алгоритмы обучения, основанные как на обучении с учителем, так и на самоорганизации. Раздел 3 посвящен однонаправленным сигмоидальным сетям, чаще всего применяющимся на практике. Обсуждаются градиентные алгоритмы обучения, реализующие метод обратного распространения ошибки для ее минимизации при генерации вектора градиента. Представлены элементы глобальной оптимизации методами имитации отжига и генетических алгоритмов. В разделе 4 рассматриваются проблемы практического использования неоднородных сетей, в том числе выбора оптимальной архитектуры сети, принципов формирования обучающих выборок и методов повышения эффективности обобщения. Представлены примеры использования таких сетей для задач распознавания и классификации образов, сжатия сигналов, идентификации динамических объектов и прогнозирования временных рядов. Раздел 5 посвящен сетям с радиальными базисными функциями (RBF). Рассматриваются типовые сетевые структуры и алгоритмы обучения, основанные на обучении с учителем и на самоорганизации конкурирующих нейронов. В разделе 6 описываются специализированные сети, структура которых проектируется исходя из необходимости достижения конкретных целей. К ним относятся сеть каскадной корреляции Фальмана и сеть Вольтерри. Особенно интересна неоднородная структура сети Вольтерри, предназначенной для адаптивной обработки сигналов в реальном времени. В разделе 7 содержатся сведения о рекуррентных сетях, используемых в качестве ассоциативных запоминающих устройств. Представлено описание структур и методов обучения сетей Хопфилда, Хемминга и сети типа ВАМ. Их функционирование иллюстрируется на численных примерах. Раздел 8 посвящен рекуррентным сетям, построенным на неоднородных персептронах, в частности рассматриваются сеть RMLP, сеть Эльмана и сеть RTRN Вильямса-Зиспера. Теоретические рассуждения подкрепляются многочисленными примерами компьютерного моделирования этих сетей. В разделе 9 обсуждаются сети с самоорганизацией на основе конкуренции нейронов. Приводятся описания алгоритмов обучения таких сетей и принципы их применения для решения задач распознавания и классификации образов, сжатия сигналов и прогнозирования временных рядов. В разделе 10 рассматриваются вопросы корреляционного обучения (по Хеббу). Представлены два вида нейронных сетей, в которых реализовано обобщенное правило Хебба: сети РСА, осуществляющие анализ главных компонентов, и сети ICA Херольта-Джуттена для слепого разделения сигналов. Обсуждаются важнейшие алгоритмы обучения этих сетей и принципы их практического использования. Разделы 11 и 12 посвящены новейшим достижениям в теории нейронных сетей, связанным с применением нечеткой логики. В одиннадцатом разделе представлены математические основы нечетких систем, необходимые для понимания деятельности таких сетей. В двенадцатом разделе рассматриваются базовые структуры и принципы функционирования нечетких сетей, использующих для адаптации параметров методы обучения как с учителем, так и на основе самоорганизации. Несколько слов о применяемой терминологии. Причины лингвистической неоднозначности, которой грешат многие русскоязычные публикации, кроются в разрозненности отечественных научных центров, занимающихся исследованием и применением искусственных нейронных сетей, а также в отсутствии русскоязычного периодического издания национального масштаба, целиком посвященного этой проблематике и способного формировать “терминологическую политику”. При переводе монографии С. Осовского мы старались соблюдать принцип стилистического единства текста (особенно в плане использования профессиональных англицизмов), а также максимально корректно применять правила англо-русской транскрипции и транслитерации. В необходимых случаях наряду с используемыми в книге переводными терминами приводятся их наиболее распространенные русифицированные аналоги. Издание рассчитано на читателя, обладающего определенной математической подготовкой. Предполагается, что он знаком с основными понятиями линейной алгебры, дифференциального исчисления, теории оптимизации, теории вероятности и теории множеств. Хочется верить, что публикация книги С. Осовского на русском языке станет еще одним стимулом для повышения эффективности как проводимых, так и планируемых в России исследований в области нейронных сетей. И. Рудинский, кандидат технических наук
|
1 |
Оглавление
|