Прикладные методы анализа данных и знаний

  

Загоруйко Н.Г. Прикладные методы анализа данных и знаний. - Новосибирск: ИМ СО РАН, 1999, стр. 270

Главная цель машинной обработки экспериментальных или статистических данных состоит в автоматическом обнаружении скрытых в них закономерностей. Эти закономерности или знания позволяют понять сущность изучаемого процесса и, опираясь на имеющиеся данные, предсказывать новые факты. Первая часть книги содержит описания основных понятий, используемых в данной области. Во второй части представлен широкий круг методов и алгоритмов, с помощью которых из данных извлекаются новые знания. Большие объемы знаний также требуют машинной обработки с целью обнаружения закономерностей более высокого уровня или метазнаний. Третья часть книги и посвящена методам анализа знаний.

В книге отражены оригинальные результаты, полученные автором и его сотрудниками. Большая часть приведенных в ней алгоритмов давно и широко применяется при решении прикладных задач из области геологии, медицины, экономики, океанологии, речевой технологии и многих других. Студентам разных специальностей книга позволит познакомиться с основными идеями, используемыми в современных методах анализа данных и знаний. Аспиранты, специализирующиеся в области прикладной статистики и искусственного интеллекта, могут найти в ней предмет для постановки новых направлений исследований. Практики из любой прикладной области, связанные с необходимостью анализировать информацию в процессе принятия решений, узнают о новых средствах поддержки их деятельности.



Оглавление

Предисловие
Часть I. Введение в анализ данных
Глава 1. Основные понятия
§ 1. Чем отличаются «данные» от «знаний»?
§ 2. Что такое анализ данных?
§ 3. Принятие решений по прецедентам и моделям
§ 4. Что такое анализ знаний?
§ 5. Что такое закономерность?
Глава 2 Классификация задач анализа данных
§ 1. Теория измерений
1.1. Типы измерительных шкал
1.2. Сравнительная информативность шкал
§ 2. Классификация задач анализа данных
Глава 3 Базовые гипотезы, лежащие в основе методов анализа данных
§ 1. Гипотеза компактности
§ 2. Гипотеза L-компактности
Часть II. Методы анализа данных
Глава 4. Задачи таксономии
§ 1. Природа задач таксономии
§ 2. Алгоритмы таксономии класса FOREL
2.1. Алгоритм FOREL
2.2. Алгоритм FOREL-2
2.3. Алгоритм SKAT
2.4. Алгоритм KOLAPS
2.5. Алгоритм BIGFOR
2.6. Иерархическая таксономия
§ 3. Динамичная таксономия
3.1. Алгоритм DINA
3.2. Алгоритм SETTIP
§ 4. Таксономия с суперцелью
4.1. Алгоритм ROST
§ 5. Таксономия в анизотропном пространстве
§ 6. Сравнение алгоритмов таксономии
§ 7. Выбор числа таксонов
§ 8. Примеры решения практических задач
8.1. Задачи палеонтологии и геологической разведки
8.2. Задачи социологии и экономики
8.3. Задачи биологии
8.4. Задачи океанологии
8.5. Задачи распознавания речевых сигналов («кодовая книга»)
8.6. Другие области применения
§ 9. Некоторые дополнительные замечания о таксономии
Глава 5 Распознавание образов
§ 1. Алгоритмы построения решающих правил
§ 2. Статистические решающие правила
§ 3. Алгебраические методы построения решающих правил
§ 4. Распознавание большого числа образов
4.1. Метод отбора сильнейшего конкурента (МСК)
4.2. Метод попутного разделения (ПОРА)
4.3. Метод покоординатного вычеркивания (МПВ)
§ 5. Оценка потерь
§ 6. Гипотеза компактности в распознавании образов
§ 7. Построение решающих правил по конечной выборке
§ 8. Решающие правила, опирающиеся на прецеденты
8.1. Минимизация набора прецедентов (алгоритм STOLP)
8.2. Метод «дробящихся эталонов» (алгоритм ДРЭТ)
8.3. Таксономические решающие функции (алгоритм ТРФ)
§ 9. Логические решающие правила
9.1. Алгоритм CORAL
9.2. Алгоритм DW
§ 10. Представительность выборки
Глава 6 Выбор системы информативных признаков
§ 1. Постановка задачи
§ 2. Критерии информативности признаков
§ 3. Метод последовательного сокращения (алгоритм Del)
§ 4. Метод последовательного добавления признаков (алгоритм Add)
§ 5. Метод случайного поиска с адаптацией (алгоритм СПА)
§ 6. Направленный таксономический поиск признаков (алгоритм НТПП)
Глава 7 Заполнение пробелов и обнаружение ошибок в эмпирических таблицах
§ 1. Обзор работ по проблеме заполнения пробелов
§ 2. Базовый алгоритм ZET заполнения пробелов
§ 3. Некоторые варианты алгоритма ZET
§ 4. Примеры применения алгоритмов семейства ZET
§ 5. Алгоритмы семейства WANGА
Глава 8 Прогнозирование многомерных временных рядов
§ 1. Введение
§ 2. Обучающийся генетический алгоритм прогнозирования LGAP
2.2. Отбор компетентных штаммов
2.3. Выработка частных вариантов прогноза
2.4. Получение окончательного прогноза
§ 3. Критерии для оценки точности прогноза
§ 4. Возможности распараллеливания алгоритма LGAP
§ 5. Экспериментальная проверка алгоритма LGAP
§ 6. Коллективно-групповые методы распознавания (класс алгоритмов КГМ)
Глава 9. Согласование разнотипных шкал
§ 1. Расстояние между объектами в пространстве разнотипных признаков
§ 2. Расстояние между разнотипными признаками
Глава 10 Алгоритмы таксономии в L-пространстве
§ 1. Алгоритм L-KRAB
§ 2. Алгоритм L-KRAB-2
§ 3. Выбор числа таксонов
Глава 11 Методы распознавания образов в L-пространстве
§ 1. Правило k ближайших соседей (алгоритм L-NNR)
§ 2. Выбор прецедентов (алгоритм L-STOLP)
§ 3. Групповое распознавание
Глава 12. Другие задачи анализа данных в L-пространстве
§ 1. Критерии информативности L-пространства
§ 2. Задачи заполнения пробелов
§ 3. Пакет прикладных программ ОТЭКС
Глава 13 Анализ данных и Data Mining
§ 1. Что такое Data Mining?
§ 2. Переоткрытие некоторых законов природы
2.2. Закон Менделя
2.3. Периодический закон Менделеева
Часть III. Анализ знаний и структур
Глава 14. Метрика в пространстве знаний
§ 1. Меры близости между предикатами
§ 2. Расстояние между знаниями
Глава 15. Методы анализа знаний
§ 1. Таксономия знаний
§ 2. Распознавание образов в пространстве знаний
§ 3. Выбор информативного подмножества предикатов
§ 4. Заполнение пробелов в базе знаний
Глава 16 Методы анализа структурных объектов
§ 1. Метод динамического программирования
§ 2. Метод скрытых марковских процессов (СМП)
§ 3. D-алгоритм для таксономии траекторий
§ 4. Иерархические структуры
§ 5. Расстояние между иерархиями
5.1. Расстояние по виду структуры
5.2. Расстояние по весовым индексам
§ 6. Таксономия иерархий
§ 7. Распознавание иерархических структур
Глава 17. Анализ данных, знаний и структур в системах искусственного интеллекта
§ 1. Экспертные системы партнерского типа
§ 2. Отличительные характеристики ЭС и ПС
§ 3. Состояние разработок в области партнерских систем
§ 4. Анализ данных, знаний и структур, связанных с изучением проблемы устойчивого развития
Заключение
Литература
email@scask.ru