ИНДЕКСИРОВАНИЕ
— присвоение документу набора ключевых слов или кодов, служащих указателем содержания документа и используемых для его поиска (в основном, для документов с научно-тех. информацией). Возможны два способа И. — свободное (когда непосредственно из текста документа извлекают ключевые слова без учета всех видоизменений их форм и отношений между ними) и контролируемое (когда в поисковый образ документа включаются только те слова, которые зафиксированы в словаре ключевых слов, где указаны их синонимические, родовидовые и ассоциативные отношения). Обычно И. осуществляют опытные библиотекари или специалисты данной отрасли науки. Для уменьшения затрат времени и средств разрабатываются методы автоматического

статистические, пермутационные, библиографические и ассоциативные методы индексирования.
Статистические методы И. основаны на гипотезе о том, что частота употребления слова связана с его значимостью для смысла документа. Обычно эта связь понимается слишком упрощенно — как возрастание информационной значимости слов с ростом их частоты. Другие, напротив, полагают, что информационная ценность редких слов выше, чем информационная ценность частых слов. Это учитывается при использовании метода статистических отклонений, когда измеряются отклонения частоты слов в индексируемом документе от теоретически ожидаемой частоты этих слов.
Пермутац ионное И. И. словами из заголовка документа путем помещения заголовка в алфавитный словарь столько раз, сколько разных слов имеется в нем; при этом каждое ключевое слово помещают на свое место алфавита и сопровождают всем контекстом
заголовка. Пермутационное И. широко применяют в информационных службах.
Библиографическое и ассоциативное И. используют в более широких целях: библиографическое — для И. документа ссылками на др. документы и публикации, содержащиеся в нем (указатель цитированной литературы позволяет производить поиск информации и изучать закономерности развития науки); ассоциативное — для И. с использованием карт ассоциативных связей между ключевыми словами, полученных с помощью анализа частоты повторения сочетаний ключевых слов в текстах. В зависимости от интервала текста, в котором регистрируется эта частота, получают различные карты ассоциативных связей. См. также А ннотирование автоматическое, Информационно-поисковая система документальная, Поиск информации автоматический.
Лит.: Михайлов А. И., Черный А. И., Гиляревский Р. С. Основы информатики. М., 1968 [библиогр. с. 728—735]; Москович В. А. Статистика и семантика. М., 1969 [библиогр. с. 294— 301]. В. А. Москович.