СЛОВАРЬ АВТОМАТИЧЕСКИЙ
— 1) Словарь, в котором словарный поиск осуществляется не вручную, а машиной (автоматически); 2) тот же словарь с системой программ обслуживающих. С. а. может использоваться как для автоматического перевода (см. Машинный перевод) с одного языка (входного) на другой язык (выходной), так и непосредственно человеком-переводчиком.
С. а. представляет собой совокупность словарных статей, содержащих информацию о лексических единицах, т. е. словах или фразеологических словосочетаниях (таких, что смысл всего словосочетания не может быть выведен из смыслов отд. элементов этого словосочетания некоторым регулярным образом). Заглавие словарной статьи — это принятая в данном С. а. запись лексической единицы. Одной такой единице может соответствовать несколько словарных статей. Заглавием словарной статьи может быть основа слова (тогда мы имеем словарь основ), словоформа (тогда речь идет о словаре словоформ), а также фразеологическое сочетание, которое может записываться как последовательность одних словоформ или как последовательность основ и словоформ.
В словаре основ записывается та основа (или несколько основ) лексической единицы, от которой можно образовать все формы данной лексической единицы с помощью определенных правил и таблиц, содержащих списки аффиксов (частей слов, изменяющих значения корней слов). Таким путем достигается значительная экономия памяти ЦВМ по сравнению со словарем словоформ. Недостаток словарей основ заключается в том, что при таком способе записи заглавия появляется возможность неправильного разбиения словоформы текста на основу и аффиксы при поиске (см. Словарный поиск).
Словарь словоформ содержит все формы каждой лексической единицы. При работе со словарями этого типа отпадает необходимость морфологического анализа, но сильно возрастает объем памяти, занятой словарем.
В системе автомат, перевода С. а. содержит, как правило, следующие характеристики лексической единицы: переводные эквиваленты; указание о наличии других значений у данной лексической единицы (в этом случае должен задаваться способ выбора нужного значения); морфологические сведения: а) часть речи, б) указание о словоизменении, в) указание о словообразовании, г) тип чередования; синтаксические сведения; семантические сведения; лексические сведения (слова, которые могут употребляться с данным словом); стилистические пометы; указание о том, что данное слово является сложным и пишется через пробел; ударение; различные тех. характеристике (напр., число букв в основе). Иногда эта совокупность характеристик наз. словарной информацией слова.
С. а. по сравнению с обычным двуязычным словарем обладает следующими особенностями: словарная статья С. а. содержит больше характеристик данной лексической единицы, чем их имеется в обычном словаре; С. а. делится на два независимых словаря — входного и выходного языков, между которыми устанавливается соответствие путем задания для каждого слова входного языка его переводного эквивалента.
С. а. обычно записывается в ЦВМ на носителе информации определенных видов (лентах магнитных, дисках магнитных и т. п.). Осн. методы записи заглавий словарных статей следующие: заглавие кодируется побуквенно; записывается не само заглавие, а его определенный «сжатый» код; в машине Вообще не хранятся заглавия, а хранится т. н. «дерево» букв. Сущность методов «сжатого» кодирования состоит в том, что из кода заглавия, полученного побуквенным кодированием, получаются более короткие коды равной длины.
Используются также различные способы сокращенной записи заглавий, напр., одинаковые начала не повторяются при записи основ. Такая запись сделана в группе СЕТА (Гренобль, Франция) для автомат, перевода с русского языка на французский. «Дерево» букв — это таблица таблиц. В первой таблице указаны все буквы, возможные на первом месте слова; при каждой букве этой таблицы указан адрес таблицы букв, возможных на втором месте после данной буквы, и т. д. При последней букве хранится адрес словарной статьи. «Дерево» букв не нашло широкого применения, т. к. при такой организации словаря затруднено его пополнение. При побуквенном кодировании заглавия в С. а. обычно располагаются в алфавитном порядке. Но известны и др. способы упорядочивания, напр., в порядке убывания длины заглавий или в порядке убывания частоты употребления соответствующих лексических единиц.
Из имеющихся словарей большого объема, предназначенных для автомат, перевода, заслуживает внимания словарь, составленный в Гарвардском ун-те (США). Этот русско-английский автомат, словарь, содержащий 12 000 русских лексических единиц (да 30 000 основ), успешно функционирует с 1959. Словарь обслуживается системой программ, позволяющей пополнять его, подсчитывать частоту слов в тексте, проверять информацию к словарным единицам и т. п. Национальная физ. лаборатория (Англия) использовала его в экспериментах по переводу текстов из области радиотехники и электроники. Русская часть этого словаря использована группой СЕТА в системе русско-французского перевода.
Большую работу по составлению пятиязычного словаря, предназначенного для человека-переводчика, проделали ученые Брюссельского ун-та совместно с Терминологическим бюро Европейского объединения угля и стали (Люксембург). Этот словарь (DICAUTOM) дает возможность получать переводы тех.
терминов с немецкого, французского и голландского на любой из пяти языков (английский, голландский, немецкий, итальянский, французский). Словарь насчитывает 6000 терминов, каждый из которых записан на 5 языках, причем тут же на пяти языках приводятся контексты, в которых встречается данный термин. Переводчик получает переводы отмеченных им слов на заданный язык вместе со списком контекстов каждого слова. Большой англонемецкий словарь (700 000 англ. слов) имеется в Мангейме (ФРГ); машина выдает все переводы слов, отмеченных переводчиком.
Лит.:
.