ЯЗЫКА МОДЕЛИ АНАЛИТИЧЕСКИЕ
— разновидности моделей языка, в которых считается заданным некоторый набор текстов или иные сведения, интерпретируемые как эмпирические данные о языке, и на основании этих данных устанавливаются те или иные закономерности строения языка (см. Языка модели математические). Я. м. а. можно рассматривать как формальное описание некоторых сторон исследовательской деятельности лингвиста. Они Ее обязательно связаны с автомат, анализом текста и могут не быть конструктивными.
Существуют Я. м. а., построенные на основе статистических методов, но чаще всего под Я. м. а. понимают модели, в которых используются лишь первоначальные понятия логики и теории множеств, а также некоторые элементарные понятия алгебры и, реже, топологии.
В Я. м. а. наиболее полно разработанного типа исходными понятиями являются: а) мн-во V (обычно, но не всегда, конечное), называемое «словарем»; б) мн-во
правильных последовательностей, или «фраз» языка (элементы ниже наз. словами, элементы 0 — фразами) и в) некоторые отношения на этих множествах, отражающие в общем виде смысл слов и предложений языка. Основы теории Я. м. а. этого типа изложила в конце 50-х г.
ученый О. С. Кулагина.
По своему назначению Я. м. а. подразделяют на фонологические (предназначенные для описания фонологических понятий) и синтаксические (предназначенные для описания синтаксических — в широком смысле слова — понятий). В фонологических моделях элементы словаря интерпретируются обычно как звуки языка, а правильные последовательности — как возможные сегменты речи между соседними паузами; в синтаксических моделях элементы V, как правило, означают слова (причем, напр., «стол» и «столу» — разные элементы), а правильные последовательности — грамматически правильные предложения (не обязательно осмысленные; напр., предложение «Бесцветные зеленые идеи яростно спят» грамматически правильно).
Я. м. а. указанного выше типа можно классифицировать по сложности исходных объектов следующим образом.
1. Язык 1-й степени сложности — пара
Пусть
и g — произвольные, не обязательно правильные, последовательности элементов V). Упорядоченная пара
контекстом. Говорят, что
допускает слово
последовательность
, если
. Пусть а,
Говорят, что а подчиняет b относительно 0 (обозначение
), если любой контекст, допускающий а, допускает и b. Если
, то по определению а и b входят в одно семейство S. Семейство
подчиняет
если существуют а
такие, что
Семейство
начальным, если не существует
такого, что
Совокупность
, где S — начальное семейство и для любого
верно
элементарной грамматической категорией (ЭГК), порожденной S. Слова «одинаковой формы», напр., «окно» и «лето», как правило относятся к одному семейству. Но, напр., «метро» и «окно» относятся к разным семействам (ср. «подошел к метро» при невозможности «подошел к окно»). Эти слова объединяются, однако, в одну ЭГК (в другую ЭКГ входят «окну» и «метро» и т. п.). Т. о., здесь возникают средства для формального описания омонимии. Наряду с отношениями на словаре (т. н. отношениями парадигматическими) в модели могут изучаться и отношения на фразах (т. н. отношения синтагматические).
Пусть
содержит не менее двух слов. Последовательность
конфигурацией 1-го ранга, если существует слово а такое, что для любых
тогда и только тогда, когда
. Пусть определено понятие конфигурации
ранга для всех
Тогда конфигурацией
ранга наз. последовательность А, для которой найдется слово а такое, что для любых
выполняются условия: 1) еели
, то
если
не содержит вхождений конфигураций рангов, меньших
, пересекающихся с выделенным вхождением А и не входящих в него целиком, то
. Конфигурация ранга
наз. простой, если она не содержит никаких других конфигураций ранга
. Фраза
неприводимой в языке
если она не содержит никаких конфигураций этого языка.
Язык наз. конечно-характеризуемым, если число его простых конфигураций и неприводимых фраз конечно. С помощью этих понятий устанавливаются связи между Я. м. а. и грамматиками порождающими; в частности, всякий конечно-характеризуемый язык может быть порожден бесконтекстной грамматикой. Модель
допускает различные обобщения. Одно из них состоит в том, что подчинение определяется относительно произвольного подмножества (фрагмента)
множества
. При этом наиболее важны т. н. правильные фрагменты. Фрагмент
наз. правильным, если для любых
из
следует а
Рассмотрение фрагментов дает лучшее приближение к реальным лингвистическим методам, чем рассмотрение всего мн-ва
, т. к. в лингвистике язык всегда изучается по некоторой ограниченной совокупности фраз. Наконец, в модели
исследуются разбиения словаря V. Пусть В — такое разбиение
-образом слова а (обозначенного как В (а)) наз. класс, в который а попадает при разбиении В.
-образом последовательности
последовательность классов
Обозначим через В (F) мн-во классов разбиения В, через
мн-во всех таких последовательностей
что для каждой из них
. Пару
можно рассматривать как язык 1-й степени сложности. Естественным образом определяются понятия
-контекста,
-подчинения и
-семейства. Разбиение на
-семейства наз. производным от разбиения В и обозначается В.
2. Язык 2-й степени сложности — пара
, где Г — разбиение словаря на т. н. окрестности, интерпретируемые в синтаксических моделях как мн-ва форм одного слова, слов одного корня или слов, относящихся к одному объекту действительности. В этой модели предложено несколько аналогов части речи, напр.: а) разбиение на типы Т — производное от разбиения на окрестности; б) система гипертипов, т. е. ЭГК, определенных в языке
Удобство второго понятия иллюстрируется следующим примером. Слова «окно», «дом» и «игрушка» принадлежат к одному типу (хотя и к разным семействам), но слово «мнение» относится уже к другому типу, ибо можно сказать «мнение, что он жив», но невозможно «окно, что он жив», «дом, что он жив» или «игрушка, что он жив». Тем не менее слово «окно» всегда можно заменить на слово «мнение» без нарушения грамматической правильности, а отсюда следует, что существует объединяющий их гипертип.
В модели
предложен ряд аналогов грамматической категории рода. Простейший из них имеет следующий вид: слова а и b относятся к одному роду, если для всякого слова
найдется слово
и то же верно для любого слова
Так, слова «окну» и «дому», входящие в одно семейство
окну», «дому») входят в два разных рода, т. к. слова «окно» и «дом» входят в разные семейства. Поскольку категория рода определяется в модели абстрактно, то «роды» определяются не только для существительных, но и для др. частей речи. В классе глаголов в один род объединяются все глаголы с одинаковым управлением, напр., «благодарить», «ругать», «награждать» (к.-н. за что-либо). Но не все грамматические категории могут быть выведены из исходных понятий модели
Язык 3-й степени сложности — пара
где
— система
разбиений словаря, называемых категориями. Классы, в которые попадает слово а при разбиениях
его категориальными формами, или признаками, и интерпретируются как синтаксические, семантические или фонологические группировки. Если каждое разбиение состоит из двух классов, система
бинарной, или дихотомической.
Так, напр., в фонологической теории Р. Якобсона каждый звук любого языка мира характеризуется системой из
признаков, принимающих только два значения (гласность — негласность, согласность — несогласность, звонкость — глухость, высокая тональность — низкая тональность и т. п.). Эту систему можно описать с помощью понятий теории кодов. В данной модели все категории равноправны, но в ряде моделей признаки могут быть иерархизованы так, чтобы одни группировки определялись с помощью других.
Пусть, напр., задана категория, интерпретируемая для существительных как категория грамматического числа. Тогда категория падежа может быть определена следующим образом. Все контексты, допускающие слова из обеих категориальных форм числа, наз. падежеобразующими. Два падежеобразующих контекста по определению эквивалентны, если они допускают одни и те же сло-ва. Падежом тогда наз. класс эквивалентных падежеобразующих контекстов. Эта идея принадлежит А. Н. Колмогорову (правда, он сформулировал ее для всего мн-ва контекстов).
4. Язык 4-й степени сложности — пара
, где
— отношение «смыслового
включения» на мн-ве
означает, что смысл фразы
включен в смысл фразы g). Если
, то фразы
и g тождественны по смыслу. В рамках модели
предложен ряд аналогов для понятия фонемы — напр., следующий. Говорят, что звуки х и у находятся в отношении коммутации К, если существуют последовательности
, имеющие разный смысл. Пусть
, где
мн-во признаков, соответствующих х. Признак
наз. дифференциальным для х, если существует звук у такой, что: а)
различаются только тем, что в
признак
заменен другим признаком. Фонемой, соответствующей
мн-во признаков, дифференциальных для х.
Часто строятся аналоги фонемы, использующие лишь отношение коммутации. Все эти модели имеют широкое применение в задачах, где нужно оптимизировать систему записи языковой информации, напр., при транскрипции, в рамках
строятся также т. н. трансформационные описания языка (см. Грамматика трансформационная). Пусть одно из разбиений словаря V делит его на знаменательные и служебные слова. Говорим, что фраза
трансформационно подчинена фразе у (обозначение
), если
и для любого знаменательного слова а из
найдется слово b из g такое, что а
Если
, то
и g находятся в отношении трансформируемости. Поскольку у фразы может быть несколько смыслов, отношение трансформируемости нетранзитивно (так же, как и отношение смыслового тождества); напр., фраза «это разоблачило Карла» находится в отношении трансформируемости с фразой «это — разоблачение Карла», а эта фраза находится в отношении трансформируемости с фразой «это разоблачил Карл», в то время как смысл 1-й фразы отличен от смысла 3-й. Поэтому было предложено определить абстрактный смысл фразы
как мн-во фраз, находящихся в отношении трансформируемости с
, а мощность этого мн-ва назвать индексом синонимичности фразы.
Индексом омонимичности фразы - наз. число абстрактных смыслов, соответствующих данной фразе. Было предложено с помощью сходных с этими понятиями описывать различия между научным и поэтическим стилем (С. Маркус). Л. Небеский предложил описать в модели
отношение синтаксического подчинения следующим образом. Назовем фразу
подфразой фразы g, если: а) либо f — g, либо
можно получить из g опущением некоторых слов или заменой некоторых слов на служебные слова; б)
Слово а доминирует над словом b во фразе
если во всех подфразах фразы
в которых присутствует b, присутствует и а. Слово а непосредственно доминирует над словом b, иначе, а подчиняет b, если а доминирует над b и не существует слова
, такого, что а доминирует над с и с доминирует над b.
5. Существует класс конструктивных Я. м. а., в которых мн-во всех правильных последовательностей не является исходным, а получается в результате некоторой совокупности операций. Назовем языком тройку
, где 0 — конечное мн-во исходных фраз и а — конечное мн-во запрещенных последовательностей. Непустая последовательность А наз. распространителем слова а, если существуют последовательности
и g такие, что
, и не существует последовательностей
и g таких, что
, или
.
Мн-во правильных фраз разрешается расширить за счет фраз, получающихся путем замены в произвольной фразе некоторого слова на его распространитель (возможны модификации этой идеи за счет введения понятия ранга, по содержанию аналогичного рангу в теории конфигураций). Языком
назовем пару объектов
, где
— некоторое мн-во операторов, определенных на словах и последовательностях (в т. ч. и фразах языка). В терминах языка
может быть описан т. н. «цепочный анализ» (3. Харрис). В системе этого анализа вводятся, напр., такие операторы:
— левый адъюнкт к категории а (напр., прилагательное есть
(существительное)),
— правый адъюнкт к категории а (напр., существительное в родительном падеже есть
(существительное)).
Все фразы из
— грамматически правильны. Предложение, получающееся путем применения операторов (и дальнейшей подстановки соответствующих слов) к грамматически правильной фразе, также считается грамматически правильным. Трансформации также обычно описываются не как отношения на всем мн-ве правильных фраз, а как операции, применяемые к фразам из конечного мн-ва 0, которые наз. ядерными. Так, фраза «дом строится плотником» получается из ядерной фразы «плотник строит дом» операцией, определенной на всех фразах вида: подлежащее
переходной глагол
прямое дополнение
и переводящей их в пассивные предложения. Модели такого типа, оставаясь Я. м. а., приближаются к порождающим грамматикам.
С лингвистической точки зрения Я. м. а. подразделяют на парадигматические (модели частей речи, категории рода, падежа, ЭГК, фонемы и т. п.) и синтагматические (теория конфигураций). Теория трансформаций занимает по этому критерию промежуточное положение: отношение трансформируемости может рассматриваться как обобщение отношения принадлежности к одной парадигме, так что «буду писать» и «пишу» можно изучать и как два слова, принадлежащие к одной парадигме, и как две фразы, находящиеся в синтагматическом отношении трансформируемости.
Лит.:
:
Гладкий А. В., Мельчук И. А. Элементы математической лингвистики. М., 1969 [библиогр. с с. 188—192]; Гладкий А. В. Формальные грамматики и языки. М., 1973 [библиогр. с. 349—356]; Математическая лингвистика. М., 1964; Маркус С. Теоретико-множественные модели языков. Пер. с англ. М., 1970; Marcus S. Introduction mathS-matique h. la linguistique structural- Paris, 1967; Harris Z. Mathematical structures of language. New York - London - Sydney - Toronto, 1968.
И. И. Ревзин