Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
8.2. ПОНЯТИЯ ТЕОРИИ ФОРМАЛЬНЫХ ЯЗЫКОВВозникновение теории формальных языков в середине 50-х годов связано с разработкой Ноамом Хомским математических моделей грамматик при исследовании естественных языков. Одной из первоначальных задач лингвистов, работающих в данной области, было создание «вычислительных» грамматик, способных описывать естественные языки, например английский. Была надежда на то, что если замысел удастся, не составит большого труда научить машину «понимать» естественные языки в целях машинного перевода и решения задач. И хотя, по всеобщему мнению, надежды пока не оправдались, побочные результаты этих исследований оказали важное влияние в других областях, например при разработке компиляторов, в языках программирования, теории автоматов и, совсем недавно, в распознавании образов. В этом разделе мы прослеживаем развитие основных идей теории формальных языков в связи с проблемами синтаксического распознавания образов и обучения ЭВМ. 8.2.1. ОпределенияПонятия, определяемые ниже, играют центральную роль в теории формальных языков. И хотя некоторые из этих понятий легко отождествляются с понятиями, применяемыми при изучении естественных языков, мы предостерегаем читателя от проведения слишком глубоких аналогий. Алфавит — любое конечное множество символов. Предложение в некотором алфавите — произвольная цепочка конечной длины, состоящая из символов этого алфавита. Например, для алфавита Предложение, не содержащее ни одного символа, называется пустым предложением. В дальнейшем пустое предложение будет обозначаться Язык — произвольное множество (не обязательно конечное) предложений в некотором алфавите. Так же как и в естественных языках, серьезное изучение теории формальных языков должно концентрироваться на грамматиках и их свойствах. Грамматикой мы называем четверку
где
Предполагается, что
Рис. 8.1. Правила подстановки, использованные при порождении предложения В данном случае будет полезно сравнить приведенное выше определение формальной грамматики со стандартными понятиями грамматики английского языка. Это поможет читателю лучше понять обозначения и терминологию. Рассмотрим простое предложение The boy runs (мальчик бежит). На рис. 8.1 показана запись этого предложения в виде дерева. Порождение данного предложения происходит следующим образом. Мы начинаем с абстрактного понятия, которое называем (предложение). На этом этапе (предложение) — не более чем синтаксическое понятие, представляющее все правильные предложения английского языка. Затем мы заменяем (предложение) на (именная составляющая) плюс (глагольная составляющая). В теории формальных языков мы всегда начинаем с описаииого выше символа Язык, порождаемый грамматикой В этой главе используются следующие обозначения. Нетерминальные символы обозначаются прописными буквами Множество Р правил подстановки состоит из выражений вида когда ясно, о какой грамматике идет речь, Пример. Рассмотрим грамматику
Применение второго правила приводит к цепочке
Язык, порождаемый этой грамматикой, состоит, как мы видим, исключительно из цепочек подобного вида, причем длина конкретной цепочки зависит от
|
1 |
Оглавление
|