Порталы:

Биология Война География Информатика Искусство История Культура Лингвистика Математика Медицина Охрана труда Политика Право Психология Религия Техника Физика Философия Экономика

Мы поможем в написании ваших работ!

Автоматы для регулярных языков

Покажем, что каждый регулярный язык можно распознать конечным автоматом.

Теорема 5.1. Для каждого регулярного выражения r можно эффективно построить такой недетерминированный конечный автомат M, который распознает язык, задаваемый r, т.е. L_M= L_r.

Доказательство Построение автомата M по выражению r проведем индукцией по длине r, т.е. по общему количеству символов алфавита символов и знаков операций и скобок в записи r.

Базис. Автоматы для выражений длины 1: и показаны на следующем рисунке.

Рис. 5.1.

Заметим, что у каждого из этих трех автоматов множество заключительных состояний состоит из одного состояния.

Индукционный шаг. Предположим теперь, что для каждого регулярного выражения длины <= k построен соответствующий НКА, причем у него единственное заключительное состояние. Рассмотрим произвольное регулярное выражение r длины k+1. В зависимости от последней операции оно может иметь один из трех видов: (r₁ + r₂), (r₁ r₂) или (r₁)^*. Пусть и - это НКА, распознающие языки L_r1 и L_r2, соответственно. Не ограничивая общности, мы будем предполагать, что у них разные состояния: .

Тогда НКА , диаграмма которого представлена на рис. 5.2, распознает язык .

Рис. 5.2.

У этого автомата множество состояний , где q₀ - это новое начальное состояние, q_f - новое (единственное !) заключительное состояние, а программа включает программы автоматов M₁ и M₂ и четыре новых команды -переходов: . Очевидно, что язык, распознаваемый НКА M, включает все слова из L_{M₁} и из L_{M₂}. С другой стороны, каждое слово переводит q₀ в q_f, и после первого шага несущий его путь проходит через q₀¹ или q₀². Так как состояния M₁ и M₂ не пересекаются, то в первом случае этот путь может попасть в q_f только по -переходу из q_f¹ и тогда . Аналогично, во втором случае .

Для выражения диаграмма НКА , распознающего язык L_r, представлена на следующем рисунке.

Рис. 5.3.

У этого автомата множество состояний , начальное состояние q₀= q₀¹, заключительное состояние q_f =q_f², а программа включает программы автоматов M₁ и M₂ и одну новую команду - -переход из заключительного состояния M₁ в начальное состояние M₂, т.е. . Здесь также очевидно, что всякий путь из q₀= q₀¹ в q_f =q_f² проходит через -переход из q_f¹ в q₀². Поэтому всякое слово, допускаемое M, представляет конкатенацию некоторого слова из L_M1} с некоторым словом из L_M2}, и любая конкатенация таких слов допускается. Следовательно, НКА M распознает язык .

Пусть r = r₁^*. Диаграмма НКА , распознающего язык L_r=L_r1* = L_M1^* представлена на рис. 5.3.

Рис. 5.3. Диаграмма автомата M, распознающего язык Lr1*

У этого автомата множество состояний , где q₀ - это новое начальное состояние, q_f - новое (единственное !) заключительное состояние, а программа включает программу автомата M₁ и четыре новых команды -переходов: . Очевидно, . Для непустого слова w по определению итерации для некоторого k >= 1 слово w можно разбить на k подслов: w=w₁w₂... w_k и все . Для каждого i= 1,... ,k слово w_i переводит q₀¹ в q_f¹. Тогда для слова w в диаграмме M имеется путь

Следовательно, . Обратно, если некоторое слово переводит q₀ в q_f, то либо оно есть либо его несет путь, который, перейдя из q₀ в q₀¹ и затем пройдя несколько раз по пути из q₀¹ в q_f¹ и вернувшись из q_f¹ в q₀¹ по -переходу, в конце концов из q_f¹ по -переходу завершается в q_f. Поэтому такое слово .

Из теорем 4.2 и 5.1 непосредственно получаем

Следствие 5.1. Для каждого регулярного выражения можно эффективно построить детерминированный конечный автомат, который распознает язык, представляемый этим выражением.

Это утверждение - один из примеров теорем синтеза: по описанию задания (языка как регулярного выражения ) эффективно строится программа (ДКА), его выполняющая. Справедливо и обратное утверждение - теорема анализа.

Теорема 5.2. По каждому детерминированному (или недетерминированному) конечному автомату можно построить регулярное выражение, которое представляет язык, распознаваемый этим автоматом.

Доказательство этой теоремы достаточно техническое и выходит за рамки нашего курса.

Таким образом, можно сделать вывод, что класс конечно автоматных языков совпадает с классом регулярных языков. Далее мы будем называть его просто классом автоматных языков.

Автомат M_r, который строится в доказательстве теоремы 5.1 по регулярному выражению r, не всегда является самым простым.

Например, для реализации выражения-слова a₁a₂ ... a_n, где , можно просто использовать автомат с (n+1) состоянием q_i (i=0,1,2, ... , n) и командами q_{i-1} a_i -> q_i, в котором нет пустых -переходов, участвующих в общей конструкции для конкатенации. Также при построении автомата для объединения M₁ и M₂ можно сливать их начальные состояния в одно, если в них нет переходов из других состояний (тогда не потребуется новое начальное состояние). Можно также объединить их заключительные состояния, если из них нет переходов в другие состояния и алфавиты M₁ и M₂ совпадают. Если из заключительного состояния M₁ нет переходов в другие состояния, то при конкатенации его можно объединить с начальным состоянием M₂. Вместе с тем, утверждения задачи 5.9 показывают, что наша общая конструкция достаточно экономна.

Пример 5.7. Применим теорему 5.1 к регулярному выражению , которое, как мы заметили в примере 5.4, представляет язык, состоящий из всех слов, которые не содержат подслово '000'.

На рис. 5.5 представлены диаграммы автоматов M₁ и M₂, построенных по выражениям r₁ = (1 +01 +001) и , соответственно, с помощью конструкций для конкатенации и объединения. Как мы отмечали выше, автомат M₁ можно было бы еще упростить, склеив начальные состояния q₂, p₁ и s₁, а также заключительные состояния q₃, p₃ и s₄.

Рис. 5.5.

Автомат M₃ для выражения r₁^* = (1 +01 +001)^* получается из M₁ добавлением нового начального состояния q₀ и заключительного состояния q₅ и -переходов из q₀ в q₁ и q₅, из q₄ в q₅ и из q₅ в q₁. Затем результирующий автомат для исходного выражения r получается последовательным соединением M₃ и M₂. Он представлен ниже на рис. 5.6.

<== предыдущая страница	\|	следующая страница ==>
Регулярные выражения и языки	\|	Минимизация булевых функций методом карт Вейча

Дата добавления: 2015-07-26; просмотров: 148; Нарушение авторских прав

Мы поможем в написании ваших работ!

lektsiopedia.org - Лекциопедия - 2013 год. | Страница сгенерирована за: 0.004 сек.