Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Regulární výrazy Regulární výrazy představují další možnost popisu regulárních jazyků (právě od nich dostaly své jméno). Definice: Množina všech regulárních.

Podobné prezentace


Prezentace na téma: "Regulární výrazy Regulární výrazy představují další možnost popisu regulárních jazyků (právě od nich dostaly své jméno). Definice: Množina všech regulárních."— Transkript prezentace:

1 Regulární výrazy Regulární výrazy představují další možnost popisu regulárních jazyků (právě od nich dostaly své jméno). Definice: Množina všech regulárních výrazů nad abecedou  je definována následovně:  je regulární výraz, e je regulární výraz, a je regulární výraz pro každé písmeno a  ∑, jsou-li r 1 a r 2 regulární výrazy nad abecedou , potom r 1 + r 2, r 1  r 2 a r 1 * jsou také regulární výrazy nad abecedou .

2 Regulární výrazy Definice: Každému regulárnímu výrazu nad abecedou  odpovídá jazyk nad abecedou  následovně: regulárnímu výrazu  odpovídá jazyk , regulárnímu výrazu e odpovídá jazyk {e}, regulárnímu výrazu a (a  ∑) odpovídá jazyk {a}, jestliže regulárnímu výrazu r 1 odpovídá jazyk L 1 a regulárnímu výrazu r 2 jazyk L 2, potom regulárnímu výrazu r 1 + r 2 odpovídá jazyk L 1  L 2 a regulárnímu výrazu r 1  r 2 odpovídá jazyk L 1  L 2 a regulárnímu výrazu r 1 * odpovídá jazyk L 1 *.

3 Regulární výrazy Věta (Kleene): Jazyky definované regulárními výrazy jsou regulární jazyky, tj. jazyky rozpoznávané konečnými automaty. Máme tři možnosti popisu každého regulárního jazyka:  Regulární gramatikou  Regulárním výrazem  Konečným automatem Důkaz: K regulárnímu výrazu sestavíme konečný automat (snadné) Ke konečnému automatu sestrojíme odpovídající regulární výraz (těžší)

4 Regulární výrazy - cvičení Převod regulárního výrazu na konečný automat: regulárnímu výrazu  odpovídá jazyk  (???), regulárnímu výrazu e odpovídá jazyk {e} (???), regulárnímu výrazu a (a  ∑) odpovídá jazyk {a} (???), jestliže regulárnímu výrazu r 1 odpovídá jazyk L 1 a regulárnímu výrazu r 2 jazyk L 2, potom regulárnímu výrazu r 1 + r 2 odpovídá jazyk L 1  L 2 (???) a regulárnímu výrazu r 1  r 2 odpovídá jazyk L 1  L 2 (???) a regulárnímu výrazu r 1 * odpovídá jazyk L 1 * (???).

5 Regulární výrazy Aplikace regulárních výrazů:  Program grep ( vyhledávání v souborech ) (Global search for Regular Expression and Print) grep ahoj soubor grep „vystudoval \(fim\|mff\)" soubor grep -i „vystudoval \(fim\|mff\)" soubor (najde i FIM a MFF)  Využití v editorech Editor vi používá regulární výrazy k vyhledávání textu a k jeho nahrazování. Po stisknutí stisknutím klávesy „/“ (resp. „?“ při hledání směrem vzad) napíšete regulární výraz a stisknete [Enter]. Kurzor poskočí na nejbližší následující/před­chozí řetězec vyhovující zadanému výrazu.  Využití v programovacích jazycích ( PERL )  Využití při syntaktické analýze v překladačích

6 Vlastnosti regulárních jazyků Věta: Množina slov přijatých KA s n stavy je a) neprázdná  KA přijme slovo s délkou menší než n b) nekonečná  KA přijme slovo s délkou d: n  d<2n Důkaz: ad a) <= platí triviálně => pro důkaz sporem předpokládejme, že máme nejkratší přijaté slovo a toto slovo má délku k  n. Při přijímání slova délky k projde automat k+1 konfigurací a protože |Q|=n, potom při přijímání slova délky k  n musí tento automat nejméně jedním stavem projít dvakrát.

7 Vlastnosti regulárních jazyků Formálně lze toto zapsat: (q 0,w 1 w 2 w 3 ) …. (q x,w 2 w 3 ) …. (q x,w 3 ) …. (q,e) Odtud je zřejmé, že také slovo w 1 w 3 bude akceptované stejným automatem a jelikož |w 1 w 3 |<|w 1 w 2 w 3 |, docházíme ke sporu s předpokladem, že původní slovo bylo nejkratší. 

8 Vlastnosti regulárních jazyků Věta: Nechť L je regulární jazyk. Potom existuje taková konstanta p,že pro všechna slova w  L & |w|  p, můžeme slovo w psát ve tvaru w= w 1 w 2 w 3, kde |w 2 |>0, |w 1 w 2 |  p a současně platí w 1 w 2 i w 3  L  i  0. Důkaz: K regulárnímu jazyku L existuje KA M=(Q,T, ,q 0, F) takový, že L = L(M). Nechť |Q|=p Jestliže w  L & |w|  p, potom automat při přijímání tohoto slova projde automat alespoň p+1 konfigurací a protože |Q|=p, potom nutně tento automat musí nejméně jedním stavem projít dvakrát.

9 Vlastnosti regulárních jazyků Formálně lze toto zapsat: (q 0,w 1 w 2 w 3 ) k (q x,w 2 w 3 ) + (q x,w 3 ) l (q,e) Odtud je zřejmé, že také slova w 1 w 3, w 1 w 2 w 3, w 1 w 2 2 w 3, … budou akceptována stejným automatem a tedy patří do L. 

10 Význam věty V každém „dostatečně“ dlouhém slově regulárního jazyka je obsaženo kratší neprázdné, které patří do stejného jazyka Jeho vynecháním či naopak opakovaným přidáváním (pumpováním) dostáváme vždy slova téhož jazyka „Pumping lemma“

11 Využití věty Věta: Nechť L je regulární jazyk. Potom existuje taková konstanta p,že pro všechna slova w  L & |w|  p, můžeme slovo w psát ve tvaru w= w 1 w 2 w 3, kde |w 2 |>0, |w 1 w 2 |  p a současně platí w 1 w 2 i w 3  L  i  0. L regulární jazyk => platí …… w 1 w 2 i w 3  L  i  0. Je to implikace a tedy pokud neplatí závěr, nemůže platit ani předpoklad Ale pozor, nelze to použít naopak (tj. pokud závěr platí, ještě to neznamená,že jazyk L je regulární)

12 Využití věty Příklad: Jazyk L={0 n 1 n |n  1} je bezkontextový jazyk. a) Bezkontextový je, pokud najdeme bezkontextovou gramatiku, která jej generuje. G=({A,S},{0,1},P,S) P={ S  A | 0S1 A  01 } b) Je regulární? Hledání gramatiky (zvlášť pokud neexistuje, bude nesmírně náročné), ale naštěstí můžeme použít předchozí větu Předpokládejme tedy, že L={0 n 1 n |n  1} je regulární jazyk.

13 Využití věty Potom pro dostatečně velké n lze řetězec 0 n 1 n zapsat jako 0 n 1 n =w 1 w 2 w 3, přičemž w 2  e a w 1 w 2 i w 3  L  i  0. Nyní mohou nastat tři možnosti: 1. 0 n 1 n = 0 k 0 l 1 n, kde k+l=n, ale 0 k (0 l ) i 1 n  L pro i  n 1 n = 0 n 1 k 1 l, kde k+l=n, ale 0 n (1 k ) i 1 l  L pro i  n 1 n = 0 k 0 l 1 r 1 s, kde k+l=r+s, ale 0 k (0 l 1 r ) i 1 s  L pro i  1 Tím se dostáváme do sporu s předpokladem, že jazyk L je regulární. Důsledek: L={0 n 1 n |n  1} je bezkontextový jazyk.

14 Trochu teorie Příklad: Je jazyk všech slov nad abecedou {a,b}, která obsahují stejný počet znaků a a b regulární? Důkaz: Použití věty je nyní trochu obtížnější, ale my víme, že průnik dvou regulárních jazyků je opět regulární jazyk Jazyk L 1 ={w| w=a * b * } je regulární a pokud by jazyk L 2 ={w|w obsahuje stejný počet a a b} byl také regulární, potom L 1  L 2 ={w| w=a n b n } je také regulární, čímž se dostáváme do sporu (jelikož víme, že regulární není) Důsledek: L={w|w obsahuje stejný počet a a b} není regulární

15 Trochu teorie Další příklady neregulárních jazyků: L 1 ={0 n 1 m | n>m} L 2 ={0 n 1 m | n  m} L 3 ={0 n 1 m 0 n | n,m  0} L 4 ={ww| w  {0,1} * } L 5 ={a n b n c n | n  0 } Praktický dopad: S jazykem L={0 n 1 n |n  1} je ekvivaletní například jazyk {,, ….} a ani tuto jednoduchou konstrukci KA neumí rozpoznat.

16 Regulární jazyky - shrnutí Regulární jazyky mají mnoho užitečných vlastností, ale jejich praktické využití v oblasti programovacích jazyků a překladačů je dosti omezené (lexikální analýza) Je nutné využít bezkontextové jazyky S nimi si již vystačíme při specifikaci většiny konstrukcí programovacích jazyků

17 Bezkontextové jazyky - úvod Překlad musí být jednoznačný (tak, jak programátor kód zamýšlel), jednoduchý a rychlý Ne každá bezkontextová gramatika je jednoznačná, a proto nás bude zajímat možnost transformace na gramatiku s příznivějšími vlastnostmi Budeme potřebovat opět nějaký vhodný stroj (automat), který bude slova příslušného jazyka Bylo by užitečné, kdybychom uměli i v tomto případě najít ke konkrétní gramatice příslušný automat a naopak k danému automatu umět zapsat odpovídající gramatiku

18 Bezkontextové jazyky DEF: Nechť G=(N,T,P,S) je gramatika. Potom G je gramatika typu 2 (bezkontextová), jestliže každé přepisovací pravidlo z P má tvar A  , A  N,   (N  T) * DEF: Jazyk nazýváme bezkontextový, jestliže je možné jej generovat bezkontextovou gramatikou. Příklad: Jazyk L={0 n 1 n |n  1} je bezkontextový jazyk. G=({A,S},{0,1},P,S) P={ S  A | 0S1 A  01 }L(G) = {0 n 1 n |n  1}

19 Jednoznačnost gramatiky DEF: Derivaci  0,  1,  2,…,  n, kde každou přímou derivaci  i   i+1 pro 0  i

20 Jednoznačnost gramatiky DEF: Bezkontextová gramatika G=(N,T,P,S) je nejednoznačná (víceznačná), jestliže existuje alespoň jedno slovo w  L(G) takové, že pro w existuje více levých (pravých) derivací. Příklad: G=({S},{a, b, if, then, else}, P, S) P={ S  if b then S else S S  if b then S S  a } je nejednoznačná gramatika.

21 Jednoznačnost gramatiky Například pro slovo if b then if b then a else a existují následující dvě levé derivace a) S  if b then S else S  if b then if b then S else S  if b then if b then a else S  if b then if b then a else a b) S  if b then S  if b then if b then S else S  if b then if b then a else S  if b then if b then a else a (Odvození začalo v prvním případě pravidlem S  if b then S else S, ve druhém S  if b then S )

22 Jednoznačnost gramatiky –problém? a) S  if b then S else S  if b then if b then S else S  if b then if b then a else S  if b then if b then a else a b) S  if b then S  if b then if b then S else S  if b then if b then a else S  if b then if b then a else a a) b)

23 Jednoznačnost gramatiky Nejednoznačnost gramatiky je velký problém, protože může způsobit nejednoznačný překlad kódu Je to problém gramatiky, nikoliv jazyka V některých případech lze vytvořit gramatiku, která generuje stejný jazyk, ale v některých případech to nejde (vnitřně nejednoznačné gramatiky) Otázka jednoznačnosti bezkontextových gramatik je nerozhodnutelná (neexistuje algoritmus, který by rozhodl, zda libovolná bezkontextová gramatika je či není jednoznačná)

24 Jednoznačnost gramatiky Nejednoznačnost gramatiky je přesto někdy možné zjistit (například z tvaru přepisovacích pravidel) a transformovat na ekvivaletní gramatiku,která je jednoznačná. Příklad: Nejednoznačnou gramatiku z předchozího příkladu G=({S},{a, b, if, then, else}, P, S) P={ S  if b then S else S | if b then S | a } lze transformovat na G 1 =({S 1, S 2 },{a, b, if, then, else}, P 1, S 1 ) P 1 ={S 1  if b then S 1 | if b then S 2 else S 1 | a S 2  if b then S 2 else S 2 | a } a G 1 je jednoznačná.

25 Zásobníkový automat DEF: Zásobníkový automat M je sedmice M=(Q, , , ,q 0,Z 0,F), kde Q je konečná množina vnitřních stavů automatu  je konečná množina vstupních symbolů ( vstupní abeceda )  je konečná množina zásobníkových symbolů ( zásobníková abeceda )  je přechodové zobrazení  : Qx(  {e})x   Qx  * q 0 je počáteční stav automatu (q 0  Q) Z 0 je počáteční zásobníkový symbol (Z 0  ) F je množina koncových stavů (F  Q)

26 Zásobníkový automat Značení: Přechodové zobrazení  : (q,a,z)  (q 1,z 1 ) znamená, že ve stavu q při čtení vstupního symbolu a a současném vyzvednutí zásobníkového symbolu z přejde zásobníkový automat (ZA) do stavu q 1 a na vrch zásobníku zapíše slovo z 1  * Poznámka: Zásobníkový automat může vykonat krok i bez přečtení vstupního symbolu (tj. neposune se čtecí hlava) a nemusí ani nic číst či zapisovat na zásobník. Formálně tedy uvažujeme  e =  {e} a  e =  {e}

27 Zásobníkový automat Zásobníkový automat pracuje po krocích (taktech). Činnost automatu je určena přechodovým zobrazením . Příklad:  : (q 1,c,X)  (q 2,WX) Poznámka: Poslední vložený symbol na zásobník se čte jako první. abcdef q1q1 gh 1 krok Z X Y abcdef q2q2 gh Z X Y W

28 Zásobníkový automat DEF: Nechť M=(Q, , , ,q 0,Z 0,F) je zásobníkový automat. Potom trojici (q,w,  )  Qx  * x  * nazýváme konfigurací zásobníkového automatu M. Konfiguraci (q 0,w, Z 0 ), kde w je vstupní řetězec nazýváme počáteční konfigurací automatu M ( na zásobníku je jen Z 0 ) a libovolnou konfiguraci (q,e,  ), kde q  F a  * nazýváme koncovou konfigurací automatu M ( není nutné zás. vyprázdnit ). DEF: Buď M =(Q, , , ,q 0,Z 0,F) zásobníkový automat. Potom nad množinou všech konfigurací definujeme relaci přechodu pro q 1,q 2  Q, w   *, a  a  * následovně: ( q 1,aw,X  ) (q 2,w,  )  (q 2,  )   (q 1,a,X) 

29 Přijímání slova ZA DEF: Nechť M=(Q, , , ,q 0,Z 0,F) je zásobníkový automat. Potom výpočtem ZA rozumíme posloupnost konfigurací (kroků) K 0, K 1, K 2,…, K n takových,že K i K i+1 pro i=0,..,n-1. DEF: Nechť M=(Q, , , ,q 0,Z 0,F) je zásobníkový automat. Potom automat M přijímá (akceptuje) slovo w   *, jestliže platí ( q 0,w,Z 0 ) * (q,e,  ) pro nějaké q  F a  * Poznámka: po přečtení slova je zásobníkový automat v koncovém stavu. DEF: Nechť M=(Q, , , ,q 0,Z 0,F) je zásobníkový automat. Jazyk L(M) specifikovaný zásobníkovým automatem M je množina řetězců L(M)={w| ( q 0,w,Z 0 ) * (q,e,  ), w   *, q  F,  * }   

30 Konstrukce ZA Příklad: Navrhněte zásobníkový automat přijímající bezkontextový jazyk L={0 n 1 n |n  0}. Řešení: Myšlenka – za každou 0 si uložíme jeden symbol na zásobník (třeba také nulu) a poté za každou jedničku jeden symbol ze zásobníku odebereme. Pokud jsme přečetli celé vstupní slovo a zásobník je prázdný, bylo na vstupu slovo z jazyka L={0 n 1 n |n  0}. Budou mi stačit čtyři stavy: q 0 - počáteční stav q 1 – čtu nuly a dělám si značky q 2 – čtu jedničky a mažu značky q 3 – koncový stav

31 Konstrukce ZA Řešení: M=({q 0,q 1,q 2,q 3 },{0,1},{Z,0}, ,q 0,Z,{q 0,q 3 })  (q 0,0,Z)= {(q 1,0Z)} % začátek – čtu první nulu a dělám si záznam  (q 1,0,0)= {(q 1,00)} % čtu další nuly a dělám si vždy záznam  (q 1,1,0)= {(q 2,e)} % čtu první 1 a mažu jednu nulu na zásobníku  (q 2,1,0)= {(q 2,e)} % čtu další 1 a mažu vždy jednu nulu na zásob.  (q 2,e,Z)= {(q 3,e)} % není co číst a zásobník je prázdný - stop (q 0,0011,Z) (q 1,011,0Z) (q 1,11,00Z) (q 2,1,0Z) (q 2,e,Z) (q 3,e,e)  

32 Reprezentace stavovým diagramem M=({q 0,q 1,q 2,q 3 },{0,1},{Z,0}, ,q 0,Z,{q 0,q 3 })  (q 0,0,Z)= {(q 1,0Z)}% začátek – čtu první nulu a dělám si záznam  (q 1,0,0)= {(q 1,00)}% čtu další nuly a dělám si vždy záznam  (q 1,1,0)= {(q 2,e)}% čtu první jedničku a mažu jednu nulu na zásobníku  (q 2,1,0)= {(q 2,e)}% čtu další jedničku a mažu vždy jednu nulu na zásob.  (q 2,e,Z)= {(q 3,e)}% není co číst a zásobník je prázdný – stop

33 Reprezentace stavovým diagramem Možné zjednodušení (opravdu to jde ????)

34 Příklady zásobníkových automatů Příklad 1: Navrhněte zásobníkový automat přijímající bezkontextový jazyk L 1 ={0 n 1 m |n>m  1}. Příklad 2: Navrhněte zásobníkový automat přijímající bezkontextový jazyk L 2 ={0 n 1 m 0 n |n,m  1}. Příklad 3: Navrhněte zásobníkový automat přijímající bezkontextový jazyk L 3 ={w3w R | w  {0,1} + } (030, 131, …, , , ….) Příklad 4: Navrhněte zásobníkový automat přijímající bezkontextový jazyk L 4 ={0 n 1 m | n  m}

35 Zásobníkový automat podruhé ( a jinak ) DEF: Zásobníkový automat M je šestice M=(Q, , , ,q 0,Z 0 ), kde Q je konečná množina vnitřních stavů automatu  je konečná množina vstupních symbolů ( vstupní abeceda )  je konečná množina zásobníkových symbolů ( zásobníková a. )  je přechodové zobrazení  : Qx(  {e})x   Qx  * q 0 je počáteční stav automatu (q 0  Q) Z 0 je počáteční zásobníkový symbol (Z 0  ) Poznámka: Takto definovaný zásobníkový automat nemá žádné koncové stavy. Slovo je přijato, pokud se přečte celé a zásobník je prázdný. Mluvíme o tzv. přijímání prázdným zásobníkem.

36 Zásobníkový automat podruhé ( a jinak ) DEF: Nechť M=(Q, , , ,q 0,Z 0 ) je zásobníkový automat. Potom trojici (q,w,  )  Qx  * x  * nazýváme konfigurací zásobníkového automatu M. Konfiguraci (q 0,w,Z 0 ), kde w je vstupní řetězec nazýváme počáteční konfigurací automatu M a libovolnou konfiguraci (q,e,e), kde q  Q nazýváme koncovou konfigurací automatu M. DEF: Nechť M=(Q, , , ,q 0,Z 0 ) je zásobníkový automat. Potom automat M přijímá (akceptuje) slovo w   *, jestliže platí ( q 0,w,Z 0 ) * (q,e,e) pro nějaké q  Q. Poznámka: po přečtení slova je zásobník prázdný. 

37 Ekvivalence zásobníkových automatů Věta: Nechť M 1 =(Q 1, ,  1,  1,q 0,Z 0 ) je zásobníkový automat přijímající prázdným zásobníkem. Potom lze sestrojit zásobníkový automat M 2 =(Q, , , ,q 0,Z 0,F) přijímající koncovým stavem takový, že L(M 1 )=L(M 2 ). Myšlenka důkazu: při vyprázdnění zásobníku zařídím přechod do nově přidaného koncového stavu Věta: Nechť M 1 =(Q 1, ,  1,  1,q 0,Z 0,F) je zásobníkový automat přijímající koncovým stavem. Potom lze sestrojit zásobníkový automat M 2 =(Q, , , ,q 0,Z 0 ) přijímající prázdným zásobníkem takový, že L(M 1 )=L(M 2 ). Myšlenka důkazu: při dosažení koncového stavu zajistím vyprázdnění zásobníku a navíc je třeba ošetřit „předčasné-nekoncové“ vyprázdnění zásobníku

38 Nedeterminismus zásob. automatů Zásobníkový automat je v principu nedeterministický (například už i tím, že jsou povoleny e-kroky, tj. změna stavu bez posunu čtecí hlavy) Nedeterminismu lze ovšem vhodně využít i ke konstrukci automatu, který přijímá konkrétní jazyk. Příklad: Navrhněte zásobníkový automat přijímající bezkontextový jazyk L 3 ={ww R | w  {0,1} * } (e, 00, 11, , …, , ….)

39 Řešení příkladu Myšlenka řešení: Slovo w si postupně ukládám na zásobník, ve „vhodnou“ chvíli se rozhodnu, že jsem v polovině a potom začnu porovnávat slovo w R se zápisem slova w uloženým na zásobníku. Řešení: M=({q 0,q 1,q 2,q 3 },{0,1},{Z,0,1}, ,q 0,Z,{q 0,q 3 })  (q 0,e,Z)= {(q 1,Z)} % nech si symbol Z na zásobníku  (q 1,0,e)= {(q 1,0)} % zapiš si nulu na zásobník  (q 1,1,e)= {(q 1,1)} % zapiš si jedničku na zásobník  (q 1,e,e)= {(q 2,e)} % jsi „možná“ uprostřed – změň stav  (q 2,0,0)= {(q 2,e)} % smaž si nulu ze zásobníku  (q 2,1,1)= {(q 2,e)} % smaž si jedničku ze zásobníku  (q 2,e,Z)= {(q 3,e)} % není co číst a zásob. je prázdný - stop

40 Reprezentace stavovým diagramem M=({q 0,q 1,q 2,q 3 },{0,1},{Z,0,1}, ,q 0,Z,{q 0,q 3 })  (q 0,e,Z)= {(q 1,Z)}  (q 1,0,e)= {(q 1,0)}  (q 1,1,e)= {(q 1,1)}  (q 1,e,e)= {(q 2,e)}  (q 2,0,0)= {(q 2,e)}  (q 2,1,1)= {(q 2,e)}  (q 2,e,Z)= {(q 3,e)}

41 Konstrukce automatu Příklad: Navrhněte zásobníkový automat přijímající bezkontextový jazyk L 4 = {w|w obsahuje stejný počet a a b} (e, ab, ba, aabb, abab, abba, baab, baba, bbaa, aaabbb, ….) Myšlenka řešení: Na vstupu symbol, na zásobníku symbol Z -> ukládej na zásobník Na vstupu i na zásobníku stejný symbol -> ukládej na zásobník Na vstupu jiný symbol než na zásobníku -> maž symbol ze zásobníku


Stáhnout ppt "Regulární výrazy Regulární výrazy představují další možnost popisu regulárních jazyků (právě od nich dostaly své jméno). Definice: Množina všech regulárních."

Podobné prezentace


Reklamy Google