Cvičení č. 8 Pokročilé regulární výrazy - na co je třeba dát pozor David Chudán Upravil D. Pejčoch.

Slides:



Advertisements
Podobné prezentace
Standardní knihovní funkce pro práci s textovými řetězci
Advertisements

Lekce - Automaty a regularní výrazy
ŘÍDÍCÍ STRUKTURY - PODMÍNKY
Programování v C jazyku - SEMINÁŘ
Vlastní skript může být umístěn: v hlavičce stránky v těle stránky
Základy psaní textu Interpunkční znaménka tečka(.), čárka(,)
Operační systém UNIX Soubory a adresářová struktura Roman Danel
Programování funkcí v Excelu
Základní pojmy v jazyce C
Jazyk VHDL Martin Štěpánek
Opakování Co je výsledkem následujícího prográmku? my $a="kol"; my $b="o"; $a.= $b; $b.= $a; print "a = $a, b = $b\n"; Vkládání speciálních znaků? Uvozovací.
VISUAL BASIC Práce se soubory.
Co jsou to regulární výrazy?
Algoritmy I. Cvičení č. 10.
Práce s textem Jan Martinovič Fakulta elektrotechniky a informatiky
53. Šrámkova Sobotka Sobotka 9. července 2009
Databázové systémy 1 Cvičení č. 8 Fakulta elektrotechniky a informatiky Univerzita Pardubice.
Databázové systémy 1 Cvičení č. 4 Fakulta elektrotechniky a informatiky Univerzita Pardubice.
Lexikální a syntaktická analýza Jakub Yaghob
MATLAB® ( část 3 - scripty).
Typografické zásady Název školyStřední odborná škola Luhačovice Číslo projektuCZ.1.07/1.5.00/ AutorMgr. Klára Masařová Název.
Téma: CorelDRAW - Textové objekty - 7. díl
C# - znakové typy a řetězce
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUM VY_32_INOVACE_01B8 Autor Ing. Jiří Kalousek Období vytvoření listopad.
KASKÁDOVÉ STYLY SYNTAXE STYLŮ PRAVIDLO DEFINUJÍCÍ STYL SE SKLÁDÁ Z NEJMÉNĚ TŘÍ ZÁKLADNÍCH ČÁSTÍ: * SELEKTOR ZNAČKY * SLOŽENÉ ZÁVORKY A V NICH JE.
Datové typy a práce s nimi
Návrh a tvorba WWW Přednáška 11
Textový editor Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Miloš Nygrýn.
ČÍSELNÉ SOUSTAVY Desítková Dvojková.
Jiří Znoj - zno Tvorba konkordace Algoritmy II 3. projekt, 5. zadání Jiří Znoj - zno
Základní typografická pravidla
3. Příkazy  Příkazy dělíme na jednoduché a strukturované.  Jednoduché příkazy - žádnou jejich dílčí částí neni příkaz - přiřazovací, vstupu a výstupu,
Využití multimediálních nástrojů pro rozvoj klíčových kompetencí žáků ZŠ Brodek u Konice reg. č.: CZ.1.07/1.1.04/ Předmět : Informační a komunikační.
Referát č.13 Textový editor (struktura textu – přiřazení stylu, formátování (vzhled) textu, změna stylu, typografická a estetická pravidla)
Využití vzorců a funkcí k úpravám v textu
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
A1PRG - Programování – Seminář Ing. Michal Standardní knihovní funkce pro vstup a výstup 12 Verze
UNIX — doplňky Informatika pro ekonomy II přednáška 9.
2. přednáška Databáze, využití MS Excel
Milan Kryl(c) 2004 MFF UK Databáze Caché NLS national language settings.
KIV/PPA1 cvičení 9 Cvičící: Pavel Bžoch. Osnova cvičení Třída String a její metody –Řetězce a operace s nimi.
Spojování řetězců Spojování řetězců Pro spojování řetězců se používá operátor Pro spojování řetězců se používá operátor. (tečka). V jiných jazycích se.
Základy psaní textu Interpunkční znaménka tečka(.), čárka(,)
Problémy s češtinou České znaky se standardně nepovažují za alfanumerické znaky (\w) Vadí to při třídění vyhodnocování regulárních výrazů Je třeba použít.
VISUAL BASIC PRALG.
Úvod do UNIXu (4 th round) David Hoksza (většina sekce o vi a obrázek na slidu 7 převzat od Libora Forsta –
JUI přednáška Vstup a výstup, cykly RNDr. Jiří Dvořák, CSc.
Počítače a programování 1 2.přednáška. Základní lexikální struktura programu Program v jazyce Java je tvořen symboly a oddělovači Program Java je psán.
Řetězce String. Co je to řetězec Jako řetězec označujeme pojmenovanou skupinu libovolných znaků Deklarujeme jej pomocí příkazu Délka řetězce není v tomto.
Úvod do UNIXu (4 th round) David Hoksza (většina sekce o vi a obrázek na slidu 7 převzat od Libora Forsta –
IB111 Práce se soubory Správa paměti. Práce se soubory v Pythonu Soubor musíme „otevřít“ Poté s ním pracujeme –Čteme a/nebo zapisujeme Nakonec musíme.
HYPERTEXT PREPROCESSOR. JAZYK PHP. VYUŽITÍ JAZYKA Programování dynamických internetových stránek a webových aplikací vytvoření šablony webu kniha návštěv.
Sed O co jde Regulární výrazy Příkazy Adresování Příklady Michal Trs,
Typografie – hladká sazba Gymnázium a Jazyková škola s právem státní jazykové zkoušky Svitavy Ditta Kukaňová.
Programování KONSTANTY, ČTENÍ PO JEDNOM ZNAKU GETCHAR() FORMÁTOVANÝ VÝSTUP POMOCÍ PRINTF, VÝVOJOVÉ DIAGRAMY, CYKLY.
Základy XML – struktura dokumentu (včetně testových otázek) Otakar Čerba Oddělení geomatiky Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita.
Makra v Excelu syntaxe. Zápis nahraného makra SubEnd Sub O klíčová slova Sub a End Sub – začátek a konec makra O komentáře O text za znakem ', až do konce.
TYPOGRAFIE Zpracovala: Mgr. Jitka Hotařová
Moduly.
Výukový materiál zpracován v rámci projektu
Vypracoval-Matěj Šmíd
Funkce SVYHLEDAT a VVYHLEDAT Kontingenční tabulky
Linux - skripty Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Libor Otáhalík. Dostupné z Metodického portálu ISSN: 
Algoritmizace a programování
Databázové systémy a SQL
Řetězce (24) Funkce strchr: deklarována v: string.h
VY_32_ INOVACE_ 01_ ČESKÝ JAZYK 3
Databázové systémy a SQL
Opakování ze 4. cvičení int a; printf("Zadej číslo: ");
Command line nástroje Jednoúčelové, ale mocné nástroje pro transformace textu Jak získat: Linux (a Mac) – součást operačního systému Windows – musí se.
Transkript prezentace:

cvičení č. 8 Pokročilé regulární výrazy - na co je třeba dát pozor David Chudán Upravil D. Pejčoch

Kvantifikátory, chování Výchozí chování kvantifikátorů je „žravé“ (greedy), kdy se snaží rozpoznat co nejvíce znaků tak, aby byl ještě splněn zbytek výrazu. Lokálně lze chování kvantifikátorů nastavit na líné (lazy), kdy kvantifikátor rozpozná co nejméně znaků. Líné chování se nastavuje pomocí otazníku za kvantifikátor (Př.: ) Příklad: /]*?> =>

Kvantifikátory, chování Příklad: Mějme řetězec „baacaaac“: – Regulární výraz b.*c v defaultním, „žravém“ chování nalezne jednu shodu „baacaaac“ – Pokud nastavíme lazy chování pomocí výrazu b.*?c, shoda bude „baac“.

Modifikátory Modifikátory slouží ke změně následujících znaků. Přiřazení jednoho znaku do určité kategorie se dělá pomocí \p{} (pozor na velká a malá písmena, výraz \P{} je negací předcházejícího!!!) \u – převod následujícího písmena z malého na velké \l – převod následující písmena z velkého na malé V případě použití velkých písmen u těchto znaků ( \U, \L) modifikátor platí až do konce řetězce nebo do nejbližšího výskytu \E, který tuto konstrukci ukončuje. Př.: Regulární výraz \d+|\p{L}+ rozpoznává sekvence písmen nebo číslic.

Matching Flags /i – aktivuje case sensitive mód /s – aktivuje režim jedné řádky (single line mode). V tomto režimu tečka rozpozná též znak nové řádky. /m – aktivuje režim více řádek (multi line mode). V tomto režimu stříška (^) značí začátek řádku a dolar ($) značí jeho konec. /x – aktivuje režim volných mezer (free spacing mode). V tomto režimu jsou mezery mezi regex výrazy ignorovány a znak # uvozuje komentář.