Hranice slov a vět Ondřej Tichý.

Slides:



Advertisements
Podobné prezentace
Školení MS Word 2007 pro začátečníky RNDr. Milan Zmátlo MěÚ Třebíč, říjen 2011 Vzdělávání v eGON centru Třebíč Tento.
Advertisements

Období vzniku: duben _inovace_FG.9.48 Autor : Vladimír TesaříkČlověk a svět práce, finanční gramotnost, nové auto.
Elektronické učební materiály - II. stupeň Informatika 8 Autor: Bc. Pavel Šiktanc Vkládání hypertextových odkazů Co se všechno naučíme??? Co je to hypertextový.
Tabulátory (20). Projekt: CZ.1.07/1.5.00/ OAJL - inovace výuky Příjemce: Obchodní akademie, odborná škola a praktická škola pro tělesně postižené,
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_18-01 Název školy Střední průmyslová škola stavební, České Budějovice, Resslova 2 AutorŠárka.
ZAL – 5. cvičení Martin Tomášek Pole - opakování Základní datový typ. V poli držíme více elementů (jednoho typu) S elementy v poli můžeme manipulovat.
Obchodní akademie, Střední odborná škola a Jazyková škola s právem státní jazykové zkoušky, Hradec Králové Autor:Mgr. Bc. Klára Loudová Název materiálu:
Elektronické učební materiály - II. stupeň Informatika – aplikace informačních technologií Autor: Bc. Pavel Šiktanc Internetové stránky Co se všechno naučíme???
ZÁKLADNÍ TYPOGRAFICKÁ PRAVIDLA Mgr. Petra Toboříková.
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_30-03 Název školy Střední průmyslová škola stavební, České Budějovice, Resslova 2 AutorRNDr.
HTML (I) (2). Projekt: CZ.1.07/1.5.00/ OAJL - inovace výuky Příjemce: Obchodní akademie, odborná škola a praktická škola pro tělesně postižené,
Elektronické učební materiály - II. stupeň Informatika 8 GRAF II – výsečový graf Autor: Bc. Pavel Šiktanc Co se všechno naučíme??? Vytváření výsečového.
Databáze © Mgr. Petr Loskot
VY_32_ INOVACE_IKR5 - 5– POWERPOINT - ODRÁŽKY A ČÍSLOVÁNÍ Název školy:
Název projektu: ZŠ Háj ve Slezsku – Modernizujeme školu
Název školy: Dětský domov, Základní škola praktická, Praktická škola a Školní jídelna, Dlažkovice 1, příspěvková organizace Třebívlice Autor: Olga.
Zpětná vazba v zesilovačích 2
Název školy: Základní škola a mateřská škola Dolní Bojanovice, okres Hodonín příspěvková organizace Číslo projektu: CZ.1.07/1.4.00/ Označení materiálu:
Lektor: Mgr. Šárka Prachařová AABYSS s. r. o.
Postup pro aktualizaci seznamu doporučené literatury a učitelů uvedených u předmětu ve studijní agendě STAG.
TVORBA A UŽITÍ TABULKY Mgr. Alena Ščuková
Pracovní porada Pracovní list.
ÚŘEDNÍ DEN 11. listopad 2015.
Hledání nejvyšších a nejnižších hodnot
Číslo v digitálním archivu školy
Kurz algoritmizace a programování v jazyce C
Název školy: Základní škola a mateřská škola Dolní Bojanovice, okres Hodonín příspěvková organizace Číslo projektu: CZ.1.07/1.4.00/ Označení materiálu:
Název projektu: Učíme obrazem Šablona: III/2
Pracovní porada Pracovní list.
Základy elektrotechniky Výkony ve střídavém obvodu
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
Operační program Vzdělávání pro konkurenceschopnost, č.OP CZ.1.07
Windows – WordPad VY_32_INOVACE_32_649
Prvky matematických výrazů
PŘÍRODOVĚDA 5. ročník Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Jiřina Jeršovová.
Název školy: ZŠ Bor, okres Tachov, příspěvková organizace
Terapeutické komunity
ADT zásobník - příklad Prakticky aplikovatelný příklad využití ADT zásobník je vyhodnocování aritmetických výrazů v Postfixové notaci: Pro zápis aritmetických.
Procvičení vzorců a funkcí v rámci jednoho i více listů
Tvorba tabulek ve Wordu II.
Název prezentace (DUMu): Princip klasického zapalování
Název: Práce s tabulátory Autor: Hokr Jan
Cukrářské technologie – pálená hmota a listové těsto
Inf Vývojový diagram.
Příkazy IF a SELECT CASE
1. Obecná problematika tvorby ŠVP
Název projektu: ZŠ Háj ve Slezsku – Modernizujeme školu
Programování (14PRG) 1. cvičení.
VY_32_INOVACE_65.
Kód materiálu: VY_32_INOVACE_09_CERTOVSKE_RYMOVANI Název materiálu:
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
Tato práce je šířena pod licencí CC BY-SA 3
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
Bibliografické odkazy a citace změny oproti starší verzi normy ISO ČSN 690 Mgr. Zdeňka Firstová Univerzitní knihovna ZČU v Plzni
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
ZÁKLADNÍ TYPOGRAFICKÁ PRAVIDLA
Výukový materiál zpracovaný v rámci projektu
1.
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
Název školy: Základní škola a mateřská škola Dolní Bojanovice, okres Hodonín příspěvková organizace Číslo projektu: CZ.1.07/1.4.00/ Označení materiálu:
C# konzole – Textový výstup
PSANÍ ÚŘEDNÍHO DOPISU KROK ZA KROKEM
Název projektu: Učíme obrazem Šablona: III/2
Název projektu: Učíme obrazem Šablona: III/2
Informatika – Základní operace s buňkami
ydewůd,ůwl registrační číslo projektu CZ /0.0/0.0/16_32/
Geometrie řízení a uložení kol.
Opakování ze 4. cvičení int a; printf("Zadej číslo: ");
Opakování ze 4. cvičení int a; printf("Zadej číslo: ");
Transkript prezentace:

Hranice slov a vět Ondřej Tichý

Zadání: Tokenizátor Program na naučení konců vět Oddělovač vět Čte text ze standardního vstupu, hledá a vyznačuje v něm hranice tokenů (slov). Program na naučení konců vět Program, který se z trénovacích dat, ve kterých jsou vyznačené věty, naučí statistiku, potřebnou pro zlepšení rozhodování o hranicích vět. Oddělovač vět Čte ze standardního vstupu tokenizovaný text s vyznačenými hranicemi odstavců. Hledá a vyznačuje v něm hranice vět.

Tokenizátor Program projede každý řádek a pomocí regulárních výrazů tokenizuje text Např. ošetření různých formátů datumů URL a e-maily by šly ošetřit lépe pomocí „if“ při načtení tokenu a hledání např. „http://“ (pak už nerozdělím na „http : / /“) nebo „@“ Sázím mezery jak se mi hodí, na konci to příkazem $lines[$i] =~ s/(\s)+/ /g; od přebytečných mezer vyčistím

Učení hranic vět Na vstupu je na každém řádku věta, tzn. snadno najdu slova, za kterými je tečka a přitom neukončují větu Tím se vytvoří seznam zkratek, který se použije při hledání hranic vět

Hledání hranic vět Odstavec je na jednom řádku, tzn. načítám každý řádek Funkcí @radek = split(/ /, $lines[$i]); získám pole slov a hledám tečky Pokud je slovo před tečkou v seznamu zkratek, konec věty se neoznačí, jinak ano Nutno ošetřit výjimky, jako závorky, uvozovky, datum etc.

Závěr Během psaní programů v podstatě žádné problémy, jde hlavně o to se probít přes regulární výrazy, pak už to jde hezky…