Zápočtová práce na POPJ Tvorba slovníku a pravidel do PC-Kimmo SLOVESA Vojtěch Holub.

Slides:



Advertisements
Podobné prezentace
Slovesa - přechodníky 32_04_05: Mluvnice – Anotace Jazyk
Advertisements

Úvod do studia jazyka – 4. Gramatika Morfologie.
Slovesa a mluvnické kategorie
Výukový materiál zpracovaný v rámci projektu „EU peníze školám“
Základní škola a Mateřská škola Slapy, okres Praha-západ
Semestrální práce KIV/PT Martin Kales Hana Hůlová.
Poznáváme slovesa Slovesa vyjadřují děj..
-způsoby, postupy, základní pojmy, náměty-
opakování a procvičování
Základní škola a mateřská škola T.G. Masaryka Milovice, Školská 112, Milovice projekt v rámci Operačního programu VZDĚLÁVÁNÍ PRO KONKURENCESCHOPNOST.
Škola: Chomutovské soukromé gymnázium Číslo projektu: CZ.1.07/1.5.00/
SLOVESA Mgr. Michal Oblouk.
1. KŠPA Kladno, s. r. o., Holandská 2531, Kladno,
Slovesa (verba).
Slovesa.
Název šablony:Inovace a zkvalitnění výuky prostřednictvím ICT zaměření VM:4. ročník – Jazyk a jazyková komunikace – Český jazyk a literatura – Slovesný.
PŘECHODNÍKY Mgr. Michal Oblouk.
Slovesa.
Vypravování VY_32_INOVACE_ČJ-S 8.,9.11
Název sloupce Datový typ Počet znaků Znaková sada Možnost prázdného pole Typ klíče Automatický přírůstek.
Jiří Znoj - zno Tvorba konkordace Algoritmy II 3. projekt, 5. zadání Jiří Znoj - zno
Tento Digitální učební materiál vznikl díky finanční podpoře EU- OP Vzdělávání pro konkurenceschopnost. Není –li uvedeno jinak, je tento materiál zpracován.
Označení materiálu: VY_32_INOVACE_RUBMO_CESKYJAZYK_06
Číslo a název šablony klíčové aktivity
85.1 Slovesný způsob Mlč! mlčel bych….. Mlčme! mlčel bys… mlčím…
TVARY OZNAMOVACÍHO A ROZKAZOVACÍHO ZPŮSOBU
Autorem materiálu a všech jeho částí, není li uvedeno jinak, je Kateřina Najmanová Trpný rod- The Passive.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Leona Jarošová ANOTACE Prezentace seznamuje žáky s mluvnickými kategoriemi sloves.
Název školy: ZÁKLADNÍ ŠKOLA PODBOŘANY, HUSOVA 276, OKRES LOUNY Autor: Vladislav Michl Název: VY_32_INOVACE_542_SLOVESA_MLUVNICKÉ_KAT EGORIE Téma: OPAKOVÁNÍ.
 U řady jmen s kmenem zakončeným skupinou dvou nebo více souhlásek, např. hra, kresba, látka, astra, ondatra, se v G. pl. do skupiny vkládá e: her, kreseb,...“(Cvrček.
SLOVESA - 5 Ohebný slovní druh-časují se
Základy slavistiky – seminář – 2.lekce
KORPUSY A KVANTITATIVNÍ DATA Úvod do korpusové lingvistiky 11.
Mgr. Michal Oblouk OHEBNÉ SLOVNÍ DRUHY.
PRESENT SIMPLE AFFIRMATIVE_05 Mgr. Filip Soviš ANJ_Tenses
Český jazyk 3. ročník ZŠ „Slovesa“
Lingvistický software Morfologický analyzátor – AJKA Morfologický analyzátor – AJKA Morfologická databáze – I_PAR Morfologická databáze – I_PAR Desambiguace.
Verbal overshadowing effect – verbální zastínění
Slovesné třídy a vzory Určují se pouze u sloves
Německé sloveso „werden“ PhDr. Taťána Tonová. ANOTACE Kód DUMu: VY_32_INOVACE_4.NJ.19 Číslo projektu: CZ.1.07/1.5.00/ Vytvořeno: leden 2014 Ročník:
Slovesné kategorie praktické opakování 1. OSOBA a ČÍSLO 1.os. JÁ - nesu1. os. MY - neseme 2. os. TY - neseš2. os. VY - nesete 3. os. ON – nese3. os.
Název školy: Základní škola Pomezí, okres Svitavy
Číslo přílohy: VY_ 32_INOVACE_14 _Slovesa II. část - časování
Klára Osolsobě, Hana Žižková
Multimediální prezentace vzdělávacích oblastí ŠVP
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
Mgr. Marie Havránková TVAROSLOVÍ 7 - slovesa Mluvnice pro 2. ročník
Základní škola Unhošť Jazyk a jazyková komunikace
Mgr. Marie Havránková TVAROSLOVÍ 13 – slovesa –slovesné třídy,
Mgr. Marie Havránková TVAROSLOVÍ 10 – slovesa – slovesný čas
NÁZEV ŠKOLY: Základní škola Strančice, okres Praha - východ
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
Český jazyk 6. ročník ZÁKLADNÍ ŠKOLA SADSKÁ Mgr. Jiřina Homolová
VY_32_INOVACE_Sib_I_14 Slovesa
SLOVESNÝ ZPŮSOB Autor prezentace: Mgr. Jaroslava Zámostná
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
Slovesné třídy.
AUTOR: Mgr. Linda Tůmová NÁZEV: VY_32_INOVACE_03_ČJ_19
SLOVESA Staň se kouzelníkem.
Kód materiálu: VY_32_INOVACE_02_SLOVESNE_CASY Název materiálu:
METODICKÉ LISTY výstup projektu Vzdělávací středisko pro další vzdělávání pedagogických pracovníků v Sokolově reg. č. projektu: CZ.1.07/1.3.11/
NÁZEV ŠKOLY: Základní škola a Mateřská škola Nedvědice, okr
Autor: Mgr. Jitka Langerová Datum: Název: VY_32_INOVACE_15_ČESKÝ JAZYK
ZÁKLADNÍ ŠKOLA, JIČÍN, HUSOVA 170 Číslo projektu
SLOVESA číslo projektu : CZ.1.07/1.4.00/
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
TVAROSLOVÍ VY_32_INOVACE_XIII-C-06.
Slovesa Název školy: Základní škola Zaječí, okres Břeclav
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
Transkript prezentace:

Zápočtová práce na POPJ Tvorba slovníku a pravidel do PC-Kimmo SLOVESA Vojtěch Holub

Zadání Stáhněte a rozchoďte PC-Kimmo Vytvořte do PC-Kimmo slovník (soubor.lex) a pravidla (soubor.rul) pro slovní druh - slovesa K dispozici dostanete anotovaný korpus PDT Gramatiku si zjistěte v mluvnici (doporučená: Příruční mluvnice češtiny)

Gramatika Čas přítomný: Způsob oznamovací: kmen prézentní + osobní koncovka (nes+u, nes+eš, nes+e, nes+eme...) slovesa se dělí na dva podtypy => podle toho se volí osobní koncovky I. nesu neseš nese... II. prosím prosíš prosí... volám voláš volá...

Gramatika Čas přítomný: Způsob rozkazovací: kmen prézentní + koncovky 2. os. sg: -0, -i, -ej 1. os. pl: -me, -eme/ěme, -ejme 2. os. pl: -te, -ete/ěte, -ejte Čas minulý kmen minulý + koncovky (-l, -la, -lo, -li, -ly) sg. pl. 1. os. nesl nesli/nesly 2. os. nesl nesli/nesly 3. os. nesl/nesla/neslo nesli/nesly/nesla

Gramatika Kmen prézentní X Kmen minulý Většina sloves má kmen minulý jiný než kmen prézentní !!! Není možné algoritmicky převést jeden kmen na druhý Velké rozdíly i u velmi podobných sloves brát : ber – bra hrát : hraj – hrá

Program Účel programu je získat z korpusu všechny prézentní a minulé kořeny sloves, jejich infinitiv a skupinu koncovek, která může následovat Popis algoritmu: - Definujeme pole koncovek minulých a přítomných – každé zvlášť - Pro koncovky přítomné definujeme jejich podtřídu podle tvaru koncovky - Pro každé sloveso (1 znak v anotaci = V): začátek cyklu - Pokud je druhý znak v anotaci f – infinitiv – nemá koncovku (\alt End) - Jinak pokud je devátý znak v anotaci P (přítomný čas), postupně porovnáváme koncovku slovesa s přítomnými koncovkami – najdeme-li shodu, koncovku odtrhneme, zjistíme podtřídu a zapíšeme pokračování pro přítomné koncovky dané podtřídy (např. VPresentSufT1)

Program - Jinak pokud je devátý znak v anotaci R (minulý čas), postupně porovnáváme koncovku slovesa s minulými koncovkami – najdeme-li shodu, koncovku odtrhneme a zapíšeme pokračování pro minulé koncovky - Pokud se tvar slovesa po odtržení (kmen) již v lexikonu nevyskytuje přidáme ho do pole (společne s infinitivem, pokračováním a slovním druhem) konec cyklu - Seřadíme pole podle abecedy – klíčem je kmen - Vložíme pole do souboru

Struktura

Problémy Problémy korpusu: - Cizojazyčná slovesa - V české abecedě nevyskytující se znaky - Překlepy - Gramatické chyby či nespisovné výrazy - Nejsou obsažena všechna slovesa v čase minulém, přítomném a infinitivu Problémy lexikonu: - V pravidlech nejsou aplikována jiná než defaultní pravidla - Není zařazen rod trpný a přechodníky

Ukázka korpusu

Ukázka lexikonu Slovesa Koncovky

Ukázka výstupu

Závěr Má práce byla poměrně náročná a vyžadovala nastudování mnoha materiálů. I přes ohromnou nepravidelnost a variabilitu českého jazyka, přes mnohé uvedené problémy a absenci pravidel jsem si jist, že analýza zadaného slovesa bude z minimálně 80 procent úspěšná a přesná. Myslím, že toto je velmi dobrý výsledek.

Děkuji za pozornost