GAK – CJBB84 čt. 12.30-14.00 3.11. 2011 CJBB84.

Slides:



Advertisements
Podobné prezentace
Značkování slovesných tvarů (GK čas)
Advertisements

Syntetické futurum v češtině
CJBB84 1 GAK – CJBB84 st
CJBB CJBB75.
Vypracováno kolektivem autorů České společnosti pro technickou normalizaci Úřad pro technickou normalizaci, metrologii a státní zkušebnictví
Mgr. Marie Havránková TVAROSLOVÍ 4 – přídavná jména Mluvnice pro 2. ročník 2. ročník Srpen 2012.
Název školy: Základní škola Okříšky Autor: Mgr. Jana Němcová Název: VY_32_INOVACE_04 Téma: Slovní zásoba a její obohacování Číslo projektu: CZ 1.07/1.4.00/
Název školy: ZÁKLADNÍ ŠKOLA SADSKÁ Autor: Michaela Blažková Název DUM: VY_32_Inovace_ Slovesný vid Název sady: Český jazyk 8. ročník Číslo projektu:
VY_32_INOVACE_CAJKOVA.JAZCES. 07 Vid dokonavý a nedokonavý.
Název školyStřední škola hotelová a služeb Kroměříž Číslo projektuCZ.1.07/1.5.00/ Autor Mgr. Eva Drlíková, Mgr. Jana Vašinová Název šablonyIVY_32_INOVACE.
Inf Tabulkový procesor - funkce. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím ICT.
NÁZEV ŠKOLY: ZŠ Dolní Benešov, příspěvková organizace AUTOR: Mgr. Martina Steyerová NÁZEV: VY_32_INOVACE_19_Český jazyk – 9. ročník TÉMA: Přechodníky ČÍSLO.
ŠKOLA: Gymnázium, Chomutov, Mostecká 3000, příspěvková organizace AUTOR:Mgr. Jiří Kolář NÁZEV:VY_32_INOVACE_08B_02_PC_a_zdraví TEMA:HARDWARE A SOFTWARE.
Elektronická přihláška Studenti z ČR a SR použijí tento formulář ! Studenti bez rodného čísla použijí tento formulář !
SLOVNÍKY ČÍSLO DUM: VY_32_INOVACE_CJL_2_43 Číslo projektu: CZ.1.07./1.5.00/ Název projektu: Zlepšení podmínek pro vzdělávání na SUŠ, Ostrava.
9. Mateřská škola, Písek, Alšova Identifikační údaje o škole Právní subjekt:Základní škola Josefa Kajetána Tyla a Mateřská škola Písek, Tylova 2391.
VY_32_ INOVACE_ 04_ VLASTIVĚDA 4 Základní škola a Mateřská škola, Potštejn, okres Rychnov nad Kněžnou NADMOŘSKÁ VÝŠKA Autor: Mgr.Renata Viktorinová.
Název školy: ZÁKLADNÍ ŠKOLA SADSKÁ Autor: Mgr. Jiřina Homolová Název DUM: VY_32_Inovace_ Slova neohebná Název sady: Český jazyk 6. ročník Číslo.
Slovesné tvary určité a neurčité sloveso vyjadřuje nějaký děj nebo stav ve větě stojí jako přísudek (jdeme, hoří) slovesné tvary dělíme na: určité - vyjadřují.
CZ.1.07/1.4.00/ "Učíme se moderně" Digitální učební materiál zpracovaný v rámci projektu Šablona:III/2 Inovace a zkvalitnění výuky prostřednictvím.
Databáze © Mgr. Petr Loskot
PRESENT SIMPLE NEGATIVE_09
Název školy: ZŠ Bor, okres Tachov, příspěvková organizace Autor: Mgr
Název prezentace (DUMu)
NÁZEV ŠKOLY: Základní škola a Mateřská škola Nedvědice, okr
VIKMA06 Rešeršní a studijně rozborová činnost
Paragrafované znění I 9. listopadu 2016 doc. JUDr. Radim Boháč, Ph.D.
Elektronická přihláška
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů Skladba 9. ročník
SLOVESA SE SLŮNĚTEM PRO DRUHÁČKY
NÁZEV ŠKOLY: ČÍSLO PROJEKTU: NÁZEV MATERIÁLU: TÉMA SADY: ROČNÍK:
AUTOR: Mgr. Kateřina Palečková NÁZEV: VY_32_INOVACE_5C_02
NÁZEV ŠKOLY: Základní škola Hostouň, okres Domažlice,
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
Mgr. Marie Havránková TVAROSLOVÍ 11 –slovesa – slovesný vid
Slovesa.
CJBB CJBB84.
AUTOR: Mgr. Marcela Lazáková NÁZEV ŠKOLY:
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
ÚZEMNÍ DIFERENCIACE ČEŠTINY
ÚKL CJBB CJBB84.
Český jazyk 6. ročník ZÁKLADNÍ ŠKOLA SADSKÁ Mgr. Jiřina Homolová
Digitální učební materiál zpracovaný v rámci projektu
Škola ZŠ Třeboň, Sokolská 296, Třeboň Autor Mgr. Alena Dohnalová Číslo
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
Kód materiálu: VY_32_INOVACE_02_SLOVESNE_CASY Název materiálu:
NÁZEV ŠKOLY: Základní škola a Mateřská škola Nedvědice, okr
Název školy: ZŠ Bor, okres Tachov, příspěvková organizace Autor: Mgr
Název školy:  ZÁKLADNÍ ŠKOLA PODBOŘANY, HUSOVA 276, OKRES LOUNY Autor:
BIBS Informatika pro ekonomy přednáška 2
NÁZEV ŠKOLY: ZŠ Dolní Benešov
Autor: Mgr. Vladimíra Dvořáková
GDPR: ochrana osobních údajů
NÁZEV ŠKOLY: Základní škola a Mateřská škola Nedvědice, okr
Paragrafované znění I 8. listopadu 2017 doc. JUDr. Radim Boháč, Ph.D.
Název školy: Speciální základní škola, Louny,
Klasifikace větných členů, rozbor věty jednoduché
Základní statistické pojmy
Větné členy.
Autor: Mgr. Monika Hřavová Název : VY_32_INOVACE_2A16Čj4_Slovesa
Úvod do korpusové lingvistiky 3
Kondiční cvičení v tělocvičně Překážková dráha
NÁZEV ŠKOLY: Základní škola a Mateřská škola Nedvědice, okr
Informatika – Základní operace s buňkami
Fond malých projektů Školení pro Konečné uživatele Zlín
Autor: Mgr. Vladimíra Dvořáková
Název školy: ZŠ Klášterec nad Ohří, Krátká 676 Autor: Mgr
Tečné a normálové zrychlení
ZÁKLADNÍ ŠKOLA PODBOŘANY, HUSOVA 276, OKRES LOUNY
TVAROSLOVÍ SLOVNÍ DRUHY – SLOVA OHEBNÁ A NEOHEBNÁ
Transkript prezentace:

GAK – CJBB84 čt. 12.30-14.00 3.11. 2011 CJBB84

Vyhledávání jevů na hranici slovník/gramatika tvarová homonymie – noční můra automatizace v NLP homonymie způsobená homonymií gramatických a slovotvorných formantů – konkrétně prefix po- otevřené seznamy – korpus jako zdroj dat pro doplnění okrajových jevů gramatiky do slovníků automatických morfologických analyzátorů CJBB84

Futurum v češtině a korpusy dokonavá slovesa opisné futurum nedokonavých sloves syntetické futurum CJBB84

F - futurum (budoucí čas) H - minulost nebo přítomnost (P/R) Značkování gramatické kategorie času v korpusech ČNK Pozice 9 - Čas (TENSE) - - neurčuje se F - futurum (budoucí čas) H - minulost nebo přítomnost (P/R) P - prézens (přítomný čas) R - minulý čas X - libovolný čas (F/R/P) - - neurčuje se CJBB84

Implicitní atribut tag dotazovací řádek VB……F.* Nfiltr lemma být CJBB84

Korpus SYN (22) být 5302509 jít 181280 trvat 85600 jet 82167 růst 14078 nést 12481 běžet 10456 letět 5800 téci 3710 vézt 2555 vést 2278 hrnout 969 cestovat 961 plout 758 lézt 755 stěhovat 406 hnát 382 řítit 22 plavat 21 plazit 19 krást 9 kvést 4 CJBB84

Korpusy ? Pokuste si vzpomenout na další možnosti. Ověřte, zda se vyskytují v korpusech. CJBB84

Implicitní atribut word dotazovací řádek po Implicitní atribut word dotazovací řádek po.* Implicitní atribut tag Pfiltr VB.* Konkordance – statistiky – lemma CJBB84

povalí ? povalit ? valit CJBB84

povede ? povést ? vést „Zůstaň u nás, budeš nám vařit, a když všechno budeš dělat, povede se ti dobře !“ (Jan Vodňanský: Analýza pohádky o Sněhurce a sedmi trpaslících) CJBB84

Mluvnice & korpusy Seznamy uváděné v příručkách (viz bibliografie) jsou rozsáhlejší než uvedený seznam Předpoklad: tvoří patrně otevřené množiny Závěr : korpusy mohou přispět k jejich rozšíření Korpusy mohou zpřesnit stávající popisy CJBB84

Implicitní atribut word dotazovací řádek povede Zobrazení – atributy – lemma+tag CJBB84

Řadu sloves, která uvádějí tištěné zdroje v korpusech nejsou capat/pocapá cupat/pocupá drát se/podere chvátat/pochvátá jechat/pojechá klíčit/poklíčí kulhat/pokulhá kulit se/pokulí kvačit/pokvačí kvapit/pokvapí lít/pole(i)jeje linout se/poline loudat se/poloudá pálit/popálí pršet/poprší rajzovat/porajzuje rázovat/porázuje šířit se/pošíří štrádovat/poštráduje vát/pověje vinout se/povine viset/povisí vrávorat/povrávorá CJBB84

korpusy dokládají navíc (tag=„VB.*“) 10 sloves + 1 BMK vanout/povane svištět/posviští kráčet/pokráčí táhnout/potáhne mazat/pomaže valit (se)/povalí (se) pást (se)/popase (se) šinout (se)/pošine (se) trénovat/potrénuje trvat/potrvá péct/popeče (s kým) CJBB84

korpusy dokládají (tag!=„V.*“) 9 sloves (doložena též na internetu) šupat/pošupe brodit se/pobrodí se crčet/pocrčí šupajdit/pošupajdí harcovat/poharcuje koučovat/pokoučuje veslovat/povesluje (SYNPUB2006) šupačit/pošupačí (SYNPUB2006) prýštit/poprýští (SYNPUB2006) CJBB84

Zastoupení lemmat v tištěných zdrojích, korpusech a na internetu tištěné zdroje 60 lemmat 72,29 % pouze korpusy 20 lemmat 24,1 % korpusy i tištěné zdroje 37 lemmat 44,58 % pouze tištěné zdroje lemmat 27,71 % pouze internet lemmata 3,61 % tištěné zdroje + korpusy 83 lemmat 100 % CJBB84

Upřesnění definice významu sloves schopných tvořit tvary syntetického futura Pohyb v konkrétním slova smyslu (přemísťování z místa na místo jednosměrně/ v určeném směru) : (půjde, pojede, poběží, poplazí se, pokráčí, pošine se, povalí, pomaže, ...) pohyb bez určení směru (různými směry) : (pošíří se, poline se, ... ). Proces zahrnující pohyb a) přírodní (povane, pověje, pol(i/e)je, poprší, ...); b) s neživým nositelem (rostlina: pokvete, poroste, poplazí se, strom: ponese (ovoce), ...; hudba: poline se, povalí ...; vůně: pošíří se, poline se, ...; voda: poteče, povalí, pocrčí, poprýští..., zpráva: pošíří se ,... ); c) mentální (popálí mu to) d) s živým nositelem (poroste, popase se, ... pták: ponese (vejce), ...); e) ve významu fungovat (v přeneseném významu jít) (správně) poklape, pošlape, povalí ...; vycházet s někým, (poklape, pošlape, popeče, ...). f) ve významu vést (pokoučuje, potrénuje, povládne) CJBB84

Gramatika a korpus rozšíření seznamu sloves, která mohou v češtině vyjadřovat futurum synteticky upřesnění definic jejich významů stabilní jádro proměnlivá periferie CJBB84

Bibliografie ČECHOVÁ A KOL. (1996): Čeština, řeč a jazyk. Praha : ISVN. ČERMÁK, F. (1990): Syntagmatika a paradigmatika českého slova. Praha : Karlova Univerzita. KOMÁREK, M. a kol. (1986): Mluvnice češtiny II., Praha : Academia. OSOLSOBĚ, K. (2007): Syntetické futurum v češtině – gramatiky, slovníky, korpusy. Přednášky a besedy z XL. běhu LŠSS. Brno, s. 131-144. OSOLSOBĚ, K. (2007): Popis gramatických významů jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů. SPFFMU A, 55, v tisku. OSOLSOBĚ, K.: Značkování gramatických kategorií v korpusech ČNK a jejich zachycení v gramatice a ve slovníku (syntetické futurum, stupňování adjektiv, neurčité číslovky a příslovce míry). In Štícha, F. Grammar & Corpora / Gramatika a korpus 2007. Academia : Praha, 2008, s. 407-416. ŠMILAUER, V. (1972): Nauka o českém jazyku. Praha : SPN. Elektronická verze Slovníku spisovného jazyka českého (SSJČ) a Slovníku spisovné češtiny pro školu a veřejnost (SSČ) dostupná z chrome://debdict/content/debdict.xul Český národní korpus - SYN2000, SYN2005, SYN2006PUB, BMK, PMK, ORAL2006. Ústav Českého národního korpusu FF UK, Praha 2000. Dostupné z WWW: <http://ucnk.ff.cuni.cz>. Morfologický analyzátor Ajka dostupný z http://nlp.fi.muni.cz/projekty/ajka/ajkacz.htm. CJBB84

Úkol na 10.10. 2011 Vyhledejte v korpusu SYN tvary slovesa mazat (pomažu, …)v syntetickém futuru a ve futuru opisném (budu mazat, …). Porovnejte frekvenci výskytu synonymních forem. CJBB84