GAK – CJBB84 čt. 12.30-14.00 6.10.2011. Vyhledávání v korpusu s/bez použití lemmatizace a morfologických značek Základní vyhledávání v korpusu Obsah:

Slides:



Advertisements
Podobné prezentace
Dokončení textu Čtenářská gramotnost.
Advertisements

EU Peníze školám Inovace ve vzdělávání na naší škole ZŠ Studánka
Úvod do studia jazyka – 4. Gramatika Morfologie.
Practice with Numbers Answer the following questions in Czech. Remember to use the correct case of nouns after numbers. Vzor: Kolik minut má hodina?
CJBB75 1 ZPK CJBB CJBB75 2 Je to, co je skryto ve značce „stupeň“, jediné, co je možné se z korpusu dozvědět o stupňování v češtině ? Pozice.
NÁZEV ŠKOLY: ZÁKLADNÍ ŠKOLA PODBOŘANY, HUSOVA 276, OKRES LOUNY
CJBB75 1 ZPK CJBB75 čtvrtek G
OBTÍŽNĚJŠÍ TVARY SLOVES
Číslo v digitálním archivu školy
Telling Time Write out each of the following time expressions in words. Vzor: 5:25 Je pět hodin a dvacet pět minut. *Taken from Lesson 7, pg. 89, ex. 7.
Expressions of Time Write out the following times in two different ways (whenever possible). Vzor: 1:30 am Je jedna hodina třicet minut. Je půl druhé.
Základní škola a mateřská škola T.G. Masaryka Milovice, Školská 112, Milovice projekt v rámci Operačního programu VZDĚLÁVÁNÍ PRO KONKURENCESCHOPNOST.
1. Datum vytvoření: Téma: Slovesa Cíl prezentace: Rozlišování slovesných tvarů Časová dotace: 45 min Anotace: Výukový materiál je zaměřen.
SLOVESA Mgr. Michal Oblouk.
CJBB84 1 ZPK CJBB75 čtvrtek G
CJBB84 1 GAK CJBB CJBB84 2 Využití morfologických vlastností českého slovesa při formulaci dotazu při vyhledávání deverbativ od tvaru od.
Internet Definice Historie Použití Programy pro práci s internetem
Předmět: Český jazyk - mluvnice Cílová skupina: 6. ročník ZŠ
Slovesa (verba).
EU Peníze školám Inovace ve vzdělávání na naší škole ZŠ Studánka
VÝUKOVÝ MATERIÁL ZPRACOVÁN V RÁMCI PROJEKTU EU PENÍZE ŠKOLÁM Registrační číslo projektu: CZ.1.07/1.4.00/ Jméno autora:Mgr. Jitka Charvátová Třída/ročník:
Pamatujete si, jak jsme si v loňském školním roce hráli na pošťáky? Každé slovo byl dopis s adresou, který jsme museli správně doručit. Teď si všechny.
CJBB75 1 ZPK CJBB75 čtvrtek G
Anotace: Slovesa Autor: Mgr. Michaela Vacková Jazyk: český Vzdělávací oblast: Jazyk a jazyková komunikace Očekávaný výstup: žák poznává slovní druhy, žák.
Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: CZ.1.07/1.5.00/ Šablona:III/2č. materiálu:VY_32_INOVACE_48.
Název projektu: Šablony Špičák číslo projektu: CZ.1.07/1.4.00/ šablona III/2 autor výukového materiálu: Mgr. Jana Jiroušová, VM vytvořen: únor 2012,
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
Číslo a název šablony klíčové aktivity
Škola: Základní škola a Mateřská škola Nečtiny, Nečtiny 39 Název: VY_32_INOVACE_SADA02_ČESKÝ JAZYK_DUM17 Předmět: Český jazyk Ročník: 2. Klíčová.
VY_32_INOVACE_TMM26060BOU Výukový materiál v rámci projektu OPVK 1.5 Peníze středním školám Číslo projektu: CZ.1.07/1.5.00/ Název projektu: Rozvoj.
Název projektu: Šablony Špičák číslo projektu: CZ.1.07/1.4.00/ šablona III/2 autor výukového materiálu: Mgr. Jana Jiroušová, VM vytvořen: prosinec.
NÁZEV ŠKOLY: Základní škola Javorník, okres Jeseník REDIZO: NÁZEV: VY_32_INOVACE_452_Slovní druhy AUTOR: Mgr. Dagmar Petřeková ROČNÍK, DATUM:
 U řady jmen s kmenem zakončeným skupinou dvou nebo více souhlásek, např. hra, kresba, látka, astra, ondatra, se v G. pl. do skupiny vkládá e: her, kreseb,...“(Cvrček.
CJBB84 1 GAK – CJBB84 st
NÁZEV ŠKOLY: Základní škola Javorník, okres Jeseník REDIZO: NÁZEV: VY_32_INOVACE_333_Slovní druhy AUTOR: Mgr. Šárka Kubáčková ROČNÍK, DATUM:
Korpusová lingvistika ( 3 ) Jan Radimský FF JU České Budějovice.
CJBB84 1 GAK – CJBB84 st
Co nejrychleji a nejpřesněji odpovídej na dané otázky.
CJBB CJBB75.
Základy slavistiky – seminář – 2.lekce
CJBB75 1 ZPK CJBB75 středa G
KORPUSY A KVANTITATIVNÍ DATA Úvod do korpusové lingvistiky 11.
Český jazyk – 2. ročník „Slovní druhy“
Český jazyk 3. ročník ZŠ „Slovesa“
Lingvistický software Morfologický analyzátor – AJKA Morfologický analyzátor – AJKA Morfologická databáze – I_PAR Morfologická databáze – I_PAR Desambiguace.
PRAXE V ČESKÉM PROSTŘEDÍ Úvod do korpusové lingvistiky 5.
PLIN033_3 Přegenerovávání a podgenerovávání – dva problémy automatické analýzy přirozeného jazyka, konkrétně slovotvorby.
CJBB75 Základy využití korpusu pro praxi st G13.
Kontingenční tabulky. Úvod Kontingenční tabulky jsou jedním ze základních nástrojů pro práci s Excelem i pro jakékoliv smysluplné zpracování a vyhodnocování.
NÁZEV ŠKOLY: Základní škola a mateřská škola Bohdalov ČÍSLO PROJEKTU: CZ.1.07/1.4.00/ ŠABLONA: III/2 VZDĚLÁVACÍ OBLAST: Jazyk a jazyková komunikace.Český.
Přísudek a podmět Autor: Mgr. Ivana Tesařová Materiál vznikl v rámci projektu Škola pro život č.proj. CZ.1.07/1.4.00/
Název školy: ZÁKLADNÍ ŠKOLA SADSKÁ Autor: Mgr. Dobrá Jana Název DUM: VY_32_Inovace_ Slovní druhy Název sady: Český jazyk 4. ročník Číslo projektu:
Klára Osolsobě, Hana Žižková
Mgr. Marie Havránková TVAROSLOVÍ 7 - slovesa Mluvnice pro 2. ročník
Mgr. Marie Havránková TVAROSLOVÍ 13 – slovesa –slovesné třídy,
CJBB CJBB84.
Všestranné jazykové rozbory
SKUPINOVÁ PRÁCE – SLOVNÍ DRUHY
ÚKL CJBB CJBB84.
GAK – CJBB84 čt CJBB84.
ZPK CJBB CJBB75.
Název: VY_12_INOVACE_ČJ_15   Škola: ZŠ a MŠ Chraštice, Chraštice 44
Základní škola a mateřská škola Bohdalov CZ.1.07/1.4.00/ III/2
OZNAČENÍ MATERIÁLU: VY_32_INOVACE_38_ČJ4
Mgr. Marie Havránková TVAROSLOVÍ 12 – slovesa – slovesný rod
Číslo DUM: VY_32_INOVACE_CJ8_02
TVAROSLOVÍ VY_32_INOVACE_XIII-C-06.
Úvod do korpusové lingvistiky 3
Mgr. Lenka Vrzáňová Větná stavba října 2011
VY_32_INOVACE_42_Slovni_druhy_jinak
Transkript prezentace:

GAK – CJBB84 čt

Vyhledávání v korpusu s/bez použití lemmatizace a morfologických značek Základní vyhledávání v korpusu Obsah: Vyhledávání tvaru slova nebo slovního spojení Vyhledávání podle atributu lc (lowercase) Vyhledávání podle atributu lemma Vyhledávání podle atributu tag (morfologická značka) Nastavení implicitního atributu Hledání v rámci jedné věty Vyhledávání tvaru slova nebo slovního spojení Vyhledávání podle atributu lc (lowercase) Vyhledávání podle atributu lemma Vyhledávání podle atributu tag (morfologická značka) Nastavení implicitního atributu Hledání v rámci jedné věty

vyhledejte v korpusu SYN2010 slovní tvar hnát lemma hnát všechna slovesa v infinitivu všechna slovesa na -át

Otázky Pomocí funkce statistik zjistěte, jak je v korpusu SYN rozložen poměr tvarů slovních druhů u slovního tvaru hnát a u lemmatu hnát. Pokuste se pomocí P-filtru získat seznam slovesných/substantivních tvarů a zjistěte, jaká je chybovost značkování.

Možnost vyhledávat tvar bez použití morfologické značky Jak vyhledat tvary infinitivu bez morfologické značky ? Hledání pomocí formy – na co v češtině končí infinitiv ?

Zakončení -t -ti -ci -ct

Je možná nějaká přesnější specifikace ?.*t (? život, dost, opět, část, procent,...).*ti (? proti, ti, společnosti, děti, části,...).*ci (?práci, věci, noci, ulici, rámci,...).*ct (?patnáct, dvanáct, čtrnáct, jedenáct,...)

Jak ? Existují nějaká předpověditelná tvrzení týkající se toho, co může/nemůže stát před - t, -ti, -ci, -ct ? Co nám může pomoci ? Gramatika Pozorování korpusových dat

Co předchází ? V C

V at, át et, ět, ét it, ít ot, ót ut, ůt yt, ýt

C.*[cčdďfghjklmnňpqrřsštťvwxzž]t.*[cčdďfghjklmnňpqrřsštťvwxzž]ti

Co předchází ? KmV KoV v případě otevřeného kořene (s 0 KmV) finála uzavřeného kořene

KmV infinitivu : gramatika nebo náhoda dělat, ?zvířat, ?stát, ?tentokrát ?let slyšet ?opět, ?pět, ?estét mít, ?pocit, mluvit, ?sít ?život, ?kvót ?minut, dosáhnout, ?aut, ?lhůt být, ?byt, ?Kamarýt

KoV III. třída vzor krýt atematická slovesa

finála kořene I. třída vzor nést I. třída vzor péci

dotaz.*[aáeěiíý]t|.*out.*[aáeěiíý]ti|.*outi

A co hřbet internet karet ret cigaret kvartet kulomet

? Existují nějaká další omezení ? Týkají se všech V v roli KmV/Kov ?

Dotaz.*[aáeěiíý]t|.*out.*[aáeěiíý]ti|.*outi N-filtr.*[bpfvmdtnr]et.*[bpfvmdtnr]eti

Dotaz.*[szc]t.*[szc]ti N-filtr.*[cčdďfghjklmnňpqrřsštťvwxzžaeěioóúy][szc] t.*[cčdďfghjklmnňpqrřsštťvwxzžaeěioóúy][szc] ti

Všimněme si.*náct nárůst

Gramatika Uzavřené a otevřené třídy

Samostatné řešení úkolů z morfologie a tvoření slov Stejným způsobem popište postup, který může pomoci při vyhledávání l-ových příčestí. Pomocí analogických strategií lze vyhledávat také podstatná jména slovesná na ní/tí. Popište jak.