Explicitní popis jazyka a anotovaná data se zřetelem na češtinu GA ČR P406/10/0875 Explicitní popis jazyka a anotovaná data se zřetelem na češtinu Workshop.

Slides:



Advertisements
Podobné prezentace
Úvod do studia jazyka – 4. Gramatika Morfologie.
Advertisements

Anotace souborovosti v datech PDT a PDTSC Revize modálních významů v PDT: gramatém slovesného způsobu a větné modality Magda Ševčíková
Gramatémy ve FGP a v PDT II Část 2
Natural Language Processing Prague Arabic Dependency Treebank Otakar Smrž koordinátor projektu Motivační přehled problémů, řešení a aplikací.
Vypracovala:Mgr.Silvie Reitharová
Název materiálu:VY_32_INOVACE_CJ2r0116 Název sady:Morfologie pro 2. ročník Vzdělávací oblast:Jazyk a jazyková komunikace Vzdělávací obor:Český jazyk a.
CJBB75 1 ZPK CJBB75 čtvrtek G
Eva Beranová, Základní škola, Čapkova 126, Klatovy
Základové větné struktury, slovesná valence a její chápání
Gramatémy ve FGD a v PDT II Magda Razímová, Zdeněk Žabokrtský Část 1 (ZŽ) – Motivace, výchozí situace – Upřesnění formálního rámce – typování uzlů – Implementace.
Lingvistika dvacátého století Magda Ševčíková Přednáška
Základní syntaktické pojmy
VY_32_INOVACE_Čj-Ml 6.,7.18 Anotace: Prezentace je zaměřena na druhy přísudku. Obsahuje základní pravidla pro tvoření přísudku slovesného a jmenného se.
VY_32_INOVACE_Čj-Ml 6.,7.15 Anotace: Prezentace je zaměřena na slovesné kategorie rod a vid. Ke každé kategorii je uvedena stručná definice s příklady.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Jan Kryšpín. Obchodní akademie a Střední odborná škola logistická, Opava, příspěvková.
1 Ověřování lingvistické teorie nad počítačovým korpusem Eva Hajičová ÚFAL MFF UK v Praze
SLOVESA Mgr. Michal Oblouk.
Workshop 3 grantů – PDT 3.0 – představy, realita, budoucnost Jarmila Panevová.
Koreferát: LISp-Miner a (lékařské) ontologie Vojtěch Svátek.
Větné členy a věty vedlejší podmět a přísudek
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Jan Kryšpín. Obchodní akademie a Střední odborná škola logistická, Opava, příspěvková.
Valence a Pražský závislostní korpus (PDT)
Větné členy, základní větné členy
Formální jazyky a gramatiky
Tomáš Urych, ESO9 Intranet a.s.
Informatika pro ekonomy II přednáška 10
Aktivita č. 6 Návrh a zavedení systému řízení kvality Workshop Výsledky analytického šetření.
Zde, narozdíl od předešlé verze, PDF, se do verze, ve formátu word, dá vpisovat řešení jednotlivých úkolů.
Databázové systémy 2 Zkouška – 08:00. Příklad I – Procedura – 5 bodů Vytvořte proceduru P_ZK3(p_oddeleni_id_from NUMBER, p_oddeleni_id_to NUMBER,
Zápočtová práce na POPJ Tvorba slovníku a pravidel do PC-Kimmo SLOVESA Vojtěch Holub.
Databázové systémy Informatika pro ekonomy, př. 18.
Valenční slovník českých sloves Zdeněk Žabokrtský ÚFAL,
Slovesný vid mluvnická kategorie sloves
PŘÍSUDEK Mgr. Michal Oblouk.
CJBB84 1 GAK – CJBB84 st
Automatická předanotace TFA v české části PCEDT GAP406/10/0875 (Komputační lingvistika: Explicitní popis jazyka a anotovaná data se zřetelem na češtinu)
Markéta Lopatková Karolína Skwarska Václava Kettnerová Eduard Bejček
Významy morfologických kategorií v PDT 2.0 Magda Razímová Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze.
MorČe morfologické značkování češtiny
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Jan Kryšpín. Obchodní akademie a Střední odborná škola logistická, Opava, příspěvková.
Mohu říct na ZŠ, že „byl pronásledován“ je přísudek jmenný se sponou?
Lingvistický software Morfologický analyzátor – AJKA Morfologický analyzátor – AJKA Morfologická databáze – I_PAR Morfologická databáze – I_PAR Desambiguace.
PŘEDMĚT: ORGANIZACE ZNALOSTÍ PŘEDNÁŠEJÍCÍ: Josef Schwarz Automatická indexace Základní metody a postupy.
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
Akreditace laboratoří podle revidované ČSN EN ISO/IEC 17025:2005 Ing. Martin Matušů, CSc.
Slovesné kategorie praktické opakování 1. OSOBA a ČÍSLO 1.os. JÁ - nesu1. os. MY - neseme 2. os. TY - neseš2. os. VY - nesete 3. os. ON – nese3. os.
© IHAS 2011 Tento projekt je financovaný z prostředků ESF prostřednictvím Operačního programu Vzdělávání pro konkurenceschopnost a státního rozpočtu ČR.
Alexandr II. Nikolajevič. ruský car v letech 1855 – 1881 narodil se 29. dubna 1818 v Petrohradě syn cara Mikuláše I. a jeho manželky Alexandry Fjodorovny.
Vyjádření příčiny a důsledku. Příčina (spojka PROTOŽE) Petr byl sám doma, protože jeho rodiče šli do divadla. Proč byl Petr sám doma? Protože jeho rodiče.
Klára Osolsobě, Hana Žižková
Vzorový příklad výpočtu křižovatky se SSZ
OZNAČENÍ MATERIÁLU: VY_32_INOVACE_274_ČJ8
Evidence aplikací a jejich dokumentace
NÁZEV ŠKOLY: Základní škola Strančice, okres Praha - východ
AUTOR: Mgr. Kateřina Palečková NÁZEV: VY_32_INOVACE_5C_13
Dan Zeman (Statistický parser na analytické rovině)
NÁZEV ŠKOLY: 2. základní škola, Rakovník, Husovo náměstí 3
Automatická indexace Základní metody a postupy
Informatika pro ekonomy přednáška 8
Slovesa II VY_32_INOVACE_03-12 Ročník: 7. Vzdělávací oblast:
Autor: Mgr. Eva Kotounová
ŠKOLA: Základní škola Velké Karlovice, okres Vsetín
Mgr. Marie Havránková TVAROSLOVÍ 12 – slovesa – slovesný rod
Základní škola a Mateřská škola Choustník, okres Tábor
Digitální učební materiál
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
PŘÍSUDEK (Př) Základní větný člen Co dělá podmět? slovesný
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
Základní větné členy – přísudek
SLOHOVÉ ÚTVARY očekávané pro zadání maturitní písemné práce
Transkript prezentace:

Explicitní popis jazyka a anotovaná data se zřetelem na češtinu GA ČR P406/10/0875 Explicitní popis jazyka a anotovaná data se zřetelem na češtinu Workshop 12. dubna 2012 Jarmila Panevová

2 Nové schéma slovesných gramatémů Základ „diatgram“ Základ: zavedení slovesného morfologického gramatém „diatgram“ – gramatická diateze (pasivum a další obměny spojené se změnou formy slovesa a přeskupením aktantů) Workshop 12. dubna 2012

3 Hodnoty gramatému „diatgram“ akt (aktivum) pas (opisné pasivum ) disp (dispoziční modalita) deagent (zevšeobecnění konatele)

4 Workshop 12. dubna 2012 res1 (rezultativ „objektový“ s býti) res2 (rezultativ posesivní s míti) res2.1 – v Sb je ACT res2.2 – v Sb je ADDR recipient (recipientní pasivum s „dostat“)

5 Workshop 12. dubna 2012 Zrušení stávajících gramatémů: resultative dispmod O gramatému „factmod“ (místo „verbmod“) a „sentmod“– M. Ševčíková

6 Workshop 12. dubna 2012 Důsledky: u res2.1, res2.2, recipient změna tektogramatické struktury (má uvařeno, dostal zaplaceno – jsou složené tvary slovesné). Nerozhodnuto: změny i na analytické rovině? (mít a dostat by byly AuxV)

7 Workshop 12. dubna 2012 Řešení pro PDT 3.0 Act vs. pas – řešeno v PDT2.0 Disp – automaticky přepsat oddělený gramatém dispmod (=1) do diatgram Deagent – automaticky přepsat, kde je se (na ATS AuxR) a Gen.ACT (redundance?! – asi ne)

8 Workshop 12. dubna 2012 Ostatní změny manuálně: Recipient – 0 výskytů v PDT2.0 Res2 (2.1, 2.2) cca 120 výskytů v PDT2.0 (Jarka Hlaváčová) (1) Litvínov má skvěle našlápnuto.res2.1 (2) Každý z nich má určen.res2.2 měsíční úkol. (3) Postaveno.??? má na Oseku. (rozhodne anotátor na základě kontextu)

9 Workshop 12. dubna 2012 Rozdíl pas vs. res1 (homonymie) Pas – „dějovější“ (ACT vyjádřen and/or sloveso nedokonavé (až na výjimky)) Res1 – „výsledek předchozího děje“ (stav) (2 anotátorky manuálně – mezianotátorská shoda nízká)

10 Workshop 12. dubna 2012 Příklady: (4) Ve chvíli, kdy přejížděl křižovatku, bylo světlo (už) rozsvíceno.res1 (= rozsvícené) (5) Nevstupujte do katakomby dřív, než bude světlo rozsvíceno.pas (kastelnánem). Založit na výsledcích anotování ATS: rozdíl pasivum vs. stav se lišil ve struktuře (důvěra v rozhodnutí anotátorů analytické roviny)

11 Workshop 12. dubna 2012 Stav odpovídá res1 ATS struktura: být rodič, -n/t participium slovesa dcera (afun = PNOM) Pasivum ATS struktura: n/t participium rodič, tvary být AuxV dcera

12 Workshop 12. dubna 2012 Jirka Mírovský ošetří skriptem, pak ruční kontrola (specifika jako „krátce řečeno“, sloveso zůstat místo být) Diatsynt: Rcp (reciprocita) – zvlášť kvůli kombinatorice ( Jan a Marie mají na sebe políčeno.). Zatím nebyla verze Rcp (zachycené syntakticky) revidována, zůstává PDT2.0.)