Previously existing lexical data resources automatic preprocessing manual annotation manual & automatic consistency checking automatic postprocessing resulting.

Slides:



Advertisements
Podobné prezentace
1 Škola: Gymnázium, Brno, Slovanské náměstí 7 Šablona: III/2 – Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN prostřednictvím.
Advertisements

Podpora rozvoje cizích jazyků pro Evropu 21. stol. INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Tento projekt je spolufinancován Evropským sociálním fondem a státním.
Tutorial: Mechanic - electrician Topic: Technical training II. class Printed circuit boards 3 Prepared by: Melichařík Lubomír Projekt Anglicky v odborných.
Novinky ze zahraničí IVIG 2008
Základní technická terminologie Poznámka: značka * za slovem znamená pokračování kliknutím, zbytek je načasován.
Základní elektrická terminologie Poznámka: značka * za slovem znamená pokračování kliknutím, zbytek je načasován.
1 Jarmila Panevová Malá Skála – září 2012  GA ČR P406/2010/0875 „Computational Linguistics: Explicit description of language and annotated data focused.
Prague Dependency Treebank and Functional Generative Description
Evoluce Katalýza. © 2011 Nature Publishing Group. Published by Nature Publishing Group.2 Figure 1 Rapid evolutionary innovation during an Archaean.
Jméno autora: Mgr. Mária Filipová Datum vytvoření: Číslo DUMu: VY_32_INOVACE_02_AJ_EP Ročník: 1. – 4. ročník Vzdělávací oblast:Jazyk a jazyková.
Tutorial: Mechanic - electrician Topic: Electric measurement the 2nd. year Measuring devices 1 Prepared by: Ing. Jiří Smílek Projekt Anglicky v odborných.
Lada Leszkowová, Gymnázium K.V. Raise Hlinsko, 2014 leden
Počítačová grafika pro inženýry - CAD systémy pro DTP - znaky, stránky, dokumenty, tisk, osvitové jednotky pro manažery - obrázky, interpretace pro autory.
ŠkolaStřední průmyslová škola Zlín Název projektu, reg. č.Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávací.
Jméno autora:Mgr. Mária Filipová Datum vytvoření: Číslo DUMu:VY_32_INOVACE_05_AJ_ACH Ročník: 1. – 4. ročník Vzdělávací oblast: Jazyk a jazyková.
Fonologie Cvičení číslo 4. Kdo je tady? Kdo má domácí úkol?
Číslo projektuCZ.1.07/1.5.00/ Číslo materiálu VY_32_INOVACE_AJK-2.PT-15-Česká republika Název školyStřední odborná škola a Střední odborné učiliště,
Abba – poslech, práce s textem.
1 Škola: Gymnázium, Brno, Slovanské náměstí 7 Šablona: III/2 – Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN prostřednictvím.
? PRESENT SIMPLE OR PRESENT CONTINUOUS. PRESENT SIMPLE PŘÍTOMNÝ ČAS PROSTÝ We read a lot. We read every day. We usually read books of fiction. Our friend,
Jméno autora: Mgr. Mária Filipová Datum vytvoření: Číslo DUMu: VY_32_INOVACE_07_AJ_CM Ročník: 1. – 4. ročník Vzdělávací oblast:Jazyk a jazyková.
Integrated Development Environment datové modely pro SharePoint Michal Černík.
40.1 If clauses - 2nd and 3rd conditional
Přítomné časy, budoucí – will, minulý čas prostý - 6. ročník Základní škola Jakuba Jana Ryby Rožmitál pod Třemšínem Efektivní výuka pro rozvoj potenciálu.
Předpřítomný čas Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ondřej Hoberla. Dostupné z Metodického portálu ISSN:
Využití multimediálních nástrojů pro rozvoj klíčových kompetencí žáků ZŠ Brodek u Konice reg. č.: CZ.1.07/1.1.04/ Předmět:Anglický jazyk Ročník:6.
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Podpora rozvoje cizích jazyků pro Evropu 21. stol. Tento projekt je spolufinancován Evropským sociálním fondem a státním.
Podpora rozvoje cizích jazyků pro Evropu 21. stol. INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Tento projekt je spolufinancován Evropským sociálním fondem a státním.
Musím to udělat? Do I have to do this?. Proč tam musíme jít? Why do we have to go there?
Modal Verbs = způsobová slovesa.
42.1 Reported statements (Nepřímá řeč)
Project Tree Planting. About parcel Parcel is owned by Pěnčín village Parcel is owned by Pěnčín village Village Pěnčín is situated near Jablonec nad Nisou.
Podpora rozvoje cizích jazyků pro Evropu 21. stol. INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Tento projekt je spolufinancován Evropským sociálním fondem a státním.
Jméno autora: Mgr. Olga Bayerlová Datum vytvoření: Číslo DUMu: VY_32_INOVACE_18_AJ3E Ročník: II. Anglický jazyk Vzdělávací oblast: Jazyk a jazyková.
Tento Digitální učební materiál vznikl díky finanční podpoře EU- OP Vzdělávání pro konkurenceschopnost. Není –li uvedeno jinak, je tento materiál zpracován.
Educational program: Mechanic - electrician Title of program: Technical training II. class Astable multivibrator Worked out: Bc. Chumchal Miroslav Projekt.
Konverzace v anglickém jazyce ročník
Setkání uživatelů SFX Statistické reporty SFX.
Podpora rozvoje cizích jazyků pro Evropu 21. stol. INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Tento projekt je spolufinancován Evropským sociálním fondem a státním.
Future with „Going to“ Mgr. Ludmila Faltýnková EU OPVK ICT2-4/AJ11 Základní škola Olomouc, Heyrovského 33 Určeno pouze pro výuku Žádná část ani celek nesmí.
Maturita oral exam rehearsal Lada Leszkowová, GKVR Hlinsko, 2013 prosinec The Czech Republic.
Valency in the Prague Dependency Treebank
11/24/2014Kurt Gödel1 Lecture 13 Arithmetics; Gödel’s incompleteness theorems.
Příjemce Základní škola, Třebechovice pod Orebem, okres Hradec Králové Registrační číslo projektuCZ.1.07/1.1.05/ Název projektu Digitalizace výuky.
1 Škola: Gymnázium, Brno, Slovanské náměstí 7 Šablona: III/2 – Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN prostřednictvím.
Tutorial: Mechanic - electrician Topic: Technical training II. class Printed circuit boards 2 Prepared by: Melichařík Lubomír Projekt Anglicky v odborných.
Číslo projektuCZ.1.07/1.5.00/ Číslo materiálu VY_32_INOVACE_AJK-4.PT-30-Problémy dnešního světa Název školyStřední odborná škola a Střední odborné.
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_180 Název školyGymnázium, Tachov, Pionýrská 1370 Autor Mgr. Eleonora Klasová Předmět.
1 Škola: Gymnázium, Brno, Slovanské náměstí 7 Šablona: III/2 – Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN prostřednictvím.
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_178 Název školyGymnázium, Tachov, Pionýrská 1370 Autor Mgr. Eleonora Klasová Předmět.
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUM Businessland / Making Contracts 06B16 AutorLadislava Pechová Období vytvořeníLeden.
Jak postupujeme vpřed v testování? Jak se nám daří vytvářet denní buildy? Stíháme opravovat chyby? Jak kvalitně chyby opravujeme?
Tutorial: Obchodní akademie Topic: Logical Functions Prepared by: Mgr. Zdeněk Hrdina Projekt Anglicky v odborných předmětech, CZ.1.07/1.3.09/ je.
Název a adresa školy: Střední odborné učiliště stavební, Opava, příspěvková organizace, Boženy Němcové 22/2309, Opava Název operačního programu:OP.
CZECH STATISTICAL OFFICE Na padesátém 81, CZ Praha 10, Czech Republic Blind Friendly Website Helena Koláčková Czech Statistical Office.
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu „Učíme moderně“ Registrační číslo projektu:
EU peníze středním školám Název vzdělávacího materiálu: B2 – Verbs – Computers Číslo vzdělávacího materiálu: ICT12-19 Šablona: III/2 Inovace a zkvalitnění.
Gymnázium, Brno, Elgartova 3 GE - Vyšší kvalita výuky CZ.1.07/1.5.00/ III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Téma: English Grammar.
Základní škola Třemošnice, okres Chrudim, Pardubický kraj Třemošnice, Internátní 217; IČ: , tel: , emaiI:
Gymnázium, Brno, Elgartova 3 GE - Vyšší kvalita výuky CZ.1.07/1.5.00/ III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Téma: English Grammar.
Název školy: ZŠ Varnsdorf, Edisonova 2821, okres Děčín, příspěvková organizace Jazyk a jazyková komunikace, Anglický jazyk, Minulý čas prostý pravidelných.
Název vzdělávacího materiálu
Tento projekt byl realizován za finanční podpory Evropské unie.
DIGITÁLNÍ UČEBNÍ MATERIÁL
Critical thinking Critical thinking is a general term that covers all thinking processes that strive to get below the surface of something: questioning,
Essay to be included in final critique
Image Stitching II Linda Shapiro ECE/CSE 576.
CONCLUSIONS AND RECOMMENDATION
TEACHING ENGLISH TO ADVANCED LEVEL LEARNERS AT AN INTERNATIONAL UNIVERSITY. Stanislav Tumskiy, Karina Tkachenok MGIMO-UNIVERSITY (RUSSIAN FEDERATION)
Transkript prezentace:

previously existing lexical data resources automatic preprocessing manual annotation manual & automatic consistency checking automatic postprocessing resulting valency lexicon (XML) Valency Dictionary of Czech Verbs: Complex Tectogrammatical Annotation Markéta Straňáková-Lopatková Zdeněk Žabokrtský Center for Computational Linguistics, Charles University, Prague { ACT PAT ADDR EFF vyměnit (to exchange) ACT MEANS DIR3 jet (to go) based on Functional Generative Description [Sgall et al.,1986] closely related to the tectogrammatical tree structures of the Prague Dependency Treebank [Hajičová et al., 2001] 38 Example of the TG- structure : "... od prodejců vybírá poplatky každé ráno správce tržiště." ("... the janitor of a market-place collects fees from the sellers every morning. ") Theoretical background Motivation Goals There is no wide-coverage valency lexicon containing functors ("thematic roles"). Indeed, there is no Czech lexicon where valency phenomena are treated in a sufficiently systematic way! to develop an annotation scheme, methodology and software tools for a tectogrammatically annotated valency dictionary of Czech verbs to verify the approach on a small set of verbs to keep maximal consistency for all captured phenomena emphasis on both human and machine readability of the output Processing steps What should the dictionary ideally capture? for each verb set of valency frames for each valency frame ordered sequence of frame slots synonyms examples of usage reciprocity control (“equi/raising verbs“) possible type of reflexivity type of passivisation lemma of aspectual correlate(s) type of usage (prim./second./idiom.) semantic class (verba dicendi etc.) pointer(s) to EuroWordNet synset(s) number of occurences in a text sample for each frame slot functor surface realization(s) type (obligatory/optional/quasivalency/typical) Sample from the dictionary Conclusion Future work we can build an interesting and important language resource, but......creating high-quality data requires a lot of human effort; the task cannot be fully automated finding hard-and-fast criteria for annotator’s decisions enlarging the current lexicon intensive use of different language resources linking to other languages ACT PAT čekat na někoho (to wait for sb.) Current State 1000 verbs being annotated (350 finished) circa 60% coverage on verbs in running text * dodat [to deliver,to supply,to add] -aspect: (imp); dodávat (perf) = + ACT(1;obl) PAT(4;obl) DIR3(;obl) BEN(3,pro+4;typ) -synon: dopravit -example: dodat (někomu/pro někoho) někam zboží [to deliver goods somewhere] -note: alter -use: prim -freq: 1 + ACT(1;obl) ADDR(3;obl) PAT(4;obl) DIR3(;typ) -synon: dopravit -example: dodat někomu zboží (někam); dodali si (jeden druhému) zboží (někam) [to deliver goods to somebody; they delivered goods to each other] -note: alter -use: prim -reciprocity: ACT-ADDR -freq: 1 + ACT(1;obl) PAT(k+3;opt) EFF(4,že;obl) -synon: říci -example: dodal k tomu své připomínky /vše, co věděl [to add a remark on something] -use: secondary -class: dicendi -freq: 18 + ACT(1;obl) ADDR(3;obl) PAT(4,2;obl) -example: dodat někomu odvahu/odvahy; dodali si odvahy (jeden druhému) [to encourage somebody] -reciprocity: ACT-ADDR -use: idiom * předpokládat [to presuppose,to assume,to demand] -aspect: (imp.) + ACT(1;obl) PAT(o+6;opt) EFF(4,že;obl) -synon: brát za dané -example: předpokládal o tom, že je to pravda; předpokládali o sobě (navzájem), že nelžou [he presupposed about it that it was true; they assumed (one about the other) that they didn’t tell lies] -reciprocity: ACT-PAT -use: prim -class: dicendi -ewn: 1 -freq: 27 + ACT(1,inf,že,aby;obl) PAT(4,že;obl) -synon: žádat -example: tato práce předpokládá jistou zručnost; pracovat zde předpokládá zručnost [this work demands certain skill; it demands skill to work here] -control: gen -use: secondary -ewn: 2 -freq: 3 Verbal valency frame a range of syntactic elements (verbal modifiers) either required or specifically permitted by the verb