Sparse Data Issue in MT Evaluation Ondřej Bojar, Kamil Kos, David Mareček;

Slides:



Advertisements
Podobné prezentace
Píseň “Mám príma den” Reakce?. Fonologie Cvičení číslo 3.
Advertisements

Informační schůzka k programu IP Erasmus v Burgasu.
Tento výukový materiál vznikl v rámci Operačního programu Vzdělávání pro konkurenceschopnost 1. KŠPA Kladno, s. r. o., Holandská 2531, Kladno,
Úvod do korpusové lingvistiky 8
Semantic Translation Polysemy, meaning change and multiple interpretations. Final Presentation.
Mít rád Fill in the blanks with the appropriate forms of mít rád in both the present and past. Vzor: Radek ____ hudbu. Radek má rád hudbu. Radek měl rád.
Americký umělec Michael Heizer (narozen 1944)
The map scale Mathematical Game 7th grade. Metodické pokyny  Autor: Mgr. Markéta Drobečková  Vytvořeno:  Určeno pro 7.ročník  Matematika.
Evaluation of Performance Based on Information in Documents‘ Databases Hana Pessrová Tomáš Cahlík.
ATLAS UPGRADE PHASE II (ITK) A ČESKÁ REPUBLIKA Z. Doležal, A. Kupčo.
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUM Businessland / Meeting and Presentation 06B14 AutorLadislava Pechová.
CHARLES UNIVERSITY IN PRAGUE faculty of mathematics and physics Advanced.NET Programming I + II 1 st Lecture Pavel Ježek.
Tato prezentace je výstupem projektu COM-MP Partnerství škol Comenius v rámci Programu celoživotního u č ení. The Czech Republic Tento projekt.
1 Škola: Gymnázium, Brno, Slovanské náměstí 7 Šablona: III/2 – Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN prostřednictvím.
Department of Electrical Engineering Název projektu/publikace Jméno Příjmení.
PDT 1 Zdeněk Žabokrtský Czech Technical University, Department of Computer Science the following presentation can be downloaded.
S CENARIO - BASED METHODOLOGY FOR COMPARISON OF THE SOFTWARE TRAFFIC CONTROL AGENTS Seminář DSS – Richard Lipka.
Pracovní list - pro tisk Vloženo z stress.pptx Začátek.
PhD study: English language Jazyková rozmanitost a komunikace CZ.1.07/2.3.00/ Tento projekt je spolufinancován Evropským sociálním fondem a státním.
REGULACE GENOVÉ EXPRESE.
Jméno autora: Mgr. Olga Bayerlová Datum vytvoření: Číslo DUMu: VY_32_INOVACE_07_AJ3E Ročník: II. Anglický jazyk Vzdělávací oblast: Jazyk a jazyková.
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUM Business Communications/ Private and Business Correspondence 06C2 AutorLadislava.
Líbit se In the following sentences, translate the English in parentheses into Czech, using the correct form of líbit se. Vzor: Jak (do you like) ta kniha?
Významy morfologických kategorií v PDT 2.0 Magda Razímová Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze.
The Boat Race Worksheet VY_32_INOVACE_3B8 G ymnázium a Střední odborná škola, Lužická 423, Jaroměř Mgr. Věra Dundálková.
Tutorial: Obchodní akademie Topic: Creating Formulas Prepared by : Mgr. Zdeněk Hrdina Projekt Anglicky v odborných předmětech, CZ.1.07/1.3.09/
Jméno autora: Mgr. Mária Filipová Datum vytvoření: Číslo DUMu: VY_32_INOVACE_11_AJ_CM Ročník: 1. – 4. ročník Vzdělávací oblast:Jazyk a jazyková.
Revision test Relative clauses.
IEAP – CTU Prague 3D detektory - radiační odolnost, elektrické a laser testy Tomáš Slavíček, Cinzia Da Via, Vladimír Linhart.
Číslo projektuCZ.1.07/1.5.00/ Číslo materiálu VY_32_INOVACE_AJK-2.PT-16-Praha Název školyStřední odborná škola a Střední odborné učiliště, Dubno.
Mezioborová síť spolupráce pro policy development v oblasti udržitelného rozvoje Přehled aktivit COŽP 26. září 2011, Jana Dlouhá.
Systémy pro zpřístupňování eVŠKP DSPACE CZ Speech about Czech DSpace User Group by Pavla Rygelová Central Library of VSB – Technical.
MY FAVORITE TOWNS ENGLISH PROJECT VÍT POSPÍŠIL 8. B.
Scanservice a.s. | Náchodská 2397/23 | Praha 9 | Česká republika | D O C U M E N T I M A G I N G
Prague is the capital and largest city of the Czech Republic The city is home to about 1.3 million people Flag of Czech Republic.
Číslo projektu CZ.1.07/1.5.00/ Název školy Gymnázium Česká a Olympijských nadějí, České Budějovice, Česká 64 Název materiálu VY_32_INOVACE_AJ_4_FIG_18_.
Střední škola a Vyšší odborná škola cestovního ruchu, Senovážné náměstí 12, České Budějovice Č ÍSLO PROJEKTU CZ / / Č ÍSLO.
ZŠ Týnec nad Labem AUTOR:Lenka Hrnčířová VY_32_INOVACE_17_Konverzace v Aj 6. ročník_Easter Téma:Easter CZ.1.07/1.4.00/
Rudolf Rosa Strojový překlad pojmenovaných entit za pomoci Wikipedie.
NOT CLASSIFIED | Saab IC in CR | Issue 1 | © Saab SAAB INDUSTRIAL COOPERATION IN THE CZECH REPUBLIC Krasimira Stoyanova – Head of Central Europe.
● Téma hodiny: The Czech Republic – Symbols of the CR ● Předmět: English language ● Ročník: střední škola ● Klíčová slova: Symbols ● Jméno autora:
Language preparation for a study in Czech Universities 1) Czech language for foreigners in USP 2) Courses of Czech for foreigners in Czech Rep.
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů MY COUNTRY Název materiálu VY_32_INOVACE_19_Clementinum, Transport in Prague, animals, Autor.
JSV Company Presentation Jana Švihlová
BAT centrum Brno - průřez činností v letech 2015–2016
Karel Roubík, Jakub Ráfl, Thomas Bachman ČVUT FBMI
Název projektu/publikace
Vzor posteru autorů z PK, nastaven rozměr 80x100 cm
Profilová témata-určená školou (PL- pracovní list 3. část)
Týden CJV Štěpánka Bilová
DIGITÁLNÍ UČEBNÍ MATERIÁL
Téma hodiny: The Czech Republic – Prague II. present
Obchodní akademie, Střední odborná škola a Jazyková škola s právem státní jazykové zkoušky, Hradec Králové Autor: Mgr. Radka Černá Název materiálu: VY_32_INOVACE_5_ANGLICKY_JAZYK_GRAMATIKA_15Spojky.
VY_32_Inovace_ To be – zápor Project 1
Čeština: 9. lekce Czech language: 9th lesson
AUTOR: Mgr. Alena Bartoňková
LONDON AND PRAGUE Autor: Mgr. Ivana Tesařová
DIGITÁLNÍ UČEBNÍ MATERIÁL
Projekt Anglicky v odborných předmětech, CZ.1.07/1.3.09/
Název školy: Základní a Mateřská škola Bečváry, okres Kolín Autor: Mgr
Introduction to MS Dynamics NAV (Expected Costs)
Distribution of CFTR mutations in the Czech population: Positive impact of integrated clinical and laboratory expertise, detection of novel/de novo alleles.
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
Quantum Chemistry / Quantum Mechanics
BAT centrum Brno a jeho činnost v roce 2018
Název školy: Základní škola Chomutov, Písečná 5144 Název materiálu: VY_22_INOVACE_22_Aida_hz1 Číslo projektu: CZ 1.07/1.4.00/ Autor: Mgr. Zdena.
Jakub Horák, horakj(na)fld.czu.cz, L026
Spolupráce s partnery – základ kvalitní odborné výuky
Pak. pak pak Selamat pagi, Bart. Your Indonesian is coming along well. I gather you think that “pak”, pronounced “puck”, is the Indonesian word.
Transkript prezentace:

Sparse Data Issue in MT Evaluation Ondřej Bojar, Kamil Kos, David Mareček; Charles University in Prague, Institute of Formal and Applied Linguistics (ÚFAL) Full text, acknowledgement and the list of references in the proceedings of ACL Don’t Trust BLEU <20 Don’t Trust BLEU <20 MetricAvgBestWorst Void par Void sons Void Functor sons GTM SemPOS + 1 BLEU SemPOS par SemPOS + 4 BLEU SemPOS + 1 BLEU NIST SemPOS sons SemPOS SemPOS + 1 BLEU BLEU BLEU BLEU BLEU TER PER BLEU Functor par Functor MetricAvgBestWorst 3 SemPOS + 1 BLEU SemPOS + 1 BLEU SemPOS + 1 BLEU SemPOS + 1 BLEU SemPOS BLEU SemPOS par Functor sons GTM BLEU Void NIST Void sons BLEU BLEU BLEU SemPOS sons Functor par Functor Void par PER TER ConfirmedHas Errors1-grams2-gms3-gms4-gms YesYes YesNo NoYes NoNo REFkongres/n ustoupit/v :/n vláda/n usa/n banka/n napumpovat/v 700/n miliarda/n dolar/n cu-bojarkongres/n výnos/n :/n vláda/n usa/n moci/v čerpadlo/n 700/n miliarda/n dolar/n banka/n pctranskongres/n vynášet/v :/n us/n vláda/n čerpat/v 700/n miliarda/n dolar/n banka/n Problems of BLEU SemPOS: Coarser Metric for a Better Performance Overly Sensitive to Word Forms SRCPrague Stock Market falls to minus by the end of the trading day REFpražská burza se ke konci obchodování propadla do minusu SYS1praha trh cenných papírů padá minus do konce obchodního dne SYS2praha stock market klesne k minus na konci obchodního dne Overly Sensitive to Sequences SRCCongress yields: US government can pump 700 billion dollars into banks REFkongres ustoupil : vláda usa může do bank napumpovat 700 miliard dolarů cu-bojarkongres výnosy : vláda usa může čerpadlo 700 miliard dolarů v bankách pctranskongres vynáší : us vláda může čerpat 700 miliardu dolarů do bank …across Languages Large Portions Unscored for English-Czech Only one word of each hypothesis confirmed by the reference. Moreover, the match is a false positive in SYS1. About 1/3 of running words not confirmed by the reference despite not containing any errors (based on manual flagging of errors). Fortunately only few false positives (6.34% of running words). cu-bojar scored far better in BLEU thanks to n-gram LM and correct sequences (incl. one 4-gram) two important words (mistranslated as nouns instead of verbs by cu-bojar and rendering the sentence incomprehensible) unscored in both cases SemPOS (Kos and Bojar, 2009) evaluates the overlapping of lemmas (base forms) of content-bearing words including their semantic part of speech between the reference and the hypothesis. In this particular example, pctrans still does not win but at least the quality of cu-bojar is not overestimated. Correlation to Human Judgments; SemPOS and Other Metrics Czech-to-English tested on: (Number of judgments in brackets.) MetricsMATR08 (cn+ar: 1652), WMT08 News Articles (de: 199, fr: 251), WMT08 Europarl (es: 190, fr: 183), WMT09 (cz: 320, de: 749, es: 484, fr: 786, hu: 287) English-to-Czech tested on: WMT08 News Articles (en: 267), WMT08 Commentary (en: 243), WMT09 (en: 1425) Variants of SemPOS Various Classifications of Content-Bearing Words The match in lemma is accepted only within the class of the word: SemPOS uses semantic part of speech (noun, verb, …) Functor uses tectogrammatical (deep syntactic) dependency edge label (ACTor, PATient, DIRfrom, …) Void uses a single class only. Deep Syntactic Relations par requires for each token also the lemma of the parent to match sons requires for each token also the set of children’s lemmas to match Combining with BLEU SemPOS completely ignores word order. We test several linear combinations of SemPOS and BLEU x (calculated on x- grams only but including the brevity penalty) The classification in English less reliable  Void performs best. Syntactic structure informative for English (par>sons>nothing). The combinations of SemPOS and BLEU outperforms both individual metrics and scores best for Czech. Automatically assigned functors in Czech deceiving. SemPOS for English The original SemPOS (Kos and Bojar, 2009) is based on the tectogrammatical theory as utilized in the Prague Dependency Treebank (Sgall et al., 1986; Hajič et al. 2006) and thus limited to Czech. The tectogrammatical layer is being adapted for English (Cinková et al., 2004; Hajič et al., 2009), including automatic annotation tools.