Den s románskou filologií FF JČU České Budějovice doc. PhDr. Jan Radimský, Ph.D.

Slides:



Advertisements
Podobné prezentace
Identifikátor materiálu: EU
Advertisements

CAT je sice anglicky kočka, ale i … Copyright, 1999 © Ing. Otto Pacholík,
Natural Language Processing Prague Arabic Dependency Treebank Otakar Smrž koordinátor projektu Motivační přehled problémů, řešení a aplikací.
Internetový (webový) prohlížeč. Druhy prohlížečů 1. byl v roce 1993 NCSA Mosaic Následovaly další … Netscape 1.0 Netscape 2.0 Netscape 3 Gold Zdroj:
SILNĚ OVLIVNĚNÉ VODNÍ ÚTVARY METODY A JEJICH VYUŽITÍ V PŘÍPADOVÉ STUDII V POVODÍ LABE, ČESKÁ REPUBLIKA Hradec Králové, 20. leden 2004 Johan Van Assel Aquaplus.
JAZYKOVÁ INFRASTRUKTURA Ústav Českého národního korpusu Filozofická fakulta UK Praha.
Mgr. Alena Lukáčová, Ph.D., Dr. Ján Šugár, CSc.
Analýza informačního systému
Učebnice Ekologie a ochrana životního prostředí
Materiály pro sněm RVŠ František Ježek 20. května 2004.
Systémy pro podporu managementu 2
Chceme mít také v ČR snadný přístup k vysokoškolským kvalifikačním pracím? (a co je pro to třeba udělat) Informace pro předsednictvo RVŠ Praha,
ŠKOLA:Gymnázium, Tanvald, Školní 305, příspěvková organizace ČÍSLO PROJEKTU:CZ.1.07/1.5.00/ NÁZEV PROJEKTU:Šablony – Gymnázium Tanvald ČÍSLO ŠABLONY:III/2.
Tvorba dokumentů – kritéria Obsah a forma –aktuálnost a správnost informací, variabilní data, –forma adekvátní příjemci, estetika, –účelná struktura, členění.
Úvod do korpusové lingvistiky 4
Simulační modely a programové vybavení. Vývoj simulačních programů  Původně pouze strojový kód –Příliš dlouhé, náročné na programátora, obtížné hledání.
Segmentace občanského chování občanů v ČR jako nástroj pro přesnější zacílení občanského vzdělávání.
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
Vedoucí práce: doc. PhDr. Ing. Mgr. PhD.
Nové funkce v novém Skliku
Vítejte při prezentaci některých zajímavých vlastností slovníků Lingea Lexicon. Mezi stránkami můžete přecházet pomocí kláves, myší nebo počkat na automatické.
Vítejte na přednášce Počítač pro překladatele - překlad podporovaný počítačem Praha, 9. listopadu 2002 © Ing. Otto Pacholík 2002,
Maturita 2008? Společná část Profilová část.
PPC Cílená, měřitelná a efektivní reklama Aleš Miklík, Lupa.cz.
Metodika objektového přístupu při tvorbě překladačů. Marek Běhálek Informatika a aplikovaná matematika FEI VŠB-TU Ostrava.
Zápočtová práce na POPJ Tvorba slovníku a pravidel do PC-Kimmo SLOVESA Vojtěch Holub.
Příslib do budoucna Zprávy z Univerzity Karlovy Alena Matuszková, Knihovna společenských věd TGM v Jinonicích Otevřené repozitáře, Brno,
Korpusová lingvistika (5) Korpus CORTE Jan Radimský FF JU České Budějovice.
Národní úložiště šedé literatury (NÚŠL) informace o projektu SKIP Klub vysokoškolských knihoven AMU, Iva Horová.
B ORIS L EHEČKA, ODDĚLENÍ VÝVOJE JAZYKA ÚJČ AV ČR, V. V. I. DALIBORIS. CZ P RAŽSKÉ JARO V O STRAVĚ, 24. BŘEZNA 2015 Nástroje pro badatele (nejen)
Název ročníkové práce Vaše Jméno Vedoucí práce: doc. PhDr. Ing. Mgr. Jméno Příjmení, PhD., CSc.
Analýza informačního systému. Podrobně zdokumentovaný cílový stav Paramentry spojené s provozem systému – Cena – Přínosy – Náklady a úspory – …
Školení WordPress a publikování na webu Mgr. Pavel Krejčí
AnotaceMateriál tvoří prezentace. Opakování předložek a přídavných jmen. AutorMgr. Olga Medunová JazykFrancouzština Očekávaný výstup Ověření znalostí z.
Shodnocení GAN etapy projektu GAN ETAPA PROJEKTU IT415.
Odborné a vědecké práce Brno 12. března Odborné a vědecké práce Zpráva o semestrálním projektu Závěrečná práce Bakalářská a diplomová práce Disertační.
MorČe morfologické značkování češtiny
Využití programu Excel jako CAT nástroje (vytváření pamětí pro překlady ze stávajících textů) Jiří Vedral Jednota tlumočníků a překladatelů, Praha (hl.
Kontrola pravopisu Daniel Zeman Počítačové zpracování češtiny.
Umělá inteligence Robin Horniak. Definice Umělá inteligence (Artificial Intelligence), zkráceně UI (AI) věda, která se zabývá tím, jak přinutit stroje.
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
Užitečné aplikace při studiu čínštiny
Comment les jeunes passent-ils leur temps libre en République Tchèque?/Jak tráví volný čas mládež v České republice? Rédactrices/Vytvořily: Cécile Saffroy,
SPŠ stavební a Obchodní akademie, Kladno, Cyrila Boudy 2954 EU peníze školám CZ.1.07/1.5.00/ Je tiens le dialogue Autor: Mgr. Anna Sekeráková.
Střední škola a Vyšší odborná škola cestovního ruchu, Senovážné náměstí 12, České Budějovice Č ÍSLO PROJEKTU CZ.1.07/1.5.00/ Č ÍSLO MATERIÁLU.
Dolování znalostí z vícejazyčných textových dat Luděk Svozil , Brno Vedoucí práce: doc. Ing. František Dařena, Ph.D.
Statistická extrakce idiomů Jan Bušta CZPJ FI MU, Brno PV
České vysoké učení technické v Praze Fakulta dopravní Ústav dopravní telematiky Geografické informační systémy Doc. Ing. Pavel Hrubeš, Ph.D.
ELRC Seminář, Praha, Panel: je možno se zapojit?” Jan Hajič (MFF UK) 1.
Statistika nuda je... ? Úkol č. 1: Dobu, po kterou bude znít píseň „Statistika“ autorů Jaroslava Uhlíře a Zdeňka Svěráka (cca 2 min 05 s), máte na rozbor.
Logistické procesy ve stavebnictví Autor diplomové práce: Bc. Lukáš Hlaváč Vedoucí diplomové práce: Ing. Terezie Vondráčková, Ph.D. České Budějovice, červen.
CPVŠK 2005, , Praha Suchdol Návrh národního souboru metadat pro popis e-VŠKP Specifikace metadat Eva BRATKOVÁ, ÚISK FF UK v Praze
Vysoká škola technická a ekonomická Ústav technicko-technologický
SOFTWARE Operační systémy.
Vysoká škola technická a ekonomická
Filosofie Základy logiky.
Operační Systém Operační systém je v informatice základní programové vybavení počítače (tj. software), které je zavedeno do paměti počítače při jeho.
Veřejný seminář k projektu NIX-ZD.CZ
Daniel Zeman Počítačové zpracování češtiny Kontrola pravopisu Daniel Zeman
Vysoká škola technická a ekonomická v Českých Budějovicích Ústav podnikové strategie Analýza vhodnosti používaných komunikačních nástrojů ve vybraném podniku.
CRM v maloobchodní jednotce se sportovním zbožím
Obhajoba diplomové práce
Výchova přirozeného zdravi
ANALÝZA VNITROPONIKOVÉHO KOMUNIKAČNÍHO SYSTÉMU VE VYBRANÉM PODNIKU
Digitální učební materiál
Vysoká škola technická a ekonomická v Českých Budějovicích
Geografické informační systémy
Jazykové korpusy (lingvistika, filologie, výuka jazyků)
Rozvoj metod mapování, zejména na evropské úrovni
Analýza informačního systému
Transkript prezentace:

Den s románskou filologií FF JČU České Budějovice doc. PhDr. Jan Radimský, Ph.D.

Jak překládá počítač? Dvojznačná otázka Jak kvalitně počítač překládá? Dokáže plně nahradit člověka – překladatele? Dokáže zprostředkovat význam textu, i když s formálními chybami? S jakými typy textů si poradí nejlépe? Jakým způsobem počítač překládá? Proč... dělá chyby, jaké chyby? Co je strojový překlad? Na jakém principu funguje? Co od něj (ne)můžeme čekat a proč? GT: *Comment bien l'ordinateur traduit? GT: *Comment se traduit l'ordinateur? GT, Bing: *Comment se traduit ordinateur?

Co není strojový překlad (1) Elektronický překladový slovník (zde: Lingea) CAT nástroj: Computer-Aided Translation (zde: Trados)

Co není strojový překlad (2) Paralelní korpus (zde: Linguee)

Co je strojový překlad Plně automatizovaný systém, který překládá bez zásahu člověka (zde: Bing) Nečekané výsledky Pan Dursley byl ředitelem firmy jménem Grunnings, která vyráběla vrtačky. M. Dursley était le directeur d'une société nommée Grunnings, qui a fait des exercices. Pan Dursley byl ředitelem firmy jménem Grunnings, která vyráběla vrtačku. M. Dursley était le directeur d'une société nommée Grunnings, qui a fabriqué la perceuse.

Jak funguje strojový překlad (1) Překlad založený na pravidlech (rule-based): léta Slovník, slovník + gramatická pravidla Přímý, později interlingvální (přes abstraktní zápis významu) Řada obtížných problémů: Grafická slova si neodpovídají: il va - chodí Víceznačnost (ambiguita) Kontextová: aller – chodit / jezdit / letět / plout... Mimojazyková realita: řeka – fleuve / rivière Anafory Elle a refusé, mais je lui ai dit que... – řekl/a jsem mu/jí, že Flexe, slovosled...

Jak funguje strojový překlad (2) Překlad založený na statistice (SMT): od 90. let, současnost Čerpá z existujících překladů Založený na slovech (starší model) jaká je pravděpodobnost, že se dané slovo v daném kontextu přeloží právě takto? Založený na „frázích“ (novější model) [acide aminé] – [aminokyselina] Vlastnosti relativně snadno se programuje potřebuje velká vstupní data (paralelní korpusy) velmi úspěšný u stereotypních textů, nízká kvalita u ne-stereotypních textů problematický pro jazyky s bohatou flexí a volnějším slovosledem žádná pravidlová analýza: jazykové chyby na výstupu (flexe, shody, slovosled...) nedetekuje anafory Hybridní systémy: současnost Základem modul SMT, výsledek upraven rule-based modulem

Co lze čekat od strojového překladu (1) H. de Balzac: Le père Goriot

Co lze čekat od strojového překladu (2) NAŘÍZENÍ KOMISE (ES) č. 255/2005 z 15. února 2005 o trvalém povolení některých doplňkových látek v krmivech

Závěry Dnes zejména dva typy systémů: Statistické: Google translate Hybridní: Bing Na čem záleží úspěšnost strojového překladu? Typ textu Stereotypní = lepší překlad (technické texty, ustálené formulky, komplexní termíny) Jazyková kombinace Musí existovat obrovský paralelní korpus pro dané dva jazyky (trénovací data) Překlad přes 3. jazyk vždy problematičtější (Google translate) Typ výchozího a cílového jazyka: izolační jazyky (lepší výsledky) vs. flektivní nebo aglutinační jazyky Současné využití? informativní překlad (MT for assimilation, vs. MT for dissemination) vstupní data pro CAT systémy: překladatel upravuje/edituje navrženou verzi