ELRC Seminář, Praha, 15. 12. 2015 Tomáš Svoboda Jan Hajič Jazyky a jazykové technologie v České republice 1.

Slides:



Advertisements
Podobné prezentace
1 Projekt „České centrum pro mobilitu v letech “ finančně podporuje Ministerstvo školství, mládeže a tělovýchovy v rámci programu EUPRO.
Advertisements

Aktuální proces přípravy programového období 2014+
Setkání kontaktních osob Praha Marta Rybičková.
JAZYKOVÁ INFRASTRUKTURA Ústav Českého národního korpusu Filozofická fakulta UK Praha.
Univerzita J. E. Purkyně v Ústí nad Labem - Aplikovaný výzkum prof. Jiřina Jílková Biomedicínský výzkum Ústí nad Labem, 23. května
Velké infrastruktury pro výzkum, vývoj a inovace
Základní škola národního umělce Petra Bezruče, Frýdek-Místek, tř. T. G. Masaryka 454 Projekt SIPVZ 2005.
Představení projektu Seminář k projektu Vliv změn světa práce na kvalitu života Ing. Lenka Svobodová VÚBP Praha, 25. září 2006.
Programové období Benefit Ministerstvo pro místní rozvoj ČR, Staroměstské náměstí 6, Praha 1 Datum:
Střední zdravotnická škola, Národní svobody Písek, příspěvková organizace Registrační číslo projektu:CZ.1.07/1.5.00/ Číslo DUM:VY_32_INOVACE_BERGMANNOVA_18.
Označení materiálu: VY_32_INOVACE_HLAVE_CESKYJAZYK1_19
Úvod do korpusové lingvistiky 8
Barbora Votavová, Vendula Šimanová
Národnosti Jazyky.
Grantové příležitosti pro Ph.D. studenty
2.Marketingové prostředí
Bakalářský studijní program Elektrotechnika Obor  Aplikovaná a komerční elektronika Oborová katedra  Katedra elektroniky.
Základní informace k aktuálnímu stavu finančních prostředků Program Iniciativy Společenství INTERREG IIIA Česká republika – Svobodný stát Bavorsko 2004.
IBM Global Services ČR © 2006 IBM Corporation April, 2006 E-stát a EU Pavel Hrdlička.
KANCELÁŘ CZELO: PARTNER ČESKÉHO VaVaI V BRUSELU ANNA VOSEČKOVÁ.
Univerzita Karlova v Praze Pedagogická fakulta Ústav profesionálního rozvoje pracovníků ve školství (od října 2001) ředitelka: PhDr. Jana Kohnová Ústav.
ÚŘAD VLÁDY ČESKÉ REPUBLIKY Úřad vlády ČR a Ministerstvo pro místní rozvoj ČR CESTA K INFORMACÍM O EVROPSKÉ UNII V ČESKÉ REPUBLICE.
Zajištění bezpečnosti potravin v České republice
Vysoké školy a Národní politika výzkumu a vývoje a její realizace Ministerstvo školství, mládeže a tělovýchovy.
European Commission Enterprise and Industry Služby sítě Enterprise Europe Network.
VEŘEJNÁ EKONOMIKA A SPRÁVA
ČESKÉ CENTRUM PRO MOBILITU STŘEDISKO SPOLEČNÝCH ČINNOSTÍ AKADEMIE VĚD ČESKÉ REPUBLIKY v.v.i. Robert HrubýJindra Emmerová Kateřina Hošková.
Autor: Mgr. Helena Nováková
Mateřská škola, Základní škola a Praktická škola, Horní Česká 15, Znojmo EU peníze školám Registrační číslo projektu: CZ.1.07/1.5.00/ Název projektu:
Mgr. Martin Turnovský, MBA Sekce rozvoje podnikatelského prostředí a konkurenceschopnosti © Ministerstvo průmyslu a obchodu Strategické záměry a.
REALIZACE PRÁV PŘÍSLUŠNÍKŮ NÁRODNOSTNÍCH MENŠIN
Technologické Inovační Centrum Akční plán RIS ZK – aktivity TIC Lenka Kostelníková Seminář „Inovace a technologie v rozvoji regionů“, Brno
Březen – měsíc internetu podeváté aneb Na úřad přes internet Jaroslav Winter BMI sdružení ISSS, Hradec Králové
Obor: Kybernetika a měření Jaké studium zajišťují katedry typ obor stud./rok bakalářské Kybernetika a měření 150 magisterské Kybernetika a měření - RT,
Tato prezentace je spolufinancována z Evropského sociálního fondu a státního rozpočtu České republiky Grantové příležitosti pro Ph.D. studenty Ing. Šárka.
Možnosti využití mobilní komunikace při krizových situacích

Kvalitativní výzkum v pedagogických vědách: posílení profesních kompetencí absolventů Opera č ní program Rozvoj lidských zdroj ů Evropský sociální fond.
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
Popularizace výsledků dopravního výzkumu CZ.1.07/2.3.00/
Na průzkumu se podílely: Krajský úřad Jihomoravského kraje Úřad práce České republiky - krajská pobočka v Brně.
Kapitola 13: Evropské bankovnictví, Evropská centrální banka
Ing. Dagmar Parmová. Kdo jsme? Asociace průvodců České republiky, r. s. 460 individuálních členů z celé ČR, 22 přidružených členů (právnické osoby) –
N ÁRODNOSTNÍ MENŠINY NA ÚZEMÍ Č ESKÉ REPUBLIKY Jana Hřebíčková 4.B.
Univerzita Tomáše Bati ve Zlíně Se sídlem v Uherském Hradišti, Studentské nám
ICT ve výuce jazyků Petr Caloň Masarykovo gymnázium Příbor.
Page 1 Energetická závislost EU - Možná řešení - Daniela Štoková.
Digitální učební materiál Název projektu: Inovace vzdělávání na SPŠ a VOŠ PísekČíslo projektu: CZ.1.07/1.5.00/ Škola: Střední průmyslová škola a.
Univerzita Karlova v Praze, Přírodovědecká fakulta.
ELRC Seminář, Praha, Jan Hajič (MFF UK) Jak je možno se zapojit? 1.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Titul. Vladimír Mikulík. Slezské gymnázium, Opava, příspěvková organizace. Vzdělávací.
Centrum pro výzkum, vývoj a inovace Life for Science. Science for Life.
Skupina UNIPETROL Člen skupiny PKN Orlen Martin Růžička Úsek výzkumu a vývoje.
Seminář k soutěži Parádní web 21. leden 2014 Ing. Kamil Válek tajemník Městského úřadu Uherský Brod.
ELRC Seminář, Praha, Panel: je možno se zapojit?” Jan Hajič (MFF UK) 1.
Ekonomika veřejného sektoru František Svoboda, Konzultační hodiny: čtvrtek, 13-15, kancelář 414
DITTRICHOVA PRAHA 2 ZELENÁ LINKA PRO EXPORT Novinky na rok 2010.
Národní rozvojový program mobility pro všechny (NRPM)
Průzkum zaměstnanosti v Jihomoravském kraji k
Prioritní osa 2 Terciární vzdělávání, výzkum a vývoj OPERAČNÍ PROGRAM VZDĚLÁVÁNÍ PRO KONKURENCESCHOPNOST PhDr. Kateřina Pösingerová, CSc.
Fond rozvoje sdružení CESNET
Nástroje podpory uživatelů
Ekonomika veřejného sektoru
Problémy trhu práce v České republice a Evropské Unii
EURATOM: základ evropské spolupráce
Inovační potenciál České republiky Ing. Martin Štícha Sekce VaVaI
O nás Univerzita s TRADICÍ – založena 1999
VY_32_INOVACE_07_Zeměpis_8.ročník 15_Evropská unie, NATO
Zdravotnictví: hospodářský kontext
Možnosti spolufinancování vědecké a výzkumné činnosti ČHMÚ
Transkript prezentace:

ELRC Seminář, Praha, Tomáš Svoboda Jan Hajič Jazyky a jazykové technologie v České republice 1

ELRC Seminář, Praha, Jeden úřední jazyk (čeština) Skutečnost je složitější –Turistika –Obchod a mezinárodní komerční aktivity –Migrace –Regionální rozvoj, vývoj, státní správa, mez, spolupráce Mobilita a doprava Energetika, změna klimatu Životní prostředí a –EU: přeshraniční spolupráce a mobilita Zákony, vyhlášky, nařízení (pracovní, obchodní, sociální, turistika) Zdravotní dokumentace, rychlá pomoc Kolik jazyků máme v ČR? 2

ELRC Seminář, Praha, Čeština je výrazně převažující jazyk Češi mají dva cizí jazyky ve škole –Angličtina –Němčina, francouzština, ruština (další méně) Jazyky menšin: –Slovenština –Romština (Sinti) –Ruština, vietnamština, ukrajinština, polština, angličtina –Nářečí (Ostrava, Slezsko, Slovácko) Jazyky v ČR 3

ELRC Seminář, Praha, Jazyky sousedních zemí 4 Polština Slovenština Němčina

ELRC Seminář, Praha, RegionCountriesLanguages Střední Evropa Německo (část), Polsko, ČR, Rakousko, Slovensko, Maďarsko, Itálie (sever), Slovinsko, Chorvatsko Němčina, polština, slovenština, maďarština, italština, slovinština, chorvatština DunajskýNěmecko (část), Bulharsko, Chorvatsko, ČR, Maďarsko, Rumunsko, Slovensko, Slovinsko Němčina, bulharština, slovenština, maďarština, rumunština, slovinština, chorvatština Regionální spolupráce (Interreg aj.) 5 A další... (např. NATO, OBSE, UNICEF, WHO, OSN…)

ELRC Seminář, Praha, Přeshraniční Rychlá pomoc, pomoc při nehodách, traumatologie –Zdravotní turistika Právní předpisy a požadavky –osobní, ekonomická činnost, státní správa Bezpečnost, policie, armáda, soudy, zastupitelství Infrastrukturní projekty –Silnice a železnice –Energetika (ropa, plyn, přenos el. energie) –Pošta a komunikace Finanční instituce a spolupráce Vícejazyčnost v regionální spolupráci 6

ELRC Seminář, Praha, Občané jiných zemí v ČR –2009: 3,9 % ( ) (srov.: Polsko 0,1 % lidí) Z toho 1,4 % z EU, zbytek mimo EU Nejvíce: Slovensko (82 tis.), Asie souhrnně, Ukrajina, i Německo (14 tis.) Migrace: tranzitní země –Dosud nevelká frekvence –Mimoevropské jazyky Zahraniční pracovní síla –Slovensko, Ukrajina, Rusko, Polsko Studenti a zahraniční učitelé –Slovensko –Rusko, Ukrajina, Vietnam, USA –Učitelé jazyků –Výzkumníci a vědci Migrace a zahraniční pracovníci 7

ELRC Seminář, Praha, Jazykové technologie –Automatická (počítačová) analýza textu a mluvené řeči Také syntéza (tzv. Text-To-Speech, nebo generevání textu) –Aplikace: Kontrola pravopisu, kontrola gramatiky, automatické opravy, doplňování diakritiky Automatický překlad (z a do češtiny) Vyhledávání v textech (např. na internetu) –Bez ohledu na slovní tvary (tzv. tvaroslovná analýza) „Big data“ analytika –Analýza sociálních sítí (polarita názorů) –Call centra (směrování hovorů, hodnocení operátorů) Telefonické informační systémy (např. PID) Kombinace „dolování“ (zajímavých) informací z textu a dat ČR a jazykové technologie 8

ELRC Seminář, Praha, Jazykové technologie v ČR: aktéři 9 Výzkumné organizace –Univerzita Karlova v Praze, MFF (Ústav formální a aplikované lingvistiky) – vedoucí vývojové středisko v oblasti automatického překladu (v EU), podíl na vývoji světově nejrozšířenějšího systému „Moses“ –Vysoké učení technické v Brně –Fakulta aplikovaných věd ZČU Plzeň (Katedra kybernetiky, NTIS) –Ústav pro jazyk český AV ČR, v.v.i. –Masarykova univerzita v Brně (NLP Lab, Katedra poč. systémů a komunikací) –Technická univerzita Liberec (Katedra mechatroniky) Firmy –Phonexia (Brno), Lingea (Brno), Speechtek (Plzeň), Good Data (Praha), Geneea (Praha), Newton,... –Jazykové technologie využívají (ve spolupráci s univerzitami a AV) např. ASPI/Kluwer, seznam.cz, centrum.cz, Google,...; soudy, ČT Infrastruktura pro výzkum a vývoj –LINDAT/CLARIN, MFF UK (+3), součást Clarin ERIC (EU)

ELRC Seminář, Praha, Jazykové technologie v ČR: stav 10 Jazykové technologie –Neexistuje kritérium „funguje/nefunguje“: vždy funguje „v procentech“ –Příklady: Kontrola pravopisu: chybějící slova, nepozná správnost „jsme/jsem“ apod. Převod slov na základní tvary pro vyhledávání: chybějící slova ve slovníku Automatický překlad – nikdy nebude perfektní (každý zná Google Translate) Čeština – stav dostupných jazykových technologií –Popsáno v Bíle knize jazyků (cihlová obálka...) Stav jazykových technologií, stav jazykových zdrojů S výjimkou vyzrálosti a kvality zpracovaných textových korpusů (dat) < 5 bodů (na škále 1-5) Automatický překlad souhrnně: nízká podpora –Hlavní důvod: nedostatek dat (přeložených textů) Kvalita závislá na dostupnosti jazykových dat (textů, audia)

ELRC Seminář, Praha, Odkazy 11 Bílá kniha jazyků – Celoevropská koordinační síť jazykových technologií – Infrastruktura pro distribuci dat a základních nástrojů – Nástroje pro překlad (open source) – Instituce: –ÚFAL MFF UK: VUT Brno: –ÚJČ AV ČR Praha: –KKY ZČU Plzeň, odd. UI: Děkuji za pozornost!