Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky

Podobné prezentace


Prezentace na téma: "Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky"— Transkript prezentace:

1 Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky http://ufal.mff.cuni.cz

2 Počítačová lingvistika Interdisciplinární obor –Matematická informatika –Lingvistika –Statistika, strojové učení –Umělá inteligence Dlouhodobý cíl –plně automatická komunikace s počítačem prostřednictvím jazyka

3 Tematické okruhy výzkumu Matematické a lingvistické základy komputační lingvistiky Implementace softwarových nástrojů pro zpracování jazyka Vytváření datových zdrojů, především gramaticky a sémanticky značkovaného textového zdroje pro češtinu (Pražský závislostní korpus), vytváření slovníků Zpracování mluvené řeči

4 Zkoumání jazyka – vrstvy jazykového popisu Posloupnost rovin: –Fonetická –Morfologická –Syntaktická –Sémantická –Logicko-obsahová

5 Dílčí úlohy na jednotlivých rovinách Určování slovotvorných kategorií slov (pád,číslo,rod,osoba….) Syntaktická analýza vět Určování významu slova na základě kontextu K čemu odkazují zájmena

6 Analýza věty (1)

7 Analýza věty (2)

8 Praktické aplikace Strojový překlad Komunikace člověk-počítač Kontrola pravopisu Vyhledávání v textech

9 Systém rovin a strojový překlad Vstupní jazyk Rovina tvarosloví Výstupní jazyk Rovina větné stavby Interlingua (?) Analýza Syntéza Rovina větného významu

10 Informaticky zajímavé problémy - paralelizace výpočtu...... DATA dotaz odpověď

11 Vyučované předměty Namátkou… –Seminář z formální lingvistiky –Statistické metody zpracování přirozených jazyků –Nástroje pro automatický překlad –Vybrané kapitoly ze syntaxe češtiny –Automatické rozpoznávání mluvené řeči –Úvod do strojového učení v počítačové lingvistice –Korpusová lingvistika –Zdroje jazykových dat

12 Uplatnění studentů ÚFAL IBM MIT Ohio State University University of Saarbrücken


Stáhnout ppt "Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky"

Podobné prezentace


Reklamy Google