Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
ZveřejnilJindřiška Karolína Tesařová
1
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky http://ufal.mff.cuni.cz
2
Počítačová lingvistika Interdisciplinární obor –Matematická informatika –Lingvistika –Statistika, strojové učení –Umělá inteligence Dlouhodobý cíl –plně automatická komunikace s počítačem prostřednictvím jazyka
3
Tematické okruhy výzkumu Matematické a lingvistické základy komputační lingvistiky Implementace softwarových nástrojů pro zpracování jazyka Vytváření datových zdrojů, především gramaticky a sémanticky značkovaného textového zdroje pro češtinu (Pražský závislostní korpus), vytváření slovníků Zpracování mluvené řeči
4
Zkoumání jazyka – vrstvy jazykového popisu Posloupnost rovin: –Fonetická –Morfologická –Syntaktická –Sémantická –Logicko-obsahová
5
Dílčí úlohy na jednotlivých rovinách Určování slovotvorných kategorií slov (pád,číslo,rod,osoba….) Syntaktická analýza vět Určování významu slova na základě kontextu K čemu odkazují zájmena
6
Analýza věty (1)
7
Analýza věty (2)
8
Praktické aplikace Strojový překlad Komunikace člověk-počítač Kontrola pravopisu Vyhledávání v textech
9
Systém rovin a strojový překlad Vstupní jazyk Rovina tvarosloví Výstupní jazyk Rovina větné stavby Interlingua (?) Analýza Syntéza Rovina větného významu
10
Informaticky zajímavé problémy - paralelizace výpočtu...... DATA dotaz odpověď
11
Vyučované předměty Namátkou… –Seminář z formální lingvistiky –Statistické metody zpracování přirozených jazyků –Nástroje pro automatický překlad –Vybrané kapitoly ze syntaxe češtiny –Automatické rozpoznávání mluvené řeči –Úvod do strojového učení v počítačové lingvistice –Korpusová lingvistika –Zdroje jazykových dat
12
Uplatnění studentů ÚFAL IBM MIT Ohio State University University of Saarbrücken
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.