Systémy zpracování řeči - SRE Úvod Honza Černocký 2008/09
2 Cíl kursu… „Studenti si rozšíří vědomosti získalané v základním kursu o zpracování řečových signálů a zpracování přirozeného jazyka. Získají přehled o metodách v současnosti implementovaných v průmyslových aplikacích (GSM telefony nebo komerčně dostupné rozpoznávače). Seznámí se s perspektivními metodami existujícími ve výzkumné oblasti. Prohloubí své znalosti zpracování přirozeného jazyka a jazykového modelování. Absolvování předmětu umožní posluchači realizovat jednoduché aplikace jako např. hlasové ovládání programu, ale především se zapojit do vývoje komplexních systémů pro zpracování řeči v akademické i průmyslové sféře.“
3 … a teď doopravdy: Naučit Vás něco o řeči. Ujasnit si některé věci sami (teorie, systematizace znalostí). Vysvětlit si to mezi sebou. Posílit link mezi speech & NLP. Ulovit lidi do naší skupiny
4 Kdo bude učit Garant: Honza Černocký NLP-part: Pavel Smrž … ale to nejzajímavější budou vykládat lidé ze –Lukáš Burget –Petr Schwarz –Pavel Matějka –Martin Karafiát –…
5 Přednášky – I. Bývalo to takto … Fonetika a fonologie - struktura slabik, fonologické procesy a rozlišující rysy [Černocký] Statistické rozpoznávání vzorů I. - Bayesovský rámec, Maximum likelihood učení, Gaussian mixture models. Parametry pro GMM modelování [Černocký] Statistické rozpoznávání vzorů II. - umělé neuronové sítě, Support vector machines. Modelování sekvencí - skryté Markovovy modely HMM. [Schwarz, Černocký, Burget] Features pro HMM a jejich transformace, trénování a adaptace HMM - MLLR, MAP, diskriminativní trénování [Burget, Karafiát, Grézl]. Rozpoznávání HMM - výslovnostní slovníky, rozpoznávací sítě, jazykový model, dekódování, lattices [Burget, Karafiát, Glembek]. Rozpoznávání fonémů. Detekce klíčových slov a vyhledávání - LVCSR, akustické, fonémové lattices. Figure of Merit. Indexace a vyhledávání [Schwarz, Szöke, Fapšo].
6 Přednášky – II. 7.Identifikace a verifikace mluvčího - GMM, SVM. Normalizace a adaptace na přenosový kanál - feature mapping, eigen- voices a nuissance attributes projection (NAP). Vyhodnocení ověřování mluvčího - DET křivky, EER, cost function [Matějka, Burget, Schwarz]. 8.Identifikace jazyka - akustická vs. fonotaktická, vyhodnocení [Matějka, Burget] 9.Kódování řeči - CELP - adaptivní a stochastická kódová kniha, GSM standardy [Černocký, Motlíček?] 10.Jazykové modelování I. - n-gramové modely, modely založené na třídách [Smrž] 11.Jazykové modelování II. - příznaky specifické pro jazyk, factored-language models, Psycholingvistika - model rozpoznávání slov, slovní asociace [Smrž]. 12.Pravděpodobnostní parsování - algoritmus inside-outside, závislostní parsování [Smrž]. 13.Presentace projektů [Vy!] … ale stejně to zase předěláme !
7 Projekty 2 typy: –Paper reading + presentace – 1 člověk –Něco udělat – 2 lidi Budou zadány do příštího týdne. Viz minulý rok … WIS Vaše nápady a souvislost s diplomovou prací jsou vítány !
8 Hodnocení Půlsemestrálka – 15b. Zkouška – 50b. Projekt – zpráva + presentace – 35b.
9 Literatura Gussenhoven, J. and Jacobs, H.: Understanding Phonology, Oxford University Press, 1998, ISBN: Psutka, J.: Komunikace s počítačem mluvenou řečí. Academia, Praha, 1995, ISBN Josef Psutka, Jindřich Matoušek, Luděk Muller, Vlasta Radová: Mluvíme s počítačem česky, Academia 2006, ISBN Gold, B., Morgan, N.: Speech and audio signal processing, John Wiley & Sons, 2000, ISBN Moore, B.C.J.: An introduction to the psychology of hearing, Academic Press, 1989, ISBN Jelinek, F.: Statistical Methods for Speech Recognition, MIT Press, 1998, ISBN Manning, C. and Schütze, H.: Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA: May Web … bude i index.html…
10 EMLS – I. European Masters in Language and Speech programme (EuroMasters): Požadavky: coverage of EuroMasters requirements by courses taken during his/her study and his/her results in these courses topic and quality of projects done during his/her study. At least one project should have speech or NL processing as its primary topic. training or stay in a company or at a university abroad or participation at a EuroMasters summer school. Co z toho: A certificate signed by President of ICSA and European Chapter of ACL:
11 EMLS – II. Speech Signal Processing (SRE) - Jan ČernockýSpeech Signal Processing Natural Language processing (NLP) - Pavel SmržNatural Language processing Speech processing systems (SRE) - Jan ČernockýSpeech processing systems Signals and Systems (ISS) - Jan ČernockýSignals and Systems Audio and Speech Processing by Humans and Machines (ASD) - Hynek HeřmanskýAudio and Speech Processing by Humans and Machines Artificial Intelligence (UIN) - František ZbořilArtificial Intelligence Neural Networks (NEU) - František ZbořilNeural Networks Formal Languages and Compilers (IFJ) - Alexander MedunaFormal Languages and Compilers Multimedia (MUM) - Pavel ZemčíkMultimedia Database Systems (IDS) - Jaroslav ZendulkaDatabase Systems Introduction to Software Engineering (IUS) - Jaroslav ZendulkaIntroduction to Software Engineering Introduction to Programming Systems (IZP) - Jitka KreslíkováIntroduction to Programming Systems Summer school 2007 byla v Brně, 2008 v Německu.
12 Závěr SRE je tu pro Vás, neváhejte komentovat program kursu (insert, delete, modify). SRE … je toho tolik, co bychom Vám chtěli říci … a času tak málo …komentujte !