Speech – a micro-intro Honza Černocký BUT Speech@FIT Fakulta informačních technologií VUT v Brně ISS the end 17.12.2014
Co děláme ? Automatická extrakce informací ze spontánní řeči Rozpoznávání mluvčího Identita Jan Novák Rozpoznávání pohlaví Pohlaví Muž nebo žena Řeč Rozpoznávání jazyka Jazyk Angličtina ? Němčina ? Rozpoznávání řeči Přepis Sejdeme se u Pavouka. Detekce klíčových slov Detekce “Pavouk”
Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) Přepis řeči na text Voice2text V2T Speech2text S2T Large vocabulary continuous speech recognition LVCSR Akustické modely Jazykový model Výslovnostní slovník Rozponávací SÍŤ Výpočet příznaků Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) “Dekódování” vstup rozhodnutí
Mel-frekvenční cepstrální koeficienty
Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) Přepis řeči na text Voice2text V2T Speech2text S2T Large vocabulary continuous speech recognition LVCSR Akustické modely Jazykový model Výslovnostní slovník Rozponávací SÍŤ Výpočet příznaků Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) “Dekódování” vstup rozhodnutí
Směs Gaussovek se středními hodnotami, kovariančními maticemi a váhami Akustický model Směs Gaussovek se středními hodnotami, kovariančními maticemi a váhami Vyhodnocení modelu nad maticí parametrů ZRE#1, Honza Černocký 14.2.2014
Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) Přepis řeči na text Voice2text V2T Speech2text S2T Large vocabulary continuous speech recognition LVCSR Akustické modely Jazykový model Výslovnostní slovník Rozponávací SÍŤ Výpočet příznaků Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) “Dekódování” vstup rozhodnutí
Rozpoznávací síť Gramatiky (váhované) konečné stavové automaty + operace s nimi (determinisace, minimalisace, …) Prosím dávejte v teoretické informatice pozor !
Zjistit více a pohrát si … Kursy FIT IKR – Klasifikace a rozpoznávání, 3.r. Bc., Lukáš Burget ZRE – Zpracování řečových signálů, 1.r. MGM, já Podívat se http://www.superlectures.com/fit-iss/ http://spokendata.com/ Pohrát si Labiny do ZRE již teď http://www.fit.vutbr.cz/study/courses/ZRE/public/#labs KALDI http://kaldi.sourceforge.net/ Phonexia BSAPI http://phonexia.com/download/ Bakalářky, diplomky
Od granátů a jablek až po IKR evaluaci simulující reálný scénář Klasifikace a rozpoznávání je základem mnoha věcí, které se u nás (a se signály obecně) dělají. Učí Lukáš Burget světově uznávaný odborník, kterého nám závidí Umí věci vysvětlit ! konsultace po 20:00 nezajdete s ním na pivo Od granátů a jablek až po IKR evaluaci simulující reálný scénář audiovizuální verifikace osob, Vyhodnocení => body a láhev(ve).
“Moje budoucnost se signály” Zajímavé a dobře placené zaměstnání neznamená jen databáze, web a sítě … Jobs in speech: BUT Speech@FIT, Phonexia, IBM Praha, Lingea, Kontakt: Honza Černocký, Igor Szöke, Petr Schwarz Jobs in graph/video: Graph@FIT, Camea, Honeywell, CadWorks … Kontakt: Pavel Zemčík, Adam Herout, Víťa Beran Jobs in aero: Aeroworks@FIT, Evektor. Kontakt: Peter Chudý Značná mezinárodní poptávka po lidech: Microsoft, Google, FB, Amazon, … VAŠE FIRMA – možnost podpory JIC