Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Speech – a micro-intro Honza Černocký BUT Fakulta informačních technologií VUT v Brně ISS the end 17.12.2014.

Podobné prezentace


Prezentace na téma: "Speech – a micro-intro Honza Černocký BUT Fakulta informačních technologií VUT v Brně ISS the end 17.12.2014."— Transkript prezentace:

1 Speech – a micro-intro Honza Černocký BUT Fakulta informačních technologií VUT v Brně ISS the end

2 2/9 Co děláme ? Automatická extrakce informací ze spontánní řeči Rozpoznávání mluvčího Rozpoznávání pohlaví Rozpoznávání jazyka Rozpoznávání řeči Identita Pohlaví Jazyk Přepis Jan Novák Muž nebo žena Angličtina ? Němčina ? Sejdeme se u Pavouka. Detekce klíčových slov Detekce “Pavouk” Řeč

3 3/9 Přepis řeči na text Voice2text V2T Speech2text S2T Large vocabulary continuous speech recognition LVCSR Výpočet příznaků Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) Akustické modely “Dekódování” vstuprozhodnutí Jazykový model Výslovnostní slovník Rozponávací SÍŤ

4 Mel-frekvenční cepstrální koeficienty 4/9

5 5/9 Přepis řeči na text Voice2text V2T Speech2text S2T Large vocabulary continuous speech recognition LVCSR Výpočet příznaků Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) Akustické modely “Dekódování” vstuprozhodnutí Jazykový model Výslovnostní slovník Rozponávací SÍŤ

6 ZRE#1, Honza Černocký /9 Akustický model Směs Gaussovek se středními hodnotami, kovariančními maticemi a váhami Vyhodnocení modelu nad maticí parametrů

7 7/9 Přepis řeči na text Voice2text V2T Speech2text S2T Large vocabulary continuous speech recognition LVCSR Výpočet příznaků Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) Akustické modely “Dekódování” vstuprozhodnutí Jazykový model Výslovnostní slovník Rozponávací SÍŤ

8 Rozpoznávací síť Gramatiky (váhované) konečné stavové automaty + operace s nimi (determinisace, minimalisace, …) Prosím dávejte v teoretické informatice pozor ! 8/9

9 Zjistit více a pohrát si … Kursy FIT IKR – Klasifikace a rozpoznávání, 3.r. Bc., Lukáš Burget ZRE – Zpracování řečových signálů, 1.r. MGM, já Podívat se Pohrát si Labiny do ZRE již teď KALDI Phonexia BSAPI Bakalářky, diplomky 9/9

10 IKR Klasifikace a rozpoznávání je základem mnoha věcí, které se u nás (a se signály obecně) dělají. Učí Lukáš Burget světově uznávaný odborník, kterého nám závidí Umí věci vysvětlit !  konsultace po 20:00  nezajdete s ním na pivo Od granátů a jablek až po IKR evaluaci simulující reálný scénář audiovizuální verifikace osob, Vyhodnocení => body a láhev(ve). 10/9

11 “Moje budoucnost se signály” Zajímavé a dobře placené zaměstnání neznamená jen databáze, web a sítě … Jobs in speech: BUT Phonexia, IBM Praha, Lingea, Kontakt: Honza Černocký, Igor Szöke, Petr Schwarz Jobs in graph/video: Camea, Honeywell, CadWorks … Kontakt: Pavel Zemčík, Adam Herout, Víťa Beran Jobs in aero: Evektor. Kontakt: Peter Chudý Značná mezinárodní poptávka po lidech: Microsoft, Google, FB, Amazon, … VAŠE FIRMA – možnost podpory JIC 11/9


Stáhnout ppt "Speech – a micro-intro Honza Černocký BUT Fakulta informačních technologií VUT v Brně ISS the end 17.12.2014."

Podobné prezentace


Reklamy Google