Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Speech – a micro-intro Honza Černocký BUT

Podobné prezentace


Prezentace na téma: "Speech – a micro-intro Honza Černocký BUT"— Transkript prezentace:

1 Speech – a micro-intro Honza Černocký BUT Speech@FIT
Fakulta informačních technologií VUT v Brně ISS the end

2 Co děláme ? Automatická extrakce informací ze spontánní řeči
Rozpoznávání mluvčího Identita Jan Novák Rozpoznávání pohlaví Pohlaví Muž nebo žena Řeč Rozpoznávání jazyka Jazyk Angličtina ? Němčina ? Rozpoznávání řeči Přepis Sejdeme se u Pavouka. Detekce klíčových slov Detekce “Pavouk”

3 Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz)
Přepis řeči na text Voice2text V2T Speech2text S2T Large vocabulary continuous speech recognition LVCSR Akustické modely Jazykový model Výslovnostní slovník Rozponávací SÍŤ Výpočet příznaků Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) “Dekódování” vstup rozhodnutí

4 Mel-frekvenční cepstrální koeficienty

5 Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz)
Přepis řeči na text Voice2text V2T Speech2text S2T Large vocabulary continuous speech recognition LVCSR Akustické modely Jazykový model Výslovnostní slovník Rozponávací SÍŤ Výpočet příznaků Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) “Dekódování” vstup rozhodnutí

6 Směs Gaussovek se středními hodnotami, kovariančními maticemi a váhami
Akustický model Směs Gaussovek se středními hodnotami, kovariančními maticemi a váhami Vyhodnocení modelu nad maticí parametrů ZRE#1, Honza Černocký

7 Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz)
Přepis řeči na text Voice2text V2T Speech2text S2T Large vocabulary continuous speech recognition LVCSR Akustické modely Jazykový model Výslovnostní slovník Rozponávací SÍŤ Výpočet příznaků Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) “Dekódování” vstup rozhodnutí

8 Rozpoznávací síť Gramatiky (váhované) konečné stavové automaty + operace s nimi (determinisace, minimalisace, …) Prosím dávejte v teoretické informatice pozor !

9 Zjistit více a pohrát si …
Kursy FIT IKR – Klasifikace a rozpoznávání, 3.r. Bc., Lukáš Burget ZRE – Zpracování řečových signálů, 1.r. MGM, já Podívat se Pohrát si Labiny do ZRE již teď KALDI Phonexia BSAPI Bakalářky, diplomky

10 Od granátů a jablek až po IKR evaluaci simulující reálný scénář
Klasifikace a rozpoznávání je základem mnoha věcí, které se u nás (a se signály obecně) dělají. Učí Lukáš Burget  světově uznávaný odborník, kterého nám závidí  Umí věci vysvětlit !  konsultace po 20:00  nezajdete s ním na pivo Od granátů a jablek až po IKR evaluaci simulující reálný scénář audiovizuální verifikace osob, Vyhodnocení => body a láhev(ve).

11 “Moje budoucnost se signály”
Zajímavé a dobře placené zaměstnání neznamená jen databáze, web a sítě … Jobs in speech: BUT Phonexia, IBM Praha, Lingea, Kontakt: Honza Černocký, Igor Szöke, Petr Schwarz Jobs in graph/video: Camea, Honeywell, CadWorks … Kontakt: Pavel Zemčík, Adam Herout, Víťa Beran Jobs in aero: Evektor. Kontakt: Peter Chudý Značná mezinárodní poptávka po lidech: Microsoft, Google, FB, Amazon, … VAŠE FIRMA – možnost podpory JIC


Stáhnout ppt "Speech – a micro-intro Honza Černocký BUT"

Podobné prezentace


Reklamy Google