Speech – a micro-intro Honza Černocký BUT

Slides:



Advertisements
Podobné prezentace
Přístupnost (bezbariérovost) již po dvanácté jako jedno z kritérií expertní tým zrakově postižených uživatelů pod vedením RNDr. Hany Bubeníčkové a Mgr.
Advertisements

Zpracování informací a znalostí Další přístupy k vyhledávání textových dokumentů Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství.
Cvičení 1 Data pro experimentální práci
PrecisPlanner 3D Software pro plánování přesnosti měření v IG
Výuka cizích jazyků technických předmětů
vyučující: Ing. Jana Herejková
Voice activity detection from gaze in video mediated communication Michal Hradis, Shahram Eivazi, Roman Bednarik Vysoké učení technické v Brně, Fakulta.
SEO pro novou firmu Bartošová Lenka 3MA
Spektra zatížení Milan Růžička 1 Dynamická pevnost a životnost
Law-ref.org Kryštof Dibusz VŠCHT Praha FCHT – Informatika a Chemie 2. ročník
Dana Sigmundová E-books jako zdroj odborných informací ÚK FSS MU, Ústřední knihovna FSS MU.
Obor S - Informační systémy ve stavebnictví
Studijní obor Informační a automatizační technika www. fsid. cvut
Práce s textem Jan Martinovič Fakulta elektrotechniky a informatiky
Programovací jazyk Prolog
SEMANTICKÝ WEB. Semantický Web WWW – Tim Berners-Lee, CERN, univerzum propojených HTML stránek, prostor hyperlinkovaných dokumentů – Informace jsou zobrazeny.
Kalmanuv filtr pro zpracování signálů a navigaci
Databázové systémy II Přednáška č. 6 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
Výukový matriál byl zpracován v rámci projektu OPVK 1.5 EU peníze školám registrační číslo projektu:CZ.1.07/1.5.00/ Autor:Mgr. Martina Daňková Zpracováno:24.10.
Replikace dat Bakalářská práce na téma. 2 Obsah prezentace - Práce s daty za pomoci XML - Webové služby - Teorie replikace dat - Replikace dat.NET Framework.
Porovnání hodnotících škál bolesti v závislosti na kognitivní funkci
Kontrola kvality hovorů „trochu“ jinak – lépe a efektivněji.
Přínosy virtualizace a privátního cloudu
Nové vzdělávací moduly pro řízení inovací a VaV v průmyslových firmách reg. č. projektu CZ.1.07/3.2.11/ Praha Realizátor projektu: AC.
Mgr. Marek Pavlů Katedra Experimentální Fyziky 1 Modelování a simulace, Mgr. Marek Pavlů.
Spolehlivost a diagnostika (vsd)
Diplomová práce Autorka: Ing. et Ing. Zuzana Hynoušová
Řečové technologie – výzkum a využití Honza Černocký BUT Fakulta informačních technologií VUT v Brně ZRE #1,
Řečové technologie – výzkum a využití
projekt PŘEDPOVĚĎ POČASÍ předpověď počasí na 13. května 2014.
Projekt PŘEDPOVĚĎ POČASÍ. Předpověď počasí na
Jemný úvod do detekce klíčových slov Honza Černocký Fakulta informačních technologií VUT v Brně ZRE poslední přednes,
předpověď počasí na 14. května 2009 OBLAČNOST 6.00.
„ostatní jen drží slovo … my ho umíme chytit“
Moderní škola 2011, CZ.1.07/1.4.00/ Informační a komunikační technologie Internet Posílání velkého množství dat VY_32_INOVACE_20 Sada 12 Základní.
Výukový matriál byl zpracován v rámci projektu OPVK 1.5 EU peníze školám registrační číslo projektu:CZ.1.07/1.5.00/ Autor:Mgr. Martina Daňková Zpracováno:29.
PŘEDNÁŠKA 0. Jiří Šebesta MRAR – Radiolokační a radionavigační systémy
Kvantitativní metody výzkumu v praxi (KMVP) 0. Poučení z minulých ročníků a novinky od ZS 2013 (2011) poslední aktualizace Jiří Šafr jiri.safr(at)seznam.cz.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Úvod do korpusové lingvistiky 8
Automatické rozpoznávání zpěvů ptáků
Biometrické Bezpečnostní Systémy Filip Orság Technologie rozpoznání mluvčího.
Digitální výukový materiál zpracovaný v rámci projektu „EU peníze školám“ Projekt:CZ.1.07/1.5.00/ „SŠHL Frýdlant.moderní školy“ Škola:Střední škola.
Název školy: Základní škola a Mateřská škola Kladno, Vodárenská 2115 Autor: Ing. Ilona Sadílková Materiál: VY_32_INOVACE_ICT36.01 Téma: PowerPoint Číslo.
Spolupráce škol s průmyslem Vlastimil Bejček
INFORMATIKA 8 Videosekvence, webkamera III2 – I8- 20.
Výsledky a srovnání systémů pro detekci klíčových slov v telefonních hovorech Vysoké učení technické v Brně Lukáš Burget, Tomáš Cipr, Honza.
Informační a komunikační technologie jako klíčový nástroj třídy budoucnosti Lucie Laitlová (DZS)
ZŠ a ZUŠ Bezdrevská 3, České Budějovice
Představení VUT v Brně a FEKT
R VY a Aplikovaná informatika Aplikovaná informatika Prezentace studijních oborů 2013.
1 Elektronická evidence paleontologických sbírek na příkladu paleontologických kolekcí České geologické služby Pavel Bokr, Petr Budil, Jan Sedláček, Marika.
ANOTACEPrezentace obsahuje informace o práci s vyhledávačem Google. Druh učebního materiáluDUM Očekávané výstupy Žáci umí použít vyhledávač Google k vyhledávání.
Formální modely výpočtu Tomáš Vaníček Katedra inženýrské informatiky Stavební fakulta ČVUT Thákurova 7, Praha 6 Dejvice, b407
Princip maximální entropie
Law-Ref Elektronická databáze mezinárodních smluvních dokumentů Kryštof Dibusz VŠCHT Praha FCHT – Informatika a Chemie 3. ročník
Systémy zpracování řeči - SRE Úvod Honza Černocký 2008/09.
Čtvrté laboratorní cvičení
Internet – služby Název školyGymnázium Zlín - Lesní čtvrť Číslo projektuCZ.1.07/1.5.00/ Název projektuRozvoj žákovských kompetencí.
1 Rozpoznávač jeté vařečky s HMM Honza Černocký
Problém majáku předpokládáme, že l známe  x0x0 xixi l chceme najít odhad x 0 (věrohodnost) maximální věrohodnost.
Fakulta informatiky Masarykova univerzita Brno. Fakulta informatiky MU Brno Brno – univerzitní město Masarykova univerzita – druhá největší univerzita.
Klasifikace a rozpoznávání
Fakulta informatiky MU Brno
Vzdělávací portál eKabinet.cz a digitální obsah pro střední školy Ing. Richard Valenta
Masmédia a manipulace: Masmédia a jejich vliv na společnost i osobní životy lidí Jana Kvardová, IV. D Střední škola KNIH, o.p.s. Brno.
Statistická extrakce idiomů Jan Bušta CZPJ FI MU, Brno PV
ISS 2015/16 intro Honza Černocký, ÚPGM. Agenda organisace cíle program kursu literatura hodnocení 2.
Řečové technologie – výzkum a využití
Linková úroveň (druhá část)
Transkript prezentace:

Speech – a micro-intro Honza Černocký BUT Speech@FIT Fakulta informačních technologií VUT v Brně ISS the end 17.12.2014

Co děláme ? Automatická extrakce informací ze spontánní řeči Rozpoznávání mluvčího Identita Jan Novák Rozpoznávání pohlaví Pohlaví Muž nebo žena Řeč Rozpoznávání jazyka Jazyk Angličtina ? Němčina ? Rozpoznávání řeči Přepis Sejdeme se u Pavouka. Detekce klíčových slov Detekce “Pavouk”

Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) Přepis řeči na text Voice2text V2T Speech2text S2T Large vocabulary continuous speech recognition LVCSR Akustické modely Jazykový model Výslovnostní slovník Rozponávací SÍŤ Výpočet příznaků Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) “Dekódování” vstup rozhodnutí

Mel-frekvenční cepstrální koeficienty

Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) Přepis řeči na text Voice2text V2T Speech2text S2T Large vocabulary continuous speech recognition LVCSR Akustické modely Jazykový model Výslovnostní slovník Rozponávací SÍŤ Výpočet příznaků Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) “Dekódování” vstup rozhodnutí

Směs Gaussovek se středními hodnotami, kovariančními maticemi a váhami Akustický model Směs Gaussovek se středními hodnotami, kovariančními maticemi a váhami Vyhodnocení modelu nad maticí parametrů ZRE#1, Honza Černocký 14.2.2014

Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) Přepis řeči na text Voice2text V2T Speech2text S2T Large vocabulary continuous speech recognition LVCSR Akustické modely Jazykový model Výslovnostní slovník Rozponávací SÍŤ Výpočet příznaků Vyhodnocení pravděpodobností nebo věrohodností (skóre hypotéz) “Dekódování” vstup rozhodnutí

Rozpoznávací síť Gramatiky (váhované) konečné stavové automaty + operace s nimi (determinisace, minimalisace, …) Prosím dávejte v teoretické informatice pozor !

Zjistit více a pohrát si … Kursy FIT IKR – Klasifikace a rozpoznávání, 3.r. Bc., Lukáš Burget ZRE – Zpracování řečových signálů, 1.r. MGM, já Podívat se http://www.superlectures.com/fit-iss/ http://spokendata.com/ Pohrát si Labiny do ZRE již teď http://www.fit.vutbr.cz/study/courses/ZRE/public/#labs KALDI http://kaldi.sourceforge.net/ Phonexia BSAPI http://phonexia.com/download/ Bakalářky, diplomky

Od granátů a jablek až po IKR evaluaci simulující reálný scénář Klasifikace a rozpoznávání je základem mnoha věcí, které se u nás (a se signály obecně) dělají. Učí Lukáš Burget  světově uznávaný odborník, kterého nám závidí  Umí věci vysvětlit !  konsultace po 20:00  nezajdete s ním na pivo Od granátů a jablek až po IKR evaluaci simulující reálný scénář audiovizuální verifikace osob, Vyhodnocení => body a láhev(ve).

“Moje budoucnost se signály” Zajímavé a dobře placené zaměstnání neznamená jen databáze, web a sítě … Jobs in speech: BUT Speech@FIT, Phonexia, IBM Praha, Lingea, Kontakt: Honza Černocký, Igor Szöke, Petr Schwarz Jobs in graph/video: Graph@FIT, Camea, Honeywell, CadWorks … Kontakt: Pavel Zemčík, Adam Herout, Víťa Beran Jobs in aero: Aeroworks@FIT, Evektor. Kontakt: Peter Chudý Značná mezinárodní poptávka po lidech: Microsoft, Google, FB, Amazon, … VAŠE FIRMA – možnost podpory JIC