„ostatní jen drží slovo … my ho umíme chytit“

Slides:



Advertisements
Podobné prezentace
JIP / KAAS / ZR aneb „Co budeme dělat
Advertisements

Základní škola a Mateřská škola Louňovice pod Blaníkem 15. srpna 2009
Střední zdravotnická škola, Brno, Jaselská 7/9
Nabídka pro partnery. Nabídka pro partnery Co jsou světové gymnaestrády Světové gymnaestrády pořádá Mezinárodní gymnastická federace (FIG) jedenkrát.
Příklady citací v textu
20. května 2009 Prague Gate, Praha – Chodov II. konference Českého institutu manažerů informační bezpečnosti.
Příklady odstraňování bariér konkurenceschopnosti české ekonomiky
AKREDITOVANÉ ŠKOLICÍ STŘEDISKO ČLEN ASOCIACE VDĚLÁVÁNÍ DOSPĚLÝCH TRADICE OD ROKU 1991 Zdeněk Mašín Microsoft Gold Certified Partner Akreditované.
Státy a jejich seskupení
49. mistrovství světa ve zpracování textu na počítači
Proměny rodiny II. Ohrožující dítě, ohrožující rodina.
Spektra zatížení Milan Růžička 1 Dynamická pevnost a životnost
Podnikové informační systémy Úvod
Úvod Klasifikace disciplín operačního výzkumu
Dana Sigmundová E-books jako zdroj odborných informací ÚK FSS MU, Ústřední knihovna FSS MU.
Lego Mindstorms Martin Flusser.
Podpora PR oddělení fakulty moderními ICT
Zahájení doktorského studia oborů Řízení a ekonomika podniku Ekonomická informatika
Tvorba didaktického testu z matematiky
Kontrola kvality hovorů „trochu“ jinak – lépe a efektivněji.
Přínosy virtualizace a privátního cloudu
1 Proč OI ? Informatický program zaměrený na základy matematiky a algoritmizace, programování a počítačových věd Malý program s osobním přístupem odborníků.
Fórum zaměřené na informační a komunikační technologie
Kladno Tým Realizační tým Jména hráčů Zuzana Škrhová Jindřich Licek
Analýza zastoupení českých a slovenských časopisů z oblasti přírodních věd v databázi Web of Science (1998 – 2006) Věra Kroftová, Agrotest fyto, s.r.o.
Návrhy usnesení Členská schůze občanského sdružení MAESTRO CLUB Kolovraty dne
INTEGROVANÉ INŽENÝRSTVÍ V ŘÍZENÍ PRŮMYSLOVÝCH PODNIKŮ 13. konferenci v rámci cyklu: Při příležitosti konání MSV Brno v Kongresovém centru Pořádají
Návrhy usnesení Členská schůze občanského sdružení MAESTRO CLUB Kolovraty dne
Řečové technologie – výzkum a využití Honza Černocký BUT Fakulta informačních technologií VUT v Brně ZRE #1,
Živá historie konference Informační gramotnost – témata, trendy, inspirace Adéla Dilhofová Jiří Zounek.
SCIENTIX - online komunita pro vzdělávání v oblasti STEM The work presented in this document is supported by the European Commission’s FP7 programme –
Elektronické služby v znalostnej spoločnosti, , Zvolen Koordinace a spolupráce – úloha Asociace knihoven vysokých škol ČR Barbora Ramajzlová.
STRATEGIE AGE MANAGEMENTU V ČESKÉ REPUBLICE CZ.1.04/5.1.01/ Mgr. Ilona Štorová AIVD ČR, o. s.
Vlastnosti tónů Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Monika Odehnalová. Materiál zpracován v rámci projektu Implementace ICT.
Marek Knězů PRAHA ročník setkání uživatelů GEPRO a ATLAS MISYS.
Řečové technologie – výzkum a využití
Internetový obchod v ČR 2005 / 2006 Konference SAEC, , Bratislava Josef Suchánek APEK - Asociace pro elektronickou komerci.
Vědecká spolupráce se zeměmi mimo EU Vladislav Čadil, Daniel Frank, Miloš Chvojka, Zdeněk Kučera, Michal Pazour, Tomáš Vondrák.
Systémy pro zpřístupňování VŠKP: zkušenosti, možnosti, nabídky, potřeby … Seminář Brno,
Jemný úvod do detekce klíčových slov Honza Černocký Fakulta informačních technologií VUT v Brně ZRE poslední přednes,
předpověď počasí na 14. května 2009 OBLAČNOST 6.00.
Spolupráce lokálních institucí Seminář Komunitní role veřejných knihoven ZLÍN
21. ROČNÍK ČERVENCE 2012 NEJSTARŠÍ FUTSALOVÝ TURNAJ S MEZINÁRODNÍ ÚČASTÍ OD ROKU 1992 KONANÝ TRADIČNĚ V PŘÍJEMNÉM PROSTŘEDÍ HÁZENKÁŘSKÉHO AREÁLU.
Obor informační technologie
1 | Kaspersky Endpoint Security Přehled. 2 | Kaspersky Endpoint Security Kaspersky Endpoint Security for Windows Kaspersky Endpoint Security for Mac Kaspersky.
Otto Chmelík, Státní okresní archiv Děčín
, 14 hod.,FZÚ m Diskuze o stavu a rozvoji výpočetních služeb sekce 1 –Změny v roce 1997 M.Lokajíček 5’ –Status služby HP J. Krásová 20’
Startegie a perspektivy trhu s biopalivy v ČR Česká zemědělská universita, Praha, listopad Česká asociace petrolejářského průmyslu a obchodu.
Úvod do korpusové lingvistiky 8
Biometrické Bezpečnostní Systémy Filip Orság Technologie rozpoznání mluvčího.
Spolupráce škol s průmyslem Vlastimil Bejček
Dům zahraničních služeb Vypracovala: Eva Jermanová.
Prezentace Centra MU pro klinicky orientovaný výzkum kvality života (CEQOL) Marek Blatný PSU AV ČR & PSU FF MU Tomáš Kepák KDO FN Brno & LF MU Brno, 21.
Výsledky a srovnání systémů pro detekci klíčových slov v telefonních hovorech Vysoké učení technické v Brně Lukáš Burget, Tomáš Cipr, Honza.
Speech – a micro-intro Honza Černocký BUT
Marika Janoušková Area Sales Manager, Central and Eastern Europe.
Informace o činnosti Společnosti revizního lékařství ČLS JEP
Dlouhodobé uchovávání a zpřístupňování dokumentů v digitální podobě
Evropská směrnice INSPIRE Ing. Pavla Tryhubová Katedra mapování a kartografie ČVUT v Praze, Fakulta stavební.
Návrh a realizace modulového systému dalšího vzdělávání učitelů v MSK Magdalena Chmelařová Opava 2008.
Hodnocení škol a ředitelů zřizovatelem – Zlínským krajem
ÚSTAV ÚZEMNÍHO ROZVOJE Robert Veselý Seminář „Jsou možné inovace v mikroregionech?“ Brno, 28. listopadu 2011 Monitoring mikroregionů a další výstupy činnosti.
Apple Computer Jan Šimík, Education manager, Apple IMC
Projekt Podpora stáží a odborných aktivit při inovaci oblasti terciárního vzdělávání na DFJP a FEI Univerzity Pardubice CZ.1.07/2.4.00/ TENTO PROJEKT.
Spolupráce při rozvoji talentů
Systémy zpracování řeči - SRE Úvod Honza Černocký 2008/09.
Fakulta informatiky Masarykova univerzita Brno. Fakulta informatiky MU Brno Brno – univerzitní město Masarykova univerzita – druhá největší univerzita.
Fakulta informatiky MU Brno
Vzdělávací portál eKabinet.cz a digitální obsah pro střední školy Ing. Richard Valenta
Smart Life.
Transkript prezentace:

Speech@FIT „ostatní jen drží slovo … my ho umíme chytit“       Speech@FIT „ostatní jen drží slovo … my ho umíme chytit“ Honza Černocký ZRE, 11.2.2009

Co je Speech@FIT ? >20-členná skupina zpracování řeči na Ústavu počítačové grafiky a multimédií FIT

Lidé … PhD. research assistants: František Grézl, Ph.D. PhD students Igor Szöke, Martin Karafiát, Ondřej Glembek, Michal Fapšo, Oldřich Plchot, Jiří Kopecký, Tomáš Mikolov, Marcel Kockmann, Květoslav Malý Pre-grad students Valiantsina Hubeika, Jakub Kubalík, Pavel Tomášek, Karel Veselý, Stefan Kombrink Administration Sylva Otáhalová, Jana Slámová Technical and support staff Kamil Chalupníček, Tomáš Cipr, Tomáš Kašpárek, Josef Žižka Dr. Jan “Honza” Černocký Executive direction Prof. Hynek Heřmanský - (IDIAP Martigny, Switzerland) advisor and guru Dr. Lukáš Burget – Scientific director Sub-group leaders: Petr Schwarz – phonemes, implementation Pavel “Pája” Matějka – SpeakerID, LanguageID

… Šrot a SW 3 IBM Blade centra s 44 IBM Blade servery po 2 CPU Cca 120 počítačů v laboratořích 16 TB diskového prostoru Profesionální správa SW: Obecný: HTK, Matlab, SGE, QuickNet Vlastní: STK, SNet

Kategorie rozpoznávání řeči „Co bylo řečeno“ – rozpoznávání řeči (speech recognition) Celkový přepis – rozpoznávání plynulé řeči s velkým slovníkem (large vocabulary continuous speech recognition LVCSR) Detekce klíčových slov nebo frází – keyword/keyphrase spotting „Jakou řečí“ – rozpoznávání jazyka (language identification LID) „Kdo to řekl“– rozpoznávání mluvčího Výběr jednoho mluvčího z množiny – identifikace mluvčího – speaker identification Ověření předpokládané identity – verifikace mluvčího – speaker verification.

                                                                                                        Evaluace – NIST „Já jsem lepší než ti druzí“ – jen kecy, pokud nejsou stejná data a evaluační metriky NIST – agentura vlády USA, http://www.nist.gov/speech Její řečová skupina organizuje pravidelné evaluace řečových technologií (rozpoznávání řeči, řečníka, jazyka, …). Všechny participující laboratoři obdrží stejná data a mají omezený čas na jejich analýzu a odeslání výsledků NISTu – objektivní srovnání výsledků. Výsledky a detaily jednotlivých systémů se diskutují na následném workshopu. Speech@FIT se evaluací účastní (Meeting recognition 2005, 2006, 2007, Language ID 2003, 2005, 2007, SpkVer 1998, 1999, 2006, 2008, Spoken term detection 2006)

Identifikace jazyka - LID Na základě řečového signálu (z mikrofonu či telefonu), určí systém jazyk (čeština, angličtina, čínština, arabština, …) Akustický a fonotaktický přístup

                                                                                                        LID – výsledky NIST LRE 2005 – systém Speech@FIT nejlepší ve 2 kategoriích a těsně druhý v jedné kategorii v konkurenci 13 laboratoří ze 4 kontinentů. Potvrzení v NIST LRE 2007 – „viděli jste v TV…“  Nejen výzkumný prototyp – reálná aplikace nasazená u složky MO ČR.

Detekce klíčových slov a frází Úkol KWS: detekce klíčových slov nebo frází: On-line pro sledování např. meetingu v reálném čase. Off-line pro prohledávání velkých audio archívů („audio-Google“).

KWS – výsledky a implementace Velmi dobré umístění v NIST STD 2006 – angličtina a arabština. Aplikace nasazená u MO ČR, několik jazyků. Real-time zpracování pro meeting room – CeBIT 2006. Integrace s multimodálním prohlížečem JFerret

Rozpoznávání mluvčího – SpkID, SpkVer Úkol SpkID: přiřadit řečový segment k jednomu z N mluvčích nebo prohlásit, že to není žádný. Úkol SpkVer: ověřit předpokládanou identitu „Je to opravdu pan Novák?“

Výsledky NIST 2006 Náš systém STBU konsorcium: FIT VUT TNO Human Factors (Nizozemí) Spescom DataVoice (Jižní Afrika) University of Stellenbosch (Jižní Afrika) + SRE 2008 -> NIST page

Kdo to platí – ~10 mil/rok… Fakulta (učitelé FIT a celofakultní výzkumné projekty) EU projekty Byly: SpeechDat-E, SpeeCon, M4, AMI, CareTaker. Jsou: AMIDA, MOBIO, KIWI, weKnowIt. Podávané: MPO, EU, … České grantové agentury: GAČR, FRVŠ, MŠMT, MPO. „Silová“ ministerstva – obrana, vnitro. EU a české průmyslové projekty Spin-off – Phonexia, s.r.o..

Diplomka/PhD ve Speech@FIT ? Připravte se na Celkem drsnou matematiku Celkem drsné programování 100% úvazek Dlouhou učící křivku („proč si na meetingu pořád připadám jako debil ?“) Ale také na Zpracování řeči má netriviální teorii, ale okamžitě jej aplikujeme v praxi. Účast na mezinárodních projektech a evaluacích – zajímaví lidé, zajímavá místa (i na déle) a skutečné srovnání se světem. Zahraniční konference Příspěvek k fakultnímu stipendiu Výkonnou administrativu a support FIT. Příjemné lidi, kteří si pomáhají, a mimofakultní akce I před PhD !

Není to zas tak složitý… Zdroj: S. Young et al.: The HTK Book (for HTK Version 3.4), Cambridge University Engineering Department, 2006 Zdroj: T. Černocký: poznámky z předmětu Matematika pro 1. ročník, ZŠ Krásného Brno, školní rok 2006/2007.