„Přepis mluveného slova do textové podoby“ Program NewtonDictate

Slides:



Advertisements
Podobné prezentace
Multiplex veřejné služby 2008 – Digimedia 2008 Ing.Pavel Hanuš Manažer programu digitalizace ČT.
Advertisements

Dana Linhartová CZ.1.04/3.4.04/ Rodina a práce: PROČ NE?
POSPOLU Podpora spolupráce škol a firem se zaměřením na odborné vzdělávání v praxi T. Vencovská.
Digitální a analogový signál
Edukační portál MEFANET Použití licencí Creative Commons v medicínském vzdělávání.
Automatické titulkování živých pořadů České televize – současný stav a výhled do budoucna Luděk Müller Katedra kybernetiky, Fakulta aplikovaných.
Cvičení 1 Data pro experimentální práci
OLE-onlinelearning Studium odkudkoli a kdykoli
Vzdělání: Univerzita Karlova v Praze - filozofická fakulta – pedagogika a psychologie – učitelství pro školy II. cyklu – rok zakončení 1981 Univerzita.
Pavel Kurfürst - Ústav cizích jazyků LF Univerzita Palackého v Olomouci, ČR
eGovernment – aplikace principů v ISKN
1 Týmová práce TYMP1/ C4 Verbální a neverbální komunikace - 1 Pavla Kotyzová UNIVERZITA TOMÁŠE BATI VE ZLÍNĚ, FAKULTA MULTIMEDIÁLNÍCH KOMUNIKACÍ, ÚSTAV.
Modernizace studijních opor Představení LMS Moodle
Projekt Knihovny Kroměřížska spolufinancovaný Evropským sociálním fondem a státním rozpočtem České republiky.
Základy počítačů a kancelářský software
SOFTWARE operační systémy
Anglický jazyk Michaela Hrdličková, 251 PT1 – Provozní technika 1. ročník „Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem.
Základy práce s počítačem – lekce V. Zvyšování IT gramotnosti zaměstnanců vybraných fakult MU.
Online jazyková výuka v praxi. rychlost srozumitelnost efektivita Přenos informací.
SPECIFIKA VÝUKY POČÍTAČOVÝCH KURZŮ UNIVERZITY TŘETÍHO VĚKU Michal Vojkůvka.
Red Bull Stratos NEWTON Media. Akce Pětiletá příprava Stočlenný tým odborníků Rakušan Felix Baumgartner 40 televizních stanic (50 zemí) 130 digitálních.
Bohdana Stoklasová Národní knihovna ČR
Definování prostředí pro provozování aplikace dosud jsme řešili projekt v obecné rovině aplikace bude ovšem provozována v konkrétním technickém a programovém.
Elektrotechnika v hodinách anglického jazyka
Výukové programy pro předmět český jazyk a literatura
Komunikace.
Prezentace Centra MU pro klinicky orientovaný výzkum kvality života (CEQOL) Marek Blatný PSU AV ČR & PSU FF MU Tomáš Kepák KDO FN Brno & LF MU Brno, 21.
Co jsou to multimédia Bohumil Bareš.
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
e-learning Lucie Rohlíková
Celní služby 2000 Radek Sedláček TranSoft a.s Radek Sedláček TranSoft a.s
KOMUNIKACE OLGA BÜRGEROVÁ. CÍLE:  VÝZNAM PRVNÍHO DOJMU  UMĚT NAVÁZAT KONTAKT.
Mgr. Karla Hrbáčková Metodologie pedagogického výzkumu
3. ročník, studijní obory SOU Mgr. Smékalová Dagmar „Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky.“
© 2000 VEMA počítače a projektování spol. s r. o..
Dana Sigmundová Metalib aneb jak vyhledávat (skoro) ve všech (multi)oborových databázích současně? ÚK FSS MU, Ústřední knihovna FSS MU.
Základní škola Uničov, Haškova 211 Aktivní motivace žáků ZŠ = jistota pro budoucnost řemesel CZ.1.07/1.1.04/ , realizace – INVESTICE.
Studentská PARDUBICE Implementace MIIS na Univerzitě Pardubice Petr Švec, Univerzita Pardubice.
Buďte v obraze Služby pro veřejnou správu oblasti monitorování médií NEWTON INFORMATION TECHNOLOGY, s.r.o. Politických vězňů 10, Praha 1
Nokia Czech Republic, s.r.o. Igor Šmerda, program manager.
Digitalizace v ČR ISSS, Hradec Králové, duben 2005.
Kontrola pravopisu Daniel Zeman Počítačové zpracování češtiny.
Hudební akustika PhDr. Petr Kalina, Ph.D
Software pro automatické rozpoznání řeči Biomedicínský výzkum s podporou evropských fondů Ústí nad Labem dubna 2010 Aleš Vychodil.
Archivní VadeMeCum v Národním muzeu PhDr. Martin Šámal 2015.
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
Dana Mazancová Databáze Anopress a ČTK ÚK FSS MU, Ústřední knihovna FSS MU.
Klient pro správu databází MySQL 1 Klient pro správu databází MySQL Zbyněk Munzar České vysoké učení technické v Praze Fakulta elektrotechnická.
Vzdělávací portál eKabinet.cz a digitální obsah pro střední školy Ing. Richard Valenta
Univerzita Karlova v Praze Lékařská fakulta v Plzni Oddělení OVAVT Jestliže chcete oživit systém Vaší výuky, „online learning systém“ Vám nabízí? Jednoduché.
© NSZM ČR Národní síť Zdravých měst ČR Setkání Zdravých měst a realizátorů MA21 v Kraji Vysočina Jihlava, 12. ledna 2015.
Využití standardů pro průběžné sledování učebního pokroku žáků Jana Straková Institut pro sociální a ekonomické analýzy a Ústav pro informace ve vzdělávání.
Psát není tak složité, aneb pojďte s námi tvořit Metodický portál.
ČESKÝ JAZYK A LITERATURA Praktická aplikace teoretických poznatků z hláskosloví Online diskuse k virtuální hospitaci – Open Gate, gymnázium.
D IDAKTIKA INFORMATIKY : SOUČASNÝ STAV A PERSPEKTIVY JEJÍHO ROZVOJE V RÁMCI SYSTÉMU OBOROVÝCH DIDAKTIK Miroslava Černochová (Univerzita Karlova v Praze)
DIGITÁLNÍ UČEBNÍ MATERIÁL
Customer Contact Praha
Inf Elektronická komunikace
Škola ZŠ Třeboň, Sokolská 296, Třeboň Autor Mgr. Miroslava Tomanová
Komunikace Mgr. Vladimír Velešík.
Daniel Zeman Počítačové zpracování češtiny Kontrola pravopisu Daniel Zeman
Orbis pictus 21. století Přenosové schéma
Budování Integrovaného informačního systému Národního památkového ústavu Petr Volfík, NPÚ ÚP
PŘÍPRAVA A REALIZACE VÝUKOVÝCH MATERIÁLŮ PRO PODPORU
Hudební akustika PhDr. Petr Kalina, Ph.D
Vysoké učení technické v Brně
Vysoké učení technické v Brně
Ústřední knihovna FSS MU
Prezentace univerzitního informačního systému
Ing. Alžběta Králová SEFIRA spol. s r.o.
Transkript prezentace:

„Přepis mluveného slova do textové podoby“ Program NewtonDictate NEWTON Technologies, a.s. Ing. Petr Herian www.diktovani.cz petr.herian@diktovani.cz 1

NEWTON Media - Největší komerční archív plných textů v ČR Unikátní patentovaný systém zpracování dat, (světová konference FIBEP 2008 v Praze) Multimediální archiv pro vydavatele a vysílatele (Mafra, Ringier, TV Nova, ČRo, PSP,…) V Newtonu Média řešíme úlohu Měsíčně zpracováváme 8000 hodin záznamu, 600 hodin doslovně přepisujeme Okamžitá úspora času (30-75%) Spolupráce s Technickou univerzitou v Liberci (od roku 2005): Propojení vývojových týmů, sdílení výsledků a zkušeností, zpětná vazba Spolufinancování vývoje technologie Voice to Text (V2T) Samostatné nadstavbové moduly, nové aplikace, servis, komunikace s klienty

Produkty vývoje zavedené do praxe MyVoice a MyDictate NewtonDictate – diktovací program ATT – přepis a titulkování TV AudioSearch - vyhledávání v archivech

Praktická ukázka programu NewtonDictate

NewtonDictate 2.4

Program NewtonDictate pracuje jako textový editor (např. Word) Základní funkce programu Program NewtonDictate pracuje jako textový editor (např. Word) a současně také jako digitální záznamník Program řeč nahrává, automaticky přepisuje, přičemž kteroukoliv část přepisu si lze kdykoliv přehrát a v případě potřeby snadno opravit. Diktuje se interpunkce, program automaticky formátuje čísla, symboly a používané zkratky. Program můžete jednoduše naučit nová slova, celé věty,... Program můžete naučit rozpoznávat Váš hlas (nadiktovat 120 předepsaných vět) Diktovat lze do libovolného místa v textu, text i audio záznam lze libovolně kopírovat, mazat přesouvat. Program nadiktovaný záznam průběžně ukládá. Diktovat můžete také do libovolného programu, diktuje se na pozici kurzoru. Program umí přepisovat audio nahrávky z diktafonů

Jak dosahovat nejlepších výsledků při diktováni aneb boj o každé procento

Systém pro rozpoznávání hlasu se stále učí Hlavní problémy rozpoznávání řeči Komunikace řečí - pro člověka přirozená věc, pro počítač velmi komplikovaná úloha Systém pro rozpoznávání hlasu se stále učí 1. HLAS - Variabilita hlasového projevu, každý člověk mluví jinak (výška hlasu, podoba hlásek, intonace, výslovnost, volba slov, momentální stav, prostředí ...) 2. SLOVNÍK - Rozsáhlost slovní zásoby (Angličtina 50 tis. slov, Čeština > 1 milion) Systém rozpoznává jednotlivá slova, mnoho stejně znějících slov („byly“, „bily“, „Billy“ …), 250 000 příjmení v ČR, místopisné názvy apod. V současnosti systém rozpozná 500.000 slov, slovo které není ve slovníku systém nikdy nepřepíše

Text: Až se vrátíš, zavolej jako včera na linku pět šest sedm. Hlavní problémy rozpoznávání řeči 3. KONTEXT - Volba nejpravděpodobnější sekvence po sobě jdoucích slov (odlišná témata) chybí oddělovače (pauzy) mezi slovy, dochází ke koartikulaci, asimilaci, Text: Až se vrátíš, zavolej jako včera na linku pět šest sedm. Text bez mezer: ažsevrátíšzavolejjakovčeranalinkupětšestsedm Foneticky: ašsevrátížzavolejakofčeranalinkupěčesedum 4. PROSTŘEDÍ - Vliv prostředí a přenosové cesty – degradace signálu hluk okolí, vlastnosti přenosové linky (mikrofon/diktafon), další mluvící osoby, ruchy, šumy…

Co bylo řečeno a v jakých časových okamžicích? Princip rozpoznávání řeči Co bylo řečeno a v jakých časových okamžicích? | - | zavolá | - | premiéra | předseda | - | | - | za | vola | premiéra | předsedá | - | |-| zvolá | prima | éra | před | sebou | - | | - | zavolej | premiéra | předsedo | - | | - | zavolá | - | premiér | a | předseda | - | Při rozpoznávání spojité řeči není apriori známo: Kolik slov bylo řečeno? Jaká sekvence slov byla řečena? Byla všechna vyřčená slova ze slovníku? Byla to skutečně jenom řeč nebo i další zvuky a hluky? V jakých časových okamžicích začínala jednotlivá slova?

Zkušenosti s programem Program na každého reaguje jinak, ale obecný právní text přepíše bez větších chyb. Pokud tomu tak není je někde problém (mikrofon, charakteristika hlasu, nastavení (muž/žena), slovník) Nelze program jen zapnout a mluvit (existují vyjímky), je potřeba nalézt správný způsob diktování (intonace, plynulost,...) . Naučit se ideální způsob diktování trvalo zkušeným soudcům a advokátům několik hodin. Tato časová investice se však velmi rychle vrátila v úspoře času. Některá slova (věty) program nemá šanci rozpoznat Nejčastější chyba - my čekáme co program napíše, program čeká co řekneme Pro první seznámení doporučujeme přečíst známý text (nedívat se na monitor)

Systém pro rozpoznávání hlasu se stále učí Budoucnost Systém pro rozpoznávání hlasu se stále učí Na vylepšení programu nepřetržitě pracujeme Vaše zpětná vazba je pro nás velmi důležitá, své náměty přípomínky zasílejte na mail info@diktovani.cz. Každé další rozpoznané procento šetří čas. (stále vylepšujeme, HLAS, SLOVNÍK, VAZBY SLOV) Anonymizované texty zvýší úspěšnost rozpoznávání (místopisné názvy, často používané formulace, apod.) Úspěšnost rozpoznávání zvýší také doslovně přepsané audio nahrávky

REFERENCE Ministerstvo spravedlnosti - projekt pro všechny soudy a státní zastupitelství v ČR (přes 1.600 licencí) Inspekce životního prostředí – celostátní projekt pro všechny inspektoráty inspekce Česká národní banka - implementace systému přepisovacího pracoviště NEWTON Media, a.s. - projekt přepisu rozhlasového a televizního vysílání, titulkování TV Ministerstvo vnitra Česká zemědělská univerzita 1. a 3. Lékařská fakulta Univerzita Karlova Masarykova univerzita v Brně Všeobecná fakultní nemocnice v Praze EU-Media - EURActiv.cz IKEM - Institut Klinické a Experimentální Medicíny Poliklinika Budějovická Oblastní nemocnice Mladá Boleslav, a.s. Poliklinika Prosek Masarykova nemocnice v Ústí nad Labem Revmatologický ústav Mammacentrum, Praha MEDICON, a.s. Nemocnice Prachatice, a.s ACHK - Ambulantní centrum pro choroby hlavy a krku, s.r.o. Gymnázium, ZŠ a MŠ pro sluchově postižené, Praha Metropolitní univerzita Praha Manlomka, s.r.o., chráněná dílna

Ing. Petr Herian Ing. Magdaléna Nekolná Děkuji za pozornost www.diktovani.cz Ing. Petr Herian                                             Ing. Magdaléna Nekolná