Cvičení 1 Data pro experimentální práci

Slides:



Advertisements
Podobné prezentace
ON-LINE TESTY PRO DOKTORANDY NA UK FF PRAHA
Advertisements

Webkamera A její využití.
Vlastní skript může být umístěn: v hlavičce stránky v těle stránky
Zakázkově vytvořená aplikace Technologický software HTH8 s.r.o, Eimova 880, Polička, tel.: , fax: ,
Ostatní vnitřní komponenty
Kvantitativní metody výzkumu v praxi
Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv.
SSC - cvičení 7 Aplikace programového systému Speech Laboratory - SL Postup: 1.Zkopírovat z adresy
Výpočetní technika Akademický rok 2006/2007 Letní semestr Mgr. Petr Novák Katedra informatiky a geoinformatiky FŽP UJEP
Hromadná korespondence
Architektury a techniky DS Cvičení č. 4 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
Databázové systémy 1 Cvičení č. 6 Fakulta elektrotechniky a informatiky Univerzita Pardubice.
Tutorial Zobrazení článku na EBSCOhost rozhraní
Hardwarová implementace Petriho sítí Vlastní HW implementace a syntéza.
Multimédia ve vzdělávání ZVUK
Textový editor 11 Styly.
Úvodní hodina informace k předmětu ICT Úvodní hodina informace k předmětu ICT Ing. Pavel Kraják Místnost 222 linka 274.
17.Tabulkový procesor (filtrování a řazení dat, formuláře, podmínky a podmíněné formátování, export a import dat) Barbora Skoumalová 4.A.
Textový procesor Open Office, Writer OKRAJE STRÁNKY
Richard Lipka Katedra informatiky a výpočetní techniky Fakulta aplikovaných věd Západočeská univerzita, Plzeň 1.
Anotace Žák se seznámí s prostředím aplikace MS Word Autor Petr Samec Jazyk Čeština Očekávaný výstup Orientuje se v prostředí aplikace MS Word Speciální.
IT Session Two Lessons Three and Four. Outline  IT Test 1  International Phonetic Alphabet  IPA – Interactive chart  Exercise 1  Český národní korpus.
4IT445 – Testování a ladění v PHP Ing. Jan Mittner
Gymnázium, SOŠ a VOŠ Ledeč nad Sázavou I NFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE Ing. Jan Roubíček.
Audacity Filip Mečíř. O co se jedná Zvukový editor a rekordér Multiplatformní software-pro Windows, Mac i Linux.
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
Výsledky a srovnání systémů pro detekci klíčových slov v telefonních hovorech Vysoké učení technické v Brně Lukáš Burget, Tomáš Cipr, Honza.
Atmosféra – montáž zvuku VY_32_INOVACE_Mul4r0113Mgr. Jiří Mlnařík.
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
KIV/ZIS cvičení 6 Tomáš Potužák. Pokračování SQL Klauzule GROUP BY a dotazy nad více tabulkami Stáhnout soubor studenti_dotazy_sql.mdb.
Jan Majer, Tomáš Pytlík, Tomáš Vondráček IKE D o k u m e n t o g r a f i c k é i n f o r m a č n í s y s t é m y.
Principy posuzování kvality software podle ČSN ISO/IEC Praha Ing
 Hlavním smyslem citování je zachytit myšlenkové vazby mezi originálním textem a použitými myšlenkami z jiných zdrojů [Boldiš, 2002].  dokázat vlastní.
Košík – tisk/export záznamů Řazení záznamů – záznamy v košíku lze seřadit podle různých kritérií v liště řazení – název, první autor atd. Záznamy, které.
Úvod do počítačové grafiky
KASKÁDOVÉ STYLY 1. 2 PRVNÍ STANDARD (CSS1) BYL PŘEDSTAVEN V ROCE 1996, PROTO STARŠÍ PROHLÍŽEČE ("ČTYŘKOVÉ" VERZE) IE A NN KASKÁDOVÉ STYLY NEPODPORUJÍ.
Práce se šablonami v MS Word 2007
Zápatí a záhlaví, okraje stránky, číslování stránek
Power Point– popis prostředí
Databázové systémy I Cvičení č. 10 Fakulta elektrotechniky a informatiky Univerzita Pardubice 2013.
Realtime identifikace osob podle hlasu
5. Prezentace výsledků experimentální práce
Databázové modelování
Základy syntaxe jazyka PHP PHP JE TECHNOLOGIE BĚŽÍCÍ NA SERVERU. PHP JE TECHNOLOGIE BĚŽÍCÍ NA SERVERU. Typický PHP skript obsahuje: Typický PHP skript.
MS Word Hromadná korespondence v MS Word 2007.
Multimédia Multimediální prezentace Ročník: 8 Předmět: Informační a komunikační technologie Učitel: Vojtěch Novotný Téma: Multimédia 1 Ověřeno ve výuce:
Microsoft SQL server Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T.G. Masaryka, Kostelec nad Orlicí.
Jak učit tvorbu www stránek Navarová Adéla. Proč učit tvorbu www stránek? Prezentace na internetu (Výrobky, firmy, celebrity, kluby…)
MorČe morfologické značkování češtiny
Univerzita třetího věku kurz Pokročilý Multimedia – Obrázky, Video a Hudba.
INTERNET INFORMATIKA 5. TŘÍDA. Internet si volně můžeme vyložit jako sít, která vzájemně propojuje počítače po celém světě. Někdy se také internet označuje.
Inovace bakalářského studijního oboru Regenerace a výživa ve sportu Možnosti e-learningových nástrojů.
filtrování a řazení dat, podmíněné formátování,
Univerzita třetího věku kurz Pokročilý Tabulkový procesor 4.
Kontrola pravopisu Daniel Zeman Počítačové zpracování češtiny.
PROGRAMY PRO ZPRACOVÁNÍ ZVUKU MARTIN BÁRTA. Obsah tématu  Rozdělení funkcí v nahrávacím řetězci  Nahrávání a editace  Postprodukce  Mastering  Software.
GORDIC ® spol. s r. o. Prvotní spuštění aplikace Gordic DSO - ISDSlite Nástroje pro snadnou správu Datových zpráv z Informačního systému Datových schránek.
Aplikace Přijímačky školní rok 2014/2015
Seznamy (databáze) v tabulkových kalkulátorech (Microsoft Office Excel, Open Office Calc, …)
Nechcete nikoho ochu­dit o svá moudra, názory a famózní řeč? PRESENT.ME.
SEEL - Partnership SEEL - Zvuk v Evropském E-Learningu ( DE02-KA ) Školení učitelů– Module 3: Důležité prvky podcastu SEEL Teacher Traininh.
Import dat Access (16). Projekt: CZ.1.07/1.5.00/ OAJL - inovace výuky Příjemce: Obchodní akademie, odborná škola a praktická škola pro tělesně.
Zvuk. Co je to zvuk Zvuk - jedná se o mechanické vlnění, které je schopen člověk vnímat a také rozlišovat. – Základní vlastností je frekvence, kterou.
Skenování obálek a obsahů v praxi NK ČR Seminář účastníků SK ČR,
Programy pro zpracování zvuku
KIV/ZD cvičení 10 Tomáš Potužák.
Daniel Zeman Počítačové zpracování češtiny Kontrola pravopisu Daniel Zeman
Přehled pro vytvoření šablony
Výpočetní technika Akademický rok 2008/2009 Letní semestr
Tradiční metodiky vývoje softwaru
Transkript prezentace:

Cvičení 1 Data pro experimentální práci

Potřeba dat Data pro: trénování akustického modelu experimenty, testování, vyhodnocování Práce s daty v HTK Trén. nahrávky Přepisy Trénovací nástroje Modely Testovací nástroje Test. nahrávky Aut. přepisy Referenční přepisy Skóre

Trénovací data pro fonémový akustický model Požadavky: záznamy řeči v prostředí podobném cílové aplikaci nahrávky musí obsahovat všechny fonémy (nejlépe s odpovídající frekvencí) nahrávky musí pocházet od co největšího počtu osob nahrávky musí být textově a akusticky různorodé nahrávky by měly být foneticky jednoznačné (např. bez přeřeků) naždá nahrávka musí být foneticky správně a přesně přepsána Ke každé nahrávce musí existovat 3 soubory (jména bez diakritiky!) zaznam1.wav (nahrávka) zaznam1.txt (textový přepis) K obědu si dám pizzu a džůs. zaznam1.phn (fonetický přepis) - k objedu si dám picu a Čús -

Jak zvolit a nahrávat trénovací věty Vytvořit seznam 100 vět. Věty by měly být snadno vyslovitelné, nejlépe najednou (bez pauzy). Ideální věty obsahují 5 – 8 slov, číslovky jsou rozepsány. Věty lze brát z tisku či z jiných zdrojů (vyvarovat se cizích slov). Ve větách by se měly objevit všechny fonémy, ty nejméně časté alespoň 2 x. (Seznam fonémů na následující stránce.) K nahrávání použít vhodný software (Audacity), dobrý mikrofon. Nastavit si 16 kHz a 16 bit!!! Větu si přečíst a pak v klidu nahrát. Zajistit, aby před řečí bylo cca 0,5 sekundy ticha, totéž za větou. Uložit pod správným jménem *.wav a *.txt. Vytvořit ke každé větě fonetický přepis – pozor na „y“, „ě“, „ďi“, „X“ Pozor též na spodobu „muž je“ -> „muš je“ ale „muž byl“ -> „muž bil“

Fonémy v češtině – česká fonetická abeceda Nouza, J., Psutka, J., Uhlíř, J.: Phonetic Alphabet for Speech Recognition of Czech. In: Radio Engineering, vol. 6, no. 4, December 1997, pp. 16-20.