Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Cvičení 1 Data pro experimentální práci. Potřeba dat Data pro:trénování akustického modelu experimenty, testování, vyhodnocování Práce s daty v HTK Trénovací.

Podobné prezentace


Prezentace na téma: "Cvičení 1 Data pro experimentální práci. Potřeba dat Data pro:trénování akustického modelu experimenty, testování, vyhodnocování Práce s daty v HTK Trénovací."— Transkript prezentace:

1 Cvičení 1 Data pro experimentální práci

2 Potřeba dat Data pro:trénování akustického modelu experimenty, testování, vyhodnocování Práce s daty v HTK Trénovací nástroje Trén. nahrávkyPřepisy Modely Testovací nástroje Test. nahrávkyAut. přepisy Referenční přepisySkóre

3 Trénovací data pro fonémový akustický model Požadavky: •záznamy řeči v prostředí podobném cílové aplikaci •nahrávky musí obsahovat všechny fonémy (nejlépe s odpovídající frekvencí) •nahrávky musí pocházet od co největšího počtu osob •nahrávky musí být textově a akusticky různorodé •nahrávky by měly být foneticky jednoznačné (např. bez přeřeků) •naždá nahrávka musí být foneticky správně a přesně přepsána Ke každé nahrávce musí existovat 3 soubory (jména bez diakritiky!) 1.zaznam1.wav (nahrávka) 2.zaznam1.txt (textový přepis)K obědu si dám pizzu a džůs. 3.zaznam1.phn (fonetický přepis)- k objedu si dám picu a Čús -

4 Jak zvolit a nahrávat trénovací věty 1.Vytvořit seznam 100 vět. 2.Věty by měly být snadno vyslovitelné, nejlépe najednou (bez pauzy). 3.Ideální věty obsahují 5 – 8 slov, číslovky jsou rozepsány. 4.Věty lze brát z tisku či z jiných zdrojů (vyvarovat se cizích slov). 5.Ve větách by se měly objevit všechny fonémy, ty nejméně časté alespoň 2 x. (Seznam fonémů na následující stránce.) 6.K nahrávání použít vhodný software (Audacity), dobrý mikrofon. 7.Nastavit si 16 kHz a 16 bit!!! 8.Větu si přečíst a pak v klidu nahrát. Zajistit, aby před řečí bylo cca 0,5 sekundy ticha, totéž za větou. 9.Uložit pod správným jménem *.wav a *.txt. 10.Vytvořit ke každé větě fonetický přepis – pozor na „y“, „ě“, „ďi“, „X“ 11.Pozor též na spodobu „muž je“ -> „muš je“ale „muž byl“ -> „muž bil“

5 Fonémy v češtině – česká fonetická abeceda Nouza, J., Psutka, J., Uhlíř, J.: Phonetic Alphabet for Speech Recognition of Czech. In: Radio Engineering, vol. 6, no. 4, December 1997, pp


Stáhnout ppt "Cvičení 1 Data pro experimentální práci. Potřeba dat Data pro:trénování akustického modelu experimenty, testování, vyhodnocování Práce s daty v HTK Trénovací."

Podobné prezentace


Reklamy Google