Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv.

Slides:



Advertisements
Podobné prezentace
Projekt Informatika 2 ČVUT FSV obor Geodézie a Kartografie Bc. Jan Zajíček
Advertisements

Cvičení 1 Data pro experimentální práci
MARKOVSKÉ ŘETĚZCE.
Algoritmy a struktury meuropočítačů ASN – C2
Mechanika s Inventorem
SMS brána Eurotel Jednoduché OCR pomocí neuronových sítí Marek Kukačka
Aplikace teorie grafů Základní pojmy teorie grafů
Úvod Klasifikace disciplín operačního výzkumu
Hledání začátků exonů v DNA Klára Pešková, Michal Bída.
Topologie neuronových sítí (struktura, geometrie, architektura)
Aplikační počítačové prostředky X15APP MATLAB - SIMULINK
ASN - cvičení 2 : Ukázky práce s NN-Toolboxem
SSC - cvičení 7 Aplikace programového systému Speech Laboratory - SL Postup: 1.Zkopírovat z adresy
LVQ – Learning Vector Quantization
SSC - cvičení 3 MATLAB - BPG algoritmus 1.Vytvořit tréninková data 2.Vytvořit objekt sítě 3.Natrénovat síť 4.Simulace Funkce pro učení: learngd … základní.
Kalmanuv filtr pro zpracování signálů a navigaci
Rozložení EEG elektrod (10-20 system)
Algoritmy a struktury neuropočítačů ASN - P1 Prof.Ing. Jana Tučková,CSc. Katedra teorie.
Pro Nekonečno – RC Palouček
Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .
Využití umělých neuronových sítí k urychlení evolučních algoritmů
Rozpoznávání tištěných znaků pomocí LVQ sítí Neuronové sítě 2006/2007 Jan Hroník, Pavel Krč.
Komprese barev Jakub Gemrot Ondřej Burkert. Popis problému Běžné obrázky mají 16,7 mil. barev Běžné obrázky mají 16,7 mil. barev Problém: Jak je rozumně.
Medians and Order Statistics Nechť A je množina obsahující n různých prvků: Definice: Statistika i-tého řádu je i-tý nejmenší prvek, tj., minimum = statistika.
NEROVNOMĚRNÝ POHYB.
Tvorba prezentací v programu PowerPoint Autor: ing. Jaroslav Mochan
Neuronové sítě Jakub Krátký.
Vícevrstvé neuronové sítě.  Neuronové sítě jsou složeny z neuronů tak, že výstup jednoho neuronu je vstupem jednoho nebo více neuronů  Propojení neuronů.
Výstupy z GIS Pojmy a typy výstupů, aneb pro koho, co a jak Ing. Jiří Fejfar, Ph.D.
III. Řešení úloh v testech Scio z matematiky
1 Národní informační středisko pro podporu jakosti.
(předpisy zobrazující výsledek podle daného vzorce a zadaných dat)
Biometrické Bezpečnostní Systémy Filip Orság Technologie rozpoznání mluvčího.
Vyhledávání podobností v datech s využitím singulárního rozkladu
Audacity Filip Mečíř. O co se jedná Zvukový editor a rekordér Multiplatformní software-pro Windows, Mac i Linux.
Textový procesor (MS Word)
QT intervaly – metody detekce konce T vlny Jitka Jirčíková.
36NAN Semestrální práce Predikce ceny akcií dle dosavadního vývoje.
Datové typy a struktury
Dokumentace informačního systému
Analýza infromačního systému. Matice afinity ISUD matice – Insert (vkládání dat) – Select (výběr dat) – Update (aktualizace dat) – Delete (vymazání dat)
Neuronové sítě Jiří Iša
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Jan Šaršon Milan Jaška 1Dobývání znalostí, MFF UK, 2008.
Vektorová kvantizace (VQ) (Vector Quantization)
Speciální struktury číslicových systémů ASN – P9
Logika a umělá inteligence pro multi-agentní systémy Mobilní agent řízený neuronovou sítí.
Základy ALgoritmizace 6. cvičení. Program cvičení Kontrolní bod 1 zakončení grafického zápisu algoritmů - vývojových diagramů –identifikátory a proměnné.
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík, CSc.
Opakování k písemné práci. Zadání (2b)Vysvětlete jak by šlo použít LSQ učení pro rozpoznání vzoru A od vzorů B a C. Jak by vypadaly bipolární vstupy a.
ŘÍZENÍ DOPRAVY POMOCÍ SW AGENTŮ Richard Lipka, DSS
Analýza informačního systému. Podrobně zdokumentovaný cílový stav Paramentry spojené s provozem systému – Cena – Přínosy – Náklady a úspory – …
Metodika generování a ladění modelů neuronových sítí Ing. Martin MoštěkVŠB – Technická Univerzita Ostrava.
W i ref (t+1) = W i ref (t) + h ci (t) [X(t) - W i ref (t)], i Nc h ci (t) 0, t  proces konverguje Algoritmy a struktury neuropočítačů ASN – P3 SOM algoritmus.
Mgr. Karel FischerÚprava prezentace1 Změna použité šablony Ke změně šablony mohu použít jednu ze tří možností: a)Formát \ návrh snímku b)V panelu nástrojů.
Vzdělávací technologie Ing. Kateřina Kostolányová, Ph.D.
Algoritmy a struktury neuropočítačů ASN - P14 Hopfieldovy sítě Asociativní paměti rekonstrukce původních nezkreslených vzorů předkládají se neúplné nebo.
Dita Matesová, David Lehký, Zbyněk Keršner
Praktická využití UNS V medicínských aplikacích Jan Vrba 2006.
Práce pro profesionály Cvičíme se v MATLABu © Leonard Walletzký, ESF MU, 2003.
Cenová mapa podnájmů v Praze Ondřej Kmoch Tomáš Kohan
Neuronové sítě. Vývoj NS 1943 – W. McCulloch, W. Pittse – první jednoduchý matematický model neuronu 1951 – M. Minsky - první neuropočítač Snark 1957.
Programování v MATLABu © Leonard Walletzký, ESF MU, 2000.
Neuronové sítě.
Geografické informační systémy pojetí, definice, součásti
KIV/ZD cvičení 5 Tomáš Potužák.
Neuronové sítě.
Výpočetní složitost algoritmů
Neuronové sítě.
Algoritmizace a datové struktury (14ASD)
Transkript prezentace:

Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv zdravých dětí 15 různých variant každé hlásky od několika dětí doba trvání hlásky: jako medián z trvání všech variant pro každou hlásku: matice P k ij, i=Du k med, j=15, k=1,...,36. Vstupní data do MLNN: TREN MLNN hláska, na kterou má být daná síť natrénována (odpovídající target hodnota je „1“) 250 vektorů obsahujících náhodné úseky řeči neobsahují hlásku z první části (odpovídající target hodnota je „0“) přeřazení vektorů v náhodném pořadí 12 LPC koeficientů a chyba predikce Algoritmy a struktury neuropočítačů ASN – P8

UNS: 4 vrstvy aktivační funkce: hyperbolická tangenta Vyhledání jednotlivých hlásek postupné testování neuronových sítí z registru pomocí plovoucího okna --- přes celý signál výstup ze sítě nabývá hodnoty z intervalu rozhodovací mez zvolena experimentálně výstup mez překročí testovaný úsek = hláska na kterou byla testovaná neuronová síť natrénovaná

Segmentace pomocí SOM - 2 úrovně vstupní signál je přiveden do hlavní KSOM trénovaná na všechny hlásky podle umístění shluku vektorů s podobnými vlastnostmi je aktivována některá z vedlejších map Hlavní mapa klasifikuje „hrubě“. vedlejší mapy KSOM -- klasifikují přesněji o počtu a složení vedlejších map rozhoduje rozmístění shluků v hlavní KSOM KSOM : čtvercová, hrana 30 neuronů u hlavní mapy 15 (10) neuronů u vedlejší mapy funkce tvaru okolí vítězného neuronu: gaussian poloměr okolí: postupně se zmenšoval z 20 na 1 hlavní mapa z 10 na 1 vedlejší mapa počet interací: 10 tisíc

Parametrizace: 20 melovských kepstrálních koeficientů 16 ms segmenty s 50% překryvem Hammingovo okno 1-3 vektory o 20-ti elementech (v závislosti na trvání hlásky) Trénovací soubor TREN SOM Program: SEGANN – SEGmentation by ANN Matlab 7, NN Toolbox

Vytvoření a natrénování Kohonenových map. Vstup: struktura dat vytvořená v předchozím kroku. Výstup: struktura s natrénovanou mapou a struktura trénovacích dat ve formátu podle SOM Toolboxu. Obsahuje různé volby pro vytvoření a trénování KSOM jméno mapy, její rozměry, topologie a struktura mapy, způsob řazení dat v trénovací matici, možnost normování dat, způsob trénování, nastavení okolí vítězného neuronu, počet trénovacích epoch, nastavení funkce rychlosti učení. SEGANN – program pro fonémovou segmentaci Velký problém – souvisí s češtinou: při fonémové segmentaci a labelování je to počet souhlásek stojících vedle sebe např. krk, prst, mrtvá !!! Nejvíce explosívy obtížné určení hranic jsou velmi krátké Nárůst problémů: nedbalá výslovnost, narušená řeč

Okno pro segmentaci řeči Vstup: - natrénované Kohonenovy mapy - zvukový signál, který chceme segmentovat Výstup: textový soubor - stejný formát jako při ručním segmentování tři sloupce: fonetická transkripce, začátek hlásky ve vzorcích (od začátku wav ‑ souboru) doba trvání hlásky Graf: 8 oken aktuálně zpracovávaného signálu Nad jednotlivými okny je název hlásky, která byla v příslušném okně rozpoznána