Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv.

Slides:

Advertisements

Podobné prezentace

Projekt Informatika 2 ČVUT FSV obor Geodézie a Kartografie Bc. Jan Zajíček

Advertisements

Cvičení 1 Data pro experimentální práci

MARKOVSKÉ ŘETĚZCE.

Algoritmy a struktury meuropočítačů ASN – C2

Mechanika s Inventorem

SMS brána Eurotel Jednoduché OCR pomocí neuronových sítí Marek Kukačka

Aplikace teorie grafů Základní pojmy teorie grafů

Úvod Klasifikace disciplín operačního výzkumu

Hledání začátků exonů v DNA Klára Pešková, Michal Bída.

Topologie neuronových sítí (struktura, geometrie, architektura)

Aplikační počítačové prostředky X15APP MATLAB - SIMULINK

ASN - cvičení 2 : Ukázky práce s NN-Toolboxem

SSC - cvičení 7 Aplikace programového systému Speech Laboratory - SL Postup: 1.Zkopírovat z adresy

LVQ – Learning Vector Quantization

SSC - cvičení 3 MATLAB - BPG algoritmus 1.Vytvořit tréninková data 2.Vytvořit objekt sítě 3.Natrénovat síť 4.Simulace Funkce pro učení: learngd … základní.

Kalmanuv filtr pro zpracování signálů a navigaci

Rozložení EEG elektrod (10-20 system)

Algoritmy a struktury neuropočítačů ASN - P1 Prof.Ing. Jana Tučková,CSc. Katedra teorie.

Pro Nekonečno – RC Palouček

Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .

Využití umělých neuronových sítí k urychlení evolučních algoritmů

Rozpoznávání tištěných znaků pomocí LVQ sítí Neuronové sítě 2006/2007 Jan Hroník, Pavel Krč.

Komprese barev Jakub Gemrot Ondřej Burkert. Popis problému Běžné obrázky mají 16,7 mil. barev Běžné obrázky mají 16,7 mil. barev Problém: Jak je rozumně.

Medians and Order Statistics Nechť A je množina obsahující n různých prvků: Definice: Statistika i-tého řádu je i-tý nejmenší prvek, tj., minimum = statistika.

NEROVNOMĚRNÝ POHYB.

Tvorba prezentací v programu PowerPoint Autor: ing. Jaroslav Mochan

Neuronové sítě Jakub Krátký.

Vícevrstvé neuronové sítě.  Neuronové sítě jsou složeny z neuronů tak, že výstup jednoho neuronu je vstupem jednoho nebo více neuronů  Propojení neuronů.

Výstupy z GIS Pojmy a typy výstupů, aneb pro koho, co a jak Ing. Jiří Fejfar, Ph.D.

III. Řešení úloh v testech Scio z matematiky

1 Národní informační středisko pro podporu jakosti.

(předpisy zobrazující výsledek podle daného vzorce a zadaných dat)

Biometrické Bezpečnostní Systémy Filip Orság Technologie rozpoznání mluvčího.

Vyhledávání podobností v datech s využitím singulárního rozkladu

Audacity Filip Mečíř. O co se jedná Zvukový editor a rekordér Multiplatformní software-pro Windows, Mac i Linux.

Textový procesor (MS Word)

QT intervaly – metody detekce konce T vlny Jitka Jirčíková.

36NAN Semestrální práce Predikce ceny akcií dle dosavadního vývoje.

Datové typy a struktury

Dokumentace informačního systému

Analýza infromačního systému. Matice afinity ISUD matice – Insert (vkládání dat) – Select (výběr dat) – Update (aktualizace dat) – Delete (vymazání dat)

Neuronové sítě Jiří Iša

Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.

Jan Šaršon Milan Jaška 1Dobývání znalostí, MFF UK, 2008.

Vektorová kvantizace (VQ) (Vector Quantization)

Speciální struktury číslicových systémů ASN – P9

Logika a umělá inteligence pro multi-agentní systémy Mobilní agent řízený neuronovou sítí.

Základy ALgoritmizace 6. cvičení. Program cvičení Kontrolní bod 1 zakončení grafického zápisu algoritmů - vývojových diagramů –identifikátory a proměnné.

© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík, CSc.

Opakování k písemné práci. Zadání (2b)Vysvětlete jak by šlo použít LSQ učení pro rozpoznání vzoru A od vzorů B a C. Jak by vypadaly bipolární vstupy a.

ŘÍZENÍ DOPRAVY POMOCÍ SW AGENTŮ Richard Lipka, DSS

Analýza informačního systému. Podrobně zdokumentovaný cílový stav Paramentry spojené s provozem systému – Cena – Přínosy – Náklady a úspory – …

Metodika generování a ladění modelů neuronových sítí Ing. Martin MoštěkVŠB – Technická Univerzita Ostrava.

W i ref (t+1) = W i ref (t) + h ci (t) [X(t) - W i ref (t)], i Nc h ci (t) 0, t  proces konverguje Algoritmy a struktury neuropočítačů ASN – P3 SOM algoritmus.

Mgr. Karel FischerÚprava prezentace1 Změna použité šablony Ke změně šablony mohu použít jednu ze tří možností: a)Formát \ návrh snímku b)V panelu nástrojů.

Vzdělávací technologie Ing. Kateřina Kostolányová, Ph.D.

Algoritmy a struktury neuropočítačů ASN - P14 Hopfieldovy sítě Asociativní paměti rekonstrukce původních nezkreslených vzorů předkládají se neúplné nebo.

Dita Matesová, David Lehký, Zbyněk Keršner

Praktická využití UNS V medicínských aplikacích Jan Vrba 2006.

Práce pro profesionály Cvičíme se v MATLABu © Leonard Walletzký, ESF MU, 2003.

Cenová mapa podnájmů v Praze Ondřej Kmoch Tomáš Kohan

Neuronové sítě. Vývoj NS 1943 – W. McCulloch, W. Pittse – první jednoduchý matematický model neuronu 1951 – M. Minsky - první neuropočítač Snark 1957.

Programování v MATLABu © Leonard Walletzký, ESF MU, 2000.

Neuronové sítě.

Geografické informační systémy pojetí, definice, součásti

KIV/ZD cvičení 5 Tomáš Potužák.

Neuronové sítě.

Výpočetní složitost algoritmů

Neuronové sítě.

Algoritmizace a datové struktury (14ASD)

Transkript prezentace:

Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv zdravých dětí 15 různých variant každé hlásky od několika dětí doba trvání hlásky: jako medián z trvání všech variant pro každou hlásku: matice P k ij, i=Du k med, j=15, k=1,...,36. Vstupní data do MLNN: TREN MLNN hláska, na kterou má být daná síť natrénována (odpovídající target hodnota je „1“) 250 vektorů obsahujících náhodné úseky řeči neobsahují hlásku z první části (odpovídající target hodnota je „0“) přeřazení vektorů v náhodném pořadí 12 LPC koeficientů a chyba predikce Algoritmy a struktury neuropočítačů ASN – P8

UNS: 4 vrstvy aktivační funkce: hyperbolická tangenta Vyhledání jednotlivých hlásek postupné testování neuronových sítí z registru pomocí plovoucího okna --- přes celý signál výstup ze sítě nabývá hodnoty z intervalu rozhodovací mez zvolena experimentálně výstup mez překročí testovaný úsek = hláska na kterou byla testovaná neuronová síť natrénovaná

Segmentace pomocí SOM - 2 úrovně vstupní signál je přiveden do hlavní KSOM trénovaná na všechny hlásky podle umístění shluku vektorů s podobnými vlastnostmi je aktivována některá z vedlejších map Hlavní mapa klasifikuje „hrubě“. vedlejší mapy KSOM -- klasifikují přesněji o počtu a složení vedlejších map rozhoduje rozmístění shluků v hlavní KSOM KSOM : čtvercová, hrana 30 neuronů u hlavní mapy 15 (10) neuronů u vedlejší mapy funkce tvaru okolí vítězného neuronu: gaussian poloměr okolí: postupně se zmenšoval z 20 na 1 hlavní mapa z 10 na 1 vedlejší mapa počet interací: 10 tisíc

Parametrizace: 20 melovských kepstrálních koeficientů 16 ms segmenty s 50% překryvem Hammingovo okno 1-3 vektory o 20-ti elementech (v závislosti na trvání hlásky) Trénovací soubor TREN SOM Program: SEGANN – SEGmentation by ANN Matlab 7, NN Toolbox

Vytvoření a natrénování Kohonenových map. Vstup: struktura dat vytvořená v předchozím kroku. Výstup: struktura s natrénovanou mapou a struktura trénovacích dat ve formátu podle SOM Toolboxu. Obsahuje různé volby pro vytvoření a trénování KSOM jméno mapy, její rozměry, topologie a struktura mapy, způsob řazení dat v trénovací matici, možnost normování dat, způsob trénování, nastavení okolí vítězného neuronu, počet trénovacích epoch, nastavení funkce rychlosti učení. SEGANN – program pro fonémovou segmentaci Velký problém – souvisí s češtinou: při fonémové segmentaci a labelování je to počet souhlásek stojících vedle sebe např. krk, prst, mrtvá !!! Nejvíce explosívy obtížné určení hranic jsou velmi krátké Nárůst problémů: nedbalá výslovnost, narušená řeč

Okno pro segmentaci řeči Vstup: - natrénované Kohonenovy mapy - zvukový signál, který chceme segmentovat Výstup: textový soubor - stejný formát jako při ručním segmentování tři sloupce: fonetická transkripce, začátek hlásky ve vzorcích (od začátku wav ‑ souboru) doba trvání hlásky Graf: 8 oken aktuálně zpracovávaného signálu Nad jednotlivými okny je název hlásky, která byla v příslušném okně rozpoznána