Algoritmy a struktury neuropočítačů ASN – P6 Syntéza neuronových sítí Optimalizace struktury Klestění neuronové sítě Výběr vstupních dat Syntéza „zdola“

Slides:



Advertisements
Podobné prezentace
PLAYBOY Kalendar 2007.
Advertisements

Lineární klasifikátor
CIT Paměti Díl X.
Podpora personálních procesů v HR Vema Jaroslav Šmarda
TEORIE ROZHODOVÁNÍ A TEORIE HER
Dynamické systémy.
OBECNÉ OPTIMALIZAČNÍ MODELY
Dualita úloh lineárního programování a analýza citlivosti
Vlastní skript může být umístěn: v hlavičce stránky v těle stránky
M A N A G E M E N T 3 Akad. rok 2009/2010, Letní semestr
1 Projektová dynamika II RNDr. Jiří Weinberger, TIMING Praha 28. Března 2008.
Kvantitativní metody výzkumu v praxi
Testování statistických hypotéz
Mechanika s Inventorem
CIT Sekvenční obvody Díl VI.
Úvod Klasifikace disciplín operačního výzkumu
Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv.
SQL – tříhodnotová logika
SSC - cvičení 7 Aplikace programového systému Speech Laboratory - SL Postup: 1.Zkopírovat z adresy
1 Metoda GENEROVÁNÍ SLOUPCŮ a její použití v celočíselném programování Jan Fábry.
Algoritmy a struktury neuropočítačů ASN - P1 Prof.Ing. Jana Tučková,CSc. Katedra teorie.
ROZHODOVACÍ PROCESY PRO VÍCECESTNÉ TELEMATICKÉ APLIKACE Filip Ekl
Dynamické rozvozní úlohy
Elektrický obvod a jeho části
Návrh a optimalizace filtru OTA-C s využitím evolučních algoritmů Praha 2007 Bc. Dalibor Barri ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická.
Medians and Order Statistics Nechť A je množina obsahující n různých prvků: Definice: Statistika i-tého řádu je i-tý nejmenší prvek, tj., minimum = statistika.
Vizualizace projektu větrného parku Stříbro porovnání variant 13 VTE a menšího parku.
Dělení se zbytkem 3 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
Základní číselné množiny
VÍCEKRITERIÁLNÍ ROZHODOVÁNÍ I.
Neuronové sítě Jakub Krátký.
Získávání informací Získání informací o reálném systému
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
1 Hodnocení geologických dat pomocí matematické statistiky Petr Čoupek 740/742/ IT spec.
Lenka Fialová Martina Procházková Ondřej Soukup Martin Valenta Cyril Vojáček 1.
Pravděpodobnost a statistika opakování základních pojmů
Jazyk vývojových diagramů

Geo-informační systémy
1 Národní informační středisko pro podporu jakosti.
Stručný obsah 5. přednášky
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
LOGICKÉ ŘÍZENÍ GEORGE BOOLE
Pojmy a interpretace.
Systémy pro podporu managementu 2
Jazyk vývojových diagramů
ANALÝZA VÝSLEDKŮ LINEÁRNÍHO OPTIMALIZAČNÍHO MODELU
Podnikové informační systémy C7 – Data Mining a získávání znalostí České vysoké učení technické v Praze Fakulta strojní ústav Řízení a ekonomiky podniku.
Přednost početních operací
TRUHLÁŘ I.ročník Výrobní zařízení Střední škola stavební Teplice
Dokumentace informačního systému
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Makrozoobentos a klasifikace toků Jarkovský J. 2,3, Kubošová K. 2,3, Zahrádková S. 1, Brabec K. 1, Kokeš J. 4, Klapka R. 2,3 1) Ústav botaniky a zoologie,
Metrologie   Přednáška č. 5 Nejistoty měření.
Opakování lekce 4,5,
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
W i ref (t+1) = W i ref (t) + h ci (t) [X(t) - W i ref (t)], i Nc h ci (t) 0, t  proces konverguje Algoritmy a struktury neuropočítačů ASN – P3 SOM algoritmus.
Algoritmy a struktury neuropočítačů ASN - P14 Hopfieldovy sítě Asociativní paměti rekonstrukce původních nezkreslených vzorů předkládají se neúplné nebo.
Praktická využití UNS V medicínských aplikacích Jan Vrba 2006.
Neuronové sítě.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Databázové systémy přednáška 13 – Analýza a reporting
Úvod do praktické fyziky
Metody strojového učení
Neuronové sítě.
Neuronové sítě.
Transkript prezentace:

Algoritmy a struktury neuropočítačů ASN – P6 Syntéza neuronových sítí Optimalizace struktury Klestění neuronové sítě Výběr vstupních dat Syntéza „zdola“ N < N krit nevýhoda : při malé volbě N krit je proces dlouhodobý otázky: 1. které prvky přidat 2. na kterém místě je přidat Syntéza neuronových sítí N je počet neuronů kanonické N=N krit dělení soustav subkanonické N < N krit redundantní N > N krit N krit většinou předem neznáme

Opakování procesu syntézy s doplněnými parametry Další volba doplňkových parametrů Jsou požadavky na transformační funkci splněny? Syntéza sítě s doplňkovými parametry Výběr doplňkových parametrů Výchozí subkanonický návrh neuronové sítě Výsledná síť NE ANO Syntéza „shora“ N > N krit nevýhoda: neekonomické řešení redukce klestění (pruning) kritérium pro volbu parametrů vysoce redundantní ( nekanonické, nadbytečné) biologické sítě nízká citlivost Syntéza zdola

Výchozí redundantní návrh NN Volba kritéria klestění Vyklestění zvolených parametrů Kontrolní analýza vlastností vyklestěné sítě Nevyhovuje - je nutno zmenšit počet vyklestěných parametrů a proces opakovat Vyhovuje - je možné se pokusit o zvýšení počtu vyklestěných parametrů Syntéza shora

Klestění a optimalizace NN Většina NN je vysoce redundantní (obsahuje nadbytečný počet neuronů) Co je klestění ? Postupné nebo jednorázové vyloučení nadbytečných prvků a synaptických vazeb. Co klestit ? synaptické spoje neurony parametry aktivačních funkcí prahy Optimalizace Heuristické pravidlo počet dat 10 krát počet parametrů Základní neuronová síť Klestění Podle citlivosti Podle velikosti parametrů Toleranční analýza

Optimalizace NN výběr parametrů (feature selection) určování důležitých parametrů, které mají vliv na nějakou význačnou vlastnost systému (prozodii, zdravotní stav pacientů) Jak? pomocí statistických metod - nejčastěji pomocí UNS - nejlépe pomocí metod matematické logiky získávání znalostí z dat (data mining) – z experimentálních dat Data Mining proces umožňující nalezení nových informací nebo ověření vzájemných vztahů ve velkých databázích, např. v obchodě bankovnictví, pojišťovnictví… pomocí neuronových sítí (často Kohonenových) pomocí fuzzy – logických obvodů, kombinovaných fuzzy neuronových sítí pomocí metody založené na matematické logice a statistice GUHA

Optimalizace struktur výběr množiny vzorů správné přiřazení hodnot parametrů protiklad : potřeba velkého počtu vzorů - velký počet vstupních neuronů co nejkratší doba trenování Počet neuronů ve vstupní vrstvě: vyhledávání markerů - hledání parametrů nejvíce ovlivňujících výstupní hodnoty; souvisí s velikostí vstupní vrstvy Počet neuronů ve výstupní vrstvě: je dán požadavkem na výstupní veličiny Počet neuronů ve skrytých vrstvách: není přesně určen obvykle větší počet na začátku učení, po naučení se některé extrahují; během tohoto procesu je třeba sledovat vývoj chybové funkce (nesmí dojít k jejímu vzrůstu) Hledáme kanonické sítě.

Postup klestění : nalezení vah alespoň o řád menší než je jejich střední hodnota pokud takové váhy existují, vyklestit je a síť přetrénovat vlastnosti se nezhorší (podstatně), pak rozbor citlivostí na parametry s nejmenšími hodnotami parametry s malými citlivostmi vyklestíme přeučení sítě z hodnot vah a prahů z předchozího opakování procesu kroku Klestění synaptických vah váhy s minimálními hodnotami podle citlivostí (velmi obtížné) – viz [SAN05] - SpeechLab Pozor! I malé změny některého parametru (malé citlivosti) mohou mít sice malý vliv na výslednou transformační funkci, ale úplné vyklestění může zásadně ovlivnit konečnou funkci.

GUHA metoda General Unary Hypotheses Automaton Zpracovává data formou rectangulární matice: různé objekty, parametry - řádky (např. hlásky) zkoumané vlastnosti - sloupce (např. základní kmitočet, trvání hlásky) Počet hypotéz vypovídá o důležitosti jednotlivých parametrů. Optimalizace struktury x1x1 x2x2 xnxn Y1Y1 Y2Y2 Vstupní vrstva Skrytá vrstva Výstupní vrstva Data Mining (GUHA) Klestění Redukce vstupních parametrů

Principy byly formulovány v r.1966 v publikaci [HAJ66]. Autory byli P. Hájek, I.Havel a Chytil. Autory teoretického a praktického rozvoje základních principů metody jsou P. Hájek a T.Havránek (1978). GUHA je založena na počítačovém generování všech možných hypotéz, které berou v úvahu souvislosti mezi zpracovávanými daty. Hypotézy popisují vztahy mezi vlastnostmi objektů. Během let došlo k mnoha změnám:  vylepšení počítačů  praktické aplikace v nejrůznějších oblastech lidského počínání. Není masově rozšířena pro svoji náročnost. GUHA Rozdělení vlastností:  antecedenty (např. charakteristické vlastnosti češtiny) vstupní parametry

 succedenty (např. F0 a trvání) výstupní parametry Program generuje a porovnává hypotézy o vztazích A S A … souvislost mezi antecedenty S … souvislost mezi succedenty … implikace (pro odhad podmíněné pravděpodobnosti P(S|A)  Je třeba specifikovat počet elementů v antecedentech a succedentech.  V souhlasu s počtem věrohodných hypotéz můžeme určit důležitost vstupních parametrů.  Definice jednotlivých kvantifikátorů je založena na statistických testech, ale jejich interpretace není statistická.

Počet hypotéz v závislosti na korelacích mezi vstupními parametry – příklad.

P #hyp. F 0 # hyp. D # hyp. celkem P #hyp. F 0 # hyp. D # hyp. celkem P1P P P2P P P3P P P4P P P5P P P6P P P7P P P8P P P9P P P P P P P P P P P P P P P … parametr Limit je 300 hypotéz, lze eliminovat parametry P1, P4, P22, P23 a všechny od P25 do P30 Počet hypotéz o vztahu vstupních a výstupních parametrů

Vyloučení parametru podle počtu hypotéz P 11 P vstupních parametrů P 13 P 1 18 vstupních parametrů - optimální P 19 P vstupních parametrů Nutné vždy ověřit!!! UNS Počáteční stav Optimální stav # neuronů ve vrstvách # neuronů# vah Důsledky optimalizace Literatura: [HAJ95] Hajek,P.,Sochorova,A.,Zvarová,J.:GUHA for personal computers., Computational Statistics and Data Analysis, Vol.19, 1995, North Holland, pp [SEB01] Sebesta,V.,Tuckova,J.:Application of Feature Extraction in Text-to-Speech Processing. Proc. of ICANGA-Int. Conf. on Artificial Neural Nets and Genetic Algorithms, Springer-Verlag/Wien, ISBN , Prague, April 2001, pp [SAN05] Santarius, J.: Systémy pro modelování prozódie syntetické řeči. Disertační práce, FEL ČVUT v Praze, 2005.

Data Mining  dobývání znalostí z dat  dolování dat  vytěžování dat Získávají se skryté, předem neznámé informace z dat, cílem je praktická využitelnost výsledků. Úlohy Data Miningu (nejčastější):  klasifikace  predikce  shluková analýza  analýza závislostí Metody:  expertní systémy a rozhodovací stromy  grafické a statistické techniky  neuronové sítě (např. KSOM a jeho varianty) pro mnoho typů úloh (i složitých) dlouhá doba učení potřeba velkého množství vzorů  genetické algoritmy