W i ref (t+1) = W i ref (t) + h ci (t) [X(t) - W i ref (t)], i Nc h ci (t) 0, t proces konverguje Algoritmy a struktury neuropočítačů ASN – P3 SOM algoritmus – s učitelem i bez učitele U-matice Vektorová kvantizace - LVQ obecně - LVQ varianty SOM algoritmus funkce okolí Obvykle: h ci (t) = h(|| r c – r i ||) r c, r i poloha vektorů c, i Nejčastěji: h ci (t) = g(t), pro i N c h ci (t) = 0, pro i Nc
Adaptace W i ref (t+1) = W i ref (t) + g(t) [X(t) – W i ref (t)], i Nc W i ref (t+1) = W i ref (t), pro všechna ostatní i N c je zvolené okolí vítězného neuronu, t je okamžitý čas, g(t) je skalár představující rychlost učení (gains) 0 < g(t) < 1 přesnost mapování závisí na počtu iterací ( 500-krát více kroků než je neuronů v mapě) počet iterací je řádově 10 5 pro prvních 1000 iterací je obvykle g(t) konstantní, dále se monotónně snižuje (lineárně, exponenciálně, skokově,…) pouze doporučení
např. g(t) = 0.9 (1-t/1000), h ci (t) = g(t). exp {-[(|| r c – r i ||) 2 ]/ 2a 2 (t)} konečná hodnota kolem 0.01 Gaussovská funkce, a…šířka shluku nejlépe volba velikosti okolí N c = N c (t) malé okolí na začátku procesu neúplná mapa !!! minimálně 1/2 velikosti mapy SOM s učitelem nová varianta Kohonenova učení algoritmus učení je podobný SOM nové: do originálních trénovacích dat je přidán další parametr informace o třídě, do které vzorek náleží
dimenze vstupního vektoru se zvětší o počet tříd, do kterých chceme klasifikovat u každého tréninkového vektoru má jeden z nových parametrů hodnotu '1' (to odpovídá přidané třídě), ostatní mají hodnotu '0' Důvod: zlepšení klasifikace Příklad Topologie sítě je 12 x neuronů Trénování sítě: počet dětí je 20, věk 6-9 let, děvčata i chlapci trénují se samohlásky 1810 vektorů všech samohlásek Řečový korpus: děti ze ZŠ, nejsou rozděleny podle věku. Důvod experimentu: ověření hypotézy o posunu v „namapování“ samohlásek u nemocných dětí, případně dospělých jedinců Chyba na obrázcích je definována jako podíl (počet správných umístění) / (počet všech umístění) Jedná se o namapování konkrétní samohlásky do vokalického trojúhelníku vzniklého po natrénování promluv zdravých dětí.
Klasifikace samohlásky „a“ muže KSOM chyba 60% SOM s učitelem chyba 44% Počet testovacích vektorů : 95 a m … samohláska „a“ vyslovená mužem Správná klasifikace … bílá barva, chybná klasifikace … černá barva
Klasifikace samohlásky „a“ ženy KSOM chyba 43% SOM s učitelem chyba 40% Počet testovacích vektorů : 64 a z … samohláska „a“ vyslovená ženou Správná klasifikace … bílá barva, chybná klasifikace … černá barva
Klasifikace samohlásky „a“ zdravých dětí KSOM chyba 21% SOM s učitelem chyba 33% Počet testovacích vektorů : 44
Klasifikace samohlásky „a“ nemocného dítěte č.1 KSOM chyba 82% SOM s učitelem chyba 58% Počet testovacích vektorů : 25 a 1n … samohláska „a“ vyslovená nemocným dítětem č.1 správná klasifikace … bílá barva, chybná klasifikace … černá barva
Klasifikace samohlásky „a“ nemocného dítěte č.2 KSOM chyba 81% SOM s učitelem chyba 72% Počet testovacích vektorů : 47 a 2n … samohláska „a“ vyslovená nemocným dítětem č.2 správná klasifikace … bílá barva, chybná klasifikace … černá barva
Důvod: vizualizace shluků jsou zobrazeny vzdálenosti mezi neurony a jejich sousedy vzdálenost mezi sousedními neurony je po výpočtu znázorněna různými barvami tmavé barvy mezi neurony velké vzdálenosti reprezentují velké rozdíly (mezery) ve vstupním prostoru světlé barvy mezi neurony vektory jsou ve vstupním prostoru blízko sebe Světlé oblasti reprezentují clustery a tmavé oblasti reprezentují hranice clusterů. Clustery jsou snadněji identifikovatelné. U - matice matice sjednocených vzdáleností a) KSOM b) SOM s učitelem