Využití technik dataminingu při rozpoznávání znaků Marek Kukačka Květen 2006
Jak vypadá lehký problém.. Data získána z SMS brány Eurotelu
Řešení jednoduchého problému Vrstevnaté neuronové sítě –Učené algoritmem back-propagation –Výsledná úspěšnost rozpoznávání: 98% Kompetiční sítě –Ekvivalentní klastrování metodou k středů –Výsledná úspěšnost rozpoznávání: 98%
A teď těžký problém.. Data získána z SMS brány Vodafonu
Rozdělení procesu rozpoznávání Vstupní data Předzpracování Samotné rozpoznávání Výstup: klasifikace
Vstupní data Předzpracování Samotné rozpoznávání Výstup: klasifikace Rozdělení procesu rozpoznávání Pro jednoduchý problém: - získaný obrázek - rozdělit na znaky - normalizovat velikost - data nacpat do vrstevnaté neuronové sítě - výstup sítě převést na rozpoznaný znak
Vstupní data Předzpracování Samotné rozpoznávání Výstup: klasifikace Rozdělení procesu rozpoznávání Pro těžký problém: − získaný obrázek − odstranit pozadí − odstranit šum − rozdělit na znaky − normalizovat velikost ? normalizovat orientaci ? − data nacpat do vrstevnaté neuronové sítě −výstup sítě převést na rozpoznaný znak
Využití technik dataminingu.. konečně Při předzpracování –Statistické metody – standartní odchylka –PCA analýza – pro normalizaci orientace znaků Při rozpoznávání –Shluková analýza –Kompetiční sítě, učené algoritmem LVQ1 –Vrstevnaté neuronové sítě
Předzpracování podle standartní odchylky Red Green Blue
Principal Component Analysis Použito pro otočení znaků na jednotnou orientaci Bohužel, většina znaků je spíš čtvercových..
Shluková analýza Pokusy o klasifikaci metodou nejbližšího souseda, k-nejbližších sousedů, k-středů, algoritmem LVQ1 Výsledek: nízká úspěšnost (zhruba 30%), malé vylepšení pouze za cenu přílišného růstu dat sítě
Vrstevnaté neuronové sítě Předzpracovaná data lze klasifikovat pomocí neuronové sítě, naučené algoritmem back-propagation Ovšem učení této sítě je značně zdlouhavé – desítky minut
Výsledky Při použití neuronové sítě pro rozpoznání znaků na třech obrázcích se stejným kódem bylo dosaženo úspěšnosti 60%.. což je zatím nejlepší výsledek pro tento problém, ke kterému jsem došel..