Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Využití technik dataminingu při rozpoznávání znaků Marek Kukačka Květen 2006
2
Jak vypadá lehký problém.. Data získána z SMS brány Eurotelu
3
Řešení jednoduchého problému Vrstevnaté neuronové sítě –Učené algoritmem back-propagation –Výsledná úspěšnost rozpoznávání: 98% Kompetiční sítě –Ekvivalentní klastrování metodou k středů –Výsledná úspěšnost rozpoznávání: 98%
4
A teď těžký problém.. Data získána z SMS brány Vodafonu
5
Rozdělení procesu rozpoznávání Vstupní data Předzpracování Samotné rozpoznávání Výstup: klasifikace
6
Vstupní data Předzpracování Samotné rozpoznávání Výstup: klasifikace Rozdělení procesu rozpoznávání Pro jednoduchý problém: - získaný obrázek - rozdělit na znaky - normalizovat velikost - data nacpat do vrstevnaté neuronové sítě - výstup sítě převést na rozpoznaný znak
7
Vstupní data Předzpracování Samotné rozpoznávání Výstup: klasifikace Rozdělení procesu rozpoznávání Pro těžký problém: − získaný obrázek − odstranit pozadí − odstranit šum − rozdělit na znaky − normalizovat velikost ? normalizovat orientaci ? − data nacpat do vrstevnaté neuronové sítě −výstup sítě převést na rozpoznaný znak
8
Využití technik dataminingu.. konečně Při předzpracování –Statistické metody – standartní odchylka –PCA analýza – pro normalizaci orientace znaků Při rozpoznávání –Shluková analýza –Kompetiční sítě, učené algoritmem LVQ1 –Vrstevnaté neuronové sítě
9
Předzpracování podle standartní odchylky Red Green Blue
10
Principal Component Analysis Použito pro otočení znaků na jednotnou orientaci Bohužel, většina znaků je spíš čtvercových..
11
Shluková analýza Pokusy o klasifikaci metodou nejbližšího souseda, k-nejbližších sousedů, k-středů, algoritmem LVQ1 Výsledek: nízká úspěšnost (zhruba 30%), malé vylepšení pouze za cenu přílišného růstu dat sítě
12
Vrstevnaté neuronové sítě Předzpracovaná data lze klasifikovat pomocí neuronové sítě, naučené algoritmem back-propagation Ovšem učení této sítě je značně zdlouhavé – desítky minut
13
Výsledky Při použití neuronové sítě pro rozpoznání znaků na třech obrázcích se stejným kódem bylo dosaženo úspěšnosti 60%.. což je zatím nejlepší výsledek pro tento problém, ke kterému jsem došel..
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.