Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Využití technik dataminingu při rozpoznávání znaků Marek Kukačka Květen 2006.

Podobné prezentace


Prezentace na téma: "Využití technik dataminingu při rozpoznávání znaků Marek Kukačka Květen 2006."— Transkript prezentace:

1 Využití technik dataminingu při rozpoznávání znaků Marek Kukačka Květen 2006

2 Jak vypadá lehký problém.. Data získána z SMS brány Eurotelu

3 Řešení jednoduchého problému Vrstevnaté neuronové sítě –Učené algoritmem back-propagation –Výsledná úspěšnost rozpoznávání: 98% Kompetiční sítě –Ekvivalentní klastrování metodou k středů –Výsledná úspěšnost rozpoznávání: 98%

4 A teď těžký problém.. Data získána z SMS brány Vodafonu

5 Rozdělení procesu rozpoznávání Vstupní data Předzpracování Samotné rozpoznávání Výstup: klasifikace

6 Vstupní data Předzpracování Samotné rozpoznávání Výstup: klasifikace Rozdělení procesu rozpoznávání Pro jednoduchý problém: - získaný obrázek - rozdělit na znaky - normalizovat velikost - data nacpat do vrstevnaté neuronové sítě - výstup sítě převést na rozpoznaný znak

7 Vstupní data Předzpracování Samotné rozpoznávání Výstup: klasifikace Rozdělení procesu rozpoznávání Pro těžký problém: − získaný obrázek − odstranit pozadí − odstranit šum − rozdělit na znaky − normalizovat velikost ? normalizovat orientaci ? − data nacpat do vrstevnaté neuronové sítě −výstup sítě převést na rozpoznaný znak

8 Využití technik dataminingu.. konečně Při předzpracování –Statistické metody – standartní odchylka –PCA analýza – pro normalizaci orientace znaků Při rozpoznávání –Shluková analýza –Kompetiční sítě, učené algoritmem LVQ1 –Vrstevnaté neuronové sítě

9 Předzpracování podle standartní odchylky Red Green Blue

10 Principal Component Analysis Použito pro otočení znaků na jednotnou orientaci Bohužel, většina znaků je spíš čtvercových..

11 Shluková analýza Pokusy o klasifikaci metodou nejbližšího souseda, k-nejbližších sousedů, k-středů, algoritmem LVQ1 Výsledek: nízká úspěšnost (zhruba 30%), malé vylepšení pouze za cenu přílišného růstu dat sítě

12 Vrstevnaté neuronové sítě Předzpracovaná data lze klasifikovat pomocí neuronové sítě, naučené algoritmem back-propagation Ovšem učení této sítě je značně zdlouhavé – desítky minut

13 Výsledky Při použití neuronové sítě pro rozpoznání znaků na třech obrázcích se stejným kódem bylo dosaženo úspěšnosti 60%.. což je zatím nejlepší výsledek pro tento problém, ke kterému jsem došel..


Stáhnout ppt "Využití technik dataminingu při rozpoznávání znaků Marek Kukačka Květen 2006."

Podobné prezentace


Reklamy Google