Využití technik dataminingu při rozpoznávání znaků Marek Kukačka Květen 2006.

Slides:



Advertisements
Podobné prezentace
Rozpoznávání obrazu (Static Hand Gesture Recognition Software)
Advertisements

SMS brána Eurotel Jednoduché OCR pomocí neuronových sítí Marek Kukačka
Hledání začátků exonů v DNA Klára Pešková, Michal Bída.
Face recognition Using PCA and EST Jakub Barták a Zdeněk BěhanMFF UK.
Problematika a metody zpracování biomed. dat z pohledu jejich klasifikace Marcel Jiřina.
Zlepšování jakosti.
Topologie neuronových sítí (struktura, geometrie, architektura)
SSC - cvičení 3 MATLAB - BPG algoritmus 1.Vytvořit tréninková data 2.Vytvořit objekt sítě 3.Natrénovat síť 4.Simulace Funkce pro učení: learngd … základní.
ČASOPROSTOROVÁ ANALÝZA VYBRANÝCH ONEMOCNĚNÍ V OLOMOUCKÉM KRAJI Michael Havlík vedoucí práce: Zdena Dobešová Konference GISÁČEK.
Algoritmy a struktury neuropočítačů ASN - P1 Prof.Ing. Jana Tučková,CSc. Katedra teorie.
Síla Výslednice navzájem rovnoběžných sil 1. díl F1 F3 F5 F6 F4 F2
DOK „Umělá inteligence“ v DOK (i jinde). NEURONOVÉ SÍTĚ.
Generátor čtyřúhelníkové sítě Petr Frantík F AKULTA STAVEBNÍ V YSOKÉ UČENÍ TECHNICKÉ V B RNĚ.
Lexikální a syntaktická analýza Jakub Yaghob
Rozpoznávání tištěných znaků pomocí LVQ sítí Neuronové sítě 2006/2007 Jan Hroník, Pavel Krč.
Neuronové sítě Jakub Krátký.
Hana Kotinová Struktura a cíl práce Metody předzpracování dat Systémy předzpracování dat Historie vývoje DPT Jak program pracuje Budoucnost.
Lenka Fialová Martina Procházková Ondřej Soukup Martin Valenta Cyril Vojáček 1.
Benchmarking Benchmarking je metoda řízení kvality, která zapojené
Shluková analýza.
Rozšíření dotazu a vývoj tématu v IR Jiří Dvorský Jan Martinovič Václav Snášel.
Biometrické Bezpečnostní Systémy Filip Orság Technologie rozpoznání mluvčího.
Vyhledávání podobností v datech s využitím singulárního rozkladu
Systémy pro podporu managementu 2
Systém rizikové analýzy při statickém návrhu podzemního díla Jan Pruška.
Podnikové informační systémy C7 – Data Mining a získávání znalostí České vysoké učení technické v Praze Fakulta strojní ústav Řízení a ekonomiky podniku.
Opakování k písemné práci. Zadání (2b)Vysvětlete jak by šlo použít LSQ učení pro rozpoznání vzoru A od vzorů B a C. Jak by vypadaly bipolární vstupy a.
Hopfieldova asociativní paměť. Topologie sítě 1 vrstva zároveň vstupní i výstupní mezi neurony existují všechny spoje (kromě smyček)
Nelineární klasifikátory
Shluková analýza.
1 Kognitivní inspirace třídění na základě závislostí atributů Jan Burian Eurfomise centrum – Kardio, Ústav informatiky AV ČR Článek je dostupný na WWW:
U MĚLÁ INTELIGENCE Lucie Ježková O3.B. C O TO VLASTNĚ JE ? Obor informatiky, který se zabývá vytvářením strojů, které se dokážou „inteligentně chovat“
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
SHLUKOVÁNÍ David Zeman FIT VUT UIFS Získávání znalostí z databází Modelování shlukové analýzy v systému SAS Enterprise Miner TM.
Klastrování - II.
Segmentace buněčných jader Pořízených konfokálním mikroskopem.
Rozpoznávání vzorů bez učitele (klastrování)
Realtime identifikace osob podle hlasu
Neuronové sítě Jiří Iša
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
1 MUDIM Mgr. Petr Šimeček. 2 Nevíte, co dělat s daty?
Business system planning Jan Smolík. Základní informace Metoda firmy IBM Poprvé publikována v roce 1981 Slouží k návrhu informační architektury.
Vektorová kvantizace (VQ) (Vector Quantization)
Rozpoznávání v řetězcích
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík, CSc.
Opakování k písemné práci. Zadání (2b)Vysvětlete jak by šlo použít LSQ učení pro rozpoznání vzoru A od vzorů B a C. Jak by vypadaly bipolární vstupy a.
Ekologická daňová reforma z pohledu HK ČR Přednáška Ing.Václav Hrabák Předseda Energetické sekce HK ČR.
Klastrování - III.
Plánování trajektorie pro bezpilotní letoun za účelem sledování pozemních objektů pomocí inerciálně stabilizované kamerové platformy Michal Kreč Vedoucí.
W i ref (t+1) = W i ref (t) + h ci (t) [X(t) - W i ref (t)], i Nc h ci (t) 0, t  proces konverguje Algoritmy a struktury neuropočítačů ASN – P3 SOM algoritmus.
SHLUKOVÁ ANALÝZA FUNKČNÍCH PLOCH PRO SLEDOVÁNÍ URBÁNNÍHO VÝVOJE OLOMOUCKÉHO REGIONU Vedoucí práce: Mgr. Jana Svobodová Martin Klícha Gisáček
Dita Matesová, David Lehký, Zbyněk Keršner
Martin Langhammer Antonín Wimberský. ÚVOD PŘEDPOKLADY Jednotný vstup Zadní SPZ Stejný úhel a vzdálenost záběru Pouze vodorovné záběry značek Obdélníkové.
Klasifikace a rozpoznávání
Elektrotechnická fakulta ČVUT KATEDRA KYBERNETIKY Vedoucí prof. Ing. Vladimír Mařík, DrSc. KATEDRA KYBERNETIKY ELEKTROTECHNICKÁ.
Cenová mapa podnájmů v Praze Ondřej Kmoch Tomáš Kohan
Neuronové sítě. Vývoj NS 1943 – W. McCulloch, W. Pittse – první jednoduchý matematický model neuronu 1951 – M. Minsky - první neuropočítač Snark 1957.
Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová.
Neuronové sítě.
Elektrotechnická fakulta ČVUT KATEDRA KYBERNETIKY Vedoucí prof. Ing. Vladimír Mařík, DrSc. KATEDRA KYBERNETIKY ELEKTROTECHNICKÁ.
Dolování znalostí z vícejazyčných textových dat Luděk Svozil , Brno Vedoucí práce: doc. Ing. František Dařena, Ph.D.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Pravděpodobnost a matematická statistika I.
VÝUKOVÉ METODY Výuková metoda je koordinovaný systém vyučovacích činností učitele a učebních aktivit žáka, který je zaměřen na dosažení učitelem stanovených.
Racionalizace logistických procesů ve vybrané společnosti
Metody strojového učení
Fylogenetická evoluční analýza
Neuronové sítě.
Pravděpodobnost a matematická statistika I.
Neuronové sítě.
Transkript prezentace:

Využití technik dataminingu při rozpoznávání znaků Marek Kukačka Květen 2006

Jak vypadá lehký problém.. Data získána z SMS brány Eurotelu

Řešení jednoduchého problému Vrstevnaté neuronové sítě –Učené algoritmem back-propagation –Výsledná úspěšnost rozpoznávání: 98% Kompetiční sítě –Ekvivalentní klastrování metodou k středů –Výsledná úspěšnost rozpoznávání: 98%

A teď těžký problém.. Data získána z SMS brány Vodafonu

Rozdělení procesu rozpoznávání Vstupní data Předzpracování Samotné rozpoznávání Výstup: klasifikace

Vstupní data Předzpracování Samotné rozpoznávání Výstup: klasifikace Rozdělení procesu rozpoznávání Pro jednoduchý problém: - získaný obrázek - rozdělit na znaky - normalizovat velikost - data nacpat do vrstevnaté neuronové sítě - výstup sítě převést na rozpoznaný znak

Vstupní data Předzpracování Samotné rozpoznávání Výstup: klasifikace Rozdělení procesu rozpoznávání Pro těžký problém: − získaný obrázek − odstranit pozadí − odstranit šum − rozdělit na znaky − normalizovat velikost ? normalizovat orientaci ? − data nacpat do vrstevnaté neuronové sítě −výstup sítě převést na rozpoznaný znak

Využití technik dataminingu.. konečně Při předzpracování –Statistické metody – standartní odchylka –PCA analýza – pro normalizaci orientace znaků Při rozpoznávání –Shluková analýza –Kompetiční sítě, učené algoritmem LVQ1 –Vrstevnaté neuronové sítě

Předzpracování podle standartní odchylky Red Green Blue

Principal Component Analysis Použito pro otočení znaků na jednotnou orientaci Bohužel, většina znaků je spíš čtvercových..

Shluková analýza Pokusy o klasifikaci metodou nejbližšího souseda, k-nejbližších sousedů, k-středů, algoritmem LVQ1 Výsledek: nízká úspěšnost (zhruba 30%), malé vylepšení pouze za cenu přílišného růstu dat sítě

Vrstevnaté neuronové sítě Předzpracovaná data lze klasifikovat pomocí neuronové sítě, naučené algoritmem back-propagation Ovšem učení této sítě je značně zdlouhavé – desítky minut

Výsledky Při použití neuronové sítě pro rozpoznání znaků na třech obrázcích se stejným kódem bylo dosaženo úspěšnosti 60%.. což je zatím nejlepší výsledek pro tento problém, ke kterému jsem došel..