Rozpoznávání tištěných znaků pomocí LVQ sítí Neuronové sítě 2006/2007 Jan Hroník, Pavel Krč.

Slides:



Advertisements
Podobné prezentace
Procenta Výpočet procentové části
Advertisements

Sedm základních nástrojů managementu jakosti
VISUAL BASIC Práce s řetězci Použitá literatura: Kvoch: Visual Basic 4.
UKAZATELE ZPŮSOBILOSTI A VÝKONNOSTI
Algoritmus k-means Ivan Pirner 2007/2008. Cíle mého snažení: • naprogramovat v MATLABu algoritmus k-means • vymyslet funkce popisující vzdálenost ve 40dimenzionálním.
Výpočet práce z výkonu a času. Účinnost
* Procenta Úvod Matematika – 7. ročník *
Rekonstrukce povrchu objektů z řezů Obhajoba rigorózní práce 25. června 2003 Radek Sviták
2 MECHANIKA 2.1 Kinematika popisuje pohyb.
Algoritmy a struktury meuropočítačů ASN – C2
SMS brána Eurotel Jednoduché OCR pomocí neuronových sítí Marek Kukačka
19.1 Odčítání v oboru do 100 s přechodem přes desítku
Hodnocení výsledků projektu ForTech Zpracoval: Mgr. Pavel Drobil, Náměstek hejtmana Moravskoslezského kraje Hodnocení výsledků projektu ForTech Zpracoval:
Hledání začátků exonů v DNA Klára Pešková, Michal Bída.
Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv.
ASN - cvičení 2 : Ukázky práce s NN-Toolboxem
Téma 3 ODM, analýza prutové soustavy, řešení nosníků
ENERGIE KLASTRŮ VODY ZÍSKANÁ EVOLUČNÍMI ALGORITMY
Algoritmy a struktury neuropočítačů ASN - P1 Prof.Ing. Jana Tučková,CSc. Katedra teorie.
Dynamické rozvozní úlohy
ŠVP na gymnáziích: od mírné skepse k chuti pokračovat Zkušenosti z projektu Pilot G/GP Lucie Slejšková Výzkumný ústav pedagogický v Praze.
Počítačová grafika III – Monte Carlo integrování
Komprese barev Jakub Gemrot Ondřej Burkert. Popis problému Běžné obrázky mají 16,7 mil. barev Běžné obrázky mají 16,7 mil. barev Problém: Jak je rozumně.
Kdo chce být milionářem ?
Jednotky délky a jejich převody 5. ročník
VY_32_INOVACE_INF_RO_12 Digitální učební materiál
ČLOVĚK A JEHO SVĚT 2. Ročník - hodiny, minuty Jana Štadlerová ŽŠ Věšín.
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)
Matematika a její využití v geografii
Neuronové sítě Jakub Krátký.
Získávání informací Získání informací o reálném systému
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Kvadratické rovnice pro S O U (x - 5)(x + 5) = 0 S = 1/2gt2
EU – OP – VK Matematika – 8.B Mgr. Václav Calábek.
Testování hypotéz (ordinální data)
Statistika Vypracoval: Mgr. Lukáš Bičík
Jazyk vývojových diagramů
Čtení myšlenek Je to až neuvěřitelné, ale skutečně je to tak. Dokážu číst myšlenky.Pokud mne chceš vyzkoušet – prosím.
Teorie psychodiagnostiky a psychometrie
Posloupnosti, řady Posloupnost je každá funkce daná nějakým předpisem, jejímž definičním oborem je množina všech přirozených čísel n=1,2,3,… Zapisujeme.
1 Národní informační středisko pro podporu jakosti.
73.1 Zaokrouhlování desetinných čísel
Dělení se zbytkem 8 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
AZ - KVÍZ Procvičení procent
Novohradské statistické dny Poznámky k problematice určování počtu shluků Hana Řezanková Vysoká škola ekonomická v Praze.
Cvičná hodnotící prezentace Hodnocení vybraného projektu 1.
Biometrické Bezpečnostní Systémy Filip Orság Technologie rozpoznání mluvčího.
MS PowerPoint Příloha - šablony.
Pojmy a interpretace.
Systémy pro podporu managementu 2
1 Celostátní konference ředitelů gymnázií ČR AŘG ČR P ř e r o v Mezikrajová komparace ekonomiky gymnázií.
Základní škola Podbořany, Husova 276, okres Louny
Slovní úlohy řešené soustavou rovnic
Statistika Ukazatelé variability
Porovnání výroby a prodejů vozidel ve světě
1 Kognitivní inspirace třídění na základě závislostí atributů Jan Burian Eurfomise centrum – Kardio, Ústav informatiky AV ČR Článek je dostupný na WWW:
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Jan Šaršon Milan Jaška 1Dobývání znalostí, MFF UK, 2008.
Logika a umělá inteligence pro multi-agentní systémy Mobilní agent řízený neuronovou sítí.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
W i ref (t+1) = W i ref (t) + h ci (t) [X(t) - W i ref (t)], i Nc h ci (t) 0, t  proces konverguje Algoritmy a struktury neuropočítačů ASN – P3 SOM algoritmus.
Dita Matesová, David Lehký, Zbyněk Keršner
Martin Langhammer Antonín Wimberský. ÚVOD PŘEDPOKLADY Jednotný vstup Zadní SPZ Stejný úhel a vzdálenost záběru Pouze vodorovné záběry značek Obdélníkové.
Cenová mapa podnájmů v Praze Ondřej Kmoch Tomáš Kohan
Neuronové sítě. Vývoj NS 1943 – W. McCulloch, W. Pittse – první jednoduchý matematický model neuronu 1951 – M. Minsky - první neuropočítač Snark 1957.
Využití technik dataminingu při rozpoznávání znaků Marek Kukačka Květen 2006.
SIPVZ – úvodní modul P ICT a změny ve výuce (2 h) metodické poznámky.
Transkript prezentace:

Rozpoznávání tištěných znaků pomocí LVQ sítí Neuronové sítě 2006/2007 Jan Hroník, Pavel Krč

Zadání problému  Rozpoznávání tištěných znaků pomocí jednoduchých statistik získaných z rastrové podoby znaku (např. po skenování papírové předlohy)  Neřešíme předzpracování, zajímá nás pouze proces identifikace znaku Vstup: hodnoty statistik Výstup: přiřazení k jedné z 26 tříd (velká písmena latinské abecedy)

Návaznost  Stejný problém řešili v roce 2005 Rudolf Kadlec a Jiří Šejnoha  Vstupní data pocházejí z databáze Delve z University of Toronto ( Sbírka vstupních dat pro různé metody učení My řešíme problém letter

Vstupní data  Celkem vzorků písmen  Přibližně rovnoměrné rozdělení znaků A – Z  Písmena jsou tištěna 20 různými fonty, přidán šum  Každý vzorek se skládá z 16 statistických charakteristik a určení správné třídy

Charakteristiky znaku 1.x-box - horizontal position of box (integer) 2.y-box - vertical position of box (integer) 3.width - width of box (integer) 4.high - height of box (integer) 5.onpix - total # on pixels (integer) 6.x-bar - mean x of on pixels in box (integer) 7.y-bar - mean y of on pixels in box (integer) 8.x2bar - mean x variance (integer) 9.y2bar - mean y variance (integer) 10.xybar - mean x y correlation (integer) 11.x2ybr - mean of x * x * y (integer) 12.xy2br - mean of x * y * y (integer) 13.x-ege - mean edge count left to right (integer) 14.xegvy - correlation of x-ege with y (integer) 15.y-ege - mean edge count bottom to top (integer) 16.yegvx - correlation of y-ege with x (integer)

Přístup k řešení  Kadlec & Šejnoha řešili problém pomocí dopředných vrstevnatých sítí učením algoritmem backpropagation  Kvůli časovým a paměťovým nárokům nakonec rozpoznávali jen polovinu (13) tříd  Dosáhli nejlepší účinnosti 90,5% při konfiguraci 16–28–13

Přístup k řešení (2)  My jsme zkusili řešit problém pomocí Kohonenových sítí učených s učitelem pomocí algoritmu LVQ  Rozpoznávali jsme všech 26 tříd na různě velkých vzorcích dat i na celé vstupní množině

Postup trénování  Síť jsme ladili v prostředí MATLAB s využitím Neural network toolboxu pomocí naprogramovaného skriptu  Vstupní data jsme rozdělili v poměru 65:35 na trénovací a ověřovací  Bylo třeba ladit několik parametrů v široké škále hodnot: Typ algoritmu (LVQ1 vs. LVQ2) Počet neuronů (26 – cca. 800) Koeficient učení (learning rate) Počet epoch učení  Test výhodnosti aplikace PCA analýzy

Postup trénování (2)  Z důvodu časové náročnosti jsme trénovali na více strojích zároveň  Trénování probíhalo jak dávkově (pevný počet epoch), tak interaktivně (sledováním průběhu, čekáním na stabilizaci)  Na celých vstupních datech trvalo jedno trénování (s pevnými parametry) několik hodin  Používali jsme i menší vzorky vstupních dat Značně rychlejší učení Většina parametrů se téměř shodovala Větší tendence k přeučení

Ladění parametrů Typ algoritmu  V několika různých konfiguracích jsme zkoušeli algoritmus LVQ2  Většinou byl znatelně horší než LVQ1, někdy se vůbec nezačal učit  Proto jsme dále používali pouze LVQ1

Ladění parametrů PCA analýza  Vzhledem k povaze vstupních dat se nabízelo použití PCA analýzy  Použili jsme PCA analýzu z toolboxu  Po vyladění parametrů analýzy se díky ní zrychlilo učení o jednotky až desítky procent, ale pouze na větších množstvích dat

Ladění parametrů Počet neuronů  Nabízelo se několik rozumných odhadů pro počet neuronů 26 výstupních tříd (předpokládá se podobnost fontů) 26 tříd * 20 fontů = 520 shluků Případně i více kvůli snadnějšímu učení  Zkoušeli jsme i hodnoty mezi odhady

Ladění parametrů Koeficient učení  Koeficient učení má přímou souvislost s ideálním počtem epoch a s kvalitou výsledku  Na plných datech jsme nalezli ideální hodnotu 0,01 Vystačí s rozumným počtem epoch (40) Další snižování nepřináší znatelně lepší výsledky Vyšší hodnoty dávají znatelně horší výsledky

Ladění parametrů Závislost learning rate vs. počet epoch (méně dat) Koeficient učení0,20,10,01 0,00 1 Počet epoch pro stabilizaci Úspěšnost na trénovací množině69%75%78% Úspěšnost na ověřovací množině14%34%37%31%

Celkový výsledek  Nejlepší dosažená úspěšnost: 70,33% na ověřovacích datech Kompletní vstupní množina LVQ1, PCA analýza 676 neuronů Koeficient učení 0, epoch, podobné výsledky již od 40 epoch, stablilizace na cca. 120 epochách 14 hodin učení

Závěr  Celkový čistý výpočetní čas cca. 50 hodin  Nedosáhli jsme sice tak dobrých výsledků jako Kadlec & Šejnoha, zato však na všech třídách  Ověřili jsme použitelnost LVQ sítí pro daný typ úlohy