SMS brána Eurotel Jednoduché OCR pomocí neuronových sítí Marek Kukačka

Slides:



Advertisements
Podobné prezentace
VN zdroj pro TILECAL vila Lanna
Advertisements

Obvod a obsah rovnoběžníků
Počítačová grafika.
Slovní úlohy o směsích (řešené lineární rovnicí o jedné neznámé)
MATLAB LEKCE 7.
Český jazyk 4.ročník Skloňování podstatných jmen rodu středního a ženského (interaktivní tabule)
Cvičení Úloha 1: Rozhodněte zda posloupnost znaků v poli délky n tvoří palindrom (slovo, které je stejné při čtení zprava i zleva). Př.: [a,l,e,l,a] [a,n,n,a]
Hledání začátků exonů v DNA Klára Pešková, Michal Bída.
Face recognition Using PCA and EST Jakub Barták a Zdeněk BěhanMFF UK.
Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv.
Topologie neuronových sítí (struktura, geometrie, architektura)
SSC - cvičení 7 Aplikace programového systému Speech Laboratory - SL Postup: 1.Zkopírovat z adresy
LVQ – Learning Vector Quantization
SSC - cvičení 3 MATLAB - BPG algoritmus 1.Vytvořit tréninková data 2.Vytvořit objekt sítě 3.Natrénovat síť 4.Simulace Funkce pro učení: learngd … základní.
Algoritmy I Cvičení č. 5.
Téma 3 Metody řešení stěn, metoda sítí.
ROZHODOVACÍ PROCESY PRO VÍCECESTNÉ TELEMATICKÉ APLIKACE Filip Ekl
Algoritmy I Cvičení č. 4.
YMUSY1 Multimediální systémy 1 Cvičení 5 Formuláře a ovládací prvky.
Rozpoznávání tištěných znaků pomocí LVQ sítí Neuronové sítě 2006/2007 Jan Hroník, Pavel Krč.
Komprese barev Jakub Gemrot Ondřej Burkert. Popis problému Běžné obrázky mají 16,7 mil. barev Běžné obrázky mají 16,7 mil. barev Problém: Jak je rozumně.
Matematika – opakování 4
Mise Mars Osídlení. Mise Mars Náš celý komplex se skládá ze čtyř budov, z kyslíkového dolu, z pěti raket, ze solárního panelu a ze dvou nádrží na kyslík.
X. Řešení úloh v testech Scio z obecných studijních předpokladů
Projekt RegInnoMobil – inovativní řešení pro regionální mobilituHarald Buschbacher Financováno Rakouským ministerstvem dopravy, inovaci a technologie v.
Neuronové sítě Jakub Krátký.
Miloslav Mazanec © 2013 Počítačová grafika.
Pravoúhlý trojúhelník
ESKILLS.EC.EUROPA.EU Výsledky IT Fitness ESKILLS.EC.EUROPA.EU Základní informace – paralelně i na Slovensku.
TMF045 letní semestr 2005/2006 II Časová propagace vlnové funkce na mřížce I. (práce s momentovou reprezentací) (Lekce II)
 vytváření signálů a jejich interpretace ve formě bitů  přenos bitů po přenosové cestě  definice rozhraní (pro připojení k přenosové cestě)  technická.
Vektory Práce s vektory Př.: Mějme dva vektory z Udělejme kombinace
ANALÝZA VÝSLEDKŮ LINEÁRNÍHO OPTIMALIZAČNÍHO MODELU
Způsob řešení soustavy lineárních rovnic
Opakování k písemné práci. Zadání (2b)Vysvětlete jak by šlo použít LSQ učení pro rozpoznání vzoru A od vzorů B a C. Jak by vypadaly bipolární vstupy a.
Jednotky obsahu km2 ha a m2 dm2 cm2 mm2.
Neuronové sítě na grafických akcelerátorech Ondřej Zicha, Jiří Formánek.
Charakteristiky výstupního procesu systémů hromadné obsluhy Martin Meca ČVUT, Fakulta strojní.
Tabulkové procesory (MS Excel) Ing. Jan Roubíček.
Násobilka 6, 7, 8, 9 VY_32_INOVACE_090, 5. sada, M ANOTACE
Interpretace výsledků modelových výpočtů
Test č.3  Binomické rozdělení pravděpodobnosti VY_32_INOVACE_21-17.
Hopfieldova asociativní paměť. Topologie sítě 1 vrstva zároveň vstupní i výstupní mezi neurony existují všechny spoje (kromě smyček)
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
Nelineární klasifikátory
Účel procedury: První a závazný krok jakékoli seriozní komparativní studie. Umožňuje vyloučit možnost, že distribuce studovaného znaku (vlastnosti, vzorce.
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Jan Šaršon Milan Jaška 1Dobývání znalostí, MFF UK, 2008.
Vektorová kvantizace (VQ) (Vector Quantization)
Rozpoznávání v řetězcích
Šablona: Inovace a zkvalitnění výuky prostřednictvím ICT Vzdělávací oblast:Informační a komunikační technologie Předmět:Informatika Ročník:7. Datum vytvoření:Březen.
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík, CSc.
Opakování k písemné práci. Zadání (2b)Vysvětlete jak by šlo použít LSQ učení pro rozpoznání vzoru A od vzorů B a C. Jak by vypadaly bipolární vstupy a.
MS OFFICE - WORD POZADÍ STRÁNKY Ing. Petr Hanáček
Sledování vozidel v reálném čase a využití pro informování cestujících
W i ref (t+1) = W i ref (t) + h ci (t) [X(t) - W i ref (t)], i Nc h ci (t) 0, t  proces konverguje Algoritmy a struktury neuropočítačů ASN – P3 SOM algoritmus.
Radim Farana Podklady pro výuku
Algoritmy a struktury neuropočítačů ASN - P14 Hopfieldovy sítě Asociativní paměti rekonstrukce původních nezkreslených vzorů předkládají se neúplné nebo.
Dita Matesová, David Lehký, Zbyněk Keršner
Martin Langhammer Antonín Wimberský. ÚVOD PŘEDPOKLADY Jednotný vstup Zadní SPZ Stejný úhel a vzdálenost záběru Pouze vodorovné záběry značek Obdélníkové.
Cenová mapa podnájmů v Praze Ondřej Kmoch Tomáš Kohan
Neuronové sítě.
Využití neuronových sítí IVTH – Informační technologie ve vodním hospodářství Vypracoval: Jiří Vacek Z-92.
Využití technik dataminingu při rozpoznávání znaků Marek Kukačka Květen 2006.
Vědecká komunikace - PSY475 ( ) Mgr. Michaela Širůčková
Vytvořili: jaroslav Šindler a Tereza Žitníková I.B.
Geografické informační systémy
Základy statistické indukce
Neuronové sítě.
Neuronové sítě.
Transkript prezentace:

SMS brána Eurotel Jednoduché OCR pomocí neuronových sítí Marek Kukačka

Úloha: rozpoznávání textu v obrázcích, které tvoří ochranu proti automatizaci odesílání SMS zpráv –SMS brána na adrese: ndex.html

Příprava trénovací množiny Stáhnutí obrázků z Internetu Popsání textu v obrázcích Vyříznutí obdélníku se znakem –podle prázdných sloupců –problémy s příliš širokými znaky, které splývají –řešení: ignoruji je, vyřadím je z učení

Zajímavost: v obrázcích se nikdy nevyskytují znaky: nula, jedna, malé O a malé L Převod znaku na matici nul a jedniček –případně jedniček a mínus jedniček pro kompetiční síť Roztáhnutí matice na standartní výšku a šířku –maximální výška znaku je 18 pixelů, max. šířka je 16 pixelů –dimenze vstupních vektorů sítě tedy je 16*18 = 288 Příprava trénovací množiny pokračování

Řešení 1: kompetiční síť 36 neuronů s váhovými vektory dimenze 288, s předem přiřazeným znakem, který budou reprezentovat Parametry: -plasticita sítě (α)– jak moc se vítězný vektor přiblíží k předloženému vzoru, podle vzorce: ∆w i = α * (x i – w i ) -použití techniky podobné LVQ – odstrkávání špatných neuronů dál od vzoru v případě, že jsou moc blízko

Kompetiční síť – postup učení 1.Předložit síti všechny vzory z množiny v náhodném pořadí 2.Pro každý vzor provést úpravu neuronu, který tento vzor reprezentuje, podle vzorce ∆w i = α * (x i – w i ) 3.Pokud je zapnuté použití LVQ, pak zjistit neuron nejbližší k tomuto vzoru (podle euklidovské metriky), a pokud to není ten správný, pak ho odstrčit dál (∆w i je stejné jako výše, jen se odčítá místo přičítá)

Kompetiční síť – výsledky Použití LVQ nepřineslo žádné výrazné zlepšení Nejefektivnější postup: –začít s malou plasticitou (0,2) –provést několikrát (10x) učení –po každém učení snížit plasticitu (o 0,01) Výsledné sítě měly úspěšnost kolem 94%, nejlepší pak 97% (špatně 12 znaků z 450)

Řešení 2: Síť se zpětným šířením Vrstevnatá síť s jednou skrytou vrstvou a sigmoidální přechodovou funkcí Topologie: 288 neuronů ve vstupní vrstvě, 36 ve výstupní, skrytá vrstva nastavitelná Použit moment učení Nastavitelné parametry: strmost sigmoidy, parametr učení, moment, # neuronů ve skryté vrstvě

Síť se zpětným šířením - výsledky Vyzkoušené varianty: Strmost sigmoidy Parametr učení # neuronů ve skryté vr. Moment učení Úspěšnost , 0.5Kolem 20% Přes 90% % Toto jsou výsledky zhruba po 300 epochách. Úspěšnost je měřena na trénovací množině! Při úspěšnosti 100% na trénovací množině má síť na datech, která nikdy neviděla, úspěšnost cca 97%

Zdrojáky K dispozici na Program není hotov! SMS zprávy neodesílá, chtěl jsem hlavně rozchodit a vyzkoušet práci neuronových sítí.