Face recognition Using PCA and EST Jakub Barták a Zdeněk BěhanMFF UK.

Slides:



Advertisements
Podobné prezentace
Kvalita – klíčový parametr GEODAT?
Advertisements

Základy rovnoběžného promítání
Algoritmus k-means Ivan Pirner 2007/2008. Cíle mého snažení: • naprogramovat v MATLABu algoritmus k-means • vymyslet funkce popisující vzdálenost ve 40dimenzionálním.
Autor: Andrea Bartoníková
Rekonstrukce povrchu objektů z řezů Obhajoba rigorózní práce 25. června 2003 Radek Sviták
Soutěžní úkol. Naším společným úkolem je dostat cyklistu ve spodní části obrazovky na konec cesty. Musí ujet celých 10 kilometrů. Musíme mu pomoci správně.
SMS brána Eurotel Jednoduché OCR pomocí neuronových sítí Marek Kukačka
Hledání začátků exonů v DNA Klára Pešková, Michal Bída.
Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv.
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
Využití umělých neuronových sítí k urychlení evolučních algoritmů
Rozpoznávání tištěných znaků pomocí LVQ sítí Neuronové sítě 2006/2007 Jan Hroník, Pavel Krč.
Základní číselné množiny
T.A. Edison Tajemství úspěchu v životě není v tom, že děláme, co se nám líbí, ale, že nacházíme zalíbení v tom, co děláme.
VÍCEKRITERIÁLNÍ ROZHODOVÁNÍ I.
Hra na zapamatování Informace o hře Vytvořil: Jakub Hrubý 6.A
Fakulty informatiky a statistiky
TMF045 letní semestr 2005/2006 II Časová propagace vlnové funkce na mřížce I. (práce s momentovou reprezentací) (Lekce II)
Kánon hlavy (Unface) Základní pravidla pro kresbu portrétu
METODA KONEČNÝCH PRVKŮ
Vyšetření fMRI popis experimentu Dobrovolník II :00.
Grafika a digitální fotografie Volitelný modul úrovně P díl č. 3.
 1. Autor zprávy : Původcem zprávy a tím, kdo ji předává druhým, jste vy sami. Způsob, jakým ji předáváte dál, může být ovlivněn například :  Postoj.
IGrid index Roman Krejčík. Obsah Motivace Prokletí dimenze Míry podobnosti IGrid, IGrid+ Experimentální porovnání.
Úprava digitálních fotografií Terezie Svobodová. => cesta mezi fotoaparátem a tiskem…
Úvod do počítačové grafiky
Hopfieldova asociativní paměť. Topologie sítě 1 vrstva zároveň vstupní i výstupní mezi neurony existují všechny spoje (kromě smyček)
Artificial Intelligence (AI).  „Úloha patří do oblasti umělé inteligence, jestliže řešení, které najde člověk považujeme za projev jeho inteligence.
Funkce více proměnných.
Ovládání počítače laserovým ukazovátkem Tomáš PokornýZávěrečná maturitní práce.
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
Reprezentace klasifikátoru pomocí „diskriminant“ funkce
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Rozhodovací stromy.
Vektorová kvantizace (VQ) (Vector Quantization)
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Lineární programování - charakteristika krajních bodů
Aplikace Machine Learning v Image Processing Irena Váňová.
Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK 4. Mapování a redukce dimenze 1. část – úvod + mapování vektorových sad.
Monte Carlo simulace Experimentální fyzika I/3. Princip metody Problémy které nelze řešit analyticky je možné modelovat na základě statistického chování.
W i ref (t+1) = W i ref (t) + h ci (t) [X(t) - W i ref (t)], i Nc h ci (t) 0, t  proces konverguje Algoritmy a struktury neuropočítačů ASN – P3 SOM algoritmus.
Základy pedagogické metodologie
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
Vyhledávání vzorů (template matching)
Stereometrie Kolmost přímek a rovin Mgr. Jakub Němec
Stereometrie Řezy hranolu II VY_32_INOVACE_M3r0109 Mgr. Jakub Němec.
MASKS © 2004 Invitation to 3D vision. MASKS © 2004 Část 1 Přehled a úvod.
Martin Langhammer Antonín Wimberský. ÚVOD PŘEDPOKLADY Jednotný vstup Zadní SPZ Stejný úhel a vzdálenost záběru Pouze vodorovné záběry značek Obdélníkové.
Klasifikace a rozpoznávání
Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová.
Neuronové sítě.
Využití technik dataminingu při rozpoznávání znaků Marek Kukačka Květen 2006.
Grafické systémy II. Ing. Tomáš Neumann Interní doktorand kat. 340 Vizualizace, tvorba animací.
Gymnázium Jakuba Škody Septima A 2011/2012.  Cílem tohoto matematicko-fyzikálního projektu byla ukázka využití vektorů v praxi.  Základním úkolem projektu.
Soustavy lineárních rovnic Matematika 9. ročník Creation IP&RK.
Základy zpracování geologických dat R. Čopjaková.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Zrak ptáků Jakub Vrána, Zdeněk Dorazil, Štěpán Konečný.
Technické zobrazování
4. cvičení
Transfer learning Jan Hrach
ANALÝZA A KLASIFIKACE DAT
Klasifikace a rozpoznávání
Funkce více proměnných.
Neuronové sítě.
Počítačová grafika.
Neuronové sítě.
ANALÝZA A KLASIFIKACE DAT
Soustavy lineárních rovnic
Transkript prezentace:

Face recognition Using PCA and EST Jakub Barták a Zdeněk BěhanMFF UK

Co je naším cílem  Natrénovat neuronovou síť tak aby byla schopna rozpoznat jednotlivé lidi na fotografiích splňujících nějaké základní podmínky

Problémy  Face detection  Zisk vstupních dat  Velikost vstupního prostoru

Face detection problem  V komplexních řešeních problému face recognition je třeba řešit problém nalezení obličeje v obrázku.  Používá se zpravidla detekce očí.

Face detection problem  Další problémy:  Natočení tváře v rovině kamery & v ose těla  Částečné zakrytí tváře  Osvětlení  a další…

Face detection problem  Face detection proto v našem případě neřešíme  Vstupní data získáváme přímým focením  proti bílé zdi  za konstatního osvětlení  konstantního natočení tváře (čelem do kamery)  Přesto o nich nelze prohlásit že jsou ideální…

Vstupní data – zisk dat

 Fotky 13 lidí  Od každého člověka 11 fotek s různými výrazy

Vstupní data – zisk dat  Problémy  Rozdílné osvětlení  Máznuté fotky  Žádný model není dokonalý…. (tedy například různé natočení hlavy)

Vstupní data - preprocesing  Ruční preprocesing  Nalezení obličeje a zisk čtvercové fotky se středem v obličeji  Převedení z barevných fotografií na černobílé

Vstupní data - preprocesing  Strojový preprocesing  Resizing na 64x64 pixelu  Normalizace intenzity na rozmezí 0-255

Vstupní data - summary  Máme tedy k dispozici 143 normalizovaných fotografií  Fotografie se liší ve dvou aspektech  Výrazy v obličeji (žádoucí)  Centralizace a natočení obličeje (nežádoucí)

Face recognition - úvod  Naším cílem je roztřídit 143 prvků správně do 13 tříd (v každé bude 11 prvků).  Hodláme využít neuronovou síť

Face recognition - úvod  Problém: Velikost vstupního prostoru a jeho řídkost  Naše fotografie obsahují 4096 pixelů (64x64), kde každý pixel může nabývat hodnot  Velikost vstupního prostoru je tedy (což je hodně)  V prostoru této velikosti máme 143 vektorů (což je málo)

Face recognition – PCA  Vstupní prostor je však silně korelovaný.  Všechny lidské tváře mají zhruba stejný tvar – ovál s výraznými znaky typu nos, oči a ústa  Některé z těchto určujících znaků jsme si zničili variací výrazů, ale doufáme že to nebude vadit.  Pomocí PCA a EST najdeme bázi nového prostoru, která bude využívat výše zmíněné korelace a pomůže nám zmenšit dimenzi.

Principal Component Analysis (PCA)  Statistická metoda umožňující zmenšit dimenzi vstupního prostoru dat  Umožňuje nalézt bázi nového prostoru jehož bázové vektory odpovídají znakům které nejvíce určují vstupní prostor  První bázový vektor pak odpovídá nejvíce určujícímu znaku, druhý bázový vektor druhému nejvíce určujícímu znaku atd.

Eigen Space Transformation (EST) Využívá se při face recognition relativně často Umožnuje provést transformaci vstupního prostoru s minimalizací ztráty informace (ve smyslu nejmenších čverců)

Eigen Space Transformation (EST) Přetvoříme obrázky z matice 64x64 na vektor 1x4096 a vytvoříme matici těchto vektorů Máme tedy matici velikosti A=4096x143 (fotek je celkem 143) Naším cílem je nalézt vlastní vektory matice A x A T, které budou vytvářet bázi nového prostoru. Když je seřadíme podle velikosti vlastních čísel příslušných každému vlastnímu vektoru, dostaneme přesně bázi kterou popisuje PCA.

Eigen Space Transformation (EST)  Problémem je, že matice X= A x A T je matice velikosti 4096 x 4096 a spočítat v ní vlastní vektory by bylo „lehce“ obtížné

Eigen Space Transformation (EST)  Spočítáme proto vlastní vektory matice X´ =A T x A, tedy matice velikosti 143 x 143 což je výrazně jednodušší a pak využijeme vztahu  λ i = λ’ i  e i = λ i -1/2 * A * e’ I  Kde λ i je vlastní číslo příslušné matici X, λ’ i je vlastní číslo příslušné matici X’. e i a e’ i jsou pak vlastní vektory příslušné těmto vlastním číslům.

Eigen Space Transformation (EST)  A takhle vypadají výsledky (10 nejvýznamnějších vlastních vektorů):

Eigen Space Transformation (EST)  10 nejméně významných vlastních vektorů

Eigen Space Transformation (EST)  Z takto získaných vlastních vektorů jsme vybrali 40 nejvýznamnějších a ty zvolili za bázi nového prostoru.  Pomocí této nové báze jsme aproximovali původní vektory a snížili tak dimenzi z původní 4096 na 40.  To už by neuronová síť měla zvládnout.  Přesnost aproximace byla bodu intenzity

Neural network training A taky že zvládla. Použili jsme síť Learning Vector Quantization (LVQ) s 20 skrytými neurony a síť byla schopna se naučit rozpoznávat bez chyby během 68 epoch.

Experimenty s neuronovou sítí Na závěr jsme se rozhodli ještě se sítí trochu experimentovat. Při trénování s 13 skrytými neurony si síť pletla dvě dvojice lidí

Experimenty s neuronovou sítí…  Přidali jsme další neuron do skryté vrstvy (14 celkem)  Sít se zlepšila a už špatně řadí pouze jednoho člověka. Za to si ho plete se dvěma

Experimenty s neuronovou sítí… Na správné rozpoznání pomohlo až 20 neuronů ve skryté vrstvě (síť se naučila za 68 epoch)

Experimenty s neuronovou sítí…  Při dalších pokusech jsme rozdělili fotografie do dvou skupin. První tvořila trénovací skupinu, druhá pak testovací.  Při rozdělení 8:3 (trénovací:testovací) a původním nastavení (20 vnitřních neuronů) si síť pletla 2 lidi  Při rozdělení 5:6 již lidi 3  Při rozdělení 2:9 měla síť pořád 93% úspěšnost

Experimenty s neuronovou sítí…  Rozdělení 1:10  Sít má k dispozici pouze jedinou fotografii aby se naučila rozpoznávat.  83.8% úspěšnost

Použitá literatura Recognizing humans by gait via parametric canonical space (Artificial Intelligence in Engineering volume 13) University of Southampton

Slovo závěrem Hlavní těžiště práce jednoznačně spočívalo v redukci velikosti vstupního prostoru a to správným postupem. Cestou jsme narazili na bezpočet různě obtížných problému, ale nebáli jsme se je vyřešit. Jak řekl největší český vynálezce všech dob je třeba se nebát, protože někdo musí říct „Tudy ne, přátelé“

Slovo závěrem… Pokus o spočítání vlastních čísel na matici velikosti 4096x4096 >>eigenVectors = eig(images*images’); …2 minuty …10 minut …20 minut “f*ck” CTR+C >>

Slovo závěrem… Pár pokusů zobrazit nějaké obrázky v Matlabu (hlavní vlastní vektor):

Slovo závěrem… Hlavní vlastní vektor podruhé…

Slovo závěrem… Ani zobrazit černobílý obrázek nemusí být triviální…

Slovo závěrem… …

Některé pokusy se na vás zkrátka projeví… Zdeněk Běhan a Jakub Barták

Opravdu, ale už opravdu konec… A to je vše přátelé Prostor pro dotazy…