Aplikace Machine Learning v Image Processing Irena Váňová
2 Osnova Motivace Aproximace signálu pomocí slovníku Matching Pursuit, OMP Porovnání těchto metod s jinými Vytváření vlastního slovníku MOD, K-SVD Aplikace těchto algoritmů
3 Motivace locationscaleorientation Gaborovy wavelety Active basis pursuit
4 Kočkopes Learning active basis clustering
5 Máme fci f, a její hodnoty {y 1,…,y l } v bodech {x 1,…,x l } Slovník – množina fcí {g 1,…,g M } Chceme minimální chybu Chyba = kvadrát normy, Globální minimum - NP Basic Matching Pursuit
6 Greedy přístup Hledáme bázi g i a koeficienty 0. prázdná báze n. máme g 1,…,g n a hledáme g n+1 : nechť máme g n+1, pak chceme minimalizovat zvolíme g n+1, max. kolineárnost s R n Stop. Chyba klesne pod danou hodnotu
7 Příklad
8 Upgrade 1. - OMP Back-fitting, Orthogonal MP Stejný postup hledání g n+1 Zafixujeme g i a minimalizujeme přes - lineární regrese
9 Upgrade 2. Pre-fitting, lze spočítat přes projekce Basic, fix. vše kromě g n+1 Back-fitting, fix. g 1,…,g n+1 hledáme Pre-fitting, fix pouze g 1,…,g n zafixováno hledáme
10 Použití matching pursuit Původně pochází ze signal processing, wavelets skupin Signál = součet funkcí Nové uplatnění: Machine learning Regresní křivka = součet funkcí Nutnost zavést obecnější ztrátovou funkci
11 Rozšíření přístupu Máme obecnou ztrátovou fci L(y i,f n (x i )) Předefinujeme reziduum R n Směr největšího spádu v prostoru fcí Back-fitting možný, ale časově náročný
12 Regrese Chceme vyjádřit klasifikační fci – regrese MP s obecnější ztrátovou fcí
13 Kernel MP Máme danou kernel fci K Slovník je kernel v každém trénovacím bodě Aproximace jsou indexy „support points“
14 Výhody KMP Žádné omezení na kernely Více než jeden tvar, měřítko kernelu pro všechny, pro jednu třídu Vložit do slovníku libovolné fce Konstantní, …
15 Porovnání s SVM, … mapování do nových dimenzí Minimalizujeme Jiná funkce, jiná chyba Kontrola řídkosti
16 Tool příklady 100 iterací Basic KMP Stejný kernel - Gausián 7 iterací Pre-fitting KMP 7 iterací back-fitting KMP = OMP Support Vector Machine
17 Houbař 8124 hub, 22 vlastností 2 třídy – , Chyba podobná Počet support vektorů je velmi rozdílný
18 Active basis pursuit
19 Vlastní slovník Zvolené slovníky – wavelets Univerzální – výhody, nevýhody Naučit se slovník pro náš problém MOD, K-svd
20 Označení Máme data y i Hledáme slovník d i, který nejlépe popisuje naše data Chyba vektoru y Chyba vstupních vektorů y 1,…,y N
21 Příklad Y D
22 Obecný framework 1. Inicializujeme slovník 2. Najdeme koeficienty X ke slovníku Matching Persuit nebo jiná metoda Omezení na X, chceme řídké 3. Pomocí X opravíme slovník D MOD, K-SVD Není ten framework povědomý? K-mean, omezení na X
23 Method of optimal directions Chyba vektoru y Chyba vstupních vektorů y 1,…,y N Zderivujeme výraz podle D a položíme = 0 po odvození oprava slovníku 1 krok 1 slovník
24 -. n N n K K N YDX = K-SVD V 1 kroku optimalizujeme 1 slovo -. n N n K-1 N Y DkDk KkKk -. =
25 SVD A = U S V T A k = u 1 s 1 v 1 T u k s k v k T
26 SVD Příklad A k = u 1 s 1 v 1 T u k s k v k T AiAi u i s i v i T
27 Porovnání metod MOD, K-SVD Náhodný slovník 50 slov – 20D Data 1500 y i Kombinace 3 slov Přidán šum Z dat spočítán slovník a porovnán y-osa # „Stejný“
28 Porovnání slovníků K-SVD, Haar, DCT slovníky 64x441 Trénovací data – bloků 8x8 Z face-image databáze Hledání koeficientů OMP 20-90% pixelů bylo vymazáno Na zbytku – OMP pomocí slovníků Chybějící pixely se dodefinovali
29 Příklad K-SVD Y D K-SVD Haar DCT
30 Výsledky K-SVD
31 Použití v odšumování 1. Init slovíku D 2. J krát opakuj Vyjádři patche pomocí D OMP Oprav slovník D K-SVD 3. Průměrování patchů na pozicích vyjádřených slovníkem D patche zašuměný obrázek Y
32 Výsledky odšumování Initial dictionary (overcomplete DCT) 64×256 Původní Výsledek dB Zašuměný Slovník po 10 iteracích
33 Reference Elad, M. Aharon, M., Image Denoising Via Sparse and Redundant Representations Over Learned Dictionaries, IEEE Transactions on Image Processing, 2006 P. Vincent, Y. Bengio, Kernel matching pursuit, Machine Learning Journal 48, 2002 Aharon, M., Elad, M. and Bruckstein, A.M., The K-SVD: an algorithm for designing of overcomplete dictionaries for sparse representation. IEEE Transactions on Signal Processing, 2005 Ying Nian Wu, Deformable Template as Active Basis, ICCV07,