Aplikace Hidden Conditional Random Fields for Gesture Recognition Sy Bor Wang Ariadna Quattoni Louis-Philippe Morency David Demirdjian Trevor Darrell Computer.

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

Program na výpočet parametrů vlhkého vzduchu
Programování funkcí v Excelu (pole)
Testování neparametrických hypotéz
SMS brána Eurotel Jednoduché OCR pomocí neuronových sítí Marek Kukačka
Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv.
Manažerská grafika: Program č.3 Jaroslav LosSB 272.
Monte Carlo permutační testy & Postupný výběr
Jiří Gazárek, Martin Havlíček Analýza nezávislých komponent (ICA) v datech fMRI, a ICA necitlivá ke zpoždění.
možnosti: -spustit prezentaci na interaktivní tabuli -na centrálním PC -pracovat ve dvojicích - / jeden PC jako náhled a druhý na aktivní činnost/
Zarovnávání biologických sekvencí
Slepý experiment na určování skluzu (EC projekt SPICE) a jeho řešení primitivní metodou J. Zahradník katedra geofyziky MFF UK.
Medians and Order Statistics Nechť A je množina obsahující n různých prvků: Definice: Statistika i-tého řádu je i-tý nejmenší prvek, tj., minimum = statistika.
Návrh modelů Jan Brůha IREAS. Návrh otázek a modelů Jaký vliv měla podpora z ESF v OP LZZ 1.1 na obrat / zisk a zaměstnanost firem? – Jde o srovnání mezi.
Teorie pravděpodobnosti
T.A. Edison Tajemství úspěchu v životě není v tom, že děláme, co se nám líbí, ale, že nacházíme zalíbení v tom, co děláme.
Hana Kotinová Struktura a cíl práce Metody předzpracování dat Systémy předzpracování dat Historie vývoje DPT Jak program pracuje Budoucnost.
Fakulty informatiky a statistiky
Vyber si některý z obrázků Přemýšlej pomocí obrázku, o čem by mohla být dnešní hodina, co tě k obrázku napadá? Zapiš si své nápady do sešitu + Zkus svůj.
VY_32_INOVACE_In 6.,7.19 PowerPoint - Vkládání grafických objektů Anotace: Žák se seznámí se zásadami vkládání grafických objektů jako fotek, klipartů.
Vytvoříte si nějakou nádhernou tabulku. (lepší než mojí nebudete mít, tak se nikdy moc nesnažte) Celou si ji označíte... Next A kliknete na obrázek grafu.
VLASTNOSTI GRAFŮ Vlastnosti grafů - kap. 3.
Procesor Procesor je ústřední výkonnou jednotkou počítače, která čte z paměti instrukce a na jejich základě vykonává program. Pokud bychom přirovnali počítač.
Reprezentace klasifikátoru pomocí „diskriminant“ funkce
Poděkování: Tato experimentální úloha vznikla za podpory Evropského sociálního fondu v rámci realizace projektu: „Modernizace výukových postupů a zvýšení.
OSNOVA: a)Funkce – úvod b) Hlavičky funkcí c) Rekurze funkcí d)Knihovny funkcí e)Příklady Jiří Šebesta Ústav radioelektroniky, FEKT VUT v Brně Počítače.
Odhad metodou maximální věrohodnost
Jan Šaršon Milan Jaška 1Dobývání znalostí, MFF UK, 2008.
Dolce: Databáze lokálních konformací DNA
Kompresní metoda ACB Associative Coder of Buyanovsky autor: George Buyanovsky připravil Tomáš Skopal podle knihy „Data Compression“ od D. Salomona, 1997,
Zvuk VY_32_INOVACE_Mul4a0220Mgr. Jiří Mlnařík. Synfig studio je primárně obrazový software. Teoreticky můžeme do scény vložit zvuk pomocí volby File /
Nelinearity s hysterezí Přerušení platnosti relace vytváří dvě různé charakteristiky, jejichž platnost je podmíněna směrem pohybu Hystereze přepínače x.
VŠB –TUO ATŘ Manažerská grafika Grafy v MS Excel 2003 Podešva Petr
Opakování lekce 4,5,
Species abundance patterns Jan Klečka. Typy modelů (nejedná se o úplný výčet) 1) Statistické modely Log-series (Fisher et al. 1943) Log-normal (Preston.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Monte Carlo simulace Experimentální fyzika I/3. Princip metody Problémy které nelze řešit analyticky je možné modelovat na základě statistického chování.
W i ref (t+1) = W i ref (t) + h ci (t) [X(t) - W i ref (t)], i Nc h ci (t) 0, t  proces konverguje Algoritmy a struktury neuropočítačů ASN – P3 SOM algoritmus.
Mgr. Karel FischerÚprava prezentace1 Změna použité šablony Ke změně šablony mohu použít jednu ze tří možností: a)Formát \ návrh snímku b)V panelu nástrojů.
Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK
Jaký je skalární součin vektorů
MASKS © 2004 Invitation to 3D vision. MASKS © 2004 Část 1 Přehled a úvod.
N_OFI_2 2. Přednáška Opce Ing. Miroslav Šulai, MBA 1.
Algoritmy a struktury neuropočítačů ASN - P14 Hopfieldovy sítě Asociativní paměti rekonstrukce původních nezkreslených vzorů předkládají se neúplné nebo.
Dita Matesová, David Lehký, Zbyněk Keršner
Klasifikace a rozpoznávání
Martin Langhammer Antonín Wimberský. ÚVOD PŘEDPOKLADY Jednotný vstup Zadní SPZ Stejný úhel a vzdálenost záběru Pouze vodorovné záběry značek Obdélníkové.
Cenová mapa podnájmů v Praze Ondřej Kmoch Tomáš Kohan
Neuronové sítě.
Klasifikace a rozpoznávání Lineární klasifikátory.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Grafické systémy II. Ing. Tomáš Neumann Interní doktorand kat. 340 Vizualizace, tvorba animací.
Míra konfliktu pozorování ● Pozorování ● BT=y, UT=no, Sc=y ● Vyjde Pr(0.12,0.88), ● ale nakolik věříme našim pozorováním a tím i výsledku? ● Kladná míra.
VIDEO. Co je video… Video je sekvence po sobě jdoucích obrázků Lidské oko (z důvodu setrvačnosti) nevnímá jednotlivé obrázky, ale plynulý pohyb Počet.
Grafický editor GIMP (8) Mgr. Jaroslav Zavadil, Gymnázium Šternberk  vyvážení barev  napodobení černobílé fotografie Dostupné z Metodického portálu
Algoritmizace a programování Algoritmy 5 – Myšlenkové mapy.
Název školy: ZŠ A MŠ ÚDOLÍ DESNÉ, DRUŽSTEVNÍ 125, RAPOTÍN Název projektu: Ve svazkové škole aktivně - interaktivně Číslo projektu: CZ.1.07/1.4.00/
Mnohonásobné imputace chybějících hodnot Analytické metody výzkumu pro mgr. Ivan Petrúšek
Využití klíčových snímků
Grafický editor GIMP (8)
Elektrické obvody.
Goniometrické funkce Autor © Mgr. Radomír Macháň
Klasifikace a rozpoznávání
Klasifikace a rozpoznávání
1 Lineární (vektorová) algebra
Neuronové sítě.
ANALÝZA A KLASIFIKACE DAT
Pokročilé neparametrické metody Validační techniky
Základy statistiky.
F-Pn-P062-Odchylky_mereni
Transkript prezentace:

Aplikace Hidden Conditional Random Fields for Gesture Recognition Sy Bor Wang Ariadna Quattoni Louis-Philippe Morency David Demirdjian Trevor Darrell Computer Science and Artificial Intelligence Laboratory, MIT cca. 2007

Cíl – rozpoznat šest gest z videa FB - Flip Back, SV - Shrink Vertically, EV - Expand Vertically, DB - Double Back, PB - Point and Back, EH – Expand Horizontally.

Experiment ● 13 lidí předvedlo 6 gest ● snímala stereo kamera ● cca. 90 vzorů pro každé gesto ● ručně určena cílová třída (typ gesta).

Předzpracování - úhly a relativní pozice kloubů D. Demirdjian and T. Darrell. 3-d articulated pose tracking for untethered deictic reference. In Int’l Conf. on Multimodal Interfaces, 2002.

(Mezi)výsledek ● Každý obrázek videa je označkován buď ● kódem gesta ● nebo ● skrytým stavem. ● Z posloupnosti se (různě dle modelu) určí výsledná třída. ● Zobrazeno jen prvních pár snímků.

Kudy na věc ● Skrytá struktura pohybu – gesto neuhádneme z jednotlivého obrázku ● HMM předpokládá nezávislá pozorovnání dáno skrytý stav/gesto – evidentně neplatí ● CRF nezávislost nepředpokládají ● HCRF – přidáme a naučíme skrytý stav „nějak“ reprezentující strukturu gesta ● pro každé gesto zvlášť ● všechna gesta sdílejí stejné skryté stavy.

HMM – skryté markovské modely ● Pro každé gesto naučíme skrytý markovský model ● každý model měl 4 stavy ● používal „single Gausian observation model“ ● Pro x vybereme model s maximální věrohodností pozorované posloupnosti x.

CRF – podmíněné náhodné pole ● Každá třída gest měla svůj stav y ● CRF predikuje Y pro každý obrázek (frame) ● najdeme nejpradvěpodobnější posloupnost (Viterbi) ● Pro x predikujeme nejčastější tag v nejpravděpodobnější posloupnosti.

HCRF každý zvlášť ● Hidden state conditional random field (HCRF) ● pro každou třídu učíme vlastní HCRF s 6-ti skrytými stavy ● pro x vydáme argmax P(model_gesta). ● Počet skrytých stavů zvolen tak, aby minimalizoval chybu na trénovacích datech.

HCRF multi-class ● Učíme jediný HCRF s 12 skrytými stavy. ● Pro x vydáme nejpravděpodobnější y. ● ω velikost okna ● času t-ω, t+ω ● φ reprezentuje features

Výsledky ● Jaká je úspěšnost ZERO – klasifikátoru? ● Tipněte, proč je CRF-1 horší než CRF-0. ● Uveďte dva důvody, proč může být HCRF-0 multi-class lepší než HCRF-0 one-vs-all. ● Tipněte, proč je HCRF-1 lepší než HCRF-0.

Naučené skryté stavy ● Naučené skryté stavy odpovídají – ale ne úplně – jednotlivým gestům. ● je tam docela dost překryvu (stav 4) ● charakteristické pozice odpovídají různým stavům ● neutrální pozice nejsou příliš rozlišeny.

Tag-ované začátky gest

HCRF - interpretace ● Učíme tři druhy parametrů theta – s, y, e. ● skalární součin můžeme interpretovat jako míru kompatibility mezi pozorovanou posloupností a stavem v čase j při velikosti okna ω ● ● reprezentuje kompatibilitu skrytého stavu a gesta ● měří kompatibilitu mezi dvojicí po sobě jdoucích stavů a gestem.

Učení ● HMM – Baum-Welch, což je varianta EM algoritmu pro HMM, ● CRF – gradientně maximalizujeme log- likelihood (Quasi-Newton optim.) ● HCRF – inference i odhad parametrů lze exaktně, protože graf E je řetězec (chain), takže cílová funkce a její gradient lze vyjádřit jako marginály. apriorn í