Voice activity detection from gaze in video mediated communication Michal Hradis, Shahram Eivazi, Roman Bednarik Vysoké učení technické v Brně, Fakulta informačních technologií v Brně Božetěchova 2, Brno
Data Záhlaví ( )2
Úloha Pro každého účastníka určit, jestli mluví. Pouze na základě pohledových dat. Záhlaví ( )3
Přístup SVM klasifikátor RBF jádro mluví x nemluví zvlášť pro každého účastníka příznaky z krátké minulosti extrahované zvlášť pro každého účastníka Záhlaví ( )4
5 člověk zájmu ostatní lidi vše ostatní okno anotace - predikcepohledová data počet fixací průměrná délka fixace průměrná vzdálenost fixací + počet lidí, na které se podíval
Výsledky Záhlaví ( )6 okna 1, 2, 3 anotace - predikcepohledová data Baseline EER =28 % Spojená okna 200 ms, 400 ms, 600 ms a 800 ms Lineární 13 % RBF 11%
D-META evaluace ( Task: Conversational engagement prediction Aktuálně se připravuje Call for papers (konference je v US ) Určení úrovně zapojení člověka ve vedlejší místnosti do konverzace: No interest, Following, Responding, Conversing, Influencing, Managing Předběžné termíny: 19-Mar-2012 Data set annotation is released 31-Jul-2012 Paper deadline 24-Aug-2012 Author notiffication 14-Sep-2012 Camera-ready Oct-2012 Work presented atD-META'12 Záhlaví ( )7
RBM – restricted boltzman machine Záhlaví ( )8 h v
Nápověda tagů (TRECVID) Záhlaví ( )9
CRBM – conditional RBM Záhlaví ( )10 h vc