Klasifikace a rozpoznávání

Slides:



Advertisements
Podobné prezentace
PLAYBOY Kalendar 2007.
Advertisements

TEORIE ROZHODOVÁNÍ A TEORIE HER
Vlastní skript může být umístěn: v hlavičce stránky v těle stránky
*Zdroj: Průzkum spotřebitelů Komise EU, ukazatel GfK. Ekonomická očekávání v Evropě Březen.
Český Internet po (uši v?) krizi Marek Antoš. snímek |datum |dokument | 1. Internetové prostředí 2.
Ukončení 1.etapy výuky cizího jazyka
Název a adresa školy: Střední odborné učiliště stavební, Opava, příspěvková organizace, Boženy Němcové 22/2309, Opava Název operačního programu:
Diskrétní matematika Opakování - příklady.
Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv.
Ten, ta, to II Fill in the blanks with the appropriate forms of ten. Vzor: Proč potřebuješ ___ knihy? Proč potřebuješ ty knihy? *Taken from Review Lesson.
Dynamické rozvozní úlohy
Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .
Správné pády I In the following sentences, put the nouns between slash marks into the correct case. Vzor: Přes naše rozdíly zůstanu /tvůj přítel/. Přes.
Vizualizace projektu větrného parku Stříbro porovnání variant 13 VTE a menšího parku.
Vzdělávací materiál / DUMVY_32_INOVACE_02B14 Příkazový řádek: obsah souborů PŘÍKLADY AutorIng. Petr Haman Období vytvořeníLeden 2013 Ročník / věková kategorie3.
Josef Keder Hana Škáchová
Dělení se zbytkem 3 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Lineární rovnice Běloun 91/1 a
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
Constructions with by Rewrite the following sentences using by constructions. Do not change the aspect. Vzor: Chci hrát tenis. Chtěl/Chtěla bych hrát tenis.
VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)
Speciální vzdělávací potřeby - žádné - Klíčová slova
Decision Trees & Genetic Programming 1 Klasické DT V některých případech nepraktické.
Získávání informací Získání informací o reálném systému
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Dělení se zbytkem 6 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Název materiálu: OPAKOVÁNÍ 1.POLOLETÍ - OTÁZKY
Název školyIntegrovaná střední škola technická, Vysoké Mýto, Mládežnická 380 Číslo a název projektuCZ.1.07/1.5.00/ Inovace vzdělávacích metod EU.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Jazyk vývojových diagramů
Elektronická učebnice - I

Číslo projektu CZ.1.07/1.4.00/ Šablona klíčové aktivity III/2 Sada Anglický jazyk Název Present simple and continuous Klíčová slova Přítomný.
Posloupnosti, řady Posloupnost je každá funkce daná nějakým předpisem, jejímž definičním oborem je množina všech přirozených čísel n=1,2,3,… Zapisujeme.
Násobení zlomků – teorie a cvičení VY_32_INOVACE_19
52_INOVACE_ZBO2_1364HO Výukový materiál v rámci projektu OPVK 1.5 Peníze středním školám Číslo projektu:CZ.1.07/1.5.00/ Název projektu:Rozvoj vzdělanosti.
Název materiálu: OPAKOVÁNÍ 1.POLOLETÍ - OTÁZKY
Zásady pozorování a vyjednávání Soustředění – zaznamenat (podívat se) – udržet (zobrazit) v povědomí – představit si – (opakovat, pokud se nezdaří /doma/)
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Cvičná hodnotící prezentace Hodnocení vybraného projektu 1.
Nový trend ve slunolamech Radek Pelz, ALARIS Czech Republic s.r.o.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
MS PowerPoint Příloha - šablony.
Pojmy a interpretace.
Konference SI Praha Ladislav Přívozník is:energy czech a.s.
1 Celostátní konference ředitelů gymnázií ČR AŘG ČR P ř e r o v Mezikrajová komparace ekonomiky gymnázií.
Technické kreslení.
Název materiálu: OPAKOVÁNÍ 1.POLOLETÍ - OTÁZKY
© 2006 Cisco Systems, Inc. All rights reserved.Cisco PublicITE I Chapter 6 1 Inter-VLAN Routing LAN Switching and Wireless – Chapter 6.
Abeceda VY_32_INOVACE_122, 7. sada, ČJ2 Český jazyk, 2. ročník ANOTACE
 Co je strategie? Dlouhodobý plán č inností zam ěř ený na dosa ž ení cíle Z ř eckého „strategos“ – generál - vedení  Rozdíl mezi strategií a taktikou?
Přednost početních operací
Modelování odezvy zákazníků v systému SAS Enterprise Miner™ Ukázková úloha pro předmět Získávání znalostí z databází doc. Ing. Jaroslav Zendulka, CSc.
DĚLENÍ ČÍSLEM 5 HLAVOLAM DOPLŇOVAČKA PROCVIČOVÁNÍ Zpracovala: Mgr. Jana Francová, výukový materiál EU-OP VK-III/2 ICT DUM 50.
Slovní úlohy řešené soustavou rovnic
Rekurze Predikát predek(X,Y). predek(X,Y) :- rodic(X,Y). predek(X,Y) :- rodic(Z,Y),predek(X,Z).
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
Autor: Ondřej Šimeček Verze: 1.1.3
© 2006 Cisco Systems, Inc. All rights reserved.Cisco PublicITE I Chapter 6 1 LAN Design LAN Switching and Wireless – Chapter 1.
Realtime identifikace osob podle hlasu
Prostorové dotazy. Buffer = obalová zóna Input Features = vstupní vrstva Output Feature Class = nově vytvořená třída s výsledky (Shapefile) Distance.
Modely uživatelských preferencí. Obsah Jak se vyjadřují preference Modely preferencí a jejich učení Model založený na atributech Kolaborativní filtrování.
Prostorové dotazy.
Klasifikace a rozpoznávání
Klasifikace a rozpoznávání
Klasifikace a rozpoznávání Lineární klasifikátory.
Klasifikace a rozpoznávání
Transkript prezentace:

Klasifikace a rozpoznávání Úvod do problematiky

CareTaker project Dohledové kamery Trajektorie osob Klasifikace (HMM) Rozpoznání „nestandardních“ Rozpoznání „podivných“ objektů (kolo v metru) Graph@FIT 2 2

FIT Participation in TRECVID 2007 High-level feature extraction Úkol: Pro daný shot videa určit, zda vykazuje daný rys Systém se učí z dat, která jsou kolektivně anotována pomocí webové aplikace (klíčové snímky) Pak posoudí sekvence (jejich klíčové snímky), které nikdy neviděl Data: databáze odvysílaných naučných pořadů BBC (stovky hodin, tj. stovky GB) Kategorie (high-level features) jsou na dalším slajdu, některé fakt „nedetekovatelné“

High Level Feature Extraction Sports: Shots depicting any sport in action Entertainment: DROPPED Weather: Shots depicting any weather related news or bulletin Court: Shots of the interior of a court-room location Office: Shots of the interior of an office setting Meeting: Shots of a Meeting taking place indoors Studio: Shots of the studio setting including anchors, interviews and all events that happen in a news room Outdoor: Shots of Outdoor locations Building: Shots of an exterior of a building Desert: Shots with the desert in the background Vegetation: Shots depicting natural or artificial greenery, vegetation woods, etc. Mountain: Shots depicting a mountain or mountain range with the slopes visible Road: Shots depicting a road Sky: Shots depicting sky Snow: Shots depicting snow Urban: Shots depicting an urban or suburban setting Waterscape_Waterfront: Shots depicting a waterscape or waterfront Crowd: Shots depicting a crowd Face: Shots depicting a face Person: Shots depicting a person (the face may or may not be visible) Government-Leader: DROPPED Corporate-Leader: DROPPED Police_Security: Shots depicting law enforcement or private security agency personnel Military: Shots depicting the military personnel Prisoner: Shots depicting a captive person, e.g., imprisoned, behind bars, in jail or in handcuffs, etc. Animal: Shots depicting an animal, not counting a human as an animal Computer_TV-screen:Shots depicting a television or computer screen Flag-US: Shots depicting a US flag Airplane: Shots of an airplane Car: Shots of a car Bus: Shots of a bus Truck: Shots of a truck Boat_Ship: Shots of a boat or ship Walking_Running: Shots depicting a person walking or running People-Marching: Shots depicting many people marching as in a parade or a protest Explosion_Fire: Shots of an explosion or a fire Natural-Disaster: Shots depicting the happening or aftermath of a natural disaster such as earthquake, flood, hurricane, tornado, tsunami Maps: Shots depicting regional territory graphically as a geographical or political map Charts: Shots depicting any graphics that is artificially generated such as bar graphs, line charts, etc. (maps should not be included)

Detekce obličeje a výrazu skenování obrazu AdaBoost klasifikátorem (klasifikace výřezů na obsahuje obličej/neobsahuje obličej) Parametrizace výřezu pomocí Haarových vlnek, o kterých bude řeč určitě v 12 Rozpoznávání výrazů pomocí podobných kasfikátorů, jako pro detekci 4 výrazy = 4 binár klasifikátory, každý rozhoduje mezi jedním výrazem a ostatními. Odezvy klasifikátorů jsou spojeny. Detekce obličeje – druhé demo ukázka aplikace v dohledových systémech  - na detekci by navazovalo například rozpoznávání osob podle obličeje (hledání vrahů, teroristů, a opozičních živlů)

Zpracovaní Řeči Web-based LID http://speech.fit.vutbr.cz/lid-demo/ Web-based Lecture Browser http://pcspeech7.fit.vutbr.cz/mbrowser/demo/

Jak takový klasifikátor pracuje?

Snímání Co se dá o rozpoznávaných předmětech zjistit? obraz, tlak, teplota, hmotnost, zvuk, pach ? jak tyto veličiny prakticky získat, jde to vůbec a kolik to bude stát ? jaké vlastnosti bude mít snímač a převod veličinačíslo ? šum linearita kalibrace stárnutí atd.

Segmentace a seskupování Rozpoznávané vzorky by mely byt izolované a neměly by s překrývat…ale to často neplatí:

Segmentace a seskupování Příklady: Při rozpoznávání řeči se signál rozdělí do krátkých úseků fixní délky, které jsou nejprve zpracovávaný samostatně a teprve později začne klasifikátor uvažovat tyto segmenty v kontextu segmentů okolních V předchozí demonstraci jsme viděli, že se v obraze nejprve detekuje obličej pomocí spousty jednoduchých klasifikátorů soustředících se na různé oblasti v obraze. Na detekovaný obličej byla poté aplikována detekce výrazu v obličeji

Extrakce příznaků Příznaky musí umožnit rozlišovat mezi třídami  musí být diskriminativní. Jedná se o předzpracování vstupu do následujícího klasifikátoru Redukce dimenzí Invariance vůči: translace (mÍsto v obrázku, čas v řeči) rotace scale (velikost v obrázku, volume v řeči) occlusion (zakrytí objektu vs. Maskování šumem) projective distorition (úhel pohledu, optika) rate (rychlost v řeči - intra- a inter-speaker variabilita) deformace atd. Dekorelace…ale o tom ještě bude řeč v samostatné přednášce o příznacích.

Extrakce příznaků Bude průměr jablka / granátu dobrým příznakem?  Podíl červené barvy [%]  Četnost  Průměr [mm]

Extrakce příznaků Nic moc, ale alespoň trochu lepší Granáty Jablka  Četnost [mm]  Podíl červené barvy [%] Intuitivně už bychom mohli začít rozpoznávat, nastavením prahu tak aby bylo co nejvíce vzorů, které jsme zatím viděli rozpoznáno správně

Extrakce příznaků Když se tak díváme na histogramy příznaků, asi nás budou pro rozpoznávání zajímat jejich pravděpodobnostní rozložení …ale to už zase předbíháme. Granáty Jablka  Četnost  Váha [dkg]

Vícerozměrné příznaky Co když se podíváme na váhu a podíl červené barvy současně. Pro rozpoznávání to tady vypadá už docela nadějně. Tak hurá na to. U jablek je váha korelovaná s červeností Granáty Jablka  Podíl červené barvy [%]  Váha [dkg]

Klasifikace O co nám jde je najít vhodnou rozhodovací linii (decision boundary) přece oddělit vzorky jedné třídy od druhé. …to se nám to krásně povedlo…ale možná to nebude to pravé

Generalizace V našem přikladu byly data náhodně vygenerovány z gaussovského rozložení. Pokud si takových dat „nasbíráme“ víc, už s našim výsledkem nebudeme tak spokojeni. Systém negeneralizuje na nová data.

Lineární klasifikátor Omezeni schopnosti detailně modelovat rozhodovací línii vedlo ke zlepšení generalizace. Oddělení tříd prostou přímkou nebo obecně hyper-rovinou teď vypadá o mnoho přijatelněji. O tom jak takovou rovinu určit bude samostatná přednáška. Bohužel, rozpoznávání z takto vybraných příznaku nebude nikdy bez chyb, protože jejich rozložení se překrývají. Budeme tuto chybu chtít alespoň minimalizovat

Lineární klasifikátor V příští přednášce si ukážeme, že pro tento případ, kdy mají jednotlivé třídy gaussovské rozložení, dosáhneme nejlepší úspěšnosti při oddělení tříd kvadratickou křivkou.

Klasifikátor založený na K-nejbližších sousedech Bude klasifikován jako granát “Neparametricky klasifikátor”  nemá žádné parametry, které by bylo potřeba trénovat či odhadovat. Klasifikátor si pamatuje všechna “trénovací data“. K nově klasifikovanému vzoru najde K nejbližších vzorů z trénovacích dat a vybere tu třídu, která je ve vybraných vzorech nejčastěji zastoupena.  Červenost Granáty Jablka Můžu ale vůbec rovnávat váhu s červeností? Prvně bude potřeba obě veličiny normalizovat – převézt do srovnatelného dinamického rozsahu  Váha

1-nejbližší soused Opět problém z generalizací – podobná klikatá rozhodovací hranice.

3-nejbližší sousedé O něco lepší výsledek. Zvýšení „počtu sousedů“ vede k vyhlazení rozhodovací hranice, přestože jsme model nijak nezjednodušili. Zde by se dalo mluvit o obdobě regularizace (viz další přednášky)

9-nejbližších sousedů Rozhodovací linie už je dosti podobná optimální kvadratické křivce

9-nejbližších sousedů měkké rozhodnutí Místo tvrdého rozhodnutí můžeme použít poměr mezi počtem sousedů z různých tříd jako „měkké“ měřítko důvěry (confidence), že vzor patří do té či oné třídy (pro K=9 máme pouze 10 úrovní).

31-nejbližších sousedů měkké rozhodnutí

Post-processing Závislé na konkrétním úkolu. Využití dalších kontextových informací jiných než je samotný vzor Pokud je výstupem klasifikátoru měkké rozhodnutí, post-processing se může přiklonit jedné variantě než té s nejlepším skóre: např. integrace apriorní pravděpodobnosti (viz další přednáška) Můžeme brát v úvahu ceny jednotlivých rozhodnutí. Co nás bolí víc? Poslat jablko pyrotechnikovi nebo granát do marmeládovny. Rozhodnutí pro konkrétní třídu pokud její skóre překročí jistý práh  Detekční úloha

Identifikace vs. detekce Identifikace vyber jednu z N možných tříd V příchozích vzorech detekuj ty, které paří do třídy, kterou hledáme. Vzory, které detekovat nechceme nemusí patřit do omezeného tříd (např. v telefonních hovorech hledáme hlas konkrétního mluvčího mezi hlasy všech možný mluvčích) Detekci proveď na základě měkkého rozhodnuti – skóre – a nastaveného prahu. Detekční práh je možné měnit podle požadované aplikace: Práh nastavený nízko  Hodně detekcí ale také hodně planých poplachů Práh nastavený vysoko  opačný problém

Detection tradeoff (DET) křivka

The Design Cycle Data collection Feature Choice Model Choice Training Evaluation Computational Complexity

The Design Cycle Data Collection Feature Choice Model Choice Training How do we know when we have collected an adequately large and representative set of examples for training and testing the system? Feature Choice Depends on the characteristics of the problem domain. Simple to extract, invariant to irrelevant transformation insensitive to noise. Model Choice Unsatisfied with the performance of our fish classifier and want to jump to another class of model Training Use data to determine the classifier. Many different procedures for training classifiers and choosing models Evaluation Measure the error rate (or performance and switch from one set of features to another one

Learning and Adaptation Supervised learning A teacher provides a category label or cost for each pattern in the training set Unsupervised learning The system forms clusters or “natural groupings” of the input patterns Reinforcement learning A teacher only say whether the classifier is correct or not on a training data.

k_nearest_neighbours in Matlab function [output_class score]=k_nearest_neighbours(test_data, class1_examples, class2_examples, k) euclidean_distances=dist([class1_examples class2_examples], test_data); [v i]=sort(euclidean_distances); score = sum(i(1:k,:) > size(class1_examples,1)) / k; output_class = score > 0.5;