© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

Silové soustavy, jejich klasifikace a charakteristické veličiny
Lineární funkce - příklady
Mechanika s Inventorem
Rovnice roviny Normálový tvar rovnice roviny
Základy lineárního programování
T.A. Edison Tajemství úspěchu v životě není v tom, že děláme, co se nám líbí, ale, že nacházíme zalíbení v tom, co děláme.
Optimalizační úlohy i pro nadané žáky základních škol
Fakulta životního prostředí Katedra informatiky a geoinformatiky
Shluková analýza.
Rovinné útvary.
MATEMATIKA I.
Formulace a vlastnosti úloh lineárního programování
Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: CZ.1.07/1.5.00/ Šablona:III/2č. materiálu:VY_32_INOVACE_89.
Funkce Základní pojmy. Funkce - Základní pojmy Základní pojmy Funkce  Funkce je pravidlo, které každému reálnému číslu z určité podmnožiny množiny 
Harmonická analýza Součet periodických funkcí s periodami T, T/2, T/3,... je periodická funkce s periodu T má periodu T perioda základní frekvence vyšší.
Shluková analýza.
Funkce více proměnných.
CW – 05 TEORIE ROZHODOVACÍCH PROCESŮ Ústav technologie, mechanizace a řízení staveb Fakulta stavební VUT v Brně © Ing. Václav Rada, CSc. 15. PŘEDNÁŠKA.
TECHNICKÉ KRESLENÍ Autor: Luboš Šlechta Datum: Třída: 8 - 9
Reprezentace klasifikátoru pomocí „diskriminant“ funkce
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: CZ.1.07/1.5.00/ Šablona:III/2č. materiálu:VY_32_INOVACE_87.
SIGNÁLY A SOUSTAVY V MATEMATICKÉ BIOLOGII
Pravoúhlá soustava souřadnic v rovině
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Množiny.
Vektorové prostory.
Diferenciální geometrie křivek
SIGNÁLY A LINEÁRNÍ SYSTÉMY
2. Vybrané základní pojmy matematické statistiky
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Podobnost trajektorií Jiří Jakl Úvod - využití Rozpoznáváni ručně psaných textů GPS navigace Analýza pohybu pracovníku v budovách Predikce.
ANALÝZA A KLASIFIKACE DAT
SIGNÁLY A LINEÁRNÍ SYSTÉMY
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
4.2. Aplikace elementární difúzní teorie
Klasifikace a rozpoznávání
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík, CSc.
Funkce Lineární funkce a její vlastnosti 2. Funkce − definice Funkce je předpis, který každému číslu z definičního oboru, který je podmnožinou množiny.
Lineární funkce Rozdělení lineárních funkcí Popis jednotlivých funkcí.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
ANALÝZA A KLASIFIKACE DAT
Technické zobrazování
Ing. Milan Houška KOSA PEF ČZU v Praze
ČASOVÉ ŘADY (SIGNÁLY A LINEÁRNÍ SYSTÉMY )
ANALÝZA A KLASIFIKACE DAT
Spojitá a kategoriální data Základní popisné statistiky
1 Lineární (vektorová) algebra
Funkce více proměnných.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
AUTOMATIZAČNÍ TECHNIKA Spojité a nespojité řízení
Lineární funkce a její vlastnosti
Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Upravila R.Baštářová.
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT
Konstruktivní úlohy na rotačních plochách
ANALÝZA A KLASIFIKACE DAT
Autor: Honnerová Helena
2. Vybrané základní pojmy matematické statistiky
ANALÝZA A KLASIFIKACE DAT
INTENZITA ELEKTRICKÉHO POLE.
Fyzikální veličiny Míry fyzikálních vlastností: X = x [X]
ANALÝZA A KLASIFIKACE DAT
ANALYTICKÁ GEOMETRIE Analytická geometrie je část geometrie, která v euklidovské geometrii zkoumá geometrické útvary pomocí algebraických a analytických.
Transkript prezentace:

© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

© Institut biostatistiky a analýz III. P Ř ÍZNAKOVÁ KLASIFIKACE - ÚVOD

© Institut biostatistiky a analýz P Ř ÍZNAKOVÝ POPIS Příznakový obraz x zpracovávaných dat je vyjádřen n-rozměrným (sloupcovým) vektorem hodnot x i, i=1,2,…,n příznakových proměnných (veličin) charakterizujících vlastnosti těchto dat, tj. platí x=(x 1,x 2,…,x n ) T.

© Institut biostatistiky a analýz P Ř ÍZNAKOVÝ POPIS Příznakové proměnné mohou popisovat kvantitativní i kvalitativní vlastnosti souboru dat. Jejich hodnoty nazýváme příznaky. Podle definičního oboru rozlišujeme proměnné:  spojité  nespojité, diskrétní, vyjmenovatelné  logické, binární, alternativní, dichotomické

© Institut biostatistiky a analýz Vrchol každého příznakového vektoru (obrazu) představuje bod n-rozměrného prostoru X n, který nazýváme obrazovým prostorem. Obrazový prostor je definován kartézským součinem definičních oborů všech příznakovým proměnných, tzn. že jej tvoří všechny možné obrazy zpracovávaného souboru dat. P Ř ÍZNAKOVÝ POPIS

© Institut biostatistiky a analýz Při vhodném výběru příznakových veličin je podobnost signálů jedné klasifikační třídy vyjádřena blízkostí jejich obrazů v obrazovém prostoru. Vymezení klasifikační třídy:  etalony - charakteristické reprezentativní obrazy  hranice  diskriminační funkce P Ř ÍZNAKOVÝ POPIS

© Institut biostatistiky a analýz Příznakový klasifikátor je stroj s tolika vstupy, kolik je příznaků a s jedním diskrétním výstupem, který udává třídu, do které klasifikátor zařadil rozpoznávaný obraz. ω r = d(x) d(x) je skalární funkce vektorového argumentu x, kterou nazýváme rozhodovací pravidlo klasifikátoru; ω r je identifikátor klasifikační třídy P Ř ÍZNAKOVÝ KLASIFIKÁTOR

© Institut biostatistiky a analýz  deterministický a nedeterministický  s pevným a proměnným počtem příznaků  bez učení a s učením P Ř ÍZNAKOVÝ KLASIFIKÁTOR

© Institut biostatistiky a analýz  deterministický a nedeterministický  s pevným a proměnným počtem příznaků  bez učení a s učením Nadále se nějaký čas věnujme deterministickým klasifikátorům s pevným počtem příznaků. P Ř ÍZNAKOVÝ KLASIFIKÁTOR

© Institut biostatistiky a analýz  Obrazový prostor je rozhodovacím pravidlem rozdělen na R disjunktních prostorů R r, r=1,…,R, přičemž každá podmnožina R r obsahuje ty obrazy x, pro které je ω r = d(x).  Návrh rozhodovacího pravidla je základním problémem návrhu klasifikátoru. P Ř ÍZNAKOVÝ KLASIFIKÁTOR

© Institut biostatistiky a analýz DISKRIMINAČNÍ ANALÝZA týká se obecně vztahu mezi kategoriální proměnnou a množinou vzájemně vázaných příznakových proměnných. Konkrétně, předpokládejme že existuje konečný počet, řekněme R, různých a priori známých populací, kategorií, tříd nebo skupin, které označujeme ω r, r=1,…,R a úkolem diskriminační analýzy je nalézt vztah, na základě kterého pro daný vektor příznaků popisujících konkrétní objekt tomuto vektoru přiřadíme hodnotu ω r. KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ

© Institut biostatistiky a analýz KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ  hranice klasifikačních tříd definujeme pomocí R skalárních funkcí g 1 (x), g 2 (x),…, g R (x) takových, že pro obraz x z podmnožiny R r pro všechna r platí g r (x) > g s (x), pro s =1,2,…,R a r ≠ s  funkce g r (x) mohou vyjadřovat např. míru výskytu obrazu x patřícího do r-té klasifikační třídy v daném místě obrazového prostoru – nazýváme je diskriminační funkce

© Institut biostatistiky a analýz  hranice mezi dvěma sousedními podmnožinami R r a R s je určena průmětem průsečíku funkcí g r (x) a g s (x), definovaného rovnicí g r (x) = g s (x), do obrazového prostoru. KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ

© Institut biostatistiky a analýz BLOKOVÉ SCHÉMA KLASIFIKÁTORU POMOCÍ DISKRIMINAČNÍCH FUNKCÍ

© Institut biostatistiky a analýz BLOKOVÉ SCHÉMA KLASIFIKÁTORU POMOCÍ DISKRIMINAČNÍCH FUNKCÍ  u dichotomického klasifikátoru (dvě třídy) je ω = sign (g 1 (x) – g 2 (x))

© Institut biostatistiky a analýz KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ  nejjednodušším tvarem diskriminační funkce je funkce lineární, která má tvar g r (x) = a r0 + a r1 x 1 + a r2 x 2 +…+ a rn x n kde a r0 je práh diskriminační funkce posouvající počátek souřadného systému a a ri jsou váhové koeficienty i-tého příznaku x i  lineárně separabilní třídy

© Institut biostatistiky a analýz KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ  nejjednodušším tvarem diskriminační funkce je funkce lineární, která má tvar g r (x) = a r0 + a r1 x 1 + a r2 x 2 +…+ a rn x n kde a r0 je práh diskriminační funkce posouvající počátek souřadného systému a a ri jsou váhové koeficienty i-tého příznaku x i  lineárně separabilní třídy

© Institut biostatistiky a analýz KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ  nejjednodušším tvarem diskriminační funkce je funkce lineární, která má tvar g r (x) = a r0 + a r1 x 1 + a r2 x 2 +…+ a rn x n kde a r0 je práh diskriminační funkce posouvající počátek souřadného systému a a ri jsou váhové koeficienty i-tého příznaku x i  lineárně separabilní třídy

© Institut biostatistiky a analýz KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ  nejjednodušším tvarem diskriminační funkce je funkce lineární, která má tvar g r (x) = a r0 + a r1 x 1 + a r2 x 2 +…+ a rn x n kde a r0 je práh diskriminační funkce posouvající počátek souřadného systému a a ri jsou váhové koeficienty i-tého příznaku x i  lineárně separabilní třídy

© Institut biostatistiky a analýz KLASIFIKACE PODLE DISKRIMINAČNÍCH FUNKCÍ  zobrazíme původní n-rozměrný obrazový prostor X n nelineární transformací Φ: X n → X m do nového m-rozměrného prostoru X m, obecně je m≠n, tak, aby v novém prostoru byly klasifikační třídy lineárně separabilní a v novém prostoru použijeme lineární klasifikátor (Φ převodník) LINEÁRNĚ NESEPARABILNÍ TŘÍDY  zachováme původní obrazový prostor a zvolíme nelineární diskriminační funkci  definovanou obecně  složenou po částech z lineárních úseků

© Institut biostatistiky a analýz KLASIFIKACE PODLE MINIMÁLNÍ VZDÁLENOSTI  reprezentativní obrazy klasifikačních tříd - etalony  je-li v obrazovém prostoru zadáno R poloh etalonů vektory x 1E, x 2E,…, x RE, zařadí klasifikátor podle minimální vzdálenosti klasifikovaný obraz x do té třídy, jejíž etalon má od bodu x minimální vzdálenost. Rozhodovací pravidlo je určeno vztahem

© Institut biostatistiky a analýz KLASIFIKACE PODLE MINIMÁLNÍ VZDÁLENOSTI  uvažme případ dvou tříd reprezentovaných etalony x 1E = (x 11E, x 12E ) a x 2E = (x 21E, x 22E ) ve dvoupříznakovém euklidovském prostoru;  vzdálenost mezi obrazem x = (x 1,x 2 ) a libovolným z obou etalonů je pak definována  hledáme menší z obou vzdáleností, tj. min s=1,2 v(x sE,x), ale také min s=1,2 v 2 (x sE,x);

© Institut biostatistiky a analýz KLASIFIKACE PODLE MINIMÁLNÍ VZDÁLENOSTI

© Institut biostatistiky a analýz KLASIFIKACE PODLE MINIMÁLNÍ VZDÁLENOSTI  diskriminační kuželové plochy se protínají v parabole a její průmět do obrazové roviny je přímka definovaná vztahem x 1 (x 11E - x 21E ) + x 2 (x 12E - x 22E ) - (x 2 12E + x 2 11E - x 2 21E - x 2 22E )/2 = 0 Tato hraniční přímka mezi klasifikačními třídami je vždy kolmá na spojnici obou etalonů a tuto spojnici půlí  klasifikátor pracující na základě kritéria minimální vzdálenosti je ekvivalentní lineárnímu klasifikátoru s diskriminačními funkcemi.

© Institut biostatistiky a analýz KLASIFIKACE PODLE MINIMÁLNÍ VZDÁLENOSTI  Klasifikace podle minimální vzdálenosti s třídami reprezentovanými více etalony je ekvivalentní klasifikaci podle diskriminační funkce s po částech lineární hraniční plochou