Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

Podobné prezentace


Prezentace na téma: "© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc."— Transkript prezentace:

1 © Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

2 © Institut biostatistiky a analýz III. BAYES Ů V KLASIFIKÁTOR

3 © Institut biostatistiky a analýz ZÁKLADNÍ POJMY A PŘEDPOKLADY  při řešení praktických úloh je třeba předpokládat, že obrazy signálů jsou ovlivněny víceméně náhodnými fluktuacemi zdroje signálu, v přenosové cestě, při předzpracování i analýze, které se nepodaří zcela eliminovat.  ztrátová funkce (  r |  s ) udává ztrátu při chybné klasifikaci obrazu ze třídy  s do třídy  r.  matice ztrátových funkcí  střední ztráta J(a) udává průměrnou ztrátu při chybné klasifikaci obrazu x

4 © Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY  pokud se soustředíme na obrazy pouze ze třídy  s, je střední ztráta dána průměrnou hodnotou z (d(x,a)|  s ) vzhledem ke všem obrazům ze třídy  s, tj. kde p(x|  s ) je podmíněná hustota pravděpodobnosti výskytu obrazu x ve třídě  s

5 © Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY  Celková střední ztráta J(a) je průměrná hodnota ze ztrát J s (a)  nebo podle Bayesova vzorce ( P(ω s |x).p(x) = p(x|ω s ).P(ω s ) ) kde p(x) je hustota pravděpodobnosti výskytu obrazu x v celém obrazovém prostoru a P(  s |x) je podmíněná pravděpodobnost, že daný obraz patří do třídy  s (tzv. aposteriorní pravděpodobnost třídy  s.

6 © Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY  Návrh optimálního klasifikátoru, který by minimalizoval střední ztrátu, spočívá v nalezení takové množiny parametrů rozhodovacího pravidla a*, že platí  Dosadíme-li za J(a) z předchozího vztahu, je  Je-li ztrátová funkce (  r |  s ) konstantní pro všechny obrazy z  s, je dále

7 © Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY  Označíme-li ztrátu při klasifikaci obrazu x do třídy  r tak po dosazení dostaneme Úloha nalezení minima celkové střední ztráty se tak převedla na minimalizaci funkce L x (  r ). Optimální rozhodovací pravidlo d(x,a*) podle kritéria minimální celkové střední ztráty je

8 © Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY  Chceme-li využít principu diskriminačních funkcí  Diskriminační funkci optimálního klasifikátoru podle kritéria minimální chyby pak definujeme

9 © Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY DICHOTOMICKÝ KLASIFIKÁTOR Celková střední ztráta v případě dvou tříd je

10 © Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY DICHOTOMICKÝ KLASIFIKÁTOR Diskriminační funkce pro dichotomický klasifikátor bude Položíme-li tento výraz nule dostaneme vztah pro hraniční plochu dichotomického klasifikátoru, ze kterého můžeme určit poměr hustot pravděpodobnosti výskytu obrazu x v každé z obou klasifikačních tříd - věrohodnostní poměr Obraz x zařadíme do třídy  1, když je věrohodnostní poměr větší než výraz na pravé straně, je-li menší pak obraz x zařadíme do třídy  2.

11 © Institut biostatistiky a analýz V Ě ROHODNOSTNÍ POM Ě R I.  Sumarizuje veškerou informaci získanou experimentem.  Pravděpodobnost, že jev (data) nastane za daných podmínek (hypotéza) děleno pravděpodobností, že stejný jev nastane za jiných podmínek. Podmínky jsou vzájemně se vylučující.

12 © Institut biostatistiky a analýz V Ě ROHODNOSTNÍ POM Ě R II. Věrohodnostní poměr (likelihood ratio) LR udává podíl pravděpodobnosti, že se vyskytne nějaký jev A za určité podmínky (jev B), k pravděpodobnosti, že se jev A vyskytne, když podmínka neplatí (jev nonB). Má-li například pacient náhlou ztrátu paměti (jev A), chceme znát věrohodnostní poměr výskytu jevu A v případě, že má mozkový nádor (jev B), tj. podíl pravděpodobnosti, s jakou ztráta paměti vzniká při nádoru mozku, k pravděpodobnosti, s jakou vzniká v ostatních případech. Věrohodnostní poměr je tedy podíl podmíněných pravděpodobností

13 © Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ PRAVDĚPODOBNOSTI CHYBNÉHO ROZHODNUTÍ Díky obtížnému stanovení hodnot ztrátových funkcí (  r |  s ) se kritérium minimální chyby zjednodušuje použitím jednotkových ztrátových funkcí definovaných Matice jednotkových ztrátových funkcí má pak tvar a celková ztráta je což je hodnota pravděpodobnosti chybného rozhodnutí.

14 © Institut biostatistiky a analýz Dosadíme-li hodnoty jednotkových ztrátových funkcí do vztahu pro ztrátu při klasifikaci obrazu do chybné třídy a s využitím Bayesova vztahu p(x) nezávisí na klasifikační třídě a tedy neovlivňuje výběr minima. Diskriminační funkci tedy můžeme určit jako KRITÉRIUM MINIMÁLNÍ PRAVDĚPODOBNOSTI CHYBNÉHO ROZHODNUTÍ

15 © Institut biostatistiky a analýz V případě dichotomického klasifikátoru je diskriminační funkce A věrohodnostní poměr je potom KRITÉRIUM MINIMÁLNÍ PRAVDĚPODOBNOSTI CHYBNÉHO ROZHODNUTÍ

16 © Institut biostatistiky a analýz KRITÉRIUM MAXIMÁLNÍ APOSTERIORNÍ PRAVDĚPODOBNOSTI  Modifikujeme-li vztah pro ztrátu při chybné klasifikaci obrazu podle Bayesova vztahu ( P(ω s |x).p(x) = p(x|ω s ).P(ω s ) ) platí  Hustota pravděpodobnosti p(x) nezávisí na klasifikační třídě a tedy místo L x (ω r ) lze použít a s jednotkovými ztrátovými funkcemi je

17 © Institut biostatistiky a analýz  Minimum ztráty L‘ x (ω r ) je právě tehdy, když P(ω r |x) je maximální. Tzn. že jako diskriminační funkci můžeme zvolit právě hodnotu aposteriorní pravděpodobnosti třídy ω r, tj. g r (x) = P(ω r |x)  Pro případ dichotomického klasifikátoru je diskriminační funkce g(x) = P(ω 1 |x) - P(ω 2 |x) = 0. Z toho plyne, že hranicí mezi třídami určuje vztah P(ω 1 |x) = P(ω 2 |x) nebo Podle tohoto kritéria zatřídíme obraz do té třídy, jejíž aposteriorní pravděpodobnost je při výskytu obrazu x větší. KRITÉRIUM MAXIMÁLNÍ APOSTERIORNÍ PRAVDĚPODOBNOSTI

18 © Institut biostatistiky a analýz KRITÉRIUM MAXIMÁLNÍ PRAVDĚPODOBNOSTI (MINIMAX) Neznáme-li apriorní pravděpodobnosti všech tříd, předpokládáme rovnoměrné rozložení (pravděpodobnost všech tříd je táž (P(ω s ) = P(ω) =1/R). Potom celková střední ztráta dosáhne minima, když Diskriminační funkci lze jako v předchozích případech definovat jako

19 © Institut biostatistiky a analýz  V případě dichotomie je věrohodnostní poměr  Pokud jsou ceny správného rozhodnutí nulové, tj. (  1 |  1 ) = (  2 |  2 ) = 0, je  Obraz je zařazen do třídy  1, když je věrohodnostní poměr než poměr cen ztrát chybných zatřídění. Jsou-li obě ceny stejné, je obraz zařazen do té třídy, pro kterou je hodnota p(x|ω s ) větší. KRITÉRIUM MAXIMÁLNÍ PRAVDĚPODOBNOSTI (MINIMAX)

20 © Institut biostatistiky a analýz KRITÉRIUM MAXIMÁLNÍ PRAVDĚPODOBNOSTI (MINIMAX)


Stáhnout ppt "© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc."

Podobné prezentace


Reklamy Google