© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

VÝPOČET OC.
Statistická indukce Teorie odhadu.
Fakulta životního prostředí Katedra informatiky a geoinformatiky
Bayesovského rozhodování
7. Přednáška limita a spojitost funkce
Testování statistických hypotéz
Modely řízení zásob Základní pojmy Deterministické modely
Problematika a metody zpracování biomed. dat z pohledu jejich klasifikace Marcel Jiřina.
Jiří Gazárek, Martin Havlíček Analýza nezávislých komponent (ICA) v datech fMRI, a ICA necitlivá ke zpoždění.
Lineární regresní analýza Úvod od problému
TEORIE HER A ROZHODOVACÍ MODELY
LOGISTICKÉ SYSTÉMY 4/14.
Pravděpodobnost a statistika opakování základních pojmů
Systémy pro podporu managementu 2
Testování hypotéz přednáška.
Náhodná proměnná Rozdělení.
ROZHODOVACÍ ÚLOHY.
Matematický aparát v teorii informace Základy teorie pravděpodobnosti
Matematická teorie rozhodování
TLAK PLYNU Z HLEDISKA MOLEKULOVÉ FYZIKY.
2.2. Pravděpodobnost srážky
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
„Svět se skládá z atomů“
Hry proti přírodě (Rozhodovací analýza)
Funkce více proměnných.
TEORIE HER.
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Reprezentace klasifikátoru pomocí „diskriminant“ funkce
Pojem účinného průřezu
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Pár dalších použití statistiky v přírodních vědách
Experimentální fyzika I. 2
SIGNÁLY A SOUSTAVY V MATEMATICKÉ BIOLOGII
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Základy zpracování geologických dat
Stabilita diskrétního regulačního obvodu
AKD VII.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie portfolia Kvantifikace množiny efektivních portfolií.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Simplexová metoda pro známé počáteční řešení úlohy LP
2. Vybrané základní pojmy matematické statistiky
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Opakování lekce 4,5,
5.4. Účinné průřezy tepelných neutronů
SIGNÁLY A LINEÁRNÍ SYSTÉMY
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
METODA HRANIČNÍCH PRVKŮ (INTEGRÁLŮ)
08:121 Jde o lepší využití materiálu vedení. Metody:1) nejnižší váhy (objemu) vedení, minimalizuje cenu vedení - investiční výdaje 2) konstantní proudové.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Podmíněná pravděpodobnost: Bayesův teorém
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Hodnocení diagnostických testů
Statistické testování – základní pojmy
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
- váhy jednotlivých studií
Úvod do praktické fyziky
Základy zpracování geologických dat Rozdělení pravděpodobnosti
ANALÝZA A KLASIFIKACE DAT
Spojitá a kategoriální data Základní popisné statistiky
Lineární optimalizační model
Úvod do induktivní statistiky
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT
Transkript prezentace:

© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

© Institut biostatistiky a analýz III. BAYES Ů V KLASIFIKÁTOR

© Institut biostatistiky a analýz ZÁKLADNÍ POJMY A PŘEDPOKLADY  při řešení praktických úloh je třeba předpokládat, že obrazy signálů jsou ovlivněny víceméně náhodnými fluktuacemi zdroje signálu, v přenosové cestě, při předzpracování i analýze, které se nepodaří zcela eliminovat.  ztrátová funkce (  r |  s ) udává ztrátu při chybné klasifikaci obrazu ze třídy  s do třídy  r.  matice ztrátových funkcí  střední ztráta J(a) udává průměrnou ztrátu při chybné klasifikaci obrazu x

© Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY  pokud se soustředíme na obrazy pouze ze třídy  s, je střední ztráta dána průměrnou hodnotou z (d(x,a)|  s ) vzhledem ke všem obrazům ze třídy  s, tj. kde p(x|  s ) je podmíněná hustota pravděpodobnosti výskytu obrazu x ve třídě  s

© Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY  Celková střední ztráta J(a) je průměrná hodnota ze ztrát J s (a)  nebo podle Bayesova vzorce ( P(ω s |x).p(x) = p(x|ω s ).P(ω s ) ) kde p(x) je hustota pravděpodobnosti výskytu obrazu x v celém obrazovém prostoru a P(  s |x) je podmíněná pravděpodobnost, že daný obraz patří do třídy  s (tzv. aposteriorní pravděpodobnost třídy  s.

© Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY  Návrh optimálního klasifikátoru, který by minimalizoval střední ztrátu, spočívá v nalezení takové množiny parametrů rozhodovacího pravidla a*, že platí  Dosadíme-li za J(a) z předchozího vztahu, je  Je-li ztrátová funkce (  r |  s ) konstantní pro všechny obrazy z  s, je dále

© Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY  Označíme-li ztrátu při klasifikaci obrazu x do třídy  r tak po dosazení dostaneme Úloha nalezení minima celkové střední ztráty se tak převedla na minimalizaci funkce L x (  r ). Optimální rozhodovací pravidlo d(x,a*) podle kritéria minimální celkové střední ztráty je

© Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY  Chceme-li využít principu diskriminačních funkcí  Diskriminační funkci optimálního klasifikátoru podle kritéria minimální chyby pak definujeme

© Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY DICHOTOMICKÝ KLASIFIKÁTOR Celková střední ztráta v případě dvou tříd je

© Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ STŘEDNÍ ZTRÁTY DICHOTOMICKÝ KLASIFIKÁTOR Diskriminační funkce pro dichotomický klasifikátor bude Položíme-li tento výraz nule dostaneme vztah pro hraniční plochu dichotomického klasifikátoru, ze kterého můžeme určit poměr hustot pravděpodobnosti výskytu obrazu x v každé z obou klasifikačních tříd - věrohodnostní poměr Obraz x zařadíme do třídy  1, když je věrohodnostní poměr větší než výraz na pravé straně, je-li menší pak obraz x zařadíme do třídy  2.

© Institut biostatistiky a analýz V Ě ROHODNOSTNÍ POM Ě R I.  Sumarizuje veškerou informaci získanou experimentem.  Pravděpodobnost, že jev (data) nastane za daných podmínek (hypotéza) děleno pravděpodobností, že stejný jev nastane za jiných podmínek. Podmínky jsou vzájemně se vylučující.

© Institut biostatistiky a analýz V Ě ROHODNOSTNÍ POM Ě R II. Věrohodnostní poměr (likelihood ratio) LR udává podíl pravděpodobnosti, že se vyskytne nějaký jev A za určité podmínky (jev B), k pravděpodobnosti, že se jev A vyskytne, když podmínka neplatí (jev nonB). Má-li například pacient náhlou ztrátu paměti (jev A), chceme znát věrohodnostní poměr výskytu jevu A v případě, že má mozkový nádor (jev B), tj. podíl pravděpodobnosti, s jakou ztráta paměti vzniká při nádoru mozku, k pravděpodobnosti, s jakou vzniká v ostatních případech. Věrohodnostní poměr je tedy podíl podmíněných pravděpodobností

© Institut biostatistiky a analýz KRITÉRIUM MINIMÁLNÍ PRAVDĚPODOBNOSTI CHYBNÉHO ROZHODNUTÍ Díky obtížnému stanovení hodnot ztrátových funkcí (  r |  s ) se kritérium minimální chyby zjednodušuje použitím jednotkových ztrátových funkcí definovaných Matice jednotkových ztrátových funkcí má pak tvar a celková ztráta je což je hodnota pravděpodobnosti chybného rozhodnutí.

© Institut biostatistiky a analýz Dosadíme-li hodnoty jednotkových ztrátových funkcí do vztahu pro ztrátu při klasifikaci obrazu do chybné třídy a s využitím Bayesova vztahu p(x) nezávisí na klasifikační třídě a tedy neovlivňuje výběr minima. Diskriminační funkci tedy můžeme určit jako KRITÉRIUM MINIMÁLNÍ PRAVDĚPODOBNOSTI CHYBNÉHO ROZHODNUTÍ

© Institut biostatistiky a analýz V případě dichotomického klasifikátoru je diskriminační funkce A věrohodnostní poměr je potom KRITÉRIUM MINIMÁLNÍ PRAVDĚPODOBNOSTI CHYBNÉHO ROZHODNUTÍ

© Institut biostatistiky a analýz KRITÉRIUM MAXIMÁLNÍ APOSTERIORNÍ PRAVDĚPODOBNOSTI  Modifikujeme-li vztah pro ztrátu při chybné klasifikaci obrazu podle Bayesova vztahu ( P(ω s |x).p(x) = p(x|ω s ).P(ω s ) ) platí  Hustota pravděpodobnosti p(x) nezávisí na klasifikační třídě a tedy místo L x (ω r ) lze použít a s jednotkovými ztrátovými funkcemi je

© Institut biostatistiky a analýz  Minimum ztráty L‘ x (ω r ) je právě tehdy, když P(ω r |x) je maximální. Tzn. že jako diskriminační funkci můžeme zvolit právě hodnotu aposteriorní pravděpodobnosti třídy ω r, tj. g r (x) = P(ω r |x)  Pro případ dichotomického klasifikátoru je diskriminační funkce g(x) = P(ω 1 |x) - P(ω 2 |x) = 0. Z toho plyne, že hranicí mezi třídami určuje vztah P(ω 1 |x) = P(ω 2 |x) nebo Podle tohoto kritéria zatřídíme obraz do té třídy, jejíž aposteriorní pravděpodobnost je při výskytu obrazu x větší. KRITÉRIUM MAXIMÁLNÍ APOSTERIORNÍ PRAVDĚPODOBNOSTI

© Institut biostatistiky a analýz KRITÉRIUM MAXIMÁLNÍ PRAVDĚPODOBNOSTI (MINIMAX) Neznáme-li apriorní pravděpodobnosti všech tříd, předpokládáme rovnoměrné rozložení (pravděpodobnost všech tříd je táž (P(ω s ) = P(ω) =1/R). Potom celková střední ztráta dosáhne minima, když Diskriminační funkci lze jako v předchozích případech definovat jako

© Institut biostatistiky a analýz  V případě dichotomie je věrohodnostní poměr  Pokud jsou ceny správného rozhodnutí nulové, tj. (  1 |  1 ) = (  2 |  2 ) = 0, je  Obraz je zařazen do třídy  1, když je věrohodnostní poměr než poměr cen ztrát chybných zatřídění. Jsou-li obě ceny stejné, je obraz zařazen do té třídy, pro kterou je hodnota p(x|ω s ) větší. KRITÉRIUM MAXIMÁLNÍ PRAVDĚPODOBNOSTI (MINIMAX)

© Institut biostatistiky a analýz KRITÉRIUM MAXIMÁLNÍ PRAVDĚPODOBNOSTI (MINIMAX)