© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

VÝPOČET OC.
Rovnice a nerovnice s neznámou pod odmocninou
Dualita úloh lineárního programování a analýza citlivosti
MARKOVSKÉ ŘETĚZCE.
Testování statistických hypotéz
Modely řízení zásob Základní pojmy Deterministické modely
Poptávka na trhu zboží a služeb
Operační systémy. OPERAČNÍ SYSTÉMY pomoc operátorovi, podpora vlastností reálného času, víceuživatelských a více úlohových systémů.
Kalmanuv filtr pro zpracování signálů a navigaci
Dynamické programování
Teorie firmy II - Optimum výrobce - Mezní produkt, zákon klesajícího mezního produktu - Izokvanty produkční funkce - Další modely výrobce
Strojové učení I (Mitchell93) učicí množina příkladů hledáme generalizaci učicí množiny ověřujeme na testovací množině pokrytí, přesnost, F-kriterium.
Vlastnosti funkcí Vypracoval: Mgr. Lukáš Bičík
Statistická mechanika - Boltzmannův distribuční zákon
Optimalizační úlohy i pro nadané žáky základních škol
Specifika formování poptávky firem po práci a kapitálu
LOGISTICKÉ SYSTÉMY 4/14.
Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: CZ.1.07/1.5.00/ Šablona:III/2č. materiálu:VY_32_INOVACE_106.
Obsah prezentace Náhodná proměnná Rozdělení náhodné proměnné.
ROZHODOVACÍ ÚLOHY.
F U N K C E.
Formulace a vlastnosti úloh lineárního programování
Funkce Funkce f reálné proměnné x je předpis, který každému x e R přiřadí nejvíc jedno y e R tak, že y = f(x) Definiční obor funkce D je množina všech.
ZPRACOVÁNÍ A ANALÝZA BIOSIGNÁLŮ
TEORIE HER.
Reprezentace klasifikátoru pomocí „diskriminant“ funkce
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Rozhodovací stromy.
Nechť částice je ve stavu popsaném vlnovou funkcí Jaké hodnoty můžeme naměřit a s jakou pravděpodobností? Jaká je střední hodnota v tomto stavu? 1/3 //
Odhad metodou maximální věrohodnost
SIGNÁLY A SOUSTAVY V MATEMATICKÉ BIOLOGII
Derivace funkce. Velikost populace v čase t 0 je N (t 0 ). Velikost populace v čase t  t 0 je N ( t ). Přírůstek populace za jednotku času je [N(t) –
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Poptávka na trhu zboží a služeb Ing. Vojtěch Jindra
Nelinearity s hysterezí Přerušení platnosti relace vytváří dvě různé charakteristiky, jejichž platnost je podmíněna směrem pohybu Hystereze přepínače x.
Distribuované algoritmy - přehled Přednášky z Distribuovaných systémů Ing. Jiří Ledvina, CSc.
Určení parametrů elektrického obvodu Vypracoval: Ing.Přemysl Šolc Školitel: Doc.Ing. Jaromír Kijonka CSc.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Simplexová metoda pro známé počáteční řešení úlohy LP
Časová analýza stochastických sítí - PERT
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Lineární programování - charakteristika krajních bodů
© Institut biostatistiky a analýz SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz ZPRACOVÁNÍ A ANALÝZA BIOSIGNÁL Ů FREKVENČNÍ SPEKTRUM SPOJITÝCH SIGNÁLŮ.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
ANALÝZA A KLASIFIKACE DAT
SIGNÁLY A LINEÁRNÍ SYSTÉMY
FEL ČVUT, katedra ekonomiky, manažerství a humanitních věd © Oldřich Starý, 2012 Finanční management Analýza projektu.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Aritmetický průměr - střední hodnota
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík, CSc.
Náhodná veličina. Nechť (, , P) je pravděpodobnostní prostor:
Operační výzkum Lineární programování Dualita v úlohách lineárního programování. Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace.
MME41 Ekonomicko-matematické metody 4 Prof. RNDr. Jaroslav Ramík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
ANALÝZA A KLASIFIKACE DAT
Spojitá a kategoriální data Základní popisné statistiky
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT
Pokročilé neparametrické metody Validační techniky
ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT
Princip max. věrohodnosti - odhad parametrů
Transkript prezentace:

© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

© Institut biostatistiky a analýz VI. SEKVEN Č NÍ KLASIFIKACE

© Institut biostatistiky a analýz ZA Č ÍNÁME  až dosud (bayesovské klasifikátory, neuronové sítě, …) – pevný konstantní počet příznaků  kolik a jaké příznaky ?  málo příznaků – možná chyba klasifikace;  moc příznaků – možná nepřiměřená pracnost, vysoké náklady;  použít příznaky, které nesou co nejvíce informace o klasifikační úloze;

© Institut biostatistiky a analýz ZA Č ÍNÁME sekvenční klasifikace - kompromis mezi velikostí klasifikační chyby a cenou určení příznaků  klasifikace na základě klasifikačního stromu;

© Institut biostatistiky a analýz ZA Č ÍNÁME Rozhodovací strom pro klasifikaci rytmu signálu EKG

© Institut biostatistiky a analýz ZA Č ÍNÁME sekvenční klasifikace - kompromis mezi velikostí klasifikační chyby a cenou určení příznaků  klasifikace na základě klasifikačního stromu;  klasifikace s rostoucím počtem příznaků, přičemž okamžik ukončení klasifikační procedury stanoví klasifikátor sám podle předem daného kritéria pro kvalitu rozhodnutí (tj. na základě vlastností klasifikačních tříd, resp. obrazů v nich);

© Institut biostatistiky a analýz PRINCIP

WALDOVO KRITÉRIUM  předpokládejme dichotomický klasifikátor obrazů popsaných příznakovými vektory (x 1, x 2, …);  nechť p(x 1, x 2, …, x i |ω 1 ) a p(x 1, x 2, …, x i |ω 2 ) jsou i-rozměrné hustoty pravděpodobnosti výskytu obrazu x = (x 1, x 2, …, x i ) v i-tém klasifikačním kroku v třídách ω 1 a ω 2 ;  nechť A a B jsou konstanty (0<B<1<A<∞);

© Institut biostatistiky a analýz WALDOVO KRITÉRIUM  pokud pro věrohodnostní poměr je Λ i  B, pak d w (x) = ω 2, je-li Λ i  A, pak d w (x) = ω 1 ; když Λ i  (B,A), pokračujeme s dalším příznakem

© Institut biostatistiky a analýz WALDOVO KRITÉRIUM  jsou-li dány pravděpodobnosti chybné klasifikace můžeme určit meze A a B podle vztahů

© Institut biostatistiky a analýz WALDOVO KRITÉRIUM OPTIMALITA  pro libovolné kritérium s pevným počtem n příznaků a s pravděpodobnostmi α a β chybných rozhodnutí platí pro n, že je větší nebo rovno střední hodnotě počtu kroků podle W.k.;  pro libovolné sekvenční kritérium je k rozhodnutí potřeba průměrný počet kroků větší než je průměrný počet kroků podle W.k.

© Institut biostatistiky a analýz MODIFIKOVANÉ WALDOVO KRITÉRIUM přes optimální vlastnosti Waldova kritéria může nastat:  počet kroků potřebných k přijetí rozhodnutí může být pro některé obrazy příliš velký, i když střední hodnota počtu kroků pro všechny obrazy je nízká;  střední hodnota počtu kroků potřebných k rozhodnutí může být příliš velká, požadujeme-li malé pravděpodobnosti chybných rozhodnutí;

© Institut biostatistiky a analýz MODIFIKOVANÉ WALDOVO KRITÉRIUM PRAXE Po určitém počtu kroků se sekvenční výpočet přeruší a dokončí se na základě nějakého rozhodnutí vycházejícího z nějakého kritéria založeného na pevném počtu příznaků. Přerušení:  předepsaný počet kroků;  zavedení proměnných hranic A(i) a B(i).

© Institut biostatistiky a analýz MODIFIKOVANÉ WALDOVO KRITÉRIUM Nechť A(i) a B(i) jsou nezáporné nerostoucí, resp. nekladné neklesající funkce počtu klasifikačních kroků. Je-li Λ i  e B(i), pak d w (x) = ω 2, je-li Λ i  e A(i), pak d w (x) = ω 1 ; když Λ i  (e B(i), e A(i) ), pokračujeme s dalším příznakem

© Institut biostatistiky a analýz MODIFIKOVANÉ WALDOVO KRITÉRIUM URČENÍ FUNKCÍ A(i) A B(i)  obvykle experimentálně;  jestliže pro mezní funkce platí A(i max ) = B(i max ), pak nejpozději pro i = i max je klasifikace ukončena, přičemž střední počet potřebných kroků je menší než u W.k. za cenu snížení kvality rozhodnutí

© Institut biostatistiky a analýz MODIFIKOVANÉ WALDOVO KRITÉRIUM URČENÍ FUNKCÍ A(i) A B(i) kde a,b > 0 a q 1,q 2  (0,1

© Institut biostatistiky a analýz MODIFIKOVANÉ WALDOVO KRITÉRIUM

© Institut biostatistiky a analýz REEDOVO KRITÉRIUM  pro obecný počet tříd zobecněný věrohodnostní poměr  takto vypočítaný poměr se srovná s mezní hodnotou r-té třídy A(ω r ), určenou jako kde P rs je pravděpodobnost, že obraz ze třídy ω s zatřídíme do ω r.

© Institut biostatistiky a analýz REEDOVO KRITÉRIUM  pokud pro třídu ω P platí Λ i (x|ω P )  A(ω P ), p=1,2,…,R, pak předpokládáme, že obraz x nepatří do třídy ω P, kterou lze z dalších úvah vyloučit;  po vyloučení všech možných tříd se spočítají nové hodnoty věrohodnostních poměrů pro zbylé třídy a proces se opakuje;  není-li možné vyloučit další třídu, zvýší se počet příznaků a klasifikace pokračuje, dokud nezbude jediná klasifikační třída;

© Institut biostatistiky a analýz REEDOVO KRITÉRIUM  pro R=2 je Reedovo kritérium ekvivalentní kritériu Waldovu a má tytéž optimální vlastnosti;  pro R>2 nebyla optimalita prokázána;

© Institut biostatistiky a analýz MODIFIKOVANÉ REEDOVO KRITÉRIUM  stejně jako Waldova kritéria lze použít proměnných mezí  proměnných práh je zpravidla definován vztahem