Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Přehled metod pro výběr relevantních eventů ze směsi signál-pozadí M. Jiřina, F. Hakl ÚI AV ČR.

Podobné prezentace


Prezentace na téma: "Přehled metod pro výběr relevantních eventů ze směsi signál-pozadí M. Jiřina, F. Hakl ÚI AV ČR."— Transkript prezentace:

1 Přehled metod pro výběr relevantních eventů ze směsi signál-pozadí M. Jiřina, F. Hakl marcel@cs.cas.cz hakl@cs.cas.cz ÚI AV ČR

2 Osnova Charakteristika eventu z hlediska zpracování klasifikátorem "Neparametrické" metody k-NN Bayesovské založené na korelační dimensi Parametrické metody neuronové sítě - perceptron/backpropagation, RBF, Hopfield, Kohonen... GMDH - MIA, analytické/aproximační NNSU - klasická/moderní random trees, random forests, C4.5, C5 problém určení = učení parametrů strukturálních, číselných, genetická optimalizace Předzpracování normalizace (standardizace) ortogonalizace shluková analýza

3 Event, resp. data 37.235720.11302100.382381.156050.173661 54.166290.0563770.001730.088181.737260.13405-1 38.92790.06863000.032520.345950.086721 67.753360.05688210.000930.221910.419040.06301-1 21.57480.1132130.000010.825180.063080.164151 22.60020.0723210.002180.237010.910110.10343-1 42.421770.06483000.181180.181990.170651 69.074430.0776680.000180.186171.084850.08089-1 43.808890.0602780.001570.294690.253580.299951 33.72750.0579700.002330.33550.248710.28248-1 23.781670.1283810.000020.369170.905220.160151 61.723040.06533210.000530.209640.048670.22402-1 40.222050.0488620.000150.387790.475880.166281 37.591960.0599860.002070.279870.072830.19927-1 35.493840.0549740.001090.230350.030610.119521 60.53760.05527210.001270.16950.387910.10302-1 řádek = event/vzorek/případ/BOD – event/sample/case/POINT… je to bod v mnohorozměrném prostoru chceme zjistit třídu.. query point sloupec = fyzikální veličina/parametr/proměnná – variable/feature/… poslední sloupec = třída, tedy signál nebo pozadí [více tříd] pevný počet sloupců („cuts“ také)

4 Data pro analýzu Dvě třídy – signál a pozadí Učicí množina validační množina (přeučení, řízení výpočtu apod.) Testovací množina Reálná data Všechna data jedné třídy z „jednoho zdroje“

5 Neparametrické metody Teoreticky vezmu metodu, použiji data a je hotovo Typicky 1-NN ALE např.u k-NN musím udat k, u jiných metod něco jiného V podstatě to (moc) nezáleží na úloze

6 k-NN metoda nejbližšího souseda 1-NN 50% informace, do jaké třídy patří meznámý bod (event) je dáno nejbližším sousedem metoda k nejbližších sousedů Learning Weighted Metrics zpracování obrazu

7 Bayesovské metody Naive Bayes (jednou, dvakrát a třikrát naivní) Chytré B. metody

8 Založené na korelační dimensi Fraktál – fraktální data prostor vnoření dimense n efektivní dimense – Hausdorffova, box- counting, informační, … korelační korelační integrál = distribuční funkce všech párových vzdáleností v log-log souřadnicích je to přímka s určitým sklonem - korelační dimense ν (ný)

9 Jeden pevný bod Korelační integrál -> mapovací funkce rozdělení sklon v log-log, tj korelační dimense -> distribution mapping exponent q, tedy jakási lokální korelační dimense lineární regrese – sklon a aditivní konstanta C S = exp(C) dvě třídy S 1 a S 0

10 Odhad

11 Harmonické číslo, harmonická řada Pravděpodobnost, že je červená v místě X se rovná součtu prvků harmonické řady za červené body (1.713..) děleno součtem celé konečné harmonické řady (3.251..) 1 2 3 5 4 6 7 8 10 9 11 13 1214

12 Parametrické metody neuronové sítě - perceptron/backpropagation, RBF, Hopfield, Kohonen... GMDH - MIA, analytické/aproximační NNSU - klasická/moderní random trees, random forests, C4.5, C5 problém určení parametrů = učení strukturálních, číselných, genetická optimalizace

13 Neuronové sítě (klasické) perceptron/backpropagation přenosová funkce sigmoida univerzální aproximátor – klasifikátor uhodnout správnou strukturu – genetická optimalizace RBF přenosová funkce Gaussova Hopfield rozpoznávání znaků, textur apod. Kohonenovy mapy shluková analýza, redukce dimense s přídavnou částí (vrstvou) aproximátor, klasifikátor

14 GMDH Neuron má dva vstupy a vytváří polynom z = a 1 + a 2 x + a 3 y + a 4 x 2 + a 5 y 2 + a 6 xy a už tím se snažíme aproximovat požadovaný výstup y lineární regrese při n vstupech máme n(n-1)/2 neuronů – 1. vrstva … MIA analytické/aproximační

15 NNSU klasická moderní

16 Random trees, random forests (Hodně vzdálená) podobnost s metodou „cuts“ „řezy“ jsou závislé a výsledcích ostatních řezů, resp. v různých místech jsou různé vždy ve směru nějaké souřadnice C4.5 C5

17 Předzpracování normalizace (standardizace) ortogonalizace shluková analýza redukce dimensionality – feature selection … metoda odmítnutí

18 Připomenutí na závěr - data jsou: 37.235720.11302100.382381.156050.173661 54.166290.0563770.001730.088181.737260.13405-1 38.92790.06863000.032520.345950.086721 67.753360.05688210.000930.221910.419040.06301-1 21.57480.1132130.000010.825180.063080.164151 22.60020.0723210.002180.237010.910110.10343-1 42.421770.06483000.181180.181990.170651 69.074430.0776680.000180.186171.084850.08089-1 43.808890.0602780.001570.294690.253580.299951 33.72750.0579700.002330.33550.248710.28248-1 23.781670.1283810.000020.369170.905220.160151 61.723040.06533210.000530.209640.048670.22402-1 40.222050.0488620.000150.387790.475880.166281 37.591960.0599860.002070.279870.072830.19927-1 35.493840.0549740.001090.230350.030610.119521 60.53760.05527210.001270.16950.387910.10302-1 řádek = event/vzorek/případ/BOD – event/sample/case/POINT… je to bod v mnohorozměrném prostoru chceme zjistit třídu.. query point sloupec = fyzikální veličina/parametr/proměnná – variable/feature/… poslední sloupec = třída, tedy signál nebo pozadí [více tříd] pevný počet sloupců („cuts“ také)

19 A výsledek


Stáhnout ppt "Přehled metod pro výběr relevantních eventů ze směsi signál-pozadí M. Jiřina, F. Hakl ÚI AV ČR."

Podobné prezentace


Reklamy Google