Přehled metod pro výběr relevantních eventů ze směsi signál-pozadí M. Jiřina, F. Hakl ÚI AV ČR.

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

Množiny Přirozená čísla Celá čísla Racionální čísla Komplexní čísla
Sčítání celých čísel.
Zpracování informací a znalostí Další přístupy k vyhledávání textových dokumentů Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství.
kvantitativních znaků
Rekonstrukce povrchu objektů z řezů Obhajoba rigorózní práce 25. června 2003 Radek Sviták
Problematika a metody zpracování biomed. dat z pohledu jejich klasifikace Marcel Jiřina.
Téma 3 ODM, analýza prutové soustavy, řešení nosníků
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
Dynamické rozvozní úlohy
DOK „Umělá inteligence“ v DOK (i jinde). NEURONOVÉ SÍTĚ.
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
Rozpoznávání tištěných znaků pomocí LVQ sítí Neuronové sítě 2006/2007 Jan Hroník, Pavel Krč.
Lineární algebra.
NÁSOBENÍ ČÍSLEM 10 ZÁVĚREČNÉ SHRNUTÍ
Lineární rovnice Běloun 91/1 a
VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)
Regresní analýza a korelační analýza
T.A. Edison Tajemství úspěchu v životě není v tom, že děláme, co se nám líbí, ale, že nacházíme zalíbení v tom, co děláme.
Neuronové sítě Jakub Krátký.
Získávání informací Získání informací o reálném systému
Dělení se zbytkem 6 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
1 Hodnocení geologických dat pomocí matematické statistiky Petr Čoupek 740/742/ IT spec.
Plošné konstrukce, nosné stěny
Pravděpodobnost a statistika opakování základních pojmů
Jazyk vývojových diagramů
Čtení myšlenek Je to až neuvěřitelné, ale skutečně je to tak. Dokážu číst myšlenky.Pokud mne chceš vyzkoušet – prosím.
Dělení se zbytkem 8 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Zásady pozorování a vyjednávání Soustředění – zaznamenat (podívat se) – udržet (zobrazit) v povědomí – představit si – (opakovat, pokud se nezdaří /doma/)
kvantitativních znaků
DĚLENÍ ČÍSLEM 7 HLAVOLAM DOPLŇOVAČKA PROCVIČOVÁNÍ
IGrid index Roman Krejčík. Obsah Motivace Prokletí dimenze Míry podobnosti IGrid, IGrid+ Experimentální porovnání.
Statistická analýza únavových zkoušek
Lineární regrese.
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
Hopfieldova asociativní paměť. Topologie sítě 1 vrstva zároveň vstupní i výstupní mezi neurony existují všechny spoje (kromě smyček)
1 Kognitivní inspirace třídění na základě závislostí atributů Jan Burian Eurfomise centrum – Kardio, Ústav informatiky AV ČR Článek je dostupný na WWW:
Lineární regresní analýza
Neuronové sítě Jiří Iša
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Modely uživatelských preferencí. Obsah Jak se vyjadřují preference Modely preferencí a jejich učení Model založený na atributech Kolaborativní filtrování.
Vektorová kvantizace (VQ) (Vector Quantization)
Základy zpracování geologických dat
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík, CSc.
Paralelní algoritmy ve zpracování dat Bc. Jan Hofta Výzkumný úkol:
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
W i ref (t+1) = W i ref (t) + h ci (t) [X(t) - W i ref (t)], i Nc h ci (t) 0, t  proces konverguje Algoritmy a struktury neuropočítačů ASN – P3 SOM algoritmus.
Podobnost trajektorií Jiří Jakl Úvod - využití Rozpoznáváni ručně psaných textů GPS navigace Analýza pohybu pracovníku v budovách Predikce.
Dita Matesová, David Lehký, Zbyněk Keršner
Úvod do praktické fyziky Seminář pro I.ročník F J. Englich, ZS 2003/04.
Praktická využití UNS V medicínských aplikacích Jan Vrba 2006.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Neuronové sítě. Vývoj NS 1943 – W. McCulloch, W. Pittse – první jednoduchý matematický model neuronu 1951 – M. Minsky - první neuropočítač Snark 1957.
Využití technik dataminingu při rozpoznávání znaků Marek Kukačka Květen 2006.
BIOSTATISTIKA LS 2016 Garant předmětu: Ing. Martina Litschmannová, Ph.D. Přednášející: Ing. Martina Litschmannová, Ph.D. Cvičící: Ing. Martina Litschmannová,
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
4. cvičení
Metody strojového učení
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Informatika pro ekonomy přednáška 4
Neparametrické testy pro porovnání polohy
Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Upravila R.Baštářová.
Pokročilé neparametrické metody Validační techniky
Informatika pro ekonomy přednáška 4
Interpolace funkčních závislostí
Základy statistiky.
Transkript prezentace:

Přehled metod pro výběr relevantních eventů ze směsi signál-pozadí M. Jiřina, F. Hakl ÚI AV ČR

Osnova Charakteristika eventu z hlediska zpracování klasifikátorem "Neparametrické" metody k-NN Bayesovské založené na korelační dimensi Parametrické metody neuronové sítě - perceptron/backpropagation, RBF, Hopfield, Kohonen... GMDH - MIA, analytické/aproximační NNSU - klasická/moderní random trees, random forests, C4.5, C5 problém určení = učení parametrů strukturálních, číselných, genetická optimalizace Předzpracování normalizace (standardizace) ortogonalizace shluková analýza

Event, resp. data řádek = event/vzorek/případ/BOD – event/sample/case/POINT… je to bod v mnohorozměrném prostoru chceme zjistit třídu.. query point sloupec = fyzikální veličina/parametr/proměnná – variable/feature/… poslední sloupec = třída, tedy signál nebo pozadí [více tříd] pevný počet sloupců („cuts“ také)

Data pro analýzu Dvě třídy – signál a pozadí Učicí množina validační množina (přeučení, řízení výpočtu apod.) Testovací množina Reálná data Všechna data jedné třídy z „jednoho zdroje“

Neparametrické metody Teoreticky vezmu metodu, použiji data a je hotovo Typicky 1-NN ALE např.u k-NN musím udat k, u jiných metod něco jiného V podstatě to (moc) nezáleží na úloze

k-NN metoda nejbližšího souseda 1-NN 50% informace, do jaké třídy patří meznámý bod (event) je dáno nejbližším sousedem metoda k nejbližších sousedů Learning Weighted Metrics zpracování obrazu

Bayesovské metody Naive Bayes (jednou, dvakrát a třikrát naivní) Chytré B. metody

Založené na korelační dimensi Fraktál – fraktální data prostor vnoření dimense n efektivní dimense – Hausdorffova, box- counting, informační, … korelační korelační integrál = distribuční funkce všech párových vzdáleností v log-log souřadnicích je to přímka s určitým sklonem - korelační dimense ν (ný)

Jeden pevný bod Korelační integrál -> mapovací funkce rozdělení sklon v log-log, tj korelační dimense -> distribution mapping exponent q, tedy jakási lokální korelační dimense lineární regrese – sklon a aditivní konstanta C S = exp(C) dvě třídy S 1 a S 0

Odhad

Harmonické číslo, harmonická řada Pravděpodobnost, že je červená v místě X se rovná součtu prvků harmonické řady za červené body ( ) děleno součtem celé konečné harmonické řady ( )

Parametrické metody neuronové sítě - perceptron/backpropagation, RBF, Hopfield, Kohonen... GMDH - MIA, analytické/aproximační NNSU - klasická/moderní random trees, random forests, C4.5, C5 problém určení parametrů = učení strukturálních, číselných, genetická optimalizace

Neuronové sítě (klasické) perceptron/backpropagation přenosová funkce sigmoida univerzální aproximátor – klasifikátor uhodnout správnou strukturu – genetická optimalizace RBF přenosová funkce Gaussova Hopfield rozpoznávání znaků, textur apod. Kohonenovy mapy shluková analýza, redukce dimense s přídavnou částí (vrstvou) aproximátor, klasifikátor

GMDH Neuron má dva vstupy a vytváří polynom z = a 1 + a 2 x + a 3 y + a 4 x 2 + a 5 y 2 + a 6 xy a už tím se snažíme aproximovat požadovaný výstup y lineární regrese při n vstupech máme n(n-1)/2 neuronů – 1. vrstva … MIA analytické/aproximační

NNSU klasická moderní

Random trees, random forests (Hodně vzdálená) podobnost s metodou „cuts“ „řezy“ jsou závislé a výsledcích ostatních řezů, resp. v různých místech jsou různé vždy ve směru nějaké souřadnice C4.5 C5

Předzpracování normalizace (standardizace) ortogonalizace shluková analýza redukce dimensionality – feature selection … metoda odmítnutí

Připomenutí na závěr - data jsou: řádek = event/vzorek/případ/BOD – event/sample/case/POINT… je to bod v mnohorozměrném prostoru chceme zjistit třídu.. query point sloupec = fyzikální veličina/parametr/proměnná – variable/feature/… poslední sloupec = třída, tedy signál nebo pozadí [více tříd] pevný počet sloupců („cuts“ také)

A výsledek