ANALÝZA A KLASIFIKACE DAT

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

Statistická indukce Teorie odhadu.
Fakulta životního prostředí Katedra informatiky a geoinformatiky
Fakulta životního prostředí Katedra informatiky a geoinformatiky
Fourierova transformace Filtrování obrazu ve frekvenční doméně
Dualita úloh lineárního programování a analýza citlivosti
Testování statistických hypotéz
Rovnice roviny Normálový tvar rovnice roviny
Geometrický parametr reaktoru různého tvaru
Odhady parametrů základního souboru
Jiří Gazárek, Martin Havlíček Analýza nezávislých komponent (ICA) v datech fMRI, a ICA necitlivá ke zpoždění.
Kalmanuv filtr pro zpracování signálů a navigaci
Lineární regresní analýza Úvod od problému
Fakulta životního prostředí Katedra informatiky a geoinformatiky
3. PRINCIP MAXIMÁLNÍ VĚROHODNOSTI
Lineární algebra.
Robustní vyrovnání Věra Pavlíčková, únor 2014.
LINEÁRNÍ OPTIMALIZAČNÍ MODEL
Optimalizační úlohy i pro nadané žáky základních škol
 př. 4 výsledek postup řešení Zjistěte, zda jsou vektory a, b, c lineárně závislé. a=(1;2;3), b=(3;0;1), c=(-1;4;5)
Matematická teorie rozhodování
Formulace a vlastnosti úloh lineárního programování
Regrese Aproximace metodou nejmenších čtverců
Lineární zobrazení.
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Elektron v periodickém potenciálovém poli - 1D
Reprezentace klasifikátoru pomocí „diskriminant“ funkce
Odhad metodou maximální věrohodnost
Experimentální fyzika I. 2
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Stabilita diskrétního regulačního obvodu
Vektorové prostory.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Simplexová metoda pro známé počáteční řešení úlohy LP
2. Vybrané základní pojmy matematické statistiky
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
polynom proměnné x f = anxn + an-1xn-1 + ……. + a0
Náhodný vektor Litschmannová, 2007.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
Podobnost trajektorií Jiří Jakl Úvod - využití Rozpoznáváni ručně psaných textů GPS navigace Analýza pohybu pracovníku v budovách Predikce.
(Popis náhodné veličiny)
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Aproximace parciálních diferenciálních rovnic – Galerkinova metoda
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Úvod do praktické fyziky Seminář pro I.ročník F J. Englich, ZS 2003/04.
Klasifikace a rozpoznávání
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Aritmetický průměr - střední hodnota
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík, CSc.
Náhodná veličina. Nechť (, , P) je pravděpodobnostní prostor:
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Ing. Milan Houška KOSA PEF ČZU v Praze
ČASOVÉ ŘADY (SIGNÁLY A LINEÁRNÍ SYSTÉMY )
Základy zpracování geologických dat Rozdělení pravděpodobnosti
1 Lineární (vektorová) algebra
Lineární optimalizační model
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT
Plánování přesnosti měření v IG Úvod – základní nástroje TCHAVP
ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT
Autor: Honnerová Helena
2. Vybrané základní pojmy matematické statistiky
ANALÝZA A KLASIFIKACE DAT
ANALYTICKÁ GEOMETRIE Analytická geometrie je část geometrie, která v euklidovské geometrii zkoumá geometrické útvary pomocí algebraických a analytických.
Transkript prezentace:

ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

VIII. ANALÝZA HLAVNÍCH KOMPONENT

ANALÝZA HLAVNÍCH KOMPONENT ZAČÍNÁME ANALÝZA HLAVNÍCH KOMPONENT PRINCIPAL COMPONENT ANALYSIS (PCA) ROZKLAD PODLE VLASTNÍCH ČÍSEL SINGULAR VALUE DECOMPOSITION (SVD) Karhunenova-Loevova transformace

ZAČÍNÁME extrakce příznaků - hledání zobrazení (optimálního) Z, které transformuje původní m rozměrný prostor (obraz) na prostor (obraz) n rozměrný (m  n); nalezení vhodné transformace – potřeba optimalizačního kritéria: obrazy v novém prostoru budou aproximovat původní obrazy ve smyslu minimální střední kvadratické odchylky; obrazy v novém prostoru budou minimalizovat odhad pravděpodobnosti chyby

ZAČÍNÁME aby byla úloha řešitelná, hledáme zobrazení v oboru lineárních zobrazení

Jak poznáme lineární zobrazení? ZAČÍNÁME aby byla úloha řešitelná, hledáme zobrazení v oboru lineárních zobrazení Jak poznáme lineární zobrazení?

Jak poznáme lineární zobrazení? ZAČÍNÁME aby byla úloha řešitelná, hledáme zobrazení v oboru lineárních zobrazení Jak poznáme lineární zobrazení?

TEORIE předpokládejme, že je dáno K obrazů a nechť existuje m příznakových veličin, které tyto obrazy charakterizují. Tedy k-tý obraz je vyjádřen m rozměrným sloupcovým vektorem yk  Y m, k=1,…,K. aproximujme nyní kterýkoliv obraz yk lineární kombinací n ortonormálních vektorů ei (m  n) ()

TEORIE koeficienty cki lze považovat za velikost i-té souřadnice vektoru yk vyjádřeného v novém systému souřadnic s bází ei, i=1,2,…,n, tj. platí použijeme-li jako kritérium minimální střední kvadratické odchylky, pak je

TEORIE pak pomocí dříve uvedených vztahů pro xk a cki dostaneme střední kvadratická odchylka pro všechny obrazy yk, k=1,…,K je (je tedy závislá na volbě bázového systému ei)

TEORIE diskrétní konečný rozvoj podle vztahu () s bázovým systémem ei, optimálním podle kritéria minimální střední kvadratické chyby nazýváme diskrétní Karhunenův – Loevův rozvoj; aby střední kvadratická odchylka podle výše uvedeného vztahu byla minimální, musí být odečítaná hodnota na pravé straně rovnice maximální.

TEORIE musíme tedy maximalizovat výraz je autokorelační matice řádu m. Protože je symetrická a semidefinitní, jsou její vlastní čísla λi, i=1,…,m, reálná a nezáporná a vlastní vektory vi, jsou buď ortonormální, nebo je můžeme ortonormalizovat (v případě násobných vlastních čísel).

TEORIE uspořádáme-li vlastní čísla sestupně podle velikosti, tj. a podle toho očíslujeme i odpovídající charakteristické vektory, lze dokázat, výe uvedený výraz dosahuje maxima, jestliže platí ei = vi, i=1,…,n a pro velikost maxima je

TEORIE pro minimální střední kvadratickou odchylku tedy platí

teorie v některých případech je vhodnější vektory yk před aproximací centrovat se střední hodnotou a místo s obrazem yk počítáme s jeho centrovanou verzí . Postup výpočtu se nemění, ale místo autokorelační matice používáme disperzní matici ve tvaru

Geometrická interpretace

vlastnosti při daném počtu n členů rozvoje poskytuje ze všech možných aproximací nejmenší střední kvadratickou odchylku; při použití disperzní matice jsou transformované souřadnice nekorelované; pokud se výskyt obrazů řídí normálním rozložením zajišťuje nekorelovanost i jejich nezávislost; vliv každého členu uspořádaného rozvoje se zmenšuje s jeho pořadím; změna požadavků na velikost střední kvadratické odchylky nevyžaduje přepočítávat celý rozvoj, nýbrž jen změnit počet jeho členů.

Rozdělení do tříd Jak se změní podmínky, když obrazy y budou platit, které budou vymezeny jako části spojitého obrazového prostoru Y m? Výskyt obrazů v jednotlivých klasifikačních třídách bude popsán podmíněnými hustotami pravděpodobnosti p(y|ωr), r=1,2,…,R a apriorní pravděpodobnost klasifikačních tříd bude P(ωr). V tom případě autokorelační matice bude

Rozdělení do tříd disperzní matice kde nebo vztahem

Rozdělení do tříd kde střední hodnota μ je vážený průměr středních hodnot všech tříd, tj.