© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

Statistická indukce Teorie odhadu.
Fakulta životního prostředí Katedra informatiky a geoinformatiky
Fakulta životního prostředí Katedra informatiky a geoinformatiky
Fourierova transformace Filtrování obrazu ve frekvenční doméně
Dualita úloh lineárního programování a analýza citlivosti
Rovnice roviny Normálový tvar rovnice roviny
Geometrický parametr reaktoru různého tvaru
Jiří Gazárek, Martin Havlíček Analýza nezávislých komponent (ICA) v datech fMRI, a ICA necitlivá ke zpoždění.
Lineární regresní analýza Úvod od problému
Fakulta životního prostředí Katedra informatiky a geoinformatiky
3. PRINCIP MAXIMÁLNÍ VĚROHODNOSTI
Lineární algebra.
Robustní vyrovnání Věra Pavlíčková, únor 2014.
Regresní analýza a korelační analýza
Optimalizační úlohy i pro nadané žáky základních škol
 př. 4 výsledek postup řešení Zjistěte, zda jsou vektory a, b, c lineárně závislé. a=(1;2;3), b=(3;0;1), c=(-1;4;5)
Matematická teorie rozhodování
Formulace a vlastnosti úloh lineárního programování
Regrese Aproximace metodou nejmenších čtverců
Lineární zobrazení.
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Elektron v periodickém potenciálovém poli - 1D
Reprezentace klasifikátoru pomocí „diskriminant“ funkce
Odhad metodou maximální věrohodnost
Experimentální fyzika I. 2
SIGNÁLY A SOUSTAVY V MATEMATICKÉ BIOLOGII
Stabilita diskrétního regulačního obvodu
Vektorové prostory.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Simplexová metoda pro známé počáteční řešení úlohy LP
2. Vybrané základní pojmy matematické statistiky
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz ZPRACOVÁNÍ A ANALÝZA BIOSIGNÁL Ů FREKVENČNÍ SPEKTRUM SPOJITÝCH SIGNÁLŮ.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
Podobnost trajektorií Jiří Jakl Úvod - využití Rozpoznáváni ručně psaných textů GPS navigace Analýza pohybu pracovníku v budovách Predikce.
ANALÝZA A KLASIFIKACE DAT
SIGNÁLY A LINEÁRNÍ SYSTÉMY
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Aproximace parciálních diferenciálních rovnic – Galerkinova metoda
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Úvod do praktické fyziky Seminář pro I.ročník F J. Englich, ZS 2003/04.
Klasifikace a rozpoznávání
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík, CSc.
Matice Přednáška č.4. Definice: Soubor prvků nazýváme maticí typu i-tý řádek j-tý sloupec prvky matice.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Laplaceova transformace
Ing. Milan Houška KOSA PEF ČZU v Praze
ČASOVÉ ŘADY (SIGNÁLY A LINEÁRNÍ SYSTÉMY )
Základy zpracování geologických dat Rozdělení pravděpodobnosti
ANALÝZA A KLASIFIKACE DAT
Spojitá a kategoriální data Základní popisné statistiky
1 Lineární (vektorová) algebra
Lineární optimalizační model
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT
Autor: Honnerová Helena
2. Vybrané základní pojmy matematické statistiky
ANALÝZA A KLASIFIKACE DAT
ANALYTICKÁ GEOMETRIE Analytická geometrie je část geometrie, která v euklidovské geometrii zkoumá geometrické útvary pomocí algebraických a analytických.
Transkript prezentace:

© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

© Institut biostatistiky a analýz VIII. ANALÝZA HLAVNÍCH KOMPONENT

© Institut biostatistiky a analýz ZA Č ÍNÁME ANALÝZA HLAVNÍCH KOMPONENT PRINCIPAL COMPONENT ANALYSIS (PCA) ROZKLAD PODLE VLASTNÍCH ČÍSEL SINGULAR VALUE DECOMPOSITION (SVD) Karhunenova-Loevova transformace

© Institut biostatistiky a analýz ZA Č ÍNÁME  extrakce příznaků - hledání zobrazení (optimálního) Z, které transformuje původní m rozměrný prostor (obraz) na prostor (obraz) n rozměrný (m  n);  nalezení vhodné transformace – potřeba optimalizačního kritéria:  obrazy v novém prostoru budou aproximovat původní obrazy ve smyslu minimální střední kvadratické odchylky;  obrazy v novém prostoru budou minimalizovat odhad pravděpodobnosti chyby

© Institut biostatistiky a analýz ZA Č ÍNÁME  aby byla úloha řešitelná, hledáme zobrazení v oboru lineárních zobrazení

© Institut biostatistiky a analýz ZA Č ÍNÁME  aby byla úloha řešitelná, hledáme zobrazení v oboru lineárních zobrazení Jak poznáme lineární zobrazení?

© Institut biostatistiky a analýz ZA Č ÍNÁME  aby byla úloha řešitelná, hledáme zobrazení v oboru lineárních zobrazení Jak poznáme lineární zobrazení?

© Institut biostatistiky a analýz TEORIE  předpokládejme, že je dáno K obrazů a nechť existuje m příznakových veličin, které tyto obrazy charakterizují. Tedy k-tý obraz je vyjádřen m rozměrným sloupcovým vektorem y k  Y m, k=1,…,K.  aproximujme nyní kterýkoliv obraz y k lineární kombinací n ortonormálních vektorů e i (m  n) ( )

© Institut biostatistiky a analýz TEORIE  koeficienty c ki lze považovat za velikost i-té souřadnice vektoru y k vyjádřeného v novém systému souřadnic s bází e i, i=1,2,…,n, tj. platí  použijeme-li jako kritérium minimální střední kvadratické odchylky, pak je

© Institut biostatistiky a analýz TEORIE  pak pomocí dříve uvedených vztahů pro x k a c ki dostaneme  střední kvadratická odchylka pro všechny obrazy y k, k=1,…,K je (je tedy závislá na volbě bázového systému e i )

© Institut biostatistiky a analýz TEORIE  diskrétní konečný rozvoj podle vztahu ( ) s bázovým systémem e i, optimálním podle kritéria minimální střední kvadratické chyby nazýváme diskrétní Karhunenův – Loevův rozvoj;  aby střední kvadratická odchylka podle výše uvedeného vztahu byla minimální, musí být odečítaná hodnota na pravé straně rovnice maximální.

© Institut biostatistiky a analýz TEORIE  musíme tedy maximalizovat výraz je autokorelační matice řádu m. Protože je symetrická a semidefinitní, jsou její vlastní čísla λ i, i=1,…,m, reálná a nezáporná a vlastní vektory v i, jsou buď ortonormální, nebo je můžeme ortonormalizovat (v případě násobných vlastních čísel).

© Institut biostatistiky a analýz TEORIE  uspořádáme-li vlastní čísla sestupně podle velikosti, tj. λ 1  λ 2  …  λ m  0 a podle toho očíslujeme i odpovídající charakteristické vektory, lze dokázat, výe uvedený výraz dosahuje maxima, jestliže platí e i = v i, i=1,…,n a pro velikost maxima je

© Institut biostatistiky a analýz TEORIE  pro minimální střední kvadratickou odchylku tedy platí

© Institut biostatistiky a analýz TEORIE  v některých případech je vhodnější vektory y k před aproximací centrovat se střední hodnotou a místo s obrazem y k počítáme s jeho centrovanou verzí. Postup výpočtu se nemění, ale místo autokorelační matice používáme disperzní matici ve tvaru

© Institut biostatistiky a analýz GEOMETRICKÁ INTERPRETACE

© Institut biostatistiky a analýz VLASTNOSTI  při daném počtu n členů rozvoje poskytuje ze všech možných aproximací nejmenší střední kvadratickou odchylku;  při použití disperzní matice jsou transformované souřadnice nekorelované; pokud se výskyt obrazů řídí normálním rozložením zajišťuje nekorelovanost i jejich nezávislost;  vliv každého členu uspořádaného rozvoje se zmenšuje s jeho pořadím;  změna požadavků na velikost střední kvadratické odchylky nevyžaduje přepočítávat celý rozvoj, nýbrž jen změnit počet jeho členů.

© Institut biostatistiky a analýz ROZD Ě LENÍ DO T Ř ÍD Jak se změní podmínky, když obrazy y budou platit, které budou vymezeny jako části spojitého obrazového prostoru Y m ?  Výskyt obrazů v jednotlivých klasifikačních třídách bude popsán podmíněnými hustotami pravděpodobnosti p(y|ω r ), r=1,2,…,R a apriorní pravděpodobnost klasifikačních tříd bude P(ω r ). V tom případě autokorelační matice bude

© Institut biostatistiky a analýz ROZD Ě LENÍ DO T Ř ÍD  disperzní matice kde nebo vztahem

© Institut biostatistiky a analýz ROZD Ě LENÍ DO T Ř ÍD kde střední hodnota μ je vážený průměr středních hodnot všech tříd, tj.

© Institut biostatistiky a analýz Příprava nových učebních materiálů oboru Matematická biologie je podporována projektem ESF č. CZ.1.07/2.2.00/ „ VÍCEOBOROVÁ INOVACE STUDIA MATEMATICKÉ BIOLOGIE “ INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ