4. cvičení 2.12.2014.

Slides:



Advertisements
Podobné prezentace
Mnohorozměrná statistická analýza dat
Advertisements

Použité statistické metody
Elipsa chyb a Helmertova křivka
Jak číst ordinační diagramy
Cvičení 6 – 25. října 2010 Heteroskedasticita
SB029 Dodatek k přednáškám Základy analýzy dat a SPSS
Lineární regresní analýza Úvod od problému
Shluková analýza Shluk (klastr, cluster) je skupina objektů, které uvnitř nějaké větší skupiny nemají ani nahodilý ani rovnoměrný výskyt a jejich vzájemná.
Analytické metody výzkumu
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Růstové a přírůstové funkce
Matice distancí v mnohorozměrné analýze. Distanční matice – proč se objevují? Vzdálenosti mezi objekty v terénu Vzdálenosti mezi taxony ve fylogenetickém.
Diskriminační analýza (DA)
Biostatistika 9. přednáška Aneta Hybšová
Matematická teorie rozhodování
MATLAB LEKCE 6.
Úvod do gradientové analýzy
Statistická analýza únavových zkoušek
Jiří Šafr jiri.safr(zavináč)seznam.cz
Úvod do gradientové analýzy
ISS Chybějící hodnoty, standardizace Semináře ke kurzu Analytické metody výzkumu Jindřich Krejčí.
Lineární regrese.
Lineární regresní analýza
Biostatistika 6. přednáška
MATLAB® ( část 6).
Charakteristiky variability
Popisná statistika III
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Pohled z ptačí perspektivy
V. Analýza rozptylu ANOVA.
AKD VII.
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Normální rozdělení a ověření normality dat
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Korelace.
Gradientová analýza II
Hustota pravděpodobnosti – případ dvou proměnných
Teorie psychodiagnostiky a psychometrie
Klasifikace a rozpoznávání
Vícerozměrné metody.
Popisná analýza v programu Statistica
1. cvičení
Inferenční statistika - úvod
Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová.
IV..
© Institut biostatistiky a analýz Vícerozměrné metody - cvičení RNDr. Eva Janoušová Podzim 2014.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Ukládání dat biodiverzity a jejich vizualizace
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Popisná statistika I tabulky četností
Faktorová analýza cíl faktorové analýzy základní pojmy, postup
Popisná analýza v programu Statistica
ANALÝZA A KLASIFIKACE DAT
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
3. cvičení
Spojitá a kategoriální data Základní popisné statistiky
Vícerozměrná analýza biodiverzity
Typy proměnných Kvalitativní/kategorická binární - ano/ne
5. cvičení
Metodologie pro ISK 2 Úvod do práce s daty
PSY252 Statistická analýza dat v psychologii II
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
Lineární regrese.
Induktivní statistika
Základy statistiky.
Základy popisné statistiky
ANALÝZA A KLASIFIKACE DAT
Transkript prezentace:

4. cvičení 2.12.2014

Dva typy modelu odpovědi druhu na (známý nebo teoretický) gradient Ordinační metody v ekologii společenstev Dva typy modelu odpovědi druhu na (známý nebo teoretický) gradient lineární (linear) – nejjednodušší odhad (na krátkém gradientu dobře funguje lineární aproximace jakékoliv funkce) unimodální (unimodal) – druh má na gradientu své optimum (na dlouhém gradientu není aproximace lineární funkcí vhodná) Lineární aproximace unimodální odpovědi na krátké části gradientu Lineární aproximace unimodální odpovědi na dlouhé části gradientu

Analýza hlavních komponent (PCA) Proměnné jsou vzájemně korelované, tedy část informace v souboru je duplicitní Analýza odstraní duplicitu z dat a zobrazí pouze unikátní informaci – tj. nahradí původní soubor proměnných souborem nových proměnných vzájemně nekorelovaných. Je založena na vlastní analýze (eigenanalysis) symetrických matic (korelační, kovarianční) 1. faktorová osa vyčerpá nejvíc celkové variability 3

Analýza hlavních komponent (PCA) Příklad: společenstvo korýšů PCA je postavena na lineárním modelu; abundance každého druhu roste ve směru šipky PCA je definováná pro kovarianční a pro korelační matici PCA není vhodna pro datovou matici s hodně nulami REÁLNA DATA 6 lokalit, každá lokalita sledována ve 3 obdobích datová matice: 18 vzorek x 63 plankt. dr. korýšů; hodnoty = stupeň dominance

Analýza hlavních komponent - PCA Statistics >> Multivariate Exploratory Techniques >> Principal components … proměnné pro výpočet suplementary variables nejsou použity pro výpočet, ale objeví se na výsledku active cases – vybrání cases (řádků), které se použijí pro výpočet, ostatní se mohou pouze zobrazit grouping variables – pro označení skupin objektů Analýza je založena na matici korelací (standardizace proměnných) nebo kovariancí (vliv rozdílných rozptylů) Smazání chybějících dat nebo jejich nahrazení průměrem Pro výpočet rozptylu se používá n nebo n-1.

Analýza hlavních komponent - výsledky quick Počet faktorů Koordináty parametrů na faktorových osách Popis analýzy 2D graf parametrů vzhledem k faktorovým osám Koordináty objektů na faktorových osách 2D graf objektů vzhledem k faktorovým osám Eigenvalues ~ variabilita vyčerpaná faktorovými osami, jejich součet = počet parametrů Grafické znázornění eigenvalues

Factor coordinates of variables = korelace Factor coordinates of cases Faktorové osy Pozice parametrů na faktorových osách parametry Factor coordinates of cases Faktorové osy Příslušnost objektů do skupin objekty Pozice parametrů na faktorových osách

Eigenvalues vyjadřují variabilitu vyčerpanou faktorovými osami, jejich hodnoty slouží při rozhodnutí kolik faktorových os je pro nás zajímavých Eigenvalue variabilita vyčerpaná příslušnou osou Kumulativní eigenvalue/vyčerpaná variabilita Průběh scree plot Eigenvalue Principal component vytvořená PCA

Plot variables cases coordinates Výpočet je založen na původní NxP matici a matici eigenvektorů, zobrazuje vzájemné vzdálenosti objektů Objekty v ordinačním prostoru PCA Vybrané faktorové osy a vyčerpaná variabilita

Plot variables factor coordinates – vynáší do prostoru faktorových os původní parametry, zobrazuje jejich korelaci s faktorovými osami Původní parametry v ordinačním prostoru PCA Vybrané faktorové osy a vyčerpaná variabilita

Analýza hlavních komponent – výsledky II parametry Korelace proměnných a faktorů Koordináty parametrů na faktorových osách Podíl variability proměnných vyčerpaný daným počtem faktorů Příspěvek proměnných k jednotlivým faktorům 2D graf parametrů vzhledem k faktorovým osám Eigenvalues Grafické znázornění eigenvalues Eigenvectors – vektory faktorů v původním prostoru Nastavení grafu

Contribution of variables Eigenvectors parametry faktory eigenvektor Contribution of variables Communalities Příspěvek parametru k variabilitě faktoru

Principal component analysis – výsledky III objekty Koordináty objektů na faktorových osách Factor scores Factor scores coefficients 2D graf objektů vzhledem k faktorovým osám Příspěvek proměnných k jednotlivým faktorům Cos2 úhlu mezi faktorem a vektorem objektu (communalities) Nastavení grafu Výběr objektů podle sumy cos2 objektu pro dané faktory Uložit koordináty nebo scores objektů

Factor scores coefficients Faktorové osy Příslušnost objektů do skupin objekty Factor coordinates dělené odmocninou eigenvalue Factor scores coefficients Faktorové osy parametry Eigenvektory podělené odmocninou eigenvalue

Analýza hlavních komponent – popisná statistika Průměr a SD proměnných Korelační a kovarianční matice proměnných, inverze, uložení Zobrazení objektů podle různých proměnných Popisné grafy jednotlivých proměnných