Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Složitější (mnohorozměrné) metody

Podobné prezentace


Prezentace na téma: "Složitější (mnohorozměrné) metody"— Transkript prezentace:

1 Složitější (mnohorozměrné) metody
stručný nástin možností vybraných metod

2 Path analysis přesný český překlad by byl něco jako analýza cestiček
Viz též SEM (Structural Equation Modelling [třeba ve programu Statistica; je to o něco širší pojem]), případně causal modelling

3 Klasická (mnohonásobná) regrese
Mnoho prediktorů, jedna odpověď Ve skutečnosti - dlouhé kauzální řetězce - v přírodě: mnohá proměnná je ovlivňovaná, a zároveň ovlivňuje - vede ke kauzálním sítím

4 Například typický hydrobiologický model
Dravé ryby Ostatní náhodné vlivy (případně tady může být teplota, chemie vody etc. Planktonožravé ryby Zooplankton Fytoplankton

5 Příklad ze skript

6 Mluvíme sice o kauzálním modelování
Ale kauzalita je “vnesena” našimi představami o systému, nikoliv experimentální manipulací Přístupy použití se liší, podle toho jak moc dovolíme, aby náš iniciální model o kauzálních závislstech byl korigován na základě dat

7 Metoda je užitečná především tam,
kde nemůžeme (alespoň některé) proměnné měnit experimentálně Oblíbená v evoluční biologii Ale i v ekologii (zvlášt na úrovni ekosystémů a společenstev ve větších prostorových škálách) Pozor při interpretaci kauzality

8 Popsáno + srozumitelně pro biology
Bill Shipley 2004 Cause and Correlation in Biology: A User's Guide to Path Analysis, Structural Equations and Causal Inference. Cambridge University Press. James B. Grace 2006 Structural Equation Modeling and Natural Systems. Cambridge University Press.

9 (Hierarchické) klasifikace
Děláme stromečky (ale nejen je)

10 Cíl klasifikace Vytvořit skupiny objektů, které jsou vnitřně homogenní, ale odlišné od ostatních

11 Typická data (matice) Snímek číslo

12 Mohu klasifikovat snímky, podle podobnosti druhového složení (dostanu skupiny podobných snímků - pak jim třeba můžu nějak říkat [Seslerietum]) druhy, podle vzájemné podobnosti (korelace) rozšíření (dostanu skupiny druhů s podobnými ekologickými nároky)

13 Typická data Chci získat skupiny podobných individuí - pozor, data jsou na různých stupnicích

14 Klasifikace Numerická taxonomie, numerická fenetika, kladistické metody Numerické taxonomie (dříve především fenetika), dnes podstatně širší pojetí Kladistika - fylogenetika - konstrukce fylogenetických stromů - dnes prakticky samostatné odvětví

15 Klasifikace S učením vs. bez učení Hierarchické vs. nehierarchické
Hierarchické - divisivní vs. algomerativní

16 Shluková analýza = Hierarchická, aglomerativní metoda, výsledkem strom: Princip - nejprve spočtu matici podobností mezi všemi páry, pak konstruuju strom

17 Přži shlukové analýze pamatuj:
Je zásadním způsobem ovlivněna tím, jakou mám míru podobnosti mezi objekty (tzv. (dis)similarity measure, příp. resemblance function). Pokud mám data měřená na různých škálách, musím standardizovat. Míry bývají často specifické pro různá odvětví

18 Při shlukové analýze pamatuj:
Velmi důležitý je i shlukovací algoritmus Předvolby (default) v programu Statistica jsou v drtivé většině nevhodné pro biologické účely - je třeba je příslušně změnit

19 Shluková analýza mi udělá skupiny vždy
ale já je nechci, chci vizualizovat podobnostní strukturu ve složení společenstev

20 Ordinace: chci dostat (pro složení společenstev)
odrinační diagram, kde podobné snímky budou blízko sebe, podobné druhy budou blízko sebe, a druhy budou mít optima v blízkosti snímků, kde se vyskytují

21 Blízkost značí podobnost
Ordinační diagram Urtica Chenopodium Cactus Nymphea Menyanthes Comarum Aira Drosera Blízkost značí podobnost

22 Ordinační diagram Nutrients Urtica Chenopodium Cactus Nymphea Menyanthes Water Comarum Aira Drosera Můžu mít i vysvětlující proměnné - buď je promítám ex post, nebo tzv. constrained ordinations.

23 Různé metody Correspondence analysis, Principal component analysis, factor analysis Oblíbené v ekologii, ale i v taxonomii (ukáže, zda jsou mezi druhy přechody), a také v psychologii

24 Constrained ordinations i pro hodnocení pokusů

25 Diskriminační analýza
Příklad: Mám diploida a tetraploida - ale nemůžu pokaždé počítat chromozomy - ptám se - jsem schopen najít pravidlo na základě měřených morfologických znaků (jako jejich lineární kombinaci), které mi dvě ploidie od sebe odliší?

26

27 Při aplikaci pozor na důkaz kruhem (expert mi určil dva druhy [hlavně na základě délky prašníků, ale to já nevím] a já pak dokážu, že dva dané druhy existují, a perfektně se odlišují délkou prašníku).

28 Jiná úspěšná aplikace ve Škodovce (MB, už dávno)
V rámci povinných prohlídek sledovali zaměstnance, a měli data o tlaku, cholesterolu, zda kouří, váhu, výšku etc. a zda do 10-ti let od prohlídky dostal či nedostal infarkt. Získali kombinaci znaků, která predikuje - chlapče, dej si pozor, spěješ k infarktu.

29 Podobnou věc udělají i klasifikační stromy
Založeny na jiném principu (není zde aditivita efektů)

30 Co užitečného jsme neprobrali v celé Biostatistice (neúplný výběr)
Power analysis (jakou mám šanci zamítnout H0) Složitější modely ANOVA (a obecně GLM) Zobecněné lineární modely Prakticky nic z metod mnohorozměrných Bayesovskou statistiku

31 Kde se můžu o statistických metodách dozvědět více
Moderní regresní metody (Šmilauer) Vizualizace dat (Šmilauer) Plánování a hodnocení ekologických experimentů (Lepš & Šmilauer) Praktikum mnohorozměrných metod (Lepš & Šmilauer)


Stáhnout ppt "Složitější (mnohorozměrné) metody"

Podobné prezentace


Reklamy Google