Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Mnohorozměrná statistika

Podobné prezentace


Prezentace na téma: "Mnohorozměrná statistika"— Transkript prezentace:

1 Mnohorozměrná statistika
včetně Path analysis

2 Path analysis: terminologie
Path analysis je název původní metody, která se dnes téměř neužívá Structural Equation Modelling (SEM): označení (obecnějších) modelů, pod ním tyto postupy nalezneme v novějších programech (též v programu Statistica)

3 Path analysis: příklad
Studuji vztah mezi rychlostí fotosyntézy, prostupností průduchů a vlastnostmi listů (koncentrace dusíku a specific leaf area, SLA) Nemohu vztahy popsat jednou regresní rovnicí, protože většina parametrů, ovlivňovaných jinými, také ovlivňuje další parametry.

4 Path analysis: korelace versus kauzalita
Metoda SEM se snaží popsat příčinné (kauzální) vztahy. Ty ale nelze s jistotou určit na základě pozorování (bez manipulace). V mnoha případech ale jednotlivými „hráči“ nelze nezávisle manipulovat (např. různé fyziologické parametry listu/rostliny) Kauzální model odhadujeme a „testujeme“ na základě shody jím předpovídaných korelací s těmi, které pozorujeme

5 Path analysis: literatura
Bill Shipley (2004): Cause and Correlation in Biology - A User's Guide to Path Analysis, Structural Equations and Causal Inference. Cambridge University Press. James B. Grace (2006): Structural Equation Modelling and Natural Systems. Cambridge University Press

6 Klasifikace - úvod Cílem klasifikace je rozdělit pozorování do dvou nebo více skupin, ve kterých jsou si pozorování co nejvíce podobná a které jsou navzájem co nejvíce odlišné Pozorováními mohou být například jedinci různých druhů plžů, na kterých byly měřeny stejné znaky: vymezení druhů či taxonů jiné úrovně – numerická taxonomie Nebo záznamy o složení vegetace, místo znaků z předchozího případu zde máme zastoupení jednotlivých druhů rostlin

7 Klasifikace: vstupní data
Dvourozměrná tabulka: vzorky a proměnné

8 Klasifikace: hierarchická 1
Stromečkový diagram se nazývá dendrogram V některých případech (při studiu společenstev organismů) můžeme chtít obdobně klasifikovat i druhy („znaky“). Podobné si budou ty druhy, které se vyskytují spolu a mají tedy podobné nároky na podmínky prostředí Do samostatného oboru se vyvinula kladistika, kde hierarchie odráží evoluční vztahy mezi druhy, ne fenetickou podobnost

9 Klasifikace: hierarchická 2
Hiearchické klasifikaci, při které se začíná od jednotlivých vzorků a ty se spojují, se říká aglomerativní, též shluková analýza Nejprve zvolím, jak vyjádřím podobnost (či nepodobnost – vzdálenost) mezi vzorky (eukleidovská distance, Jaccardův koeficient, a spousta dalších) Pak zvolím způsob, jak se tato informace převádí do struktury dendrogramu: metoda nejbližší cesty (average linkage), nejdelší cesty (complete linkage), Wardova, a další

10 Klasifikace: hierarchická 3
Obě volby - míra (ne)podobnosti i postup shlukování – velmi ovlivní povahu výsledků Implicitní volby klastrové analýzy v programu Statistica nejsou vhodné, navíc tento program postrádá v ekologii běžně užívané míry nepodobnosti Ne-hierarchické klasifikace se v biologii používají spíše výjimečně (ale třeba v GIS)

11 Ordinace Klasifikace („roz-škatulkování“) a ordinace („uspořádání za sebe“) jsou dva důležité aspekty práce lidského mozku Problémem klasifikace je, že není úplně vhodná tam, kde se vlastnosti věcí mění plynule To je třeba případ změn složení společenstev organismů podél gradientů prostředí

12 Ordinační diagramy Blízkost znamená podobnost
Vysvětlující proměnné (charakteristiky prostředí): buď promítáme dodatečně nebo použijeme v tzv. omezené ordinaci: constrained ordination

13 Omezená ordinace: testy hypotéz o mnohorozměrných datech
Metody omezené ordinace jsou obdobou regresních modelů pro analýzu celého společenstva. Lze je proto použít pro testování hypotéz

14 Diskriminační analýza
Mám předem dané skupiny: například dva druhy plžů přílepek Rád bych je odlišil na základě morfologických znaků. Mám „trénovací vzorek“ (molek. určený)

15 Co se do Biostatistiky nevešlo
Z metod častěji používaných v biologických článcích to jsou zejména tyto: Power analysis – jakou mám šanci zamítnout nulovou hypotézu pro danou velikost efektu Složitější modely ANOVA (obecného lineárního modelu, mixed effect models) Zobecněné lineární modely Metody mnohorozměrné analýzy Bayesovská statistika

16 Kde se mohu dozvědět více o složitějších statistických metodách
Plánování a hodnocení ekologických experimentů (Lepš a Šmilauer): každý ZS Moderní regresní metody (Šmilauer): ZS obročně Praktikum mnohorozměrných metod (Lepš a Šmilauer): každý LS Vizualizace dat (Šmilauer): LS obročně


Stáhnout ppt "Mnohorozměrná statistika"

Podobné prezentace


Reklamy Google