Mnohorozměrná statistika včetně Path analysis
Path analysis: terminologie Path analysis je název původní metody, která se dnes téměř neužívá Structural Equation Modelling (SEM): označení (obecnějších) modelů, pod ním tyto postupy nalezneme v novějších programech (též v programu Statistica)
Path analysis: příklad Studuji vztah mezi rychlostí fotosyntézy, prostupností průduchů a vlastnostmi listů (koncentrace dusíku a specific leaf area, SLA) Nemohu vztahy popsat jednou regresní rovnicí, protože většina parametrů, ovlivňovaných jinými, také ovlivňuje další parametry.
Path analysis: korelace versus kauzalita Metoda SEM se snaží popsat příčinné (kauzální) vztahy. Ty ale nelze s jistotou určit na základě pozorování (bez manipulace). V mnoha případech ale jednotlivými „hráči“ nelze nezávisle manipulovat (např. různé fyziologické parametry listu/rostliny) Kauzální model odhadujeme a „testujeme“ na základě shody jím předpovídaných korelací s těmi, které pozorujeme
Path analysis: literatura Bill Shipley (2004): Cause and Correlation in Biology - A User's Guide to Path Analysis, Structural Equations and Causal Inference. Cambridge University Press. James B. Grace (2006): Structural Equation Modelling and Natural Systems. Cambridge University Press
Klasifikace - úvod Cílem klasifikace je rozdělit pozorování do dvou nebo více skupin, ve kterých jsou si pozorování co nejvíce podobná a které jsou navzájem co nejvíce odlišné Pozorováními mohou být například jedinci různých druhů plžů, na kterých byly měřeny stejné znaky: vymezení druhů či taxonů jiné úrovně – numerická taxonomie Nebo záznamy o složení vegetace, místo znaků z předchozího případu zde máme zastoupení jednotlivých druhů rostlin
Klasifikace: vstupní data Dvourozměrná tabulka: vzorky a proměnné
Klasifikace: hierarchická 1 Stromečkový diagram se nazývá dendrogram V některých případech (při studiu společenstev organismů) můžeme chtít obdobně klasifikovat i druhy („znaky“). Podobné si budou ty druhy, které se vyskytují spolu a mají tedy podobné nároky na podmínky prostředí Do samostatného oboru se vyvinula kladistika, kde hierarchie odráží evoluční vztahy mezi druhy, ne fenetickou podobnost
Klasifikace: hierarchická 2 Hiearchické klasifikaci, při které se začíná od jednotlivých vzorků a ty se spojují, se říká aglomerativní, též shluková analýza Nejprve zvolím, jak vyjádřím podobnost (či nepodobnost – vzdálenost) mezi vzorky (eukleidovská distance, Jaccardův koeficient, a spousta dalších) Pak zvolím způsob, jak se tato informace převádí do struktury dendrogramu: metoda nejbližší cesty (average linkage), nejdelší cesty (complete linkage), Wardova, a další
Klasifikace: hierarchická 3 Obě volby - míra (ne)podobnosti i postup shlukování – velmi ovlivní povahu výsledků Implicitní volby klastrové analýzy v programu Statistica nejsou vhodné, navíc tento program postrádá v ekologii běžně užívané míry nepodobnosti Ne-hierarchické klasifikace se v biologii používají spíše výjimečně (ale třeba v GIS)
Ordinace Klasifikace („roz-škatulkování“) a ordinace („uspořádání za sebe“) jsou dva důležité aspekty práce lidského mozku Problémem klasifikace je, že není úplně vhodná tam, kde se vlastnosti věcí mění plynule To je třeba případ změn složení společenstev organismů podél gradientů prostředí
Ordinační diagramy Blízkost znamená podobnost Vysvětlující proměnné (charakteristiky prostředí): buď promítáme dodatečně nebo použijeme v tzv. omezené ordinaci: constrained ordination
Omezená ordinace: testy hypotéz o mnohorozměrných datech Metody omezené ordinace jsou obdobou regresních modelů pro analýzu celého společenstva. Lze je proto použít pro testování hypotéz
Diskriminační analýza Mám předem dané skupiny: například dva druhy plžů přílepek Rád bych je odlišil na základě morfologických znaků. Mám „trénovací vzorek“ (molek. určený)
Co se do Biostatistiky nevešlo Z metod častěji používaných v biologických článcích to jsou zejména tyto: Power analysis – jakou mám šanci zamítnout nulovou hypotézu pro danou velikost efektu Složitější modely ANOVA (obecného lineárního modelu, mixed effect models) Zobecněné lineární modely Metody mnohorozměrné analýzy Bayesovská statistika
Kde se mohu dozvědět více o složitějších statistických metodách Plánování a hodnocení ekologických experimentů (Lepš a Šmilauer): každý ZS Moderní regresní metody (Šmilauer): ZS obročně Praktikum mnohorozměrných metod (Lepš a Šmilauer): každý LS Vizualizace dat (Šmilauer): LS obročně