Mnohorozměrná statistika

Slides:



Advertisements
Podobné prezentace
kvantitativních znaků
Advertisements

Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)
Monte Carlo permutační testy & Postupný výběr
Jak číst ordinační diagramy
Lekce 1 Modelování a simulace
Lineární regresní analýza Úvod od problému
Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad.
Metody psychologie PhDr. Eva Tomešová, PhD.. Jak psychologové dospějí k závěrům o neznámém?  Používají VĚDECKOU METODU: IDENTIFIKACE VĚDECKÉ OTÁZKY FORMULACE.
Návrh modelů Jan Brůha IREAS. Návrh otázek a modelů Jaký vliv měla podpora z ESF v OP LZZ 1.1 na obrat / zisk a zaměstnanost firem? – Jde o srovnání mezi.
Biologická diverzita a Indexy biodiverzity
Hodnocení krajinných změn, příklad z ČR
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
1 Hodnocení geologických dat pomocí matematické statistiky Petr Čoupek 740/742/ IT spec.
Testování hypotéz (ordinální data)
Matice distancí v mnohorozměrné analýze. Distanční matice – proč se objevují? Vzdálenosti mezi objekty v terénu Vzdálenosti mezi taxony ve fylogenetickém.
Varianty výzkumu Kroky výzkumu Výběrový soubor
Shlukovací algoritmy založené na vzorkování
kvantitativních znaků
Testování hypotéz vymezení důležitých pojmů
Obecný lineární model Analýza kovariance Nelineární modely
Shluková analýza.
Rozšíření dotazu a vývoj tématu v IR Jiří Dvorský Jan Martinovič Václav Snášel.
Text: Reprodukce nálevníků Metody získávání vědeckých poznatků
Biostatistika 9. přednáška Aneta Hybšová
Míry podobnosti Klastrová analýza Metoda TWINSPAN
Experimentální design
Obecný lineární model Fitované hodnoty and regresní residuály
Shluková analýza.
Biostatistika 5. přednáška Aneta Hybšová
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Složitější (mnohorozměrné) metody
Korelace a elaborace aneb úvod do vztahů proměnných
Účel procedury: První a závazný krok jakékoli seriozní komparativní studie. Umožňuje vyloučit možnost, že distribuce studovaného znaku (vlastnosti, vzorce.
Úvod do gradientové analýzy
Lineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Závislost dvou kvantitativních proměnných
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Biostatistika 7. přednáška
Makrozoobentos a klasifikace toků Jarkovský J. 2,3, Kubošová K. 2,3, Zahrádková S. 1, Brabec K. 1, Kokeš J. 4, Klapka R. 2,3 1) Ústav botaniky a zoologie,
Digitální výukový materiál zpracovaný v rámci projektu „EU peníze školám“ Projekt:CZ.1.07/1.5.00/ „SŠHL Frýdlant.moderní školy“ Škola:Střední škola.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Odhad metodou maximální věrohodnost
Úvod do ekologie.
Pohled z ptačí perspektivy
Klasifikace Míry (ne)podobnosti (Dis)similarity measures, Resemblance functions Shluková analýza - Cluster analysis TWINSPAN.
Analýza kvantitativních dat I. Vztahy mezi 3 znaky v kontingenční tabulce - úvod Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace
8. Kontingenční tabulky a χ2 test
Biostatistika 8. přednáška
Korelace.
Biostatistika 1. přednáška Aneta Hybšová
Základy pedagogické metodologie
Motivační příklad – 1a Vliv rodičů a prostředí na vývoj mláďat Nejstarší mládě v každém hnízdě měřeno ve věku X dní Vysvětlující údaje: počet mláďat, stáří.
Aplikovaná statistika 2. Veronika Svobodová
Bc. Jaromír Šetek VNÍMÁNÍ ZEMĚ PŮVODU ZNAČKY A ZEMĚ PŮVODU PRODUKTU VEDOUCÍ PRÁCE: Ing. Pavel Štrach, Ph.D. et Ph.D.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Opakování – přehled metod
Varianty výzkumu Kroky výzkumu Výběrový soubor
Indexní analýza Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
- váhy jednotlivých studií
Proč statistika ? Dva důvody Popis Inference
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
3. cvičení
PSY252 Statistická analýza dat v psychologii II Seminář 9
Neparametrické testy pro porovnání polohy
Metodologie pro ISK 2 Úvod do práce s daty
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Transkript prezentace:

Mnohorozměrná statistika včetně Path analysis

Path analysis: terminologie Path analysis je název původní metody, která se dnes téměř neužívá Structural Equation Modelling (SEM): označení (obecnějších) modelů, pod ním tyto postupy nalezneme v novějších programech (též v programu Statistica)

Path analysis: příklad Studuji vztah mezi rychlostí fotosyntézy, prostupností průduchů a vlastnostmi listů (koncentrace dusíku a specific leaf area, SLA) Nemohu vztahy popsat jednou regresní rovnicí, protože většina parametrů, ovlivňovaných jinými, také ovlivňuje další parametry.

Path analysis: korelace versus kauzalita Metoda SEM se snaží popsat příčinné (kauzální) vztahy. Ty ale nelze s jistotou určit na základě pozorování (bez manipulace). V mnoha případech ale jednotlivými „hráči“ nelze nezávisle manipulovat (např. různé fyziologické parametry listu/rostliny) Kauzální model odhadujeme a „testujeme“ na základě shody jím předpovídaných korelací s těmi, které pozorujeme

Path analysis: literatura Bill Shipley (2004): Cause and Correlation in Biology - A User's Guide to Path Analysis, Structural Equations and Causal Inference. Cambridge University Press. James B. Grace (2006): Structural Equation Modelling and Natural Systems. Cambridge University Press

Klasifikace - úvod Cílem klasifikace je rozdělit pozorování do dvou nebo více skupin, ve kterých jsou si pozorování co nejvíce podobná a které jsou navzájem co nejvíce odlišné Pozorováními mohou být například jedinci různých druhů plžů, na kterých byly měřeny stejné znaky: vymezení druhů či taxonů jiné úrovně – numerická taxonomie Nebo záznamy o složení vegetace, místo znaků z předchozího případu zde máme zastoupení jednotlivých druhů rostlin

Klasifikace: vstupní data Dvourozměrná tabulka: vzorky a proměnné

Klasifikace: hierarchická 1 Stromečkový diagram se nazývá dendrogram V některých případech (při studiu společenstev organismů) můžeme chtít obdobně klasifikovat i druhy („znaky“). Podobné si budou ty druhy, které se vyskytují spolu a mají tedy podobné nároky na podmínky prostředí Do samostatného oboru se vyvinula kladistika, kde hierarchie odráží evoluční vztahy mezi druhy, ne fenetickou podobnost

Klasifikace: hierarchická 2 Hiearchické klasifikaci, při které se začíná od jednotlivých vzorků a ty se spojují, se říká aglomerativní, též shluková analýza Nejprve zvolím, jak vyjádřím podobnost (či nepodobnost – vzdálenost) mezi vzorky (eukleidovská distance, Jaccardův koeficient, a spousta dalších) Pak zvolím způsob, jak se tato informace převádí do struktury dendrogramu: metoda nejbližší cesty (average linkage), nejdelší cesty (complete linkage), Wardova, a další

Klasifikace: hierarchická 3 Obě volby - míra (ne)podobnosti i postup shlukování – velmi ovlivní povahu výsledků Implicitní volby klastrové analýzy v programu Statistica nejsou vhodné, navíc tento program postrádá v ekologii běžně užívané míry nepodobnosti Ne-hierarchické klasifikace se v biologii používají spíše výjimečně (ale třeba v GIS)

Ordinace Klasifikace („roz-škatulkování“) a ordinace („uspořádání za sebe“) jsou dva důležité aspekty práce lidského mozku Problémem klasifikace je, že není úplně vhodná tam, kde se vlastnosti věcí mění plynule To je třeba případ změn složení společenstev organismů podél gradientů prostředí

Ordinační diagramy Blízkost znamená podobnost Vysvětlující proměnné (charakteristiky prostředí): buď promítáme dodatečně nebo použijeme v tzv. omezené ordinaci: constrained ordination

Omezená ordinace: testy hypotéz o mnohorozměrných datech Metody omezené ordinace jsou obdobou regresních modelů pro analýzu celého společenstva. Lze je proto použít pro testování hypotéz

Diskriminační analýza Mám předem dané skupiny: například dva druhy plžů přílepek Rád bych je odlišil na základě morfologických znaků. Mám „trénovací vzorek“ (molek. určený)

Co se do Biostatistiky nevešlo Z metod častěji používaných v biologických článcích to jsou zejména tyto: Power analysis – jakou mám šanci zamítnout nulovou hypotézu pro danou velikost efektu Složitější modely ANOVA (obecného lineárního modelu, mixed effect models) Zobecněné lineární modely Metody mnohorozměrné analýzy Bayesovská statistika

Kde se mohu dozvědět více o složitějších statistických metodách Plánování a hodnocení ekologických experimentů (Lepš a Šmilauer): každý ZS Moderní regresní metody (Šmilauer): ZS obročně Praktikum mnohorozměrných metod (Lepš a Šmilauer): každý LS Vizualizace dat (Šmilauer): LS obročně