Mnohorozměrná statistika

Slides:

Advertisements

Podobné prezentace

kvantitativních znaků

Advertisements

Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)

Monte Carlo permutační testy & Postupný výběr

Jak číst ordinační diagramy

Lekce 1 Modelování a simulace

Lineární regresní analýza Úvod od problému

Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad.

Metody psychologie PhDr. Eva Tomešová, PhD.. Jak psychologové dospějí k závěrům o neznámém?  Používají VĚDECKOU METODU: IDENTIFIKACE VĚDECKÉ OTÁZKY FORMULACE.

Návrh modelů Jan Brůha IREAS. Návrh otázek a modelů Jaký vliv měla podpora z ESF v OP LZZ 1.1 na obrat / zisk a zaměstnanost firem? – Jde o srovnání mezi.

Biologická diverzita a Indexy biodiverzity

Hodnocení krajinných změn, příklad z ČR

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

1 Hodnocení geologických dat pomocí matematické statistiky Petr Čoupek 740/742/ IT spec.

Testování hypotéz (ordinální data)

Matice distancí v mnohorozměrné analýze. Distanční matice – proč se objevují? Vzdálenosti mezi objekty v terénu Vzdálenosti mezi taxony ve fylogenetickém.

Varianty výzkumu Kroky výzkumu Výběrový soubor

Shlukovací algoritmy založené na vzorkování

kvantitativních znaků

Testování hypotéz vymezení důležitých pojmů

Obecný lineární model Analýza kovariance Nelineární modely

Shluková analýza.

Rozšíření dotazu a vývoj tématu v IR Jiří Dvorský Jan Martinovič Václav Snášel.

Text: Reprodukce nálevníků Metody získávání vědeckých poznatků

Biostatistika 9. přednáška Aneta Hybšová

Míry podobnosti Klastrová analýza Metoda TWINSPAN

Experimentální design

Obecný lineární model Fitované hodnoty and regresní residuály

Shluková analýza.

Biostatistika 5. přednáška Aneta Hybšová

Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.

Složitější (mnohorozměrné) metody

Korelace a elaborace aneb úvod do vztahů proměnných

Účel procedury: První a závazný krok jakékoli seriozní komparativní studie. Umožňuje vyloučit možnost, že distribuce studovaného znaku (vlastnosti, vzorce.

Úvod do gradientové analýzy

Lineární regrese.

REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond

Závislost dvou kvantitativních proměnných

Biostatistika 6. přednáška

Další spojitá rozdělení pravděpodobnosti

Biostatistika 7. přednáška

Makrozoobentos a klasifikace toků Jarkovský J. 2,3, Kubošová K. 2,3, Zahrádková S. 1, Brabec K. 1, Kokeš J. 4, Klapka R. 2,3 1) Ústav botaniky a zoologie,

Digitální výukový materiál zpracovaný v rámci projektu „EU peníze školám“ Projekt:CZ.1.07/1.5.00/ „SŠHL Frýdlant.moderní školy“ Škola:Střední škola.

Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.

Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.

Odhad metodou maximální věrohodnost

Úvod do ekologie.

Pohled z ptačí perspektivy

Klasifikace Míry (ne)podobnosti (Dis)similarity measures, Resemblance functions Shluková analýza - Cluster analysis TWINSPAN.

Analýza kvantitativních dat I. Vztahy mezi 3 znaky v kontingenční tabulce - úvod Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace

8. Kontingenční tabulky a χ2 test

Biostatistika 8. přednáška

Biostatistika 1. přednáška Aneta Hybšová

Základy pedagogické metodologie

Motivační příklad – 1a Vliv rodičů a prostředí na vývoj mláďat Nejstarší mládě v každém hnízdě měřeno ve věku X dní Vysvětlující údaje: počet mláďat, stáří.

Aplikovaná statistika 2. Veronika Svobodová

Bc. Jaromír Šetek VNÍMÁNÍ ZEMĚ PŮVODU ZNAČKY A ZEMĚ PŮVODU PRODUKTU VEDOUCÍ PRÁCE: Ing. Pavel Štrach, Ph.D. et Ph.D.

Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.

Opakování – přehled metod

Varianty výzkumu Kroky výzkumu Výběrový soubor

Indexní analýza Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.

- váhy jednotlivých studií

Proč statistika ? Dva důvody Popis Inference

Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.

PSY252 Statistická analýza dat v psychologii II Seminář 9

Neparametrické testy pro porovnání polohy

Metodologie pro ISK 2 Úvod do práce s daty

7. Kontingenční tabulky a χ2 test

Základy statistiky.

Transkript prezentace:

Mnohorozměrná statistika včetně Path analysis

Path analysis: terminologie Path analysis je název původní metody, která se dnes téměř neužívá Structural Equation Modelling (SEM): označení (obecnějších) modelů, pod ním tyto postupy nalezneme v novějších programech (též v programu Statistica)

Path analysis: příklad Studuji vztah mezi rychlostí fotosyntézy, prostupností průduchů a vlastnostmi listů (koncentrace dusíku a specific leaf area, SLA) Nemohu vztahy popsat jednou regresní rovnicí, protože většina parametrů, ovlivňovaných jinými, také ovlivňuje další parametry.

Path analysis: korelace versus kauzalita Metoda SEM se snaží popsat příčinné (kauzální) vztahy. Ty ale nelze s jistotou určit na základě pozorování (bez manipulace). V mnoha případech ale jednotlivými „hráči“ nelze nezávisle manipulovat (např. různé fyziologické parametry listu/rostliny) Kauzální model odhadujeme a „testujeme“ na základě shody jím předpovídaných korelací s těmi, které pozorujeme

Path analysis: literatura Bill Shipley (2004): Cause and Correlation in Biology - A User's Guide to Path Analysis, Structural Equations and Causal Inference. Cambridge University Press. James B. Grace (2006): Structural Equation Modelling and Natural Systems. Cambridge University Press

Klasifikace - úvod Cílem klasifikace je rozdělit pozorování do dvou nebo více skupin, ve kterých jsou si pozorování co nejvíce podobná a které jsou navzájem co nejvíce odlišné Pozorováními mohou být například jedinci různých druhů plžů, na kterých byly měřeny stejné znaky: vymezení druhů či taxonů jiné úrovně – numerická taxonomie Nebo záznamy o složení vegetace, místo znaků z předchozího případu zde máme zastoupení jednotlivých druhů rostlin

Klasifikace: vstupní data Dvourozměrná tabulka: vzorky a proměnné

Klasifikace: hierarchická 1 Stromečkový diagram se nazývá dendrogram V některých případech (při studiu společenstev organismů) můžeme chtít obdobně klasifikovat i druhy („znaky“). Podobné si budou ty druhy, které se vyskytují spolu a mají tedy podobné nároky na podmínky prostředí Do samostatného oboru se vyvinula kladistika, kde hierarchie odráží evoluční vztahy mezi druhy, ne fenetickou podobnost

Klasifikace: hierarchická 2 Hiearchické klasifikaci, při které se začíná od jednotlivých vzorků a ty se spojují, se říká aglomerativní, též shluková analýza Nejprve zvolím, jak vyjádřím podobnost (či nepodobnost – vzdálenost) mezi vzorky (eukleidovská distance, Jaccardův koeficient, a spousta dalších) Pak zvolím způsob, jak se tato informace převádí do struktury dendrogramu: metoda nejbližší cesty (average linkage), nejdelší cesty (complete linkage), Wardova, a další

Klasifikace: hierarchická 3 Obě volby - míra (ne)podobnosti i postup shlukování – velmi ovlivní povahu výsledků Implicitní volby klastrové analýzy v programu Statistica nejsou vhodné, navíc tento program postrádá v ekologii běžně užívané míry nepodobnosti Ne-hierarchické klasifikace se v biologii používají spíše výjimečně (ale třeba v GIS)

Ordinace Klasifikace („roz-škatulkování“) a ordinace („uspořádání za sebe“) jsou dva důležité aspekty práce lidského mozku Problémem klasifikace je, že není úplně vhodná tam, kde se vlastnosti věcí mění plynule To je třeba případ změn složení společenstev organismů podél gradientů prostředí

Ordinační diagramy Blízkost znamená podobnost Vysvětlující proměnné (charakteristiky prostředí): buď promítáme dodatečně nebo použijeme v tzv. omezené ordinaci: constrained ordination

Omezená ordinace: testy hypotéz o mnohorozměrných datech Metody omezené ordinace jsou obdobou regresních modelů pro analýzu celého společenstva. Lze je proto použít pro testování hypotéz

Diskriminační analýza Mám předem dané skupiny: například dva druhy plžů přílepek Rád bych je odlišil na základě morfologických znaků. Mám „trénovací vzorek“ (molek. určený)

Co se do Biostatistiky nevešlo Z metod častěji používaných v biologických článcích to jsou zejména tyto: Power analysis – jakou mám šanci zamítnout nulovou hypotézu pro danou velikost efektu Složitější modely ANOVA (obecného lineárního modelu, mixed effect models) Zobecněné lineární modely Metody mnohorozměrné analýzy Bayesovská statistika

Kde se mohu dozvědět více o složitějších statistických metodách Plánování a hodnocení ekologických experimentů (Lepš a Šmilauer): každý ZS Moderní regresní metody (Šmilauer): ZS obročně Praktikum mnohorozměrných metod (Lepš a Šmilauer): každý LS Vizualizace dat (Šmilauer): LS obročně