Matice distancí v mnohorozměrné analýze. Distanční matice – proč se objevují? Vzdálenosti mezi objekty v terénu Vzdálenosti mezi taxony ve fylogenetickém.

Slides:



Advertisements
Podobné prezentace
Fourierova transformace Filtrování obrazu ve frekvenční doméně
Advertisements

12.přednáška integrační metody per partes substituce
Rovnice roviny Normálový tvar rovnice roviny
PA081 Programování numerických výpočtů Přednáška 2.
Monte Carlo permutační testy & Postupný výběr
Analytické nástroje GIS
Jak číst ordinační diagramy
Plošná interpolace (aproximace)
Predikce Zobecněná MNČ
MORFOMETRIE NA PRŮSEČÍKU
ZPRACOVÁVÁME KVANTITATIVNÍ DATA II.
Exponenciální a logaritmické rovnice
Analytické metody výzkumu
Fakulta životního prostředí Katedra informatiky a geoinformatiky
Obecný lineární model Analýza kovariance Nelineární modely
Základy ekonometrie Cvičení září 2010.
Shluková analýza.
Sociologický výzkum.
Gis pro krajinné ekology
Vliv rotace Země na prostorové uspořádání (polohu) pixelu v násnímaných datech.
Počítačová grafika.
Lineární rovnice Lineární rovnice s jednou neznámou máj vzorec
Míry podobnosti Klastrová analýza Metoda TWINSPAN
Shluková analýza.
Funkce více proměnných.
Gravitace (gravitační síla, tíhová síla)
Složitější (mnohorozměrné) metody
Účel procedury: První a závazný krok jakékoli seriozní komparativní studie. Umožňuje vyloučit možnost, že distribuce studovaného znaku (vlastnosti, vzorce.
Úvod do gradientové analýzy
Lineární regrese.
Lineární regresní analýza
Metody výběru variant Používají se pro výběr v případě více variant řešení stejného problému Lze vybírat dle jednoho nebo více kritérií V případě více.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: CZ.1.07/1.5.00/ Šablona:III/2č. materiálu:VY_32_INOVACE_81.
Mnohorozměrná statistika
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
ISS Úlohy o podobnosti objektů, mnohorozměrné škálování Semináře ke kurzu Analytické metody výzkumu Jindřich Krejčí.
Metrologie   Přednáška č. 5 Nejistoty měření.
Klasifikace Míry (ne)podobnosti (Dis)similarity measures, Resemblance functions Shluková analýza - Cluster analysis TWINSPAN.
Základy ekonometrie 4EK211
 Zkoumáním fyzikálních objektů (např. polí, těles) zjišťujeme že:  zkoumané objekty mají dané vlastnosti,  nacházejí se v určitých stavech,  na nich.
Počítačová chemie (5. přednáška)
Kvadratická rovnice s parametrem
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Gradientová analýza II
Kmitání.
Vyhledávání vzorů (template matching)
Motivační příklad – 1a Vliv rodičů a prostředí na vývoj mláďat Nejstarší mládě v každém hnízdě měřeno ve věku X dní Vysvětlující údaje: počet mláďat, stáří.
Teorie psychodiagnostiky a psychometrie
18.
Kvadratické nerovnice
Inferenční statistika - úvod
Lineární funkce Rozdělení lineárních funkcí Popis jednotlivých funkcí.
Opakování – přehled metod
Vrchol paraboly.
L i n e á r n í r o v n i c e II. Matematika 8.ročník ZŠ
4. cvičení
Úlohy o podobnosti objektů, mnohorozměrné škálování
Induktivní statistika
ANALÝZA A KLASIFIKACE DAT
Fylogenetická evoluční analýza
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Parciální korelace Regresní analýza
5. cvičení
2. přednáška Differenciální rovnice
Pokročilé neparametrické metody Validační techniky
Lineární regrese.
Induktivní statistika
ANALÝZA A KLASIFIKACE DAT
Transkript prezentace:

Matice distancí v mnohorozměrné analýze

Distanční matice – proč se objevují? Vzdálenosti mezi objekty v terénu Vzdálenosti mezi taxony ve fylogenetickém stromečku Vzdálenosti mezi pozorováními, které nelze kvantitativně měřit (např. degustační výsledky)

Jak s distančními maticemi nakládat? Můžeme pracovat přímo s hodnotami distancí a z údajů, které nejsou distance, je vypočítat (tak se užívá například Mantelův test). To má ale spoustu nevýhod Můžeme distance převést na souřadnice – metody mnohorozměrného škálování. Častěji v takovém případě užíváme metrickou metodu (principal coordinates analysis, PCoA)

Distance máme pro druhová data To je případ, ve kterém nám nevyhovují distance, implikované metodou CCA (chi-square distance) nebo RDA (Eukleidovská distance), spočteme si vlastní Převedeme na souřadnice pomocí PCoA; nevadí, že jich máme hodně (vysvětlované proměnné mohou být v ordinačních metodách korelovány) Použijeme tyto souřadnice v metodě RDA – to je tzv. distance-based RDA (db-RDA), Legendre & Anderson, Ecol.Monographs 1999

Distance máme pro prediktory V tomto případě musíme obvykle z vypočítaných hlavních koordinát vybírat (ty, které dobře vysvětlují hodnoty v druhových datech) – jinak by vysvětlily všechno Častá je situace, kdy máme některé prediktory jako distance (vzdálenost, fylogenetická spřízněnost), zatímco jiné ne (ekologické vlastnosti druhů, vlastnosti prostředí u snímků)

Prostorové uspořádání I. Doporučovaná metoda: PCNM (principal coordinates of neighbour matrices), Borcard & Legendre, Ecol.Modelling 2002 Spočítáme matici vzdáleností mezi jednotlivými vzorky a pak "utneme" všechny distance větší než hodnota největší vzdálenosti mezi bezprostředními sousedy. Tyto "uťaté" hodnoty nahradíme jednou – 4násobkem limity

Prostorové uspořádání II. Výslednou matici pak zpracujeme pomocí PCoA Pro pravidelně rozmístěné body odpovídá sinus-cosinus dekompozici (Fourierova transformace) – například lineární transekt Ale funguje i pro nepravidelně uspořádaná data, například pobřeží jezera

Prostorové uspořádání III. Nejčastěji užíváme tato data, vysvětlující prostorové souvislosti, v rámci variation partitioning

Fylogenetické vztahy I. Také se nejčastěji užívá v kombinaci s variation partitioning Pro překryv v objasňujících schopnostech se užívá termín „phylogenetically structured environmental variation“ (Desdevides et al., Evolution 2003), odpovídá pojmu „phylogenetic niche conservatism“ Tento postup lze užít i v případě, že nejde o mnohorozměrná data (příklad vlivu populační density na velikost těla savců)

Fylogenetické vztahy II. Jak převedeme stromeček na matici? Musíme mít tzv. ultrametrický strom (všechny cesty od terminálních nód ke kořenu, tj. počátku divergence dané skupiny, jsou stejně dlouhé) Převod na patristickou matici provádí i některé programy pro fylogenetickou analýzu (ape package v R)

Fylogenetické vztahy III. Matici převedeme na souřadnice pomocí PCoA (PrCoord) Vybereme jen souřadnice, které něco průkazně vysvětlují (forward selection), metoda RDA Zvolené souřadnice lze interpretovat jejich pozicí v původním stromečku Dále je používáme typicky jako kovariáty