Účel procedury: První a závazný krok jakékoli seriozní komparativní studie. Umožňuje vyloučit možnost, že distribuce studovaného znaku (vlastnosti, vzorce.

Slides:



Advertisements
Podobné prezentace
Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)
Advertisements

A5M33IZS – Informační a znalostní systémy Testování modelů.
Testování statistických hypotéz
Monte Carlo permutační testy & Postupný výběr
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Cvičení 6 – 25. října 2010 Heteroskedasticita
Lineární regresní analýza Úvod od problému
Diskrétní rozdělení a jejich použití
t-rozdělení, jeho použití
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
1 Hodnocení geologických dat pomocí matematické statistiky Petr Čoupek 740/742/ IT spec.
Randomizační a Monte Carlo metody
Testování hypotéz (ordinální data)
Testování hypotéz přednáška.
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Testování hypotéz vymezení důležitých pojmů
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Poskytuje daný generátor opravdu posloupnost náhodných čísel?
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Lineární regrese.
Lineární regresní analýza
Závislost dvou kvantitativních proměnných
Biostatistika 6. přednáška
Analýza variance (ANOVA).
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Práce s výsledky statistických studií
Pohled z ptačí perspektivy
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Korelace.
PSY717 – statistická analýza dat
Jak statistika dokazuje závislost
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Aplikovaná statistika 2. Veronika Svobodová
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
Statistické metody pro prognostiku Luboš Marek Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
… jsou bohatší lidé šťastnější?
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Homogenita meteorologických pozorování
Statistické testování – základní pojmy
Neparametrické testy parametrické a neparametrické testy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
Induktivní statistika
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
- váhy jednotlivých studií
Úvod do praktické fyziky
Induktivní statistika
Fylogenetická evoluční analýza
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
PSY252 Statistická analýza dat v psychologii II Seminář 9
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
příklad: hody hrací kostkou
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Základy statistiky.
Transkript prezentace:

Účel procedury: První a závazný krok jakékoli seriozní komparativní studie. Umožňuje vyloučit možnost, že distribuce studovaného znaku (vlastnosti, vzorce chování) je dána pouze fylogenetickou příbuzností srovnávaných taxonů (např. druhů).

Tři základní postupy: 1) Znaková data -kladistická metoda s vynucenou topologií a následný výpočet indexu konsistence. 2) Distanční data -Mantelův permutační test regrese 3) Dendrogram -permutační test

Princip permutačních testů: Vyzkoušet, jak by vypadala data v případě platnosti nulové hypotézy.

Jak na to? Formulovat hypotézu (model), kterou chceme testovat. Vymyslet čím (v jakém parametru) by se experimentální data získaná v případě platnosti tohoto modelu lišila od obdobných dat náhodně vygenerovaných. Vypočítat příslušný kritický parametr pro experimentální data.

Pokračování Vygenerovat několikrát (mnohokrát) soubory náhodných dat a pro každý takový soubor vypočítat hodnotu kritického parametru. Seřadit získané hodnoty parametru podle velikosti a zjistit, kolikátá v pořadí je hodnota získaná z experimentálních dat. Rozhodnout, zda umístění experimentální hodnoty na n-tém místě (např. mezi 3 % nejmenšími) může být dílem náhody.

Příklad Vykazují příbuzné kmeny parazitického prvoka Trichomonas vaginalis i podobnou míru virulence?

Fylogenetický strom kmenů trichomonád Čísla v závorkách ukazují stupeň virulence

Hypotéza: Míra virulence je podobná u příbuzných kmenů. To znamená, že suma rozdílů virulencí sousedících kmenů (skupin kmenů) (v a - v b ) pro všechny uzly fylogenetického stromu trichomonád bude menší než obdobná suma rozdílů pro stejný strom s náhodně proházenými hodnotami virulence.

Proházené hodnoty virulence Čísla v závorkách ukazují stupeň virulence

Výsledky permutačního testu: Z celkového počtu vygenerovaných souborů dat vykazovalo ve srovnání s experimentálním souborem Σ(v a - v b ): 101 (2,02%) menší 1 (0,02%) stejnou (98,0%) větší

Závěr Existuje zhruba 2 % pravděpodobnost, že mezi vzájemnou příbuzností a podobností co do virulence (pathogenních projevů) není žádný vztah a že tedy závislost pozorovaná v našem experimentálním souboru je pouze dílem náhody. Nulovou hypotézu tedy zamítáme na hladině pravděpodobnosti p=0,02.

Dostupný software Flegr,J. Záboj,P. (1997) Acta Soc.Zool.Bohem. 61: Flegr,J a spol. (1998) Parasitology Research 84: Program TREEPT (PTPT) Dendrogramy, t-test, ANOVA, lineární regrese, truncated t-test.