Práce s výsledky statistických studií

Slides:



Advertisements
Podobné prezentace
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Advertisements

Analýza experimentu pro robustní návrh
kvantitativních znaků
Použité statistické metody
Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)
Hodnocení způsobilosti měřících systémů
Cvičení 6 – 25. října 2010 Heteroskedasticita
Analýza variance (Analysis of variance)
Metody psychologie PhDr. Eva Tomešová, PhD.. Jak psychologové dospějí k závěrům o neznámém?  Používají VĚDECKOU METODU: IDENTIFIKACE VĚDECKÉ OTÁZKY FORMULACE.
Výpočet a interpretace ukazatelů asociace v epidemiologických studiích
Úvod do regresní analýzy
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Tloušťková struktura porostu
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
Inference jako statistický proces 1
Experimentální design
Charakteristiky variability
Účel procedury: První a závazný krok jakékoli seriozní komparativní studie. Umožňuje vyloučit možnost, že distribuce studovaného znaku (vlastnosti, vzorce.
Lineární regrese.
Lineární regresní analýza
Biostatistika 7. přednáška
Test dobré shody Fisherův přesný test McNemar test
Analýza variance (ANOVA).
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Princip maximální entropie
Experimentální fyzika I. 2
Pohled z ptačí perspektivy
V. Analýza rozptylu ANOVA.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie psychodiagnostiky a psychometrie
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Statistická významnost a její problémy
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
PSY717 – statistická analýza dat
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Popisná analýza v programu Statistica
STATISTICKÝ ROZCESTNÍK aneb CO S DATY Martin Sebera.
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
AKD 1 (7/5) Transformace – vytváření nových proměnných: COMPUTE → SUMA celkový počet knih Konstanta → Student FHS COUNT → knihomol (2 x III. Tercil)
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
Inferenční statistika - úvod
Mann-Whitney U-test Wilcoxonův test Znaménkový test
IV..
1 Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Vladimír Mikulík. Slezské gymnázium, Opava, příspěvková organizace. Vzdělávací materiál.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Základy zpracování geologických dat R. Čopjaková.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Neparametrické testy parametrické a neparametrické testy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
- váhy jednotlivých studií
Úvod do praktické fyziky
Popisná analýza v programu Statistica
Induktivní statistika
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Parciální korelace Regresní analýza
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Úvod do induktivní statistiky
Autor: Honnerová Helena
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Základy statistiky.
Transkript prezentace:

Práce s výsledky statistických studií

Obsah Určování kauzality Vícečetné testy Síla statistického efektu Spojování výsledků z nezávislých testů

Obsah Určování kauzality Vícečetné testy Síla statistického efektu Spojování výsledků z nezávislých testů

Asociace x kauzalita 1) 2) A B A B 3) 4) A A X X B B

Zjišťování kauzality Asociace mezi jevy A a B A je podmínka nutná (když B tak vždy A) A je podmínka dostačující (když A tak vždy B) A je podmínka nutná a zároveň dostačující (když B tak vždy A a zároveň když A tak vždy B) A zvyšuje pravděpodobnost B (když A tak častěji B a naopak) Časová následnost (temporalita) Průvodní variance (korelace s intenzitou či četností) Věcné opodstatnění (plauzibilita), u publikovaných dat to může být naopak… Reprodukovatelnost Specifita (jeden faktor – jeden následek) Koherence se současnými teoriemi a poznatky

Problémy s určováním kauzality a) temporalita B D A B nebo C A B A čas b) síla asociace A B C A B C nebo D E F A C B

Temporalita vyhynutí dešťovek vymizení chodbiček úbytek vlhkosti suchomilné rostliny t1 t2 čas

2D : 4D index ♀ ♂ 0,99 P 0,98 L 0,97 P 0,98 L

Mění toxoplasmosa prsty, nebo mění testosteron riziko infekce? vývoj prstů prenatální testosteron infekce poměr prstů postnatální testosteron protilátky

Obsah Určování kauzality Vícečetné testy Síla statistického efektu Spojování výsledků z nezávislých testů

Problém vícečetných testů

Řešení problému vícečetných testů Předem vyloučit nadbytečné proměnné Sekundární indexy (a priori) Faktorová analýza (posteriori) Bloky testů – ujasnit si předem Bonferroniho korekce (nejkonzervativnější) obvykle α/n respekt. pn správně: 1 – (n-tá odmocnina z α) Postupná Bonferroniho korekce - veličinu s nejmenším p testovat na hladině α/n, další na α/(n -1), atd. Zpětná postupná Bonferroniho korekce - veličinu s největším p testovat na hladině α, další na α/2, atd. Postupná FDR korekce - seřadit a testovat od nejmenšího p dokud pk ≤ k × α/n, k: pořadí, zamítni prvních k nulových hypotéz

Řešení problému vícečetných testů P-plot a zaostřené Bonferroniho metody (García V.L. Escaping the Bonferroni iron claw in ecological studies. OIKOS 105, 657-663, 2004.) počet nesignifikantních testů (n*) = (1/beta*) – 1, beta* směrnice vyznačené přímky

Obsah Určování kauzality Vícečetné testy Síla statistického efektu Spojování výsledků z nezávislých testů

Síla statistického efektu Nemusí souviset s p ! (na dostatečně velkém souboru se projeví i „neexistující“ efekt v případě korelace a ANOVA lze použít podíl vysvětlené variability (R2), (GLM: η2) v případě t-testu Hedkinsovo d (rozdíl mezi skupinami/S.D.) v ekologii a evoluci i „malé“ efekty významné 95% publikovaných efektů vysvětluje 1,99-7,5% variability). d=0,2 malý, 0,5 střední, 0.8 velký efekt. (reakční rychlost x brzdná dráha)

Obsah Určování kauzality Vícečetné testy Síla statistického efektu Spojování výsledků z nezávislých testů

Spojování výsledků z různých studií Souvisí fluktuační asymetrie s fitnis když p=0,09, 0,07, 0,11? Fisherova metoda výpočtu celkové signifikance: Chí2 = -2 SUMA(ln(p)), c stupňů volnosti (c: počet testů) Chí2 = -2 * (-2.41) + (-2,66) + (-2,21)=14,55 P = 0.02 metaanalýza

Metaanalýza Bere v úvahu sílu a směr naměřeného efektu i velikost studovaného souboru Síla efektu (podíl vysvětlené variability (R2), nebo Hedkinsovo d (rozdíl/S.D.) Metaanalýza umožňuje odhalit chybějící výsledky (publikační bias) trychtýřový graf

Metaanalýza Trychtýřový graf Simulované data, náhodně vytvořeno 100 vzorků velikosti 50-2000 ze souboru s normálním rozdělením, průměrem 1 a směrodatnou odchylkou 10. Křivky ohraničují oblast zahrnující 95% vzorků o dané velikosti. Černé body jsou vzorky, jejichž průměr se signifikantně liší od 0, prázdné odpovídají vzorkům, jejichž průměr se signifikantně neliší od 0. Graf má trychtýřovitý tvar pouze tehdy, když se neuplatní publikační bias a když budou publikovány i studie s nesignifikantním výsledkem. Thornton and Lee 2000 velikost efektu velikost vzorku

Metaanalýza Efekt fluktuační asymetrie na reprodukční úspěch 0,4 0,0 vážená velikost efektu -0,4 -1,2 -1,6 91 93 95 97 99 rok publikace Simmons a spol. 1999

Shrnutí Pozor na rozdíl mezi asociací a kauzalitou Pozor na mnohočetné testy Jak měřit sílu efektu, co je v biologii slabý a co silný efekt. Pozor na záludnosti metaanalýzy