Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)

Podobné prezentace


Prezentace na téma: "Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)"— Transkript prezentace:

1 Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)

2 Co je můj základní soubor? Já z něj provádím náhodný výběr Je můj výběr opravdu náhodný? Jaká je jeho vypovídací schopnost vzhledem k základnímu souboru Jsou moje opakování opravdu nezávislá? (A co pseudoreplikace?) Experiment a observační studie

3 Asi nejdůležitější poučení Než začneš dělat experiment, nebo sbírat data, měl bys (aspoň zhruba) vědět, jak je vyhodnotíš [nebo by to alespoň měl vědět školitel] Je užitečné odhadnout, jak mnoho pozorování potřebuji, abych měl šanci dostat průkazné výsledky (na to potřebuju ale mít představu o velikosti možného efektu, a variabilitě dat)

4 Další důležité ponaučení Nezamítnutí nulové hypotézy není důkazem, že nulová hypotéza platí (pokud neudělám rozumný rozbor síly testu, ale i pak je třeba být opatrný) Proto je třeba si uvědomit, jaká je asymetrie mezi zamítnutím a nezamítnutím nulové hypotézy Tato asymetrie ale vede k fenomenu „publication bias“ (co je to metaanalýza?)

5 Každá metoda má nějaké předpoklady ale ty jsou v reálu zcela splněny jen velmi zřídka Důležité je umět odhadnout, kdy je narušení natolik velké, že činí test nespolehlivým Testování předpokladů: je diskutabilní přístup - i test předpokladů má určitou sílu - a ta roste s počtem pozorování, ale robustnost metod (hlavně vůči narušení normality) roste také s počtem pozorování - lepší je se podívat na graf, než formální test (ale recenzent ho někdy chce)

6 Když už test dělám, potom Normální rozdělení mají mít v GLM reziduály (jak v ANOVě, tak v regresi) Zásadně špatně je tedy např. vzít Y v regresi, a zkoušet, jestli má normální rozdělení. Příslušné testy jsou součástí daných procedur ve Statistice

7 Co si od užití statistiky slibuji Explorační vs. konfirmační analýza dat Výsledky nejsou jen pro mě, ale také (často hlavně) pro čtenáře - já vidím, že se hnojené a nehnojené plochy liší, čtenář je odkázán na výsledek testu ve článku. (Užívám tedy často statistiku jako formální podepření svých závěrů.) Na statistiku lze také pohlížet jako na „ochranu“ před naší tendencí interpretovat výsledky tak, jak se nám líbí – podíváme se tedy, jestli daný výsledek nemohl vzniknout čistě náhodou (jak je to pravděpodobné)

8 Často provádím pokus (nebo sbírám observační data) a „vím“, že test má vyjít průkazně Nebo spíše, mám „odkoukanou“ závislost v terénu, ale potřebuji ji prokázat „tvrdými“ daty Neprůkazný výsledek se pak těžko interpretuje – je nutné si uvědomit, co je chyba II druhu, a co znamená nezamítnutí H 0. – Power analysis

9 Potřebuju silný test Pro ten potřebuju mnoho nezávislých pozorování Často konflikt mezi realističností a potřebami statistiky - „ideální“ experimentálni design by někdy ústil i do konfliktu s etikou, popř. zákonem

10 Co si od užití statistiky slibuji Často testujeme absurdní nulové hypotézy (prostě P<0,01 ve článku dobře vypadá, i když nulová hypotéza, že přidání NPK na louku nezvýší produkci je dost nesmyslná) V těchto případech si uvědomte, že test je vlastně takový rituál, čtenáře ale zajímá hlavně změna hodnoty parametru (tj. produkce se zvýšila o xx g/m 2 )

11 Nebezpečí slova „výzmnamný“ Významně odchylný od H 0 (=significant) znamená pouze, že platnost nulové hypotézy je velmi nepravděpodobná Neříká to nic o biologické významnosti Síla testu – když mám mnoho pozorování, tak mám velmi vysokou sílou testu, prokážu i naprosté drobnosti (případ automatického sběru dat, GIS)

12 Když o statistice píšu v článku (diplomce) Je podstatně lepší: Skupina krmená preparátem měla v průměru játra o 7 g lehčí, než skupina kontrolní (t=3,15, df=25, P<0,01) NEŽ: Zamítli jsme nulovou hypotézu, že váha jater u kontrolní a preparátem krmené skupiny jsou stejné.

13 Když o statistice píšu v článku (diplomce) Uvádím, kterou metodu jsem použil, nikoliv, kterou proceduru v programu Statistica. TYPICKY: V programu Statistica počítám Jednoduchou regresi pomocí modulu Multiple regression. Nicméně do diplomky píšu: Data jsem vyhodnotil pomocí jednoduché regrese.

14 Nezapomínejte na df Zvláště v ANOVě. Nezapomeňte, že F má dvoje stupně volnosti (čitatele [effect df, někdy též numerator df] a jmenovatele [error df, někdy též denominator df]). Zvlášť error df jsou důležité, podle nich se pozná, jestli jste ANOVu počítali správně.

15 Vysvětlující proměnná/é Vysvětlovaná proměnná Metoda Kvantitativní Regrese KategoriálníKvantitativníANOVA Kategoriální Kontingenční tabulky (ale i vztah dvou kat. proměnných) KvantitativníKategoriálníLogistická regrese Základní metody

16 Tyto metody mají většinou Neparametrické protějšky Ty jsou nečastěji založeny na pořadí (rank tests) Nebo jsou dnes moderní permutační (randomizační) testy

17 Vztah dvou kvantitativních pr. Korelace Vysvětlující je směs kvantit. a kvalit. Proměnných, odpověď je kvantit ANCOVA (obecné lineární modely) Shoda frekvence očekávaných četností s teorií Chi-kvadrát test dobré shody Řada popisných charakteristik Další metody

18 Co jsme neprobrali Power analysis Složitější ANOVy Mnohorozměrné metody Zobecněné lineární modely Jackknife a bootstrap Bayesovskou statistiku A řadu dalších metod

19 Snaž se najít vhodnou metodu pro svoje výsledky A nikoliv vždy napasovat svoje výsledky na metody, které jsme zde probrali Domnívat se, že po tomto kursu je člověk schopen zanalyzovat veškerá data je jako věřit, že po kursu první pomoci jsem schopen odoperovat slepé střevo


Stáhnout ppt "Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)"

Podobné prezentace


Reklamy Google