Design pokusů a hodnocení dat Pozorování nebo experiment ? Časté chyby Typy analýz Statistická literatura a software
Strategie: „Sbírej/měř všechno!“ Výhoda Nevýhoda Škola hrou, osahám si dokonale předmět zájmu Nekonečné náměty s omezenými vzorky a metodikou Rybaření v kalných vodách neznáma Méně důsledné studium literatury (může se vymstít) Stejně nepostihnu vše Mohu „náhodou“ nalézt zajímavý vztah Není nad hypotézu …
Pozorování nebo experiment? Manipulativní experiment Pozorování Objekty neovlivňuji a zaznamenávám stav Manipuluji s objekty tak, abych maximalizoval vliv zkoumaného faktoru a potlačil ostatní faktory
Pozorování Obvykle nelze potvrdit kauzalitu (nemám kontrolu) Výhody Mohou vyplynout další otázky Vidím - popíšu Nevýhody Nevyžaduje přepečlivé plánování Vliv řady dalších proměnných – slabší síla testů Při velkém N a mnoha proměnných nejspíš něco vyjde Tvrdou terénní prací získám již známé poznatky V reálu přírody
Manipulativní experiment Odhaluje kauzalitu Další otázky mne obvykle nezajímají Náročné na plánování, čas, prostor Kontrola vedlejších efektů – velká síla testu (při vhodném designu) Každé pochybení během exp. znamená ztrátu Vzdálenější realitě přírody (zvl. v laboratoři) Laboratoř, pozemek v dosahu Výhody Nevýhody
Rozhodnu se podle Tradice v oboru Logistické podpory Položené otázky Kdy je vhodný experiment? Poukáží výsledky pozorování na možnou kauzalitu? Oč náročnější je než pozorování? Úrovni součas. poznání
Časté chyby …
1. rok 2. rok nebo jiná lokalita
Špatný design pokusu: není kontrola (blank) současné efekty confounding effects zde rok nebo lokalita riziko chybné interpretace výsledků Nelze publikovat v seriózním časopise
Stejný problém Špatný design pokusu: confounding effects zde gradient prostředí riziko chybné interpretace výsledků Nelze publikovat v seriózním časopise
Časté chyby Špatný design pokusu
Náhodný výběr objektů...
Časté chyby Špatný design pokusu Nenáhodný výběr – nereprezentuje populaci (stratifikovaně náhodný výběr)
Problém malého vzorku: - nevyvážené kategorie - riziko chyby II. druhu - slabá síla testu
Časté chyby Špatný design pokusu Nenáhodný výběr – nereprezentuje populaci Malý nebo nevyvážený vzorek, chyba II. druhu – vhodná je pilotní práce
Růst vlhkosti Růst kompetice Promyšlený experiment s kontrolou a vyváženými vzorky… 2 x 4 = 8 x 2 roky = 16 ! Pseudoreplikace
Časové a prostorové pseudoreplikace nejsou opakováními, lze však s nimi pracovat.. N = 1
Časté chyby Špatný design pokusu Nenáhodný výběr – nereprezentuje populaci; Pseudoreplikace – lze „napravit“ vhodnou statistikou Nevhodná statistika (test) Malý nebo nevyvážený vzorek, chyba II. druhu – vhodná je pilotní práce
Odpověď (závislá prom.) Faktory prostředí (Prediktory) Chybí Přítomny jedna Základní popis souboru Regresní modely (ANOVA, ANCOVA …) více až mnoho Nepřímá gradientová analýza, klastrová analýza Přímá gradientová analýza, diskriminační analýza Typ analýzy …
Odpověď (závislá prom.) Faktory prostředí (Prediktory) Chybí Přítomny Jedna Základní popis souboru Regresní modely (AN(C)OVA, G/LM, GLMIX …) více až mnoho Typ analýzy …
Odpověď (závislá prom.) Faktory prostředí (Prediktory) Chybí Přítomny jedna Základní popis souboru Regresní modely (AN(C)OVA, LM, GLM, GAM …) více až mnoho Typ analýzy …
Odpověď (závislá prom.) Faktory prostředí (Prediktory) Chybí Přítomny jedna Základní popis souboru Regresní modely (AN(C)OVA, G/LM, LME …) více až mnoho Nepřímá gradient. analýza (PCA), klastrová analýza Přímá gradient. anal. (CCA), diskriminační anal. Typ analýzy …
Mám zvládnuto... Populace, náhodný výběr, nezávislá měření Parametry: průměr, medián, variance, SD, SE Stupně volnosti Chyba I. a II. druhu Testování H0 Síla testu Typy rozdělení Hladina významnosti Transformace dat
Analýza frekvencí, kontingenční tabulky, 2 testy Rankování a neparametrické testy Jedno- a vícefaktorová ANOVA, ANCOVA Další užitečné statistiky (1) Korelace a regrese, reziduály Vícenásobná porovnání Vnoření (Nested, Hierarchical design) a interakce Pevné (fixed) a náhodné (random) efekty Obecné a zobecněné ne/lineární modely
Repeated mesurements (Kompletně) znáhodněné bloky Split-plot design Prostorové a časové autokorelace, repeatability … Experimentální design: BACI (Before After Control Impact)... Další užitečné statistiky (2) Latinský čtverec
Zar J.H. 1999: Biostatistical Analysis. 4 th ed. Prentice-Hall, Inc., Upper Saddle River, NJ. 931 pp. Fowler J. & Cohen L. 1995: Practical statistics for field biology. J. Wiley & Sons, Chichester etc. 227 pp. Sokal R.R. & Rohlf F.J. 1995: Biometry: the principles and practice of statistics in biological research. 3 rd ed. Freeman & Co., New York. 887 pp.
Quinn G.P. & Keough M.J. 2002: Experimental desigh and data analysis for biologists. Cambridge Univ. Press, Cambridge. 537 pp. Crawley M.J. 2003: Statistical computing. An introduction to data analysis using S-Plus. J. Wiley & Sons, Chichester etc. 761 pp. Šmilauer P. 2007: Moderní regresní metody. Biologická fakulta JU, České Budějovice. 167 pp. (
Lepš J. & Šmilauer P. 2005: Multivariate analysis of ecological data. Biologická fakulta JU, České Budějovice. 242 pp. Lepš J. & Šmilauer P. 2005: Multivariate analysis of ecological data using CANOCO. Cambridge University Press. 269 pp. Herben T. & Münzbergová Z. 2005: Zpracování geobotanických dat v příkladech I. PřFUK, Praha. 118 pp. Lepš J. & Šmilauer P. 2000: Mnohorozměrná analýza ekologických dat. Biologická fakulta JU, České Budějovice. 102 pp.
Základní popis, regrese Gradientová (mnohorozm.) analýza Klastrová analýza Software Základní popis, regrese vč. GLM Systat, Excel Statistica S-Plus, R, SAS CANOCO Twinspan
Hodnocení (Zpracování) ekologických dat Kurzy na FŽP: Zakládání a hodnocení pokusů Základy statistiky Aplikovaná statistika V. Puš M. Šálek a kol. K. Berchová