Monte Carlo permutační testy & Postupný výběr
Lineární regrese: model
Lineární regrese: kvalita Celková suma čtverců (TSS): Modelová suma čtverců (MSS): Residuální suma čtverců (RSS):
Je ten vliv reálný? Testování v lineární regresi: F statistika Omezená ordinace: F-like statistic MSS – suma kanonických charakteristických čísel; RSS – suma neomezených charakteristických čísel Jakou distribuci má tato statistika v nulovém modelu? Monte Carlo permutační test
Test nulové hypotézy Obdobné jednocestné ANOVA nebo jednoduché regresi Máme-li jen jeden prediktor (jednu skupinu prediktorů): Obdobné jednocestné ANOVA nebo jednoduché regresi Permutujeme prediktor(y) ve vztahu k druhovým datům V každé permutaci vypočteme F statistiku vyjadřující “kvalitu” výsledné ordinace: vytváříme popis distribuce hodnot F
Permutace odvozené z modelu Máme další proměnné ovlivňující vysvětlující proměnné: Y = b1*X + b2*Z + e H0: b1 = 0 X: vysvětlující proměnná(-é); Z: kovariáta(-y) nafitujeme Y = b2*Z+e, odhadneme e jako permutujeme e => e* a vypočteme nová data jako pro každou permutaci vyhodnotíme kvalitu (F-statistika)
Permutace odvozené z designu I Permutace odvozené z modelu často fungují dobře, vedou k asymptoticky přesným odhadům chyby prvního druhu Ale pokud je to možné a praktické, používáme exaktní testy s permutací odvozenou z designu Příklad dvoucestné (dvoufaktorové) ANOVY: Y = m + Ai + Bj + e Efekt faktoru A testujeme náhodnými permutacemi uvnitř hladin faktoru B, a naopak.
Permutace odvozené z designu II Při testu interakce (A x B) musíme obvykle provádět permutace odvozené z modelu Hierarchické uspořádání, včetně split-plot: permutace odvozené z modelu nefungují správně pro vnější (whole-plot) faktory; volba permutovatelných jednotek musí být založena na správném jmenovateli F statistiky v ANOVA Ještě složitější u opakovaných měření (závislost jednotek v čase)
Permutace odvozené z designu III
Volba správných permutací (podle M. Anderson 2001) například MSA/MSblock Je MS ve jmenovateli F statistiky residuální mean square? Krok 1: Identifikuj permutované jednotky NE ANO Permutovatelné jednotky jsou kategorie faktoru ze jmenovatele MS Permutovatelnými jednotkami jsou pozorování Krok 2: Zohledni další členy modelu Jsou v modelu další členy, nezohledněné volbou permutovatelných jednotek? ANO NE Jako úroveň přesnosti testu potřebujeme? Netřeba jiné faktory zohledňovat asymptoticky přesný přesný Permutace reziduálů redukovaného modelu: permutovatelné jednotky Permutace omez uvnitř kategorií dalších faktorů Neomezené permutace permutovatelných jednotek (přesný test) ANO (asymptoticky přesné, někdy vyšší síla testu) Omezené permutace permutovatelných jednotek Malý počet možných permutací? NEBO Exaktní test nelze provést (např. test interakce)? NE (přesný test, ale někdy s nižší sílou)
Postupný výběr (forward selection) Obdobně jako v regresi: poznání relativního významu jednotlivých prediktorů, vytvoření "minimálního adekvátního modelu" CANOCO: automatic forward selection – nezávislé (marginal) a podmíněné (conditional) efekty CANOCO: manual forward selection