Monte Carlo permutační testy & Postupný výběr

Slides:



Advertisements
Podobné prezentace
ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Advertisements

Testování parametrických hypotéz
Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)
Faktory a jejich uspořádání
Další modely ANOVY.
Testování statistických hypotéz
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Cvičení 6 – 25. října 2010 Heteroskedasticita
Cvičení října 2010.
4EK211 Základy ekonometrie Autokorelace Cvičení /
4EK211 Základy ekonometrie Heteroskedasticita Cvičení – 8
Lineární regresní analýza Úvod od problému
ZÁKLADY EKONOMETRIE 7. cvičení Heteroskedasticita
ZÁKLADY EKONOMETRIE 4. cvičení PREDIKCE MULTIKOLINEARITA
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
Analýza variance (Analysis of variance)
Statistika II Michal Jurajda.
Návrh modelů Jan Brůha IREAS. Návrh otázek a modelů Jaký vliv měla podpora z ESF v OP LZZ 1.1 na obrat / zisk a zaměstnanost firem? – Jde o srovnání mezi.
Úvod do regresní analýzy
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Matice distancí v mnohorozměrné analýze. Distanční matice – proč se objevují? Vzdálenosti mezi objekty v terénu Vzdálenosti mezi taxony ve fylogenetickém.
Faktory a jejich uspořádání
Obecný lineární model Analýza kovariance Nelineární modely
Základy ekonometrie Cvičení září 2010.
Základy ekonometrie Cvičení října 2010.
ANOVA (s použitím materiálů Petra Šmilauera)
Lineární regrese.
Obecný lineární model Fitované hodnoty and regresní residuály
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Inženýrská geodézie 2009 Ing. Rudolf Urban
Účel procedury: První a závazný krok jakékoli seriozní komparativní studie. Umožňuje vyloučit možnost, že distribuce studovaného znaku (vlastnosti, vzorce.
Úvod do gradientové analýzy
Lineární regrese.
Lineární regresní analýza
Závislost dvou kvantitativních proměnných
Test dobré shody Fisherův přesný test McNemar test
Analýza variance (ANOVA).
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Princip maximální entropie
ZÁKLADY TEORIE PRAVDĚPODOBNOSTI
Pohled z ptačí perspektivy
V. Analýza rozptylu ANOVA.
Přesnost a spolehlivost v účelových sítích Bc. Jindřich Poledňák.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
8. Kontingenční tabulky a χ2 test
Kvantitativní metody výzkumu v praxi
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Korelace.
PSY717 – statistická analýza dat
Gradientová analýza II
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Motivační příklad – 1a Vliv rodičů a prostředí na vývoj mláďat Nejstarší mládě v každém hnízdě měřeno ve věku X dní Vysvětlující údaje: počet mláďat, stáří.
METODY STŘEDNĚDOBÉHO PROGNÓZOVÁNÍ SURO jaro 2010.
Jiří Šafr jiri.safr(zavináč)seznam.cz
IV..
Aplikovaná statistika 2.
Bc. Jaromír Šetek VNÍMÁNÍ ZEMĚ PŮVODU ZNAČKY A ZEMĚ PŮVODU PRODUKTU VEDOUCÍ PRÁCE: Ing. Pavel Štrach, Ph.D. et Ph.D.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Úvod do praktické fyziky
Proč statistika ? Dva důvody Popis Inference
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
PSY252 Statistická analýza dat v psychologii II Seminář 9
Parciální korelace Regresní analýza
příklad: hody hrací kostkou
Pokročilé neparametrické metody Validační techniky
Lineární regrese.
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Transkript prezentace:

Monte Carlo permutační testy & Postupný výběr

Lineární regrese: model

Lineární regrese: kvalita Celková suma čtverců (TSS): Modelová suma čtverců (MSS): Residuální suma čtverců (RSS):

Je ten vliv reálný? Testování v lineární regresi: F statistika Omezená ordinace: F-like statistic MSS – suma kanonických charakteristických čísel; RSS – suma neomezených charakteristických čísel Jakou distribuci má tato statistika v nulovém modelu? Monte Carlo permutační test

Test nulové hypotézy Obdobné jednocestné ANOVA nebo jednoduché regresi Máme-li jen jeden prediktor (jednu skupinu prediktorů): Obdobné jednocestné ANOVA nebo jednoduché regresi Permutujeme prediktor(y) ve vztahu k druhovým datům V každé permutaci vypočteme F statistiku vyjadřující “kvalitu” výsledné ordinace: vytváříme popis distribuce hodnot F

Permutace odvozené z modelu Máme další proměnné ovlivňující vysvětlující proměnné: Y = b1*X + b2*Z + e H0: b1 = 0 X: vysvětlující proměnná(-é); Z: kovariáta(-y) nafitujeme Y = b2*Z+e, odhadneme e jako permutujeme e => e* a vypočteme nová data jako pro každou permutaci vyhodnotíme kvalitu (F-statistika)

Permutace odvozené z designu I Permutace odvozené z modelu často fungují dobře, vedou k asymptoticky přesným odhadům chyby prvního druhu Ale pokud je to možné a praktické, používáme exaktní testy s permutací odvozenou z designu Příklad dvoucestné (dvoufaktorové) ANOVY: Y = m + Ai + Bj + e Efekt faktoru A testujeme náhodnými permutacemi uvnitř hladin faktoru B, a naopak.

Permutace odvozené z designu II Při testu interakce (A x B) musíme obvykle provádět permutace odvozené z modelu Hierarchické uspořádání, včetně split-plot: permutace odvozené z modelu nefungují správně pro vnější (whole-plot) faktory; volba permutovatelných jednotek musí být založena na správném jmenovateli F statistiky v ANOVA Ještě složitější u opakovaných měření (závislost jednotek v čase)

Permutace odvozené z designu III

Volba správných permutací (podle M. Anderson 2001) například MSA/MSblock Je MS ve jmenovateli F statistiky residuální mean square? Krok 1: Identifikuj permutované jednotky NE ANO Permutovatelné jednotky jsou kategorie faktoru ze jmenovatele MS Permutovatelnými jednotkami jsou pozorování Krok 2: Zohledni další členy modelu Jsou v modelu další členy, nezohledněné volbou permutovatelných jednotek? ANO NE Jako úroveň přesnosti testu potřebujeme? Netřeba jiné faktory zohledňovat asymptoticky přesný přesný Permutace reziduálů redukovaného modelu: permutovatelné jednotky Permutace omez uvnitř kategorií dalších faktorů Neomezené permutace permutovatelných jednotek (přesný test) ANO (asymptoticky přesné, někdy vyšší síla testu) Omezené permutace permutovatelných jednotek Malý počet možných permutací? NEBO Exaktní test nelze provést (např. test interakce)? NE (přesný test, ale někdy s nižší sílou)

Postupný výběr (forward selection) Obdobně jako v regresi: poznání relativního významu jednotlivých prediktorů, vytvoření "minimálního adekvátního modelu" CANOCO: automatic forward selection – nezávislé (marginal) a podmíněné (conditional) efekty CANOCO: manual forward selection