Obecný lineární model Analýza kovariance Nelineární modely

Slides:



Advertisements
Podobné prezentace
Korelace a regrese Karel Zvára 1.
Advertisements

Cvičení 9 – Ekonomická funkce nelineární v parametrech :
Další modely ANOVY.
Monte Carlo permutační testy & Postupný výběr
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Cvičení 6 – 25. října 2010 Heteroskedasticita
Predikce Zobecněná MNČ
Ekonomická funkce nelineární v parametrech Logistická křivka
Cvičení října 2010.
Lineární regresní analýza Úvod od problému
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad.
Analýza variance (Analysis of variance)
Návrh modelů Jan Brůha IREAS. Návrh otázek a modelů Jaký vliv měla podpora z ESF v OP LZZ 1.1 na obrat / zisk a zaměstnanost firem? – Jde o srovnání mezi.
Diskrétní rozdělení a jejich použití
Úvod do regresní analýzy
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Růstové a přírůstové funkce
Matice distancí v mnohorozměrné analýze. Distanční matice – proč se objevují? Vzdálenosti mezi objekty v terénu Vzdálenosti mezi taxony ve fylogenetickém.
Faktory a jejich uspořádání
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Základy ekonometrie Cvičení září 2010.
Korelace a kauzalita
Řízení a supervize v sociálních a zdravotnických organizacích
Data s diskrétním rozdělením
Lineární regrese.
Regrese Aproximace metodou nejmenších čtverců
Obecný lineární model Fitované hodnoty and regresní residuály
Simultánní rovnice Tomáš Cahlík
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Úvod do gradientové analýzy
Lineární regrese.
Praktické využití regresní analýzy Struktura národního hospodářství a znečištění ovzduší v tranzitivních ekonomikách: Případ České republiky Gabriela Jandová.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Závislost dvou kvantitativních proměnných
Další spojitá rozdělení pravděpodobnosti
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Analýza variance (ANOVA).
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Experimentální fyzika I. 2
V. Analýza rozptylu ANOVA.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Korelace.
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Motivační příklad – 1a Vliv rodičů a prostředí na vývoj mláďat Nejstarší mládě v každém hnízdě měřeno ve věku X dní Vysvětlující údaje: počet mláďat, stáří.
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
IV..
Aplikovaná statistika 2.
Základy zpracování geologických dat R. Čopjaková.
Odhady odhady bodové a intervalové odhady
Metody zkoumání závislosti numerických proměnných
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Induktivní statistika
Proč statistika ? Dva důvody Popis Inference
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
4. Metoda nejmenších čtverců
Pokročilé neparametrické metody Validační techniky
Lineární regrese.
Princip max. věrohodnosti - odhad parametrů
Transkript prezentace:

Obecný lineární model Analýza kovariance Nelineární modely

Obecný lineární model General linear model ANOVA – jednocestná: Yij = b0 + ai + eij Regresní model: Yj = b0 + b1X1j+b2X2j+ej ANOVA model lze vyjádřit (a spočítat) obdobným způsobem jako lineární regresi Obecný lineární model je společné vyjádření, s vysvětlovanou kvantitativní proměnnou a vysvětlujícími buď kvantitativními nebo faktory (kategoriální)

Příklady obecných lineárních modelů Počet druhů ve společenstvu ~ typ horniny, typ obhospodařování, nadmořská výška Hladina cholesterolu ~ pohlaví, věk, množství zkonzumovaného bůčku Míra heterozygozity ~ ploidie, velikost populace

Obecný lineární model: jeden faktor a jeden kvantitativní prediktor Příklad: jak závisí podíl fixovaného uhlíku, investovaného do reprodukce na množství dostupného fosforu (P) u tří druhů? Model: %biomasy ~ P + druh test proměnných P a druh Model: %biomasy ~ P + druh + P:druh test interakce: závisí míra změny na druhu?

Analýza kovariance (ANCOVA) Nejběžnější případ obecného lineárního modelu Obvykle předpoklad rovnoběžnosti přímek (nezávislosti faktorů a kvantitativních vysvětlujících proměnných) Těžištěm bývá vliv faktorů, kvantitativní proměnné často popisují variabilitu „pozadí“, kterou chci odstranit Faktor a kvanitativní proměnná by měly být nezávislé (jak jen to jde)

Příklady Vliv léku na krysy: mám podezření, že výsledek závisí i na váze krysy Nelze zajistit, aby byly všechny stejně těžké Použiji váhu na začátku pokusu jako kovariátu (covariate) Průměr a variabilita hmotností by měly být ve skupinách podobné Vliv mykorrhizní symbiózy na růst rostliny: výsledná hmotnost (biomasa) závisí i na počáteční Počáteční výšku (nebo počet lístků) použiji jako kovariátu Opět se snažím, aby malé i velké semenáčky byly ve všech skupinách

Vysvětlující proměnná: faktor nebo kvantitativní? V mnoha případech mám na výběr. Studuji vliv živin na biomasu rostlin, tři různé dávky hnojiva (0, 7 a 14 g N / m2) Regrese: biomasa = b0+b1*N+chyba předpoklad lineární závislosti biomasy na N, model spotřebuje jen 1 stupeň volnosti ANOVA: biomasa = společný průměr + efekt dávky + chyba 2 stupně volnosti, nemusí být lineární vztah Pokud vztah lineární, je regresní test silnější

Nelineární regrese Termín nelineární regrese nejednoznačný, alespoň čtyři běžné významy Transformací dosáhnu linearity: S = c.Az Používám polynom vysvětlující proměnné (i více): polynomická regrese (polynomial r.) Odhaduji parametry nelineárního vztahu, který nelze „linearizovat“: růstové křivky apod., non-linear least squares Používám neparametrické regresní modely

Polynomická regrese 1 Libovolně složitou funkce lze nahradit (v omezeném rozsahu hodnot prediktoru) polynomem Obvykle nemá smysl užívat polynomy složitější než kubické (třetí mocnina): kvadratická regrese, kubická regrese Y = b0 + b1X + b2X2 + b3X3 + e Při praktickém použití je rozumné proměnnou X „vycentrovat“ (odečíst průměr) Ortogonální polynomy

Polynomická regrese 2 Užíváme, pokud je vztah nelineární, ale nemáme konkrétní představu, jakou rovnicí tuto závislost popsat Postupný výběr složitosti modelu (stepwise regression) Lze použít i pro dva prediktory, buď představující prostorové souřadnice nebo například dva faktory prostředí

Non-linear least squares Nelineární metoda nejmenších čtverců Máme a priori danou rovnici a obvykle musíme dodat i počáteční odhady parametrů Příklad: saturační křivka rychlosti fotosyntézy, s rostoucí koncentrací CO2 v prostředí rychlost fotosyntézy roste do určité limity Vztah: nelze linearizovat Iterativní postup hledání řešení občas nekonverguje nebo najde sub-optimální řešení

Neparametrické regresní modely Vyhlazovací modely (smoothers) loess smoother Zobecněné aditivní modely (generalized additive models, GAM) Musíme volit složitost fitovaného modelu (stupně volnosti, ne vždy celá čísla) Nemáme k dispozici rovnici, do které bychom mohli dosadit – model je třeba zobrazit