Obecný lineární model Analýza kovariance Nelineární modely
Obecný lineární model General linear model ANOVA – jednocestná: Yij = b0 + ai + eij Regresní model: Yj = b0 + b1X1j+b2X2j+ej ANOVA model lze vyjádřit (a spočítat) obdobným způsobem jako lineární regresi Obecný lineární model je společné vyjádření, s vysvětlovanou kvantitativní proměnnou a vysvětlujícími buď kvantitativními nebo faktory (kategoriální)
Příklady obecných lineárních modelů Počet druhů ve společenstvu ~ typ horniny, typ obhospodařování, nadmořská výška Hladina cholesterolu ~ pohlaví, věk, množství zkonzumovaného bůčku Míra heterozygozity ~ ploidie, velikost populace
Obecný lineární model: jeden faktor a jeden kvantitativní prediktor Příklad: jak závisí podíl fixovaného uhlíku, investovaného do reprodukce na množství dostupného fosforu (P) u tří druhů? Model: %biomasy ~ P + druh test proměnných P a druh Model: %biomasy ~ P + druh + P:druh test interakce: závisí míra změny na druhu?
Analýza kovariance (ANCOVA) Nejběžnější případ obecného lineárního modelu Obvykle předpoklad rovnoběžnosti přímek (nezávislosti faktorů a kvantitativních vysvětlujících proměnných) Těžištěm bývá vliv faktorů, kvantitativní proměnné často popisují variabilitu „pozadí“, kterou chci odstranit Faktor a kvanitativní proměnná by měly být nezávislé (jak jen to jde)
Příklady Vliv léku na krysy: mám podezření, že výsledek závisí i na váze krysy Nelze zajistit, aby byly všechny stejně těžké Použiji váhu na začátku pokusu jako kovariátu (covariate) Průměr a variabilita hmotností by měly být ve skupinách podobné Vliv mykorrhizní symbiózy na růst rostliny: výsledná hmotnost (biomasa) závisí i na počáteční Počáteční výšku (nebo počet lístků) použiji jako kovariátu Opět se snažím, aby malé i velké semenáčky byly ve všech skupinách
Vysvětlující proměnná: faktor nebo kvantitativní? V mnoha případech mám na výběr. Studuji vliv živin na biomasu rostlin, tři různé dávky hnojiva (0, 7 a 14 g N / m2) Regrese: biomasa = b0+b1*N+chyba předpoklad lineární závislosti biomasy na N, model spotřebuje jen 1 stupeň volnosti ANOVA: biomasa = společný průměr + efekt dávky + chyba 2 stupně volnosti, nemusí být lineární vztah Pokud vztah lineární, je regresní test silnější
Nelineární regrese Termín nelineární regrese nejednoznačný, alespoň čtyři běžné významy Transformací dosáhnu linearity: S = c.Az Používám polynom vysvětlující proměnné (i více): polynomická regrese (polynomial r.) Odhaduji parametry nelineárního vztahu, který nelze „linearizovat“: růstové křivky apod., non-linear least squares Používám neparametrické regresní modely
Polynomická regrese 1 Libovolně složitou funkce lze nahradit (v omezeném rozsahu hodnot prediktoru) polynomem Obvykle nemá smysl užívat polynomy složitější než kubické (třetí mocnina): kvadratická regrese, kubická regrese Y = b0 + b1X + b2X2 + b3X3 + e Při praktickém použití je rozumné proměnnou X „vycentrovat“ (odečíst průměr) Ortogonální polynomy
Polynomická regrese 2 Užíváme, pokud je vztah nelineární, ale nemáme konkrétní představu, jakou rovnicí tuto závislost popsat Postupný výběr složitosti modelu (stepwise regression) Lze použít i pro dva prediktory, buď představující prostorové souřadnice nebo například dva faktory prostředí
Non-linear least squares Nelineární metoda nejmenších čtverců Máme a priori danou rovnici a obvykle musíme dodat i počáteční odhady parametrů Příklad: saturační křivka rychlosti fotosyntézy, s rostoucí koncentrací CO2 v prostředí rychlost fotosyntézy roste do určité limity Vztah: nelze linearizovat Iterativní postup hledání řešení občas nekonverguje nebo najde sub-optimální řešení
Neparametrické regresní modely Vyhlazovací modely (smoothers) loess smoother Zobecněné aditivní modely (generalized additive models, GAM) Musíme volit složitost fitovaného modelu (stupně volnosti, ne vždy celá čísla) Nemáme k dispozici rovnici, do které bychom mohli dosadit – model je třeba zobrazit