Odhad genetických parametrů
mechanismus genetické kontroly znaku Cíle: mechanismus genetické kontroly znaku odhad plemenných hodnot optimalizace plemenářských programů
primární genetické parametry – biometrická analýza genetický rozptyl prostřeďový rozptyl kovariance var(g) var(e) cov(a,e) sekundární genetické parametry – konstrukce z primárních dědivost opakovatelnost korelace koeficienty h2, w rG, rE, rP
Genetická podobnost = aditivní genetická vazba (A) mezi jedinci X, Y = podíl genů, které mají jedinci X, Y společné rodiče – potomci: a = 0,5 polosourozenci : a = 0,25
Podobnost příbuzných jedinců proč příbuzní vypadají (produkují) podobně? jak vysokou podobnost očekáváme?
proč jsou podobní měříme stejnou vlastnost u 2 příbuzných jedinců: Px = Ax + Ex Py = Ay + Ey korelace mezi příbuznými je výsledkem působení podobného genotypu nebo podobného prostředí
jak vysoká je podobnost? měříme stejnou vlastnost u 2 příbuzných jedinců: Px = Ax + Ex Py = Ay + Ey rPHx, PHy korelace plemenných hodnot pro stejný znak u 2 jedinců = genetická vazba * genetická variance rXYVA
Odhad podle skupin příbuzných jedinců typ podobnosti žádná střední úplná 1 2 3 vysoká býk potomci variance mezi uvnitř skupin
žádná střední úplná 1 2 3 vysoká podobnost mezi uvnitř nízká dědivost střední dědivost vysoká dědivost
pro vlastní odhad: potřebujeme mít představu o mezi a uvnitř skupinové proměnlivosti var(celková) = var(mezi) + var(uvnitř) = cov(uvnitř) z toho plyne: vysoká proměnlivost mezi rodinami (rodiny jsou odlišné) odpovídá vysoké kovarianci uvnitř rodin (příslušníci rodiny jsou si podobní)
odhad na základě skupin polosourozenců variance mezi polosourozenci = variance mezi otci = cov(uvnitř) polosourozenců sdílejí ¼ genů = ¼ VA variance uvnitř polosourozenců = zbytek celkové variance VP - ¼ VA = ¾ VA + VD + VE h2 = VA / VP = 4* variance mezi otci / VP
více otců = vyšší přesnost odhadu proměnlivosti mezi rodinami Design více otců = vyšší přesnost odhadu proměnlivosti mezi rodinami více potomků = vyšší přesnost odhadu proměnlivosti uvnitř rodin
více pozorování = přesnější odhad Poznámka: skutečný rozptyl mezi průměry rodin se MŮŽE LIŠIT od odhadovaného rozptylu MS; záleží na počtu pozorování více pozorování = přesnější odhad
odhad na základě skupin sourozenců podobný princip, ale komplikovanější odhad než v předchozím případě praví sourozenci sdílejí navíc společný vliv mateřského prostředí VM; vliv genetické dominance VD
efekty je těžké oddělit = nadhodnocení heritability variance mezi skupinami = otcovská variance kovariance mezi pravými sourozenci + M + D ½ VA + VEC + ¼ VD variance uvnitř skupin sourozenců zbytek variance Vp – (½ VA + VEC + ¼ VD) = (½ VA + VE + ¾ VD) efekty je těžké oddělit = nadhodnocení heritability
Metody odhadu ANOVA – balancovaná data; ANOVA – nebalancovaná data; - Hendersonova metoda věrohodnostní metody - maximální věrohodnost - restringovaná maximální věrohodnost (REML)
SS df MS EMS průměr 400 1 mezi 9 σe2 + nσa2 uvnitř 2 0,5 σe2 celkem ANOVA ve vybalancovaných datech: model: yij = μ + ai + eij Tabulka analýzy variance: SS df MS EMS průměr 400 1 mezi 9 σe2 + nσa2 uvnitř 2 0,5 σe2 celkem 410 4
ANOVA v nevybalancovaných datech: vážený počet pozorování pro n0σa2 maticový zápis pro výpočet SS a EMS; standardní součást některých statistických balíků; Hendersonova III. metoda;
Věrohodnostní metody (likelihood) každé pozorování má pravděpodobnostní hustotu charakterizovanou: distribuční funkcí; očekávanou hodnotou (průměrem); rozptylem;
odhad = otočení vztahu: normální rozdělení: pravděpodobnost pozorování y daná hodnotou parametrů μ, σ2 odhad = otočení vztahu: hledáme takové hodnoty parametrů μ, σ2, které po dosazení do rovnice (funkce) s maximální věrohodností vyústí ve sledované hodnoty y
hledáme věrohodnostní parametry b, V pro dané údaje X, y spojité funkce: hodnoty y jsou ve vazbě vektor očekávaných hodnot E(y) = Xb a var(y) = V tvar věrohodnostní funkce: součet čtverců SS očekávání hledáme věrohodnostní parametry b, V pro dané údaje X, y
Restringovaná maximální věrohodnost: korekce dat o pevné efekty; nalezení maximální věrohodnosti; iterativní procedura; je nutné vložit „startovní“ hodnoty hledaných parametrů;
Příklad REML algoritmu: 1. řešíme rovnice smíšeného modelu MME s využitím apriorních hodnot složek rozptylu: 2. vyjádříme složky rozptylu z MME: 3. použijeme nové λ = σe2 / σa2 a iterujeme bod 1, 2
výhody REML je přesnější; počítá s plnými rovnicemi smíšeného modelu, může zohlednit i informace z A; jako BLUP je možné zohlednit selekci; je možné aplikovat na složitější modelové rovnice, tj. maternální efekty, multitrait apod. flexibilita; přesnost (SE), nevychýlenost