Odhad genetických parametrů

Slides:



Advertisements
Podobné prezentace
Statistické metody pro testování asociace genů a nemocí
Advertisements

Teorie selekce.
Testování statistických hypotéz
Lineární model posteriorní hustota pravděpodobnosti lineární model:
SELEKCE METODY PLEMENTBY
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
GENETIKA POPULACÍ KVANTITATIVNÍCH ZNAKŮ 8
GENETIKA POPULACÍ 9 KVANTITATIVNÍCH ZNAKŮ
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Plemenářská práce v chovu prasat
Cvičení 6 – 25. října 2010 Heteroskedasticita
Téma 3 ODM, analýza prutové soustavy, řešení nosníků
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
Analýza variance (Analysis of variance)
3. PRINCIP MAXIMÁLNÍ VĚROHODNOSTI
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Markery asistovaná selekce
Pravděpodobnost a statistika opakování základních pojmů
Základy ekonometrie Cvičení září 2010.
Teoretické základy šlechtění lesních dřevin Milan Lstibůrek 2005.
Jak správně interpretovat ukazatele způsobilosti a výkonnosti
Odhady parametrů základního souboru
Základy ekonometrie Cvičení 3 4. října 2010.
Nechť (, , P) je pravděpodobnostní prostor:
Systém rizikové analýzy při statickém návrhu podzemního díla Jan Pruška.
N_OFI_2 Přednáška Počet pravděpodobnosti
Populační genetika je teoretickým základem šlechtění hospodářských zvířat; umožňuje sledování frekvencí genů a genotypů a tím i cílevědomé řízení změn.
Markery asistovaná selekce - MAS
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Princip maximální entropie
GENETIKA POPULACÍ KVANTITATIVNÍCH ZNAKŮ
V. Analýza rozptylu ANOVA.
Princip maximální entropie
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Metrologie   Přednáška č. 5 Nejistoty měření.
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Náhodný vektor Litschmannová, 2007.
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
Hustota pravděpodobnosti – případ dvou proměnných
Statistické odhady (inference) Výběr Nepotřebujeme sníst celého vola jenom proto, abychom poznali, že to jde ztuha. Samuel Johnson (anglický básník a.
Aritmetický průměr - střední hodnota
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
7 GENETIKA POPULACÍ KVANTITATIVNÍCH ZNAKŮ
2014 Výukový materiál GE Tvůrce: Mgr. Šárka Vopěnková Projekt: S anglickým jazykem do dalších předmětů Registrační číslo: CZ.1.07/1.1.36/
Genetika kvantitativních znaků charakteristika kvantitativních znaků proměnlivost a její složky základní genetické parametry.
EMM91 Ekonomicko-matematické metody č. 9 Prof. RNDr. Jaroslav Ramík, CSc.
Genetické parametry Heritabilita, korelace. primární GP genetický rozptyl prostřeďový rozptyl kovariance sekundární GP heritabilita opakovatelnost genetické.
Selekční postupy ve šlechtění rostlin I. Selekce = výběr Charles Darwin ( ) Darwinova evoluční teorie počítá s výběrem a rozmnožováním lépe.
Šlechtění hospodářských zvířat Doc. Ing. Karel Mach, CSc.
Základy zpracování geologických dat R. Čopjaková.
Dvojrozměrné (vícerozměrné) statistické soubory Karel Mach.
Základy statistické indukce
Induktivní statistika
Opakovatelnost (koeficient opakovatelnosti) Korelace genetická, prostřeďová a fenotypová Karel Mach.
Neparametrické testy parametrické a neparametrické testy
Odhady parametrů základního souboru
GENETIKA POPULACÍ KVANTITATIVNÍCH ZNAKŮ 8
Základy zpracování geologických dat Rozdělení pravděpodobnosti
ANALÝZA A KLASIFIKACE DAT
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
PSY252 Statistická analýza dat v psychologii II Seminář 9
ANALÝZA A KLASIFIKACE DAT
7. Kontingenční tabulky a χ2 test
Náhodné výběry a jejich zpracování
Princip max. věrohodnosti - odhad parametrů
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
Transkript prezentace:

Odhad genetických parametrů

mechanismus genetické kontroly znaku Cíle: mechanismus genetické kontroly znaku odhad plemenných hodnot optimalizace plemenářských programů

primární genetické parametry – biometrická analýza genetický rozptyl prostřeďový rozptyl kovariance var(g) var(e) cov(a,e) sekundární genetické parametry – konstrukce z primárních dědivost opakovatelnost korelace koeficienty h2, w rG, rE, rP

Genetická podobnost = aditivní genetická vazba (A) mezi jedinci X, Y = podíl genů, které mají jedinci X, Y společné rodiče – potomci: a = 0,5 polosourozenci : a = 0,25

Podobnost příbuzných jedinců proč příbuzní vypadají (produkují) podobně? jak vysokou podobnost očekáváme?

proč jsou podobní měříme stejnou vlastnost u 2 příbuzných jedinců: Px = Ax + Ex Py = Ay + Ey korelace mezi příbuznými je výsledkem působení podobného genotypu nebo podobného prostředí

jak vysoká je podobnost? měříme stejnou vlastnost u 2 příbuzných jedinců: Px = Ax + Ex Py = Ay + Ey rPHx, PHy korelace plemenných hodnot pro stejný znak u 2 jedinců = genetická vazba * genetická variance rXYVA

Odhad podle skupin příbuzných jedinců typ podobnosti žádná střední úplná 1 2 3 vysoká býk potomci variance mezi uvnitř skupin

žádná střední úplná 1 2 3 vysoká podobnost mezi uvnitř nízká dědivost střední dědivost vysoká dědivost

pro vlastní odhad: potřebujeme mít představu o mezi a uvnitř skupinové proměnlivosti var(celková) = var(mezi) + var(uvnitř) = cov(uvnitř) z toho plyne: vysoká proměnlivost mezi rodinami (rodiny jsou odlišné) odpovídá vysoké kovarianci uvnitř rodin (příslušníci rodiny jsou si podobní)

odhad na základě skupin polosourozenců variance mezi polosourozenci = variance mezi otci = cov(uvnitř) polosourozenců sdílejí ¼ genů = ¼ VA variance uvnitř polosourozenců = zbytek celkové variance VP - ¼ VA = ¾ VA + VD + VE h2 = VA / VP = 4* variance mezi otci / VP

více otců = vyšší přesnost odhadu proměnlivosti mezi rodinami Design více otců = vyšší přesnost odhadu proměnlivosti mezi rodinami více potomků = vyšší přesnost odhadu proměnlivosti uvnitř rodin

více pozorování = přesnější odhad Poznámka: skutečný rozptyl mezi průměry rodin se MŮŽE LIŠIT od odhadovaného rozptylu MS; záleží na počtu pozorování více pozorování = přesnější odhad

odhad na základě skupin sourozenců podobný princip, ale komplikovanější odhad než v předchozím případě praví sourozenci sdílejí navíc společný vliv mateřského prostředí VM; vliv genetické dominance VD

efekty je těžké oddělit = nadhodnocení heritability variance mezi skupinami = otcovská variance kovariance mezi pravými sourozenci + M + D ½ VA + VEC + ¼ VD variance uvnitř skupin sourozenců zbytek variance Vp – (½ VA + VEC + ¼ VD) = (½ VA + VE + ¾ VD) efekty je těžké oddělit = nadhodnocení heritability

Metody odhadu ANOVA – balancovaná data; ANOVA – nebalancovaná data; - Hendersonova metoda věrohodnostní metody - maximální věrohodnost - restringovaná maximální věrohodnost (REML)

SS df MS EMS průměr 400 1 mezi 9 σe2 + nσa2 uvnitř 2 0,5 σe2 celkem ANOVA ve vybalancovaných datech: model: yij = μ + ai + eij Tabulka analýzy variance: SS df MS EMS průměr 400 1 mezi 9 σe2 + nσa2 uvnitř 2 0,5 σe2 celkem 410 4

ANOVA v nevybalancovaných datech: vážený počet pozorování pro n0σa2 maticový zápis pro výpočet SS a EMS; standardní součást některých statistických balíků; Hendersonova III. metoda;

Věrohodnostní metody (likelihood) každé pozorování má pravděpodobnostní hustotu charakterizovanou: distribuční funkcí; očekávanou hodnotou (průměrem); rozptylem;

odhad = otočení vztahu: normální rozdělení: pravděpodobnost pozorování y daná hodnotou parametrů μ, σ2 odhad = otočení vztahu: hledáme takové hodnoty parametrů μ, σ2, které po dosazení do rovnice (funkce) s maximální věrohodností vyústí ve sledované hodnoty y

hledáme věrohodnostní parametry b, V pro dané údaje X, y spojité funkce: hodnoty y jsou ve vazbě vektor očekávaných hodnot E(y) = Xb a var(y) = V tvar věrohodnostní funkce: součet čtverců SS očekávání hledáme věrohodnostní parametry b, V pro dané údaje X, y

Restringovaná maximální věrohodnost: korekce dat o pevné efekty; nalezení maximální věrohodnosti; iterativní procedura; je nutné vložit „startovní“ hodnoty hledaných parametrů;

Příklad REML algoritmu: 1. řešíme rovnice smíšeného modelu MME s využitím apriorních hodnot složek rozptylu: 2. vyjádříme složky rozptylu z MME: 3. použijeme nové λ = σe2 / σa2 a iterujeme bod 1, 2

výhody REML je přesnější; počítá s plnými rovnicemi smíšeného modelu, může zohlednit i informace z A; jako BLUP je možné zohlednit selekci; je možné aplikovat na složitější modelové rovnice, tj. maternální efekty, multitrait apod. flexibilita; přesnost (SE), nevychýlenost