Biologické základy mapování lokusů pro kvantitativní znaky (QTL) Stanislav ČEPICA Ústav živočišné fyziologie a genetiky AV ČR, v.v.i., Liběchov 

Slides:



Advertisements
Podobné prezentace
Statistické metody pro testování asociace genů a nemocí
Advertisements

Teorie selekce.
SELEKCE METODY PLEMENTBY
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
EDA pro časové řady.
Základní genetické pojmy – AZ kvíz
Polymorfismy DNA a jejich využití ve forenzní genetice
Plemenářská práce v chovu prasat
1 2 FUNKČNÍ VARIANTA GENU ANXA11 SNIŽUJE RIZIKO ONEMOCNĚNÍ SARKOIDÓZOU: POTVRZENÍ VÝSLEDKŮ CELOGENOMOVÉ ASOCIAČNÍ STUDIE. Sťahelová A. 1, Mrázek F. 1,
POPULAČNÍ GENETIKA 6 faktory narušující rovnováhu populací
Dědičnost ukazatelů fyzické zdatnosti
Biologická diverzita a Indexy biodiverzity
Třídění umělé selekce podle způsobů provádění;
Základy genetiky.
Markery asistovaná selekce
Statistika Vypracoval: Mgr. Lukáš Bičík
Stránky o genetice Testy z genetiky
Genetika populací, rodokmen
Krmná dávka - jen kukuřice Veškerá kukuřice jen GMO Hypotetický příklad: brojler.
Teoretické základy šlechtění lesních dřevin Milan Lstibůrek 2005.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Dědičnost kvantitativních znaků
Vypracovala: Bc. SLEZÁKOVÁ Gabriela Predmet: HE18 Diplomový seminár
Využití v systematické biologii
1 Škola:Chomutovské soukromé gymnázium Číslo projektu:CZ.1.07/1.5.00/ Název projektu:Moderní škola Název materiálu:VY_32_INOVACE_BIOLOGIE 2_20 Tematická.
ONEMOCNĚNÍ Z HLEDISKA GENETIKY
Populační genetika je teoretickým základem šlechtění hospodářských zvířat; umožňuje sledování frekvencí genů a genotypů a tím i cílevědomé řízení změn.
Projekt HUGO – milníky - I
Genetická diverzita hospodářských zvířat
Markery asistovaná selekce - MAS
Lineární regresní analýza
Genetická variabilita populací  Pacient je obrazem rodiny a následně populace, ke které patří  Distribuci genů v populaci, a to jak jsou četnosti genů.
Populační genetika.
Genomika hospodářských zvířat
Charakteristiky variability
GENETICKÁ A FENOTYPOVÁ
 VZNIK GENETICKÉ PROMĚNLIVOSTI = nejdůležitější mikroevoluční
 Zkoumáním fyzikálních objektů (např. polí, těles) zjišťujeme že:  zkoumané objekty mají dané vlastnosti,  nacházejí se v určitých stavech,  na nich.
NÁHODNÉ PROCESY V POPULACÍCH NÁHODNÉ PROCESY V POPULACÍCH Náhodný výběr gamet z genofondu:
Polymorfismus lidské DNA.
PSY717 – statistická analýza dat
Základy pedagogické metodologie
HW model: jedna zcela izolovaná populace  populace často rozděleny do subpopulací genetická výměna mezi lokálními populacemi = tok genů (gene flow) A.
Mendelistická genetika
2014 Výukový materiál GE Tvůrce: Mgr. Šárka Vopěnková Projekt: S anglickým jazykem do dalších předmětů Registrační číslo: CZ.1.07/1.1.36/
2014 Výukový materiál GE Tvůrce: Mgr. Šárka Vopěnková Projekt: S anglickým jazykem do dalších předmětů Registrační číslo: CZ.1.07/1.1.36/
METODY STŘEDNĚDOBÉHO PROGNÓZOVÁNÍ SURO jaro 2010.
Praktikum z genetiky rostlin JS 2014 Genetická analýza a genetické markery Genetická analýza a identifikace počtu genů odolnosti k padlí u ječmene. Určení.
Praktikum z genetiky rostlin JS Genetické mapování mutace lycopodioformis Arabidopsis thaliana Genetické mapování genu odolnosti k padlí.
2014 Výukový materiál GE Tvůrce: Mgr. Šárka Vopěnková Projekt: S anglickým jazykem do dalších předmětů Registrační číslo: CZ.1.07/1.1.36/
EU peníze středním školám Název vzdělávacího materiálu: Vazba genů – teoretický základ Číslo vzdělávacího materiálu: ICT10/7 Šablona: III/2 Inovace a zkvalitnění.
Název školy Gymnázium, střední odborná škola, střední odborné učiliště a vyšší odborná škola, Hořice Číslo projektu CZ.1.07/1.5.00/ Název materiálu.
Genetika populací Doc. Ing. Karel Mach, Csc.. Genetika populací Populace = každá větší skupina organismů (rostlin, zvířat,…) stejného původu (rozšířená.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Selekční postupy ve šlechtění rostlin I. Selekce = výběr Charles Darwin ( ) Darwinova evoluční teorie počítá s výběrem a rozmnožováním lépe.
Šlechtění hospodářských zvířat Doc. Ing. Karel Mach, CSc.
EU peníze středním školám Název vzdělávacího materiálu: Genetika populací – teoretický základ Číslo vzdělávacího materiálu: ICT10 /13 Šablona: III/2 Inovace.
Projekt HAPMAP Popis haplotypů
Nepřímá DNA diagnostika
NÁZEV ŠKOLY: ČÍSLO PROJEKTU: NÁZEV MATERIÁLU: TÉMA SADY: ROČNÍK:
Opakovatelnost (koeficient opakovatelnosti) Korelace genetická, prostřeďová a fenotypová Karel Mach.
VY_32_INOVACE_19_28_Genetika
GENETICKÁ A FENOTYPOVÁ
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Neparametrické testy pro porovnání polohy
Praktikum z genetiky rostlin
Induktivní statistika
Základy statistiky.
Transkript prezentace:

Biologické základy mapování lokusů pro kvantitativní znaky (QTL) Stanislav ČEPICA Ústav živočišné fyziologie a genetiky AV ČR, v.v.i., Liběchov 

Mapování QTL pomocí vazbové analýzy Úvod Genomika hospodářských zvířat a její cíl Důvody studia genomů hospodářských zvířat Lokusy kvantitativních znaků - OTL Mapování QTL pomocí vazbové analýzy Populace pro vazbové mapování Genetické markery vhodné pro vazbové mapování Genetické mapy Genetická vazba – LOD, mapovací funkce Princip mapování QTL u skotu – metoda vnuček Princip mapování QTL u prasat - třígenerační F2 rodiny Mapování QTL na základě vazbové nerovnováhy (LD) Co je to LD a jak se měří Faktory ovlivňující velikost a rozsah LD v populaci Detekce QTL pomocí studia kandidátních genů (kritéria výběru, standard) Celogenomová asociační analýza (SNP mikročipy, podmínky ovlivňující schopnost detekce QTL – velikost populace, struktura populace, FDR Genomická selekce Rozdíl mezi GWAS a GS a „výhody“ GS oproti GWAS Referenční populace Používané matematické přístupy Faktory ovlivňující přesnost GS Výhody GS oproti klasické selekci Stav GS u jednotlivých druhů a kategorií zvířat Závěr

Vztah mezi markerem a ETL

Cytogenetická mapa SSC6 Tab. 5. Některé navržené modifikace složek mléka

Homologní úseky mezi prasečím chromozómem 6 a lidskými chromozómy

Mikrosatelity

SNP detekováno pomocí PCR-RFLP

Genetická vazba

LOD score

LOD score

Mapovací funkce

Rozdíly v délce vazbových map u samců a samic

Parciální genetická mapa

Mapování QTL u skotu (metoda vnuček)

Princip mapování QTL u skotu

Hohenheim F2 families x Structure and size of pedigrees F1 (2 x 28) Mating 1 8 9 4

Schéma vazby mezi markerem a QTL v F2 rodině

Princip mapování QTL v F2 populaci

Detailní mapování SSCX

Interval spolehlivosti (95% CI) CI95 = 3000/(kNδ2)   3000 = délka genomu v cM k = počet informativních rodičů na jedince (1 pro polo sourozence a zpětné páření, 2 pro F2 populaci ) N = počet zvířat v experimentu Δ = velikost kontrastu (SD) Příklad: Máme rodinu polo sourozenců (skot), N = 1000, efekt je roven 0,5 standardní odchylky pak CI95 = 3000/(1 x 1000 x 0.52) = 12 cM

Velikost intervalu spolehlivosti detekovaného QTL je nepřímo úměrná množství potomků v mapovací populaci a nepřímo úměrná druhé mocnině efektu QTL (Darvasi 1998). Velikost efektu QTL je kritická pro přesnost lokalizace. QTL s malým efektem mohou být lokalizovány pouze na chromozóm, QTL s velkým efektem mohou být na početné mapovací populaci lokalizovány s nejmenším intervalem spolehlivost 11 cM. Přesnost lokalizace QTL se středním efektem se pohybuje mezi výše uvedenými extrémy. Pro mapování QTL existuje řada počítačových programů (Mapmaker/QTL, QTL Cartographer, Map Manager QT, QGene TM, MapQTL TM, PLABQTL, Multimapper, The QTL Cafe, Epistat).

Faktory kritické pro přesnou lokalizaci 1) hustota markerů – čím více markerů, tím menší průměrný interval a vyšší rozlišení 2) hustota crossoverů – rekombinace jako jediné poskytují mapovací informace 3) detekovatelnost QTL - záleží na možnosti detekce genotypu QTL u daného jedince nebo na chromozómu. Zjištění polohy QTL vzhledem ke crossoveru vyžaduje znalost QTL alely vyskytující se na daném chromozómu. 4) Molekulární architektura QTL – mnoho QTL zahrnuje kombinovaný efekt vice QTL

Dosavadní výsledky vazbového mapování QTL Bylo zjištěno mnoho QTL Bylo zjištěno pouze minimální množství genů (příčinných mutací) Zjištěné geny jsou převážně geny velkého účinku Předpokládá se, že existuje mnoho dalších genů malého účinku, jejichž zjištění bude obtížné Využití genomických informací získaných v rodinách je velmi omezené

QTL v IGF2 prasete IGF2-intron 3-3072G – je asociována s větším osvalením a menším množstvím tuku IGF2 je maternálně imprintováný gen

Myostatin (GDF8) QTL

Mapování QTL pomocí vazbové nerovnováhy (LD) LD mapování je založeno na existenci LD mezi QTL a markerem v náhodně se pářící populaci Z efektu testovaného markeru na fenotypový znak usuzujeme na přítomnost a efekt QTL

Měření LD Nejjednodušší mírou LD je rozdíl mezi skutečnou a očekávanou frekvencí haplotypů je Dij = Pij – piqj kde Pij je frekvence haplotypu ij (i = alela i v lokusu 1; j = alela j v lokusu 2); pi a qj jsou frekvence alely i v lokusu 1 a alely j v lokusu 2. Absolutní hodnota Dij (Dij) je identická pro oba haplotypy pro jakýkoliv dvoualelový lokus. Dij, obdobně jako poněkud složitěji počítané D’ jsou pro výše zmíněné účely nepoužitelné kvůli vysoké závislosti na frekvenci alel.

r2 je nejvhodnější mírou LD Pro mapování QTL nejvíce vyhovuje míra r2 Dij r2 = ------------- p1p2q1q2 r2 se pohybuje v rozmezí mezi 0 a 1. (0 = LD neexistuje, 1 znamená perfektní nebo také kompletní LD). r2 je také částečně závislé na frekvenci alel, ale tato závislost je mnohem menší než u Dij a D’.

Faktory ovlivňující vznik a degradaci LD v populaci Mezi hlavní faktory vytvářející LD v populaci patří: mutace, selekce, křížení (migrace) Hlavním faktorem degradujícím LD jsou rekombinace. LD mezi vzdálenými markery eroduje rychle, zatímco LD mezi blízko se nacházejícími markery (geny) eroduje pomalu. IDB – identity by descends – je úsek chromozómu se shodnými alelami (haplotyp), jaké měl předek, u kterého vznikla příčinná mutace ovlivňující variabilitu užitkového znaku.

Identity by descent (IBD) 1 2 3 4 5

Degradace LD během generací

Faktory ovlivňující velikost a rozsah LD v populaci   Náhodný posun (random drift) - u populací s relativně malým počtem jedinců ovlivňuje frekvence alel a holotypů. Čím je menší Ne populace tím větší je efekt driftu (viz výše). Selekce – vliv selekce na LD závisí na směru, intenzitě a délce trvání selekce. Selekce redukuje genetickou variabilitu v následující generaci a produkuje negativní LD mezi lokusy. Když je selekce aplikovaná na určitý lokus, sousední lokusy, které jsou s tímto lokusem v LD budou mít zvýšenou LD - tzv. hitchhiking efekt. Křížení – tvoří nové (falešné) LD mezi lokusy, které dříve nebyly v LD v původních populacích a mění rozsah LD pro lokusy které byly v LD v původních populacích. Tyto falešné LD se rychle ztrácejí v následujících generacích. Vztah mezi fyzickou a genetickou vzdáleností – procento rekombinací na jednotku fyzické vzdálenosti není v genomu rovnoměrné. V některých oblastech je frekvence rekombinací (θ) < 0.3cM/Mb, zatím co v jiných oblastech je to >3 cM/Mb. Tyto rekombinační „hot spots“ a „cold spots“ nebo také rekombinační „džungle“ a rekombinační „pouště“ korespondují s bloky s nízkým a vysokým LD.

Hlavní faktory ovlivňující LD u hospodářských zvířat V populacích hospodářských zvířat je pro LD rozhodující velikost populace.Efektivní velikost populace je u většiny hospodářských zvířat malá, a proto je rozsah LD velký. LD způsobené křížením je malé při křížení plemen, která se liší pouze frekvencí alel. Toto LD vymizí po několika generacích. Významné mutace vznikly pravděpodobně před mnoha generacemi. Zatím co selekce je pravděpodobně významný zdroj LD, její efekt se pravděpodobně uplatňuje v okolí specifických genů a proto má relativně malý vliv na „průměrnou LD“ v celém genomu.

Závislost LD na efektivní velikosti populace prasat

Kandidátní geny a kriteria pro jejich výběr Pod pojmem kandidátní gen (někdy s přívlastkem fyziologický) rozumíme gen, který je metabolických drah vedoucích k manifestaci studovaného znaku. Dále existuje poziční kandidátní gen, to je gen, který se nachází v dříve identifikované QTL oblasti.   1) znalost funkce genu 2) úloha genu ve vývoji dané vlastnost 3) znalosti o vlivu genu na fenotyp u jiných druhů (myš, člověk) 4) exprese genu v dané tkáni a to i během vývoje (sval, tuk apod.) 5) gen se nachází v blízkosti QTL pro danou vlastnost (poziční kandidátní gen)

Standardy asociační analýza Studie kandidátních genů by měly dodržovat následující standard: používat práh signifikance pro mnohonásobné testování (viz dále) vyčerpávajícím způsobem charakterizovat diverzitu haplotypů s strukturu existující ve studované populaci zahrnout opakování pozitivní asociace v nezávislé populaci zahrnout údaje o resekvenování odlišných haplotypů za účelem identifikace domnělých příčinných mutací

Faktory ovlivňující schopnost asociačního testu detekovat QTL testováním efektu jednotlivých markerů r2 mezi markerem a QTL. Velikost populace musí být zvýšena faktorem 1/r2, aby bylo možno detekovat QTL ve srovnání s velikostí populace v případě, že byl QTL testován sám Heritabilitě vlastnost (h2) Počtu fenotypových záznamů (n) Na alelové frekvenci méně často se vyskytující alely testovaného markeru (p). Průkaznost rychle klesá je li p <0.1. MAF < 0.1 (Minor Allele Frequency) Na hladině průkaznosti (α) stanovenou experimentátorem

Illumina BovineHD BeadChip: 770 000 SNP . Illumina BovineHD BeadChip: 770 000 SNP Illumina Bovine SNP50 BeadChip: 54 000 SNP (51.5 Kb ) IlluminaPorcine SNP60 BeadChip: 60 000 SNPs (40kb) Duroc, Landrace, Pietran, and Large White.

Vzdálenosti mezi SNP u BovineSNP50

Počet polymorfních lokusů BovineSNP50 BedChip u různých plemen skotu

GWAS

Congenital muscular dystonia 1 - CMD1

Nature Genetics (2008) 40, 449 - 454

Princip genomické selekce (GS) Tuto metodu navrhli a pojmenoval Meuwissen et al. (2001). Zásadním rozdílem mezi MAS a genomickou selekcí je v tom, že MAS používá SNP, které jsou statisticky významně asociovány se selektovanými znaky, zatím co genomická selekce používá celogenomové panel hustě vedle sebe umístěných markerů, takže se očekává, že všechny QTL jsou v LD přinejmenším s jedním markerem. GS překonává problém s mnohonásobným testováním, tj. falešně pozitivní QTL a zachycení pouze fragmentu genetické proměnlivosti. GS pracuje na základě rozdělení celého genomu do chromozómových úseků definovaných sousedními markery a následného sledování efektů těchto chromozómových úseků. GS využívá předpokladu, že efekty chromozómových úseků budou shodné v celé populaci, protož markery jsou v LD s QTL mezi markery (mají stejnou vazbovou fázi). Proto hustota markerů musí být dostatečná, aby zajistila, že všechny QTL jsou v dostatečném LD s markery nebo haplotypy markerů.

Implementace genomické selekce (GS) Odhad efektů chromozómových segmentů v referenční populaci. Zvířata referenční populace musí mít stanoveny genotypy markerů a mít záznamy o užitkovosti. Předpověď GPH pro zvířata mimo referenční populaci, pro mladé býčky. Tito kandidáti mají k dispozici pouze genotypy markerů, ale nemají k dispozici údaje o vlastní užitkovosti. Formální kvantitativní genetika počítá s tím, že potomek zdědí polovinu vlastností od každého z rodičů. Ve skutečnosti to tak docela neplatí. Předpověď GPH pro zvířata bez údajů o vlastní užitkovosti se zakládá na sčítání efektů chromozómových úseků zjištěných v referenční populaci GPH = ∑in Xgˆi N – počet chromozómových segmentů v genomu Xi – matrice, která přiřazuje zvířata k efektům markerů nebo haplotypů Xgˆi – je vektor haplotypů v chromozómovém segmentu

Faktory ovlivňující přesnost GS Přesnost odhadu GPH závisí na 4 parametrech. 1) Rozsah a velikost LD mezi markry a QTL. 2) Počet zvířat s fenotypy a genotypy v referenční populaci, ze které jsou efekty SNP odhadovány. 3) Dědivost (heritabilita - h2) sledovaných znaků 4) Distribuce QTL efektů. První faktory 2 lze ovlivnit, druhé dva ne.

Heritabilita různých užitkových vlastnosti u černostrakatého skotu množství nadojeného mléka 0,30 množství mléčného tuku 0,30 množství mléčného tuku 0.30 procento tuku 0.58 procento bílkovin 0,51 celoživotní produkce mléka 0,15 celoživotní produkce tuku 0,15 celoživotní produkce bílkovin 0,14 délka produktivního života 0.13 Počet somatických buněk v mléce 0,10

Vztah mezi velikostí referenční populace, h2 a přesností odhadu genomické plemenné hodnoty

Velikost referenční populace a přesnost odhadu GPH s ohledem na efektivní velikost populace a heritabilitu vlastnosti

Matematické metody

Stav GS u různých druhů hospodářských zvířat

Porovnání účinnosti jednotlivých přístupů