Genetické metody v zoologii počítačová část II Radka Storchová
DATABÁZE PROGRAMY Primární databáze DNA sekvencí GenBank (Amerika) EMBL (Evropa) DDBJ (Japonsko) BLAST Na stránkách NCBI, Ensembl BLAT Na stránkách USCS Primer3 – navrhování primerů http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www.cgi In Silico PCR Databáze genů Entrez Gene RefSeq Databáze genových expresních dat UniGene GEO Důležité odkazy NCBI - http://www.ncbi.nlm.nih.gov/ tam najdu skoro vše: GenBank, Entrez Gene, UniGene, MapViewer, BLAST… ENSEMBL - http://www.ensembl.org/ Genome Browser, BLAST USCS – http://genome.ucsc.edu/ Genome Browser, BLAT, In Silico PCR Databáze genomů NCBI Ensembl UCSC Genome Browser
Z jakého organismu pochází tato sekvence? Úloha 1 Z jakého organismu pochází tato sekvence? Jaké je taxonomické zařazení tohoto organismu? >krasna neznama 1 CAAATATCTGGAGGTATGGAAAAGGGCAGGGAAGTCTCAGTGTCTGATGTGTARTGAATGTGTGCAAGAC AGCTATGTGAGAGTTGTGCTTTTATTTACTGATGGCTAGTTGGATTCCAGTGAACTCTCCCTCAAGTCCA AGGTCTGTGTGTACAAGCAGGAGGCACAGAAAGGGCTCATGGTATGCAAATGGTATGTGAATATCCAAGT TTAGATTTCCCATTCCAAACACCACACACAGTCTGACCAAGCCTTGACAGCAATAAACCAGCCCATGCAG CCTATGCATGCCTGGAAAACTGTATTATATAAGGATTGTCAGTGACTGGACACAAGGGACATACAATTTT AGAGTAAGCCCTGTAGGATCCATTGGAGACCAAGACCCATAAAACTAAGTGTTATACAAACACAGGGCAT GWATTTGCAGTCTTAATGGCTGTGAGGCAGACAAAAAATGGGAGGGGCCATGGTTTACTCAAGGTCATAA AGCAGATCAGCATCAGAGCTAGGGATAGAGCCCAGTGTTTCTGCCTAGCCAGGCTCCTTGCATACTAGAC CTCACTGTCTCTCCAAAGGCTGCAGGAAGGGCTACCAAATTAGCTCGGAGATATTTCCAGGCTCTGCAAC CTATTTCTTAGTCTGGCTTTTCTGAAAATAAACCTTGAGTGTCCCTTCAGTTTTTCTTTCTCTCTTTTCC TTCCTCACAGTTCATTTCT Návod: K identifikaci sekvence použijeme program BLAST. Taxonomické zařazení můžeme zjistit pomocí Entrez Taxonomy. Výsledek: Vranule bělokrká (Picathartes gymnocephalus) cellular organisms; Eukaryota; Fungi/Metazoa group; Metazoa; Eumetazoa; Bilateria; Coelomata; Deuterostomia; Chordata; Craniata; Vertebrata; Gnathostomata; Teleostomi; Euteleostomi; Sarcopterygii; Tetrapoda; Amniota; Sauropsida; Sauria; Archosauria; Aves; Neognathae; Passeriformes; Picathartidae; Picathartes
Existují nějaké známé sekvence této kachny? Úloha 2 Existují nějaké známé sekvence této kachny? V jaké části genomu leží (autosomy, pohlavní chromosomy, mitochondrie)? Návod: Sekvence hledáme v základních databázích nukleotidových sekvencí GenBank/EMBL/DDBJ. Stačí zadat latinský název druhu. Pokud u sekvence není napsaná lokalizace v genomu, můžeme ji zkusit „blastovat“ na genom kura domácího (v databázi osekvenovaných genomů ENSEMBL). Všichni ptáci, stejně jako savci, mají stejný obsah genů na pohlavním chromosomu Z/X. Naopak geny na autosomech jsou u jednotlivých skupin na různých chromosomech. Výsledek: Polák kaholka (Aythya marila ) AY082413 Aythya marila beta fibrinogen gene, intron 7 (autosomální gen) AY112947 Aythya marila mitochondrial D-loop, partial sequence (mitochondriální sekvence)
Jaký gen kóduje tento protein? Z jakého organismu pochází? Úloha 3 >krasna neznama 2 MDLFDFFRDWDLEQQCHYEQDRSALKKREWERRNQEVQQEDDLFSSGFDLFGEPYKVAEY TNKGDALANRVQNTLGNYDEMKNLLTNHSNQNHLVGIPKNSVPQNPNNKNEPSFFPEQKN RIIPPHQDNTHPSAPMPPPSVVILNSTLIHSNRKSKPEWSRDSHNPSTVLASQASGQPNK MQTLTQDQSQAKLEDFFVYPAEQPQIGEVEESNPSAKEDSNPNSSGEDAFKEIFQSNSPE ESEFAVQAPGSPLVASSLLAPSSGLSVQNFPPGLYCKTSMGQQKPTAYVRPMDGQDQAPD ISPTLKPSIEFENSFGNLSFGTLLDGKPSAASSKTKLPKFTILQTSEVSLPSDPSCVEEI LREMTHSWPTPLTSMHTAGHSEQSTFSIPGQESQHLTPGFTLQKWNDPTTRASTKSVSFK SMLEDDLKLSSDEDDLEPVKTLTTQCTATELYQAVEKAKPRNNPVNPPLATPQPPPAVQA SGGSGSSSESESSSESDSDTESSTTDSESNEAPRVATPEPEPPSTNKWQLDKWLNKVTSQ NKSFICGQNETPMETISLPPPIIQPMEVQMKVKTNASQVPAEPKERPLLSLIREKARPRP TQKIPETKALKHKLSTTSETVSQRTIGKKQPKKVEKNTSTDEFTWPKPNITSSTPKEKES VELHDPPRGRNKATAHKPAPRKEPRPNIPLAPEKKKYRGPGKIVPKSREFIETDSSTSDS NTDQEETLQIKVLPPCIISGGNTAKSKEICGASLTLSTLMSSSGSNNNLSISNEEPTFSP IPVMQTEILSPLRDHENLKNLWVKIDLDLLSRVPGHSSLHAAPAKPDHKETATKPKRQTA VTAVEKPAPKGKRKHKPIEVAEKIPEKKQRLEEATTICLLPPCISPAPPHKPPNTRENNS SRRANRRKEEKLFPPPLSPLPEDPPRRRNVSGNNGPFGQDKNIAMTGQITSTKPKRTEGK FCATFKGISVNEGDTPKKASSATITVTNTAIATATVTATAIVTTTVTATATATATTTTTT TTISTITSTITTGLMDSSHLEMTSWAALPLLSSSSTNVRRPKLTFDDSVHNADYYMQEAK KLKHKADALFEKFGKAVNYADAALSFTECGNAMERDPLEAKSPYTMYSETVELLRYAMRL KNFASPLASDGDKKLAVLCYRCLSLLYLRMFKLKKDHAMKYSRSLMEYFKQNASKVAQIP SPWVSNGKNTPSPVSLNNVSPINAMGNCNNGPVTIPQRIHHMAASHVNITSNVLRGYEHW DMADKLTRENKEFFGDLDTLMGPLTQHSSMTNLVRYVRQGLCWLRIDAHLL Návod: Pomocí BLAST identifikujeme sekvenci a její původ. Informace o sekvenci a funkci mRNA a příslušné genomové sekvence naleznete např. v databázi Entrez Gene. Další info v databázi ENSEMBL. Informace o expresi genu v databázi UniGene. Informace o funkci a projevech genu v databázi PubMed či OMIM. Výsledky: Jedná se o gen AFF2 známý také jako FMR2. Způsobuje syndrom fragilního chromosomu X, jedné z nejčastějších příčin mentální retardace u lidí. Jaký gen kóduje tento protein? Z jakého organismu pochází? Zjistěte sekvenci mRNA (kolik má exonů a intronů) a genomovou sekvenci. Zjistěte pozici genu v genomu. V jakých tkáních je tento gen exprimovaný? Jaké jsou jeho funkce, projevy?
Úloha 4 Mus musculus musculus M. m. domesticus Zjistili jsme, že úsek na chromosomu X, mezi markery DXMit76 a DXMit110, způsobuje neplodnost hybridních samců u dvou poddruhů myši domácí. Zjistěte jaké geny v této oblasti leží a odhadněte, který z těchto genů by mohl sterilitu způsobovat. F1 hybrid: STERILNÍ Návod: Seznam genů lze vyexportovat v databázi NCBI (přes Map Viewer), Ensembl (přes BioMart) či USCS. Porovnejte výsledky.
Úloha 5 Dostali jste 10 myších sekvencí. Zjistěte, jejich polohu v genomu. Jaký program k tomu použijete? >seq01 CCACCAACAGACAGAGCAAA >seq02 ACTTTTTAACTGAGTCACCACAAGC >seq03 GAATTACAGGCATGCGTCCT >seq04 AGACAGACGTGATCCTGCCT >seq05 GAACCGCAAGTCATGAATCA >seq06 TGGAGGTCAGGAATCAAACA >seq07 AAAAGGATTGCAGGGACTACTG >seq08 GGTGCCTACCATGCACAATT >seq09 TTTCCATTTCCTCTTTTATTGTCC >seq10 CTACAAGGGAAAACCTCAGGG Návod: Lze použít BLAST, ale protože hledáme úplně stejné sekvence můžeme použít i BLAT. Srovnej výstupy z obou programů.
Úloha 6 Chcete osekvenovat gen STYX, který leží na chromosomu X v oblasti, která je odpovědná za sterilitu samců (viz úloha 4), abyste zjistili, jestli neobsahuje mutaci způsobující sterilitu . Tento gen má ale v genomu několik kopií. Zjistěte, kde leží a čím se liší. Navrhněte primery specifické pro gen na chromosomu X. Návod: K nalezení kopií genu Styx použijte program BLAT nebo BLAST. Porovnejte alignmenty jednotlivých kopií. Navrhněte primery v programu Primer3 a pomocí In Silico PCR zjistěte, jestli amplifikují pouze kopii na chromosomu X. chr 7 chr X chr14 Výsledek: 3 kopie. Na chr 14 zdrojový gen s devíti exony. Na chr 7 a X jsou retrogeny bez intronů. Zjistěte, kdy došlo k retropozici genu STYX na chr 7 a chr X. Která retropozice je starší? Vyskytují se i u potkana? Výsledek: Retrogen na chr 7 starší, přítomen i u potkana. Retrogen na chr X mladší, není přítomen u potkana.