Stránky praktika (http://www.natur.cuni.cz/~muncling)

Slides:



Advertisements
Podobné prezentace
Vlastní skript může být umístěn: v hlavičce stránky v těle stránky
Advertisements

Genetika eukaryotní buňky
Tutoriál EDS možnosti přizpůsobení Pro administrátory support.ebsco.com.
Dana Sigmundová E-books jako zdroj odborných informací ÚK FSS MU, Ústřední knihovna FSS MU.
B130P16: Praktické základy vědecké práce Katedra experimentální biologie rostlin PřF UK SciVerse - plnotextové vyhledávání.
B130P16: Praktické základy vědecké práce Katedra experimentální biologie rostlin PřF UK Jak připojit přenosný počítač do.
Praktikum základů genomiky, zima 2007 Základy genomiky I. Úvod do bioinformatiky Jan Hejátko Masarykova univerzita, Laboratoř funkční genomiky a proteomiky.
Tutoriál EBSCO Discovery Service ~ Jednoduché vyhledávání
Hana Kotinová Struktura a cíl práce Metody předzpracování dat Systémy předzpracování dat Historie vývoje DPT Jak program pracuje Budoucnost.
Informatika Internet.
Imunologické, mikrosatelity, SSCP, SINE
Relační databáze.
Určení rodičů (analýza paternity)
VY_32_INOVACE_4.3.IVT1.12/Oc Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Jaroslav Ochodek CZ.1.07/1.5.00/ Tvorba webových.
Počítačová část 1. Databáze na internetu: (Databáze, navržení primerů) 2. Fylogenetická analýza.
Studijní informační zdroje (a jak se k nim dostat) Pro předmět Jazykový projev (2014/15) připravila Eva Cerniňáková Jabok - Vyšší odborná škola sociálně.
Fakulta elektrotechniky a informatiky
Projekt HUGO – milníky - I
Genetické metody v zoologii
Číslo šablony: III/2 VY_32_INOVACE_P4_1.17 Tematická oblast: Hardware, software a informační sítě OS WIN 7, 1. část Typ: DUM - kombinovaný Předmět: ICT.
NIST WebBook Chemie (NIST Chemistry Webbook)‏. NIST WebBook Chemie (NIST Chemistry Webbook) NIST- National Institute for Standarts and Technology
Evaluation of Performance Based on Information in Documents‘ Databases Hana Pessrová Tomáš Cahlík.
Struktura lidského genu
Počítačová část 1. seznámení s on-line databázemi, nástroji a softwarem (databáze, vyhledání sekvencí, základní manipulace se sekvencemi, navržení primerů)
Dolce: Databáze lokálních konformací DNA
Počítačová část 1. Databáze na internetu: (Databáze, navržení primerů) 2. Fylogenetická analýza.
B130P16: Praktické základy vědecké práce Katedra experimentální biologie rostlin PřF UK iHOP - plnotextové vyhledávání Pubmed.
Střední škola služeb a podnikání, Ostrava-Poruba příspěvková organizace Výukový materiál v rámci projektu OPVK 1.5 Peníze středním školám Číslo projektu:
ŠkolaStřední průmyslová škola Zlín Název projektu, reg. č.Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávací.
AKM'06 Praha NA Nové nástroje pro archivaci webu Ing. Petr Žabička, MZK Mgr. Jan HUTAŘ, NK.
KLIENT ARL školení pro pokročilé listopad Vyhledávání: zvolím bázi (epca nebo auth) zvolím jednoduché vyhledávání z rolety zvolím pole pro vyhledání.
Jednotná informační brána Cyklus školení Elektronické informační zdroje a databáze Národní knihovna ČR , , , ,
Dana Mazancová Metalib aneb jak vyhledávat (skoro) ve všech (multi)oborových databázích současně? ÚK FSS MU, 8. a Ústřední knihovna FSS MU.
Databáze velké množství dat pevně dané struktury
Klikací mapy v GIMPu Tvorba tzv. klikacích (obrázkových) map s pomocí grafického editoru GIMP Dostupné z Metodického portálu ISSN: ,
MS Excel 2 Martin Kotlík Brno, 20. ledna 2015 Obsah předchozího semináře 1 1.Popis programu Excel 2.Základní dovednosti 3.Typy vkládaných dat 4.Formát.
Sekvenování.
BLAST (basic local alignment search tool) Vyhledává podobné sekvence v databázích. Stal se nástrojem pro všechno. Určitou dobu kolektiv autorů držel krok.
Jak vyhledávat informace na Internetu?
JAK NAJÍT NEJLEPŠÍ STROM
Dana Mazancová Databáze Sage ÚK FSS MU, 25. a Ústřední knihovna FSS MU.
Anopress: nová grafika, nové možnosti Mgr. Daniela Uhrová září 2010.
Nikola Dynybylová Jediný a jedinečný Sage ÚK FSS MU, Ústřední knihovna FSS MU.
1. lekce SM 315 Statistika v SAS a víceúrovňové lineární modely.
Informační zdroje pro molekulární biologii M. Jurajda.
Molekulárně biologické databáze
Molekulárně biologické databáze Pro zajímavost, nebude součástí zkoušky… Důležité, pravděpodobně bude u zkoušky…
SEKVENCE A:MASAQSFYLL SEKVENCE B:MASGQWLLAS Které oblasti A a B jsou si nejvíce podobné ? Jsou si A a B víc podobné než A a C ? Která ze sekvencí X1,...,Xn.
DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ
Vícerozměrný přístup pro indexování XML dat
Možnosti GIS při tvorbě trojrozměrných map zemětřesení Vedoucí práce: Doc.Ing.Petr Rapant CSc. Odborná konzultace: Ing. Aleš Poláček CSc. Zpracoval : Pavel.
filtrování a řazení dat, podmíněné formátování,
CG020 Genomika Bi7201 Základy genomiky Přednáška 1
Praktikum z genetiky rostlin JS Genetické mapování mutace lycopodioformis Arabidopsis thaliana Genetické mapování genu odolnosti k padlí.
Dana Sigmundová Úvod do elektronických informačních zdrojů ÚK FSS MU, Ústřední knihovna FSS MU.
METALIB a SFX Martin Krčál Školení pro studenty FSSBrno, 29. března 2011 aneb jak vyhledávat skoro ve všech e-zdrojích současně.
Seznamy (databáze) v tabulkových kalkulátorech (Microsoft Office Excel, Open Office Calc, …)
Biotechnologie, technologie budoucnosti Aleš Eichmeier.
Projekt HAPMAP Popis haplotypů
KIV/ZD cvičení 8 Tomáš Potužák.
Nepřímá DNA diagnostika
Molekulárně-biologické databáze
Molekulárně biologické databáze
Algoritmizace a programování
Molekulární genetika Tok genetické informace:
Fylogenetická evoluční analýza
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J
Optimalizace SQL dotazů
Studium lidského genomu
HASH.
Transkript prezentace:

Stránky praktika (

Počítačová část Genetické metody v zoologii Dopolední část: (Pavel Munclinger, Václav Janoušek) - Databáze sekvencí - Manipulace se sekvencemi - Navržení primerů pro PCR - Celogenomová data Odpolední část: (Zuzana Starostová, Petr Synek) - Fylogenetická analýza

Kde se dozvědět více? Kurz Computational Genomics (Marc VanRanst) Bioinformatics bookmarks ( Úvod do bioinformatiky/Základy bioinformatiky (F. Cvrčková) Molekulární ekologie (letní semestr, populační genetika, analýza paternity)

Databáze sekvencí Primární databáze DNA sekvencí RefSeq Genomové databáze

Primární databáze DNA sekvencí International Nucleotide Sequence Databases (INSD) GenBank (National Center for Biotechnology Information) USA DNA Data Bank of Japan (DDBJ) (National Institute of Genetics) Japan European Nucleotide Archive (European Bioinformatics Institute) Europe Your submission

RefSeq: Databáze unikátních sekvencí Provozována NCBI Kurátorovaná databáze založená na sekvencích získaných z primárních databázích Unikátní sekvence genu/transkriptu/proteinu pro jednotlivé organismy/ekomorfy/varianty

Genomové databáze Skladují anotované assembly celých genomů + veškerá metadata asociovaná se sekvencemi nebo geny/transkripty/ proteiny: Sekvence, geny, transkripty, proteiny, proteinové rodiny, paralogy, orthology, mezidruhové alignmenty, genové exprese, varianty (SNPs), repetitivní elementy, mikrosatelity, strukturální změny, genová regulace, fenotypy apod

Genomové databáze Veškerá data jou vzájemně propojena pomocí identifikátorů a pozic v genomech: SekvenceGen TranskriptExpreseFunkce

Manipulace se sekvencemi Uchovávání sekvencí Alignment BLAST

Uchovávání sekvencí Sekvence uchovávány ve formě textu v klasickém textovém souboru (možno editovat v notepadu, textpadu, apod. nebo ve specifických programech určených k manipulaci a editaci sekvencí – např. BioEdit) V textových souborech uchovávány ve specifickém tvaru: –FASTA (.fa,.fas,.fasta) –GenBank (.gb) V každém souboru 1 i více sekvencí

FASTA >gi| |gb|EF | Rhinopoma hardwickei haplotype 2949 cytochrome b gene, partial cds; mitochondrial ATGACCCACATCCGAAAATCCCACCCCTTATTCAAAATTATCAACGACTCATTCATCGACCTACC AGCTCCATCAAACATTTCCTCCTGATGAAATTTTGGGTCCCTACTAGGTATTTGTTTAGCTGTAC AAATCTTAACAGGACTGTTCCTAGCAATACATTATACATCAGATACCACAACCGCCTTCTACTCT GTTACCCATATCTGCCGAGACGTAAATTACGGCTGAATCCTACGTTACCTCCATGCCAACGGAGC ATCCATATTCTTCATCTGCCTATTTATACATGTAGGCCGAGGCATCTATTACGGCTCATACCTAT TCACAGAAACATGAAACATTGGCATTATCCTTCTATTCGCCGTAATAGCAACAGCATTCATAGGC TATGTCCTCCCA >gi|... ATGA... Pouze velmi základní informace o sekvenci – formát určen primárně k manipulaci se sekvencemi

LOCUS EF bp DNA linear MAM 15-OCT-2007 DEFINITION Rhinopoma hardwickei haplotype 2949 cytochrome b gene, partial cds; mitochondrial. ACCESSION EF VERSION EF GI: KEYWORDS. SOURCE mitochondrion Rhinopoma hardwickii (Lesser mouse-tailed bat) ORGANISM Rhinopoma hardwickii Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Laurasiatheria; Chiroptera; Microchiroptera; Rhinopomatidae; Rhinopoma. REFERENCE 1 (bases 1 to 402) AUTHORS Hulva,P., Horacek,I. and Benda,P. TITLE Molecules, morphometrics and new fossils provide an integrated view of the evolutionary history of Rhinopomatidae (Mammalia: Chiroptera) JOURNAL BMC Evol. Biol. 7, 165 (2007) PUBMED REMARK Publication Status: Online-Only REFERENCE 2 (bases 1 to 402) AUTHORS Hulva,P. TITLE Direct Submission JOURNAL Submitted (18-FEB-2007) Zoology, Charles University, Vinicna 7, Prague, , Czech Republic FEATURES Location/Qualifiers source /organism="Rhinopoma hardwickii" /organelle="mitochondrion" /mol_type="genomic DNA" /db_xref="taxon:124756" /haplotype="2949" CDS 1..>402 /codon_start=1 /transl_table=2 /product="cytochrome b" /protein_id="ABR " /db_xref="GI: " /translation="MTHIRKSHPLFKIINDSFIDLPAPSNISSWWNFGSLLGICLAVQ ILTGLFLAMHYTSDTTTAFYSVTHICRDVNYGWILRYLHANGASMFFICLFMHVGRGI YYGSYLFTETWNIGIILLFAVMATAFMGYVLP" ORIGIN 1 atgacccaca tccgaaaatc ccacccctta ttcaaaatta tcaacgactc attcatcgac 61 ctaccagctc catcaaacat ttcctcctga tgaaattttg ggtccctact aggtatttgt 121 ttagctgtac aaatcttaac aggactgttc ctagcaatac attatacatc agataccaca 181 accgccttct actctgttac ccatatctgc cgagacgtaa attacggctg aatcctacgt 241 tacctccatg ccaacggagc atccatattc ttcatctgcc tatttataca tgtaggccga 301 ggcatctatt acggctcata cctattcaca gaaacatgaa acattggcat tatccttcta 361 ttcgccgtaa tagcaacagc attcataggc tatgtcctcc ca // GenBank Formát uchovává velmi detailní informaci o sekvenci – určen k uchovávání sekvencí vč. veškerých informací asociovaných se sekvencí

LOCUS EF bp DNA linear MAM 15-OCT-2007 DEFINITION Rhinopoma hardwickei haplotype 2949 cytochrome b gene, partial cds; mitochondrial. ACCESSION EF VERSION EF GI: KEYWORDS. SOURCE mitochondrion Rhinopoma hardwickii (Lesser mouse-tailed bat) ORGANISM Rhinopoma hardwickii Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Laurasiatheria; Chiroptera; Microchiroptera; Rhinopomatidae; Rhinopoma. REFERENCE 1 (bases 1 to 402) AUTHORS Hulva,P., Horacek,I. and Benda,P. TITLE Molecules, morphometrics and new fossils provide an integrated view of the evolutionary history of Rhinopomatidae (Mammalia: Chiroptera) JOURNAL BMC Evol. Biol. 7, 165 (2007) PUBMED REMARK Publication Status: Online-Only REFERENCE 2 (bases 1 to 402) AUTHORS Hulva,P. TITLE Direct Submission JOURNAL Submitted (18-FEB-2007) Zoology, Charles University, Vinicna 7, Prague, , Czech Republic FEATURES Location/Qualifiers source /organism="Rhinopoma hardwickii" /organelle="mitochondrion" /mol_type="genomic DNA" /db_xref="taxon:124756" /haplotype="2949" CDS 1..>402 /codon_start=1 /transl_table=2 /product="cytochrome b" /protein_id="ABR " /db_xref="GI: " /translation="MTHIRKSHPLFKIINDSFIDLPAPSNISSWWNFGSLLGICLAVQ ILTGLFLAMHYTSDTTTAFYSVTHICRDVNYGWILRYLHANGASMFFICLFMHVGRGI YYGSYLFTETWNIGIILLFAVMATAFMGYVLP" ORIGIN 1 atgacccaca tccgaaaatc ccacccctta ttcaaaatta tcaacgactc attcatcgac 61 ctaccagctc catcaaacat ttcctcctga tgaaattttg ggtccctact aggtatttgt 121 ttagctgtac aaatcttaac aggactgttc ctagcaatac attatacatc agataccaca 181 accgccttct actctgttac ccatatctgc cgagacgtaa attacggctg aatcctacgt 241 tacctccatg ccaacggagc atccatattc ttcatctgcc tatttataca tgtaggccga 301 ggcatctatt acggctcata cctattcaca gaaacatgaa acattggcat tatccttcta 361 ttcgccgtaa tagcaacagc attcataggc tatgtcctcc ca // Základní vlastnosti sekvence (název, délka, typ) LOCUS

LOCUS EF bp DNA linear MAM 15-OCT-2007 DEFINITION Rhinopoma hardwickei haplotype 2949 cytochrome b gene, partial cds; mitochondrial. ACCESSION EF VERSION EF GI: KEYWORDS. SOURCE mitochondrion Rhinopoma hardwickii (Lesser mouse-tailed bat) ORGANISM Rhinopoma hardwickii Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Laurasiatheria; Chiroptera; Microchiroptera; Rhinopomatidae; Rhinopoma. REFERENCE 1 (bases 1 to 402) AUTHORS Hulva,P., Horacek,I. and Benda,P. TITLE Molecules, morphometrics and new fossils provide an integrated view of the evolutionary history of Rhinopomatidae (Mammalia: Chiroptera) JOURNAL BMC Evol. Biol. 7, 165 (2007) PUBMED REMARK Publication Status: Online-Only REFERENCE 2 (bases 1 to 402) AUTHORS Hulva,P. TITLE Direct Submission JOURNAL Submitted (18-FEB-2007) Zoology, Charles University, Vinicna 7, Prague, , Czech Republic FEATURES Location/Qualifiers source /organism="Rhinopoma hardwickii" /organelle="mitochondrion" /mol_type="genomic DNA" /db_xref="taxon:124756" /haplotype="2949" CDS 1..>402 /codon_start=1 /transl_table=2 /product="cytochrome b" /protein_id="ABR " /db_xref="GI: " /translation="MTHIRKSHPLFKIINDSFIDLPAPSNISSWWNFGSLLGICLAVQ ILTGLFLAMHYTSDTTTAFYSVTHICRDVNYGWILRYLHANGASMFFICLFMHVGRGI YYGSYLFTETWNIGIILLFAVMATAFMGYVLP" ORIGIN 1 atgacccaca tccgaaaatc ccacccctta ttcaaaatta tcaacgactc attcatcgac 61 ctaccagctc catcaaacat ttcctcctga tgaaattttg ggtccctact aggtatttgt 121 ttagctgtac aaatcttaac aggactgttc ctagcaatac attatacatc agataccaca 181 accgccttct actctgttac ccatatctgc cgagacgtaa attacggctg aatcctacgt 241 tacctccatg ccaacggagc atccatattc ttcatctgcc tatttataca tgtaggccga 301 ggcatctatt acggctcata cctattcaca gaaacatgaa acattggcat tatccttcta 361 ttcgccgtaa tagcaacagc attcataggc tatgtcctcc ca // Výpis genů v sekvenci DEFINITION

LOCUS EF bp DNA linear MAM 15-OCT-2007 DEFINITION Rhinopoma hardwickei haplotype 2949 cytochrome b gene, partial cds; mitochondrial. ACCESSION EF VERSION EF GI: KEYWORDS. SOURCE mitochondrion Rhinopoma hardwickii (Lesser mouse-tailed bat) ORGANISM Rhinopoma hardwickii Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Laurasiatheria; Chiroptera; Microchiroptera; Rhinopomatidae; Rhinopoma. REFERENCE 1 (bases 1 to 402) AUTHORS Hulva,P., Horacek,I. and Benda,P. TITLE Molecules, morphometrics and new fossils provide an integrated view of the evolutionary history of Rhinopomatidae (Mammalia: Chiroptera) JOURNAL BMC Evol. Biol. 7, 165 (2007) PUBMED REMARK Publication Status: Online-Only REFERENCE 2 (bases 1 to 402) AUTHORS Hulva,P. TITLE Direct Submission JOURNAL Submitted (18-FEB-2007) Zoology, Charles University, Vinicna 7, Prague, , Czech Republic FEATURES Location/Qualifiers source /organism="Rhinopoma hardwickii" /organelle="mitochondrion" /mol_type="genomic DNA" /db_xref="taxon:124756" /haplotype="2949" CDS 1..>402 /codon_start=1 /transl_table=2 /product="cytochrome b" /protein_id="ABR " /db_xref="GI: " /translation="MTHIRKSHPLFKIINDSFIDLPAPSNISSWWNFGSLLGICLAVQ ILTGLFLAMHYTSDTTTAFYSVTHICRDVNYGWILRYLHANGASMFFICLFMHVGRGI YYGSYLFTETWNIGIILLFAVMATAFMGYVLP" ORIGIN 1 atgacccaca tccgaaaatc ccacccctta ttcaaaatta tcaacgactc attcatcgac 61 ctaccagctc catcaaacat ttcctcctga tgaaattttg ggtccctact aggtatttgt 121 ttagctgtac aaatcttaac aggactgttc ctagcaatac attatacatc agataccaca 181 accgccttct actctgttac ccatatctgc cgagacgtaa attacggctg aatcctacgt 241 tacctccatg ccaacggagc atccatattc ttcatctgcc tatttataca tgtaggccga 301 ggcatctatt acggctcata cctattcaca gaaacatgaa acattggcat tatccttcta 361 ttcgccgtaa tagcaacagc attcataggc tatgtcctcc ca // Databázové přístupové číslo ACCESSION VERSION Verze dané sekvence

LOCUS EF bp DNA linear MAM 15-OCT-2007 DEFINITION Rhinopoma hardwickei haplotype 2949 cytochrome b gene, partial cds; mitochondrial. ACCESSION EF VERSION EF GI: KEYWORDS. SOURCE mitochondrion Rhinopoma hardwickii (Lesser mouse-tailed bat) ORGANISM Rhinopoma hardwickii Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Laurasiatheria; Chiroptera; Microchiroptera; Rhinopomatidae; Rhinopoma. REFERENCE 1 (bases 1 to 402) AUTHORS Hulva,P., Horacek,I. and Benda,P. TITLE Molecules, morphometrics and new fossils provide an integrated view of the evolutionary history of Rhinopomatidae (Mammalia: Chiroptera) JOURNAL BMC Evol. Biol. 7, 165 (2007) PUBMED REMARK Publication Status: Online-Only REFERENCE 2 (bases 1 to 402) AUTHORS Hulva,P. TITLE Direct Submission JOURNAL Submitted (18-FEB-2007) Zoology, Charles University, Vinicna 7, Prague, , Czech Republic FEATURES Location/Qualifiers source /organism="Rhinopoma hardwickii" /organelle="mitochondrion" /mol_type="genomic DNA" /db_xref="taxon:124756" /haplotype="2949" CDS 1..>402 /codon_start=1 /transl_table=2 /product="cytochrome b" /protein_id="ABR " /db_xref="GI: " /translation="MTHIRKSHPLFKIINDSFIDLPAPSNISSWWNFGSLLGICLAVQ ILTGLFLAMHYTSDTTTAFYSVTHICRDVNYGWILRYLHANGASMFFICLFMHVGRGI YYGSYLFTETWNIGIILLFAVMATAFMGYVLP" ORIGIN 1 atgacccaca tccgaaaatc ccacccctta ttcaaaatta tcaacgactc attcatcgac 61 ctaccagctc catcaaacat ttcctcctga tgaaattttg ggtccctact aggtatttgt 121 ttagctgtac aaatcttaac aggactgttc ctagcaatac attatacatc agataccaca 181 accgccttct actctgttac ccatatctgc cgagacgtaa attacggctg aatcctacgt 241 tacctccatg ccaacggagc atccatattc ttcatctgcc tatttataca tgtaggccga 301 ggcatctatt acggctcata cctattcaca gaaacatgaa acattggcat tatccttcta 361 ttcgccgtaa tagcaacagc attcataggc tatgtcctcc ca // KEYWORDS Pod kterými klíčovými slovy ji lze najít

LOCUS EF bp DNA linear MAM 15-OCT-2007 DEFINITION Rhinopoma hardwickei haplotype 2949 cytochrome b gene, partial cds; mitochondrial. ACCESSION EF VERSION EF GI: KEYWORDS. SOURCE mitochondrion Rhinopoma hardwickii (Lesser mouse-tailed bat) ORGANISM Rhinopoma hardwickii Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Laurasiatheria; Chiroptera; Microchiroptera; Rhinopomatidae; Rhinopoma. REFERENCE 1 (bases 1 to 402) AUTHORS Hulva,P., Horacek,I. and Benda,P. TITLE Molecules, morphometrics and new fossils provide an integrated view of the evolutionary history of Rhinopomatidae (Mammalia: Chiroptera) JOURNAL BMC Evol. Biol. 7, 165 (2007) PUBMED REMARK Publication Status: Online-Only REFERENCE 2 (bases 1 to 402) AUTHORS Hulva,P. TITLE Direct Submission JOURNAL Submitted (18-FEB-2007) Zoology, Charles University, Vinicna 7, Prague, , Czech Republic FEATURES Location/Qualifiers source /organism="Rhinopoma hardwickii" /organelle="mitochondrion" /mol_type="genomic DNA" /db_xref="taxon:124756" /haplotype="2949" CDS 1..>402 /codon_start=1 /transl_table=2 /product="cytochrome b" /protein_id="ABR " /db_xref="GI: " /translation="MTHIRKSHPLFKIINDSFIDLPAPSNISSWWNFGSLLGICLAVQ ILTGLFLAMHYTSDTTTAFYSVTHICRDVNYGWILRYLHANGASMFFICLFMHVGRGI YYGSYLFTETWNIGIILLFAVMATAFMGYVLP" ORIGIN 1 atgacccaca tccgaaaatc ccacccctta ttcaaaatta tcaacgactc attcatcgac 61 ctaccagctc catcaaacat ttcctcctga tgaaattttg ggtccctact aggtatttgt 121 ttagctgtac aaatcttaac aggactgttc ctagcaatac attatacatc agataccaca 181 accgccttct actctgttac ccatatctgc cgagacgtaa attacggctg aatcctacgt 241 tacctccatg ccaacggagc atccatattc ttcatctgcc tatttataca tgtaggccga 301 ggcatctatt acggctcata cctattcaca gaaacatgaa acattggcat tatccttcta 361 ttcgccgtaa tagcaacagc attcataggc tatgtcctcc ca // SOURCE Organismus + zařazení v systému

LOCUS EF bp DNA linear MAM 15-OCT-2007 DEFINITION Rhinopoma hardwickei haplotype 2949 cytochrome b gene, partial cds; mitochondrial. ACCESSION EF VERSION EF GI: KEYWORDS. SOURCE mitochondrion Rhinopoma hardwickii (Lesser mouse-tailed bat) ORGANISM Rhinopoma hardwickii Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Laurasiatheria; Chiroptera; Microchiroptera; Rhinopomatidae; Rhinopoma. REFERENCE 1 (bases 1 to 402) AUTHORS Hulva,P., Horacek,I. and Benda,P. TITLE Molecules, morphometrics and new fossils provide an integrated view of the evolutionary history of Rhinopomatidae (Mammalia: Chiroptera) JOURNAL BMC Evol. Biol. 7, 165 (2007) PUBMED REMARK Publication Status: Online-Only REFERENCE 2 (bases 1 to 402) AUTHORS Hulva,P. TITLE Direct Submission JOURNAL Submitted (18-FEB-2007) Zoology, Charles University, Vinicna 7, Prague, , Czech Republic FEATURES Location/Qualifiers source /organism="Rhinopoma hardwickii" /organelle="mitochondrion" /mol_type="genomic DNA" /db_xref="taxon:124756" /haplotype="2949" CDS 1..>402 /codon_start=1 /transl_table=2 /product="cytochrome b" /protein_id="ABR " /db_xref="GI: " /translation="MTHIRKSHPLFKIINDSFIDLPAPSNISSWWNFGSLLGICLAVQ ILTGLFLAMHYTSDTTTAFYSVTHICRDVNYGWILRYLHANGASMFFICLFMHVGRGI YYGSYLFTETWNIGIILLFAVMATAFMGYVLP" ORIGIN 1 atgacccaca tccgaaaatc ccacccctta ttcaaaatta tcaacgactc attcatcgac 61 ctaccagctc catcaaacat ttcctcctga tgaaattttg ggtccctact aggtatttgt 121 ttagctgtac aaatcttaac aggactgttc ctagcaatac attatacatc agataccaca 181 accgccttct actctgttac ccatatctgc cgagacgtaa attacggctg aatcctacgt 241 tacctccatg ccaacggagc atccatattc ttcatctgcc tatttataca tgtaggccga 301 ggcatctatt acggctcata cctattcaca gaaacatgaa acattggcat tatccttcta 361 ttcgccgtaa tagcaacagc attcataggc tatgtcctcc ca // REFERENCE Článek(y), kde byla daná sekvence publikována + autoři

LOCUS EF bp DNA linear MAM 15-OCT-2007 DEFINITION Rhinopoma hardwickei haplotype 2949 cytochrome b gene, partial cds; mitochondrial. ACCESSION EF VERSION EF GI: KEYWORDS. SOURCE mitochondrion Rhinopoma hardwickii (Lesser mouse-tailed bat) ORGANISM Rhinopoma hardwickii Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Laurasiatheria; Chiroptera; Microchiroptera; Rhinopomatidae; Rhinopoma. REFERENCE 1 (bases 1 to 402) AUTHORS Hulva,P., Horacek,I. and Benda,P. TITLE Molecules, morphometrics and new fossils provide an integrated view of the evolutionary history of Rhinopomatidae (Mammalia: Chiroptera) JOURNAL BMC Evol. Biol. 7, 165 (2007) PUBMED REMARK Publication Status: Online-Only REFERENCE 2 (bases 1 to 402) AUTHORS Hulva,P. TITLE Direct Submission JOURNAL Submitted (18-FEB-2007) Zoology, Charles University, Vinicna 7, Prague, , Czech Republic FEATURES Location/Qualifiers source /organism="Rhinopoma hardwickii" /organelle="mitochondrion" /mol_type="genomic DNA" /db_xref="taxon:124756" /haplotype="2949" CDS 1..>402 /codon_start=1 /transl_table=2 /product="cytochrome b" /protein_id="ABR " /db_xref="GI: " /translation="MTHIRKSHPLFKIINDSFIDLPAPSNISSWWNFGSLLGICLAVQ ILTGLFLAMHYTSDTTTAFYSVTHICRDVNYGWILRYLHANGASMFFICLFMHVGRGI YYGSYLFTETWNIGIILLFAVMATAFMGYVLP" ORIGIN 1 atgacccaca tccgaaaatc ccacccctta ttcaaaatta tcaacgactc attcatcgac 61 ctaccagctc catcaaacat ttcctcctga tgaaattttg ggtccctact aggtatttgt 121 ttagctgtac aaatcttaac aggactgttc ctagcaatac attatacatc agataccaca 181 accgccttct actctgttac ccatatctgc cgagacgtaa attacggctg aatcctacgt 241 tacctccatg ccaacggagc atccatattc ttcatctgcc tatttataca tgtaggccga 301 ggcatctatt acggctcata cctattcaca gaaacatgaa acattggcat tatccttcta 361 ttcgccgtaa tagcaacagc attcataggc tatgtcctcc ca // FEATURES Podrobný popis jednotlivých genů včetně jejich pozic – např. počátek a konec kódující sekvence, sekvence proteinu + XREFS Pozice genu v rámci sekvence

LOCUS EF bp DNA linear MAM 15-OCT-2007 DEFINITION Rhinopoma hardwickei haplotype 2949 cytochrome b gene, partial cds; mitochondrial. ACCESSION EF VERSION EF GI: KEYWORDS. SOURCE mitochondrion Rhinopoma hardwickii (Lesser mouse-tailed bat) ORGANISM Rhinopoma hardwickii Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Laurasiatheria; Chiroptera; Microchiroptera; Rhinopomatidae; Rhinopoma. REFERENCE 1 (bases 1 to 402) AUTHORS Hulva,P., Horacek,I. and Benda,P. TITLE Molecules, morphometrics and new fossils provide an integrated view of the evolutionary history of Rhinopomatidae (Mammalia: Chiroptera) JOURNAL BMC Evol. Biol. 7, 165 (2007) PUBMED REMARK Publication Status: Online-Only REFERENCE 2 (bases 1 to 402) AUTHORS Hulva,P. TITLE Direct Submission JOURNAL Submitted (18-FEB-2007) Zoology, Charles University, Vinicna 7, Prague, , Czech Republic FEATURES Location/Qualifiers source /organism="Rhinopoma hardwickii" /organelle="mitochondrion" /mol_type="genomic DNA" /db_xref="taxon:124756" /haplotype="2949" CDS 1..>402 /codon_start=1 /transl_table=2 /product="cytochrome b" /protein_id="ABR " /db_xref="GI: " /translation="MTHIRKSHPLFKIINDSFIDLPAPSNISSWWNFGSLLGICLAVQ ILTGLFLAMHYTSDTTTAFYSVTHICRDVNYGWILRYLHANGASMFFICLFMHVGRGI YYGSYLFTETWNIGIILLFAVMATAFMGYVLP" ORIGIN 1 atgacccaca tccgaaaatc ccacccctta ttcaaaatta tcaacgactc attcatcgac 61 ctaccagctc catcaaacat ttcctcctga tgaaattttg ggtccctact aggtatttgt 121 ttagctgtac aaatcttaac aggactgttc ctagcaatac attatacatc agataccaca 181 accgccttct actctgttac ccatatctgc cgagacgtaa attacggctg aatcctacgt 241 tacctccatg ccaacggagc atccatattc ttcatctgcc tatttataca tgtaggccga 301 ggcatctatt acggctcata cctattcaca gaaacatgaa acattggcat tatccttcta 361 ttcgccgtaa tagcaacagc attcataggc tatgtcctcc ca // ORIGIN Sekvence Konec sekvence

Příklad GenBank na stránkách NCBI – ve vyhledávání možnosti “Nucleotide” - GenBank + RefSeq Vyhledávání podle rodového názvu “Mammuthus” Velké množství záznamů – omezit výběr pouze na neredundantní databázi RefSeq Celý genom – použít webový formulář k výběru pouze sekvence cytochromu b (pozice v části SOURCE – CDS) Vyhledejte sekvence cytochromu b ze všech druhů mamutů, které byly osekvenovány (jaké druhy?) Exportujte protein-kódující část do FASTA formátu a uložte na počítač Postup:

Porovnání sekvencí: Alignment Porovnání/přiřazení dvou a více sekvencí Při alignmentu předpokládána homologie sekvencí Využívány různé typy algoritmů = různé předpoklady Sekvence se shodují Sekvence se liší Sekvence chybí

Pairwise Alignment (2 sekvence) –Globální (Needleman-Wunsch): Zhruba stejně dlouhé sekvence Snaží se přiřadit od začátku až do konce sekvence –Lokální (Smith-Waterman): Jen nejlépe shodující se místa obou sekvencí Sekvence různě dlouhé Např. BioEdit Typy alignmentů

Multiple Alignment –Více sekvencí –Hledá konzervativní místa –ClustalW, Muscle, T-coffee Např. BioEdit, sms2/index.html

Uchovávání alignmentů Podobně jako v případě sekvencí – v textových souborech ve specifickém formátu Různé formáty: nejčastěji formát programu ClustalW (.aln) lze také jako multiple FASTA Phylip (.phy), NEXUS (.nex) – odpoledne Nově SAM (Sequence Alignment/Map format) – velké celogenomové alignmenty

BLAST Basic Local Alignment Search Tool Vyhledávání v databázích sekvencí na základě podobnosti Algoritmus hledá lokální podobnosti Na rozdíl od klasického aligmentu velmi efektivní nástroj jak rychle vyhledávat ve velkých databázích (např. GenBank) Podobné nástroje: BLAT, FASTA

BLAST Základní BLAST – prohlédávání celé databáze pomocí nukleotidové sekvence Vyhledávání v jednotlivých referenčních genomech

BLAST Vložit sekvenci Zvolit “Others” Zvolit databázi, ve které chceme BLASTovat

Příklad 1 Vyhledejte sekvence nejpodobnější cytochromu b mamuta z tří jiných druhů Vytvořte multiple FASTA soubor Proveďte multiple alignment stažených sekvencích BLAST na NCBI – „nucleotide blast” option - “reference genomic sequences” databáze (nonredundantní genomické sekvence) Stáhnout protein-kódující sekvence cytochromu b Vytvořit v libovolném textovém editoru multiple FASTA soubor Provést multiple alignment (na EBI – na webu, BioEdit – na počítači) EBI ( – services – DNA & RNA – Clustal2W BioEdit – Accessory Applications – ClustalW Multiple Alignment Postup:

Příklad 2 Úloha ze života BLAST ke zjištění zdroje kontaminace – např. sekvenuji mamuty – nezdá se mi jedna se sekvencí Postup: Jedna ze dvou sekvencí na stránkách praktika BLAST - “nucleotide blast” option ???

Navržení primerů pro PCR Maskování repeatů Design primerů In Silico PCR (e-PCR)

Maskování repeatů: RepeatMasker Umožní vyhledat a „zakrýt“ oblasti, které jsou v genomu ve větším počtu (mikrosatelity, retrotranspozony a transpozony) Umožní nám to při navrhování primerů se vyvarovat nespecifickým amplifikacím při PCR Pouze ale organismy, které jsou buď již osekvenovány anebo jsou jim blízce příbuzné (retrotransposony a transposony) X mikrosatelity lze maskovat u jakýchkoliv organismů

Zamaskovaná sekvence Pomocí N nebo použitím malých písmen (většina programů určených pro analýzu sekvencí s nimi umí pracovat) >MusY.1 ACACTTTTTCTTTTGCATAATGCTGTGTGGAGATTTTGCAGACAGCATTG CTGTAAAATGCAGAGTAATTTCTGTAATGAGCTTGTGAAATATTGACTAT TATGGCCCTCTCTAAGCATGGCTTTAATTATATTCTAGCACAGCAGCTTC TCTGGGGATACTCAGGTCAGATCACTGACTGAATGTTGTGTTCATTTGAA ACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNGTCATTTGTTGGTGTGCTGAATTCTGTTTTGTTTTGCTTTTAACCTAA CTAGCTAGAAATTCTGTCAATCTTTTTTCCTTCCTAGAAAGANNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNGAAACACAGGCTTT

RepeatMasker

Vložit nukleotidovou sekvenci Vybrat organismus

RepeatMasker Výstup analýzy RepeatMaskeru

RepeatMasker Výstup analýzy RepeatMaskeru

Design primerů: Primer3, Primer3Plus TCCGAAAATCCCACCAATTATCAACGACTCATTC F R

TGCG{CGCTAAGA AA[CACACACACA]CGGAATTAGGGAAC}TT Included RegionTargetExcluded Region

Maskování repeatů Koncentrace Mg2+ Koncentrace dNTPs Rozestup primerů => délka amplifikované oblasti

Elektronická PCR (e-PCR) Vezme dvojici primerů a zkouší, zda-li by PCR ve známém genomu amplifikovala pouze námi požadovanou oblast nebo i jiné oblasti Server UCSC ( Lze i na NCBI

e-PCR

Organismus Assembly F a R primery

Příklad Sekvence mikrosatelitů z myšího Y chromosomu na stránkách praktik (vytvořte multiple FASTA) Zamaskujte mikrosatelity pomocí RepeatMaskeru Navrhněte kolem nich primery v Primer3 Zjistěte, které z těchto primerů jsou dále použitelné pomocí e-PCR

Celogenomová data Pozice genů v genomu – koordinátový systém Verze assembly Práce s genomovými prohlížeči –1 gen –>1 genů (Biomart)

Pozice genů v genomu Genomický koordinátový systém – založený na fyzické pozici nukleotidů v rámci většího celku (např. kontigu, chromozomu) Tvoří pak tzv. fyzickou mapu (v base pairs: bp) –např. u myši je začátek chromozomu na centromeře (pozice 1) –např. gen SRY chrY:1,918,381-1,919,568 (přibližná pozice pak 1.9 Mb) Jiné mapy: cytogenetická mapa, genetická mapa (cM)

Assembly Verze koordinátového systému Počáteční verze genomu postrádají hůře sekvenovatelné oblasti – jsou zaplněny Nky, ale postupně dochází k neustálému zpřesňování genomické sekvence = zpřesňování fyzické mapy Rozdíl ve fyzikální pozici genů mezi různými assembly (až několik Mb) Adh5 (Alcohol dehydrogenase 5) chr3: 138,443, ,455,499chr3:138,106, ,118,463 GRCm38 NCBIM37

Genomové prohlížeče Ensembl, UCSC, NCBI Nejvíce user-friendly asi Ensembl... VERZE

Příklad Najděte tyto informace o genu Adh5 v myším genomu: Počet transkriptů, typ transkriptu? Kolik exonů má kanonický transkript? Jaká proteinová rodina (ID)? Kolik druhů dostupných na Ensembl má alespoň jeden ortholog tohoto genu? Ve kterém taxonu dostupném na Ensembl je největší počet homologů tohoto genu? Získejte protein-kódující sekvence genu (vždy kanonický transkript) pro všechny hlodavce na Ensemblu, exportujte je do FASTA formátu, proveďte alignment

BioMart Při práci s více geny – efektivní získávání dat Pracuje na principu filtru – lze nastavit parametry výběru tzn. filtrovat na základě: –pozice v genomu –ID genů (konverze ID z různých databází) –genové rodiny –orthology –paralogy –... Výstup lze uložit jako.txt,.csv nebo.xls soubor

BioMart (Ensembl)

Dababáze Dataset = organismus Verze se aktualizuje každé cca 2-3 měsíce Důležité: pamatovat si verzi se kterou pracuji!!!

Parametry výběru: kritéria definující set genů Požadovaná data ve výstupu Propojení s daty z jiných organismů (pokročilé)

Kritéria výběru: pozice v genomu

Výběr atributů ve výstupu

Seznámení s BioMartem Na základě jakých všech kritérií je možné filtrovat? Jaká data lze na BioMartu získat – možnosti atributů?

Příklad 1 Oblast na chromosomu 11 (23 – 25 Mb) byla asociována s reprodukční izolací mezi dvěma druhy myši domácí. Cílem je získat seznam protein-kódujících genů v této oblasti a vybrat kandidáty pro další výzkum (předpoklad: rychle se vyvíjející se geny mají větší pravděpodobnost být zodpověné za vznik reprodukční bariéry). Postup: –Získejte seznam genů včetně jména a popisu spolu s pozicí v genomu, orthologů u potkana a informace o rychlosti molekulární evoluce mezi potkanem a myší z oblasti chr11: –Exportujte data do excelové tabulky seřaďte geny nejvíce kandidátních po nejméně kandidátní, určete kandidáty

Příklad 2 Získejte protein-kódující sekvence všech genů z rodiny tzv. hlavních močových proteinů (Major Urinary Proteins) v genomu myši a proveďte multiple alignment Postup: –Získejte ID rodiny MUPs –Použijte BioMart k získání protein-kódujících sekvencí MUPů a exportujte je do FASTA souboru