Počítačová část 1. Databáze na internetu: (Databáze, navržení primerů) 2. Fylogenetická analýza.

Slides:



Advertisements
Podobné prezentace
PrecisPlanner 3D Software pro plánování přesnosti měření v IG
Advertisements

Genetika eukaryotní buňky
Mgr. Vlastislav Kučera přednáška č. 2.  Struktura stránky  hlavička  meta tagy  titulek stránky  připojení stylů,...  CSS.
Jazyk HTML Název školyZákladní škola a Mateřská škola Tatenice Číslo projektuCZ Název šablony klíčové aktivity Inovace a zkvalitnění výuky pomocí.
Studium lidského genomu
B130P16: Praktické základy vědecké práce Katedra experimentální biologie rostlin PřF UK SciVerse - plnotextové vyhledávání.
B130P16: Praktické základy vědecké práce Katedra experimentální biologie rostlin PřF UK Jak připojit přenosný počítač do.
Poznámky identifikaci SNP
Programování v C++ Cvičení.
Praktikum základů genomiky, zima 2007 Základy genomiky I. Úvod do bioinformatiky Jan Hejátko Masarykova univerzita, Laboratoř funkční genomiky a proteomiky.
Informace – vyhledávání informací
Informatika Internet.
WWW stránky – Struktura, adresování, hosting Mgr. Lenka Švancarová.
IVIG 2005 Informační vzdělávání a informační gramotnost v teorii a praxi vzdělávacích institucí Projekt online systému podpory informačního vzděláván v.
Určení rodičů (analýza paternity)
Počítačová část 1. Databáze na internetu: (Databáze, navržení primerů) 2. Fylogenetická analýza.
Studijní informační zdroje (a jak se k nim dostat) Pro předmět Jazykový projev (2014/15) připravila Eva Cerniňáková Jabok - Vyšší odborná škola sociálně.
Fakulta elektrotechniky a informatiky
Projekt HUGO – milníky - I
Genetické metody v zoologii
Stránky praktika (
Filtrace web stránek s využitím profilu uživatele Petr Doskočil
Počítačová část 1. seznámení s on-line databázemi, nástroji a softwarem (databáze, vyhledání sekvencí, základní manipulace se sekvencemi, navržení primerů)
URL v HTML URL - Unique Resource Locator Příklad:
B130P16: Praktické základy vědecké práce Katedra experimentální biologie rostlin PřF UK iHOP - plnotextové vyhledávání Pubmed.
2 Petr Žitný znalosti.vema.cz 3 Báze znalostí Nová služba zákazníkům ▸Báze naplněná informacemi, ke které mají uživatelé přímý přístup Základní cíl ▸Poskytovat.
Pathfinding s využitím PostGIS Prezentuje : Jan Kolář.
Jednotná informační brána Cyklus školení Elektronické informační zdroje a databáze Národní knihovna ČR , , , ,
Dana Sigmundová Metalib aneb jak vyhledávat (skoro) ve všech (multi)oborových databázích současně? ÚK FSS MU, Ústřední knihovna FSS MU.
Dana Mazancová Metalib aneb jak vyhledávat (skoro) ve všech (multi)oborových databázích současně? ÚK FSS MU, 8. a Ústřední knihovna FSS MU.
Databáze velké množství dat pevně dané struktury
Klikací mapy v GIMPu Tvorba tzv. klikacích (obrázkových) map s pomocí grafického editoru GIMP Dostupné z Metodického portálu ISSN: ,
Sekvenování.
BLAST (basic local alignment search tool) Vyhledává podobné sekvence v databázích. Stal se nástrojem pro všechno. Určitou dobu kolektiv autorů držel krok.
GENETICKÁ A FENOTYPOVÁ
INTERNET VE VZDĚLÁVÁNÍ
Podnikání na Internetu internet - zdroj informací Letní semestr 2005 Jana Holá III.
Vypracovala: Mgr. Hana Toflová Dne: ICT2/1/3/18.
DATABÁZE N á zev š kolyZ á kladn í š kola a Mateřsk á š kola Tatenice Č í slo projektuCZ N á zev š ablony kl í čov é aktivity Inovace a zkvalitněn.
1. lekce SM 315 Statistika v SAS a víceúrovňové lineární modely.
Informační zdroje pro molekulární biologii M. Jurajda.
Bioinformatika Radka Storchová.
Fyziologie reprodukce a základy dědičnosti FSS 2009 zimní semestr D. Brančíková.
Molekulárně biologické databáze
Molekulárně biologické databáze Pro zajímavost, nebude součástí zkoušky… Důležité, pravděpodobně bude u zkoušky…
SEKVENCE A:MASAQSFYLL SEKVENCE B:MASGQWLLAS Které oblasti A a B jsou si nejvíce podobné ? Jsou si A a B víc podobné než A a C ? Která ze sekvencí X1,...,Xn.
Bioinformatika pro PfUK 2002
„AFLP, amplified fragment length polymorphism“
filtrování a řazení dat, podmíněné formátování,
Praktikum z genetiky rostlin JS Genetické mapování mutace lycopodioformis Arabidopsis thaliana Genetické mapování genu odolnosti k padlí.
Jak fungují webové stránky Úvod do HTML (1). Projekt: CZ.1.07/1.5.00/ OAJL - inovace výuky Příjemce: Obchodní akademie, odborná škola a praktická.
Číslo projektu CZ.1.07/1.5.00/ Kódování materiálu vy_32_INOVACE_inf3_web01 Označení materiálu web01_uvod.pptx Název školy Gymnázium Kladno Autor.
Obchodní akademie a Jazyková škola s právem státní jazykové zkoušky Jihlava Šablona 32 VY_32_INOVACE_034.ICT.34 Tvorba webových stránek – PHP technologie.
Vyhledávání na Internetu. Webové vyhledávače Webový vyhledávač je služba, která umožňuje na Internetu najít webové stránky, které obsahují požadované.
WWW a HTML Základní pojmy Ivo Peterka.
Internet – pojmy, služby
Vyhledávání v Internetu
Nepřímá DNA diagnostika
Výpočetní technika VY_32_INOVACE_17_16_internetový vyhledávač.
Molekulárně-biologické databáze
WWW a HTML Základní pojmy Ivo Peterka.
NÁZEV ŠKOLY: ČÍSLO PROJEKTU: NÁZEV MATERIÁLU: TÉMA SADY: ROČNÍK:
Molekulárně biologické databáze
Ústřední knihovna FSS MU
Fylogenetická evoluční analýza
Studium lidského genomu
MiRNA
HASH.
SIPVZ – úvodní modul P ICT a změny ve výuce (2 h) metodické poznámky.
Informatika Internet.
Transkript prezentace:

Počítačová část 1. Databáze na internetu: (Databáze, navržení primerů) 2. Fylogenetická analýza

Kde se dozvědět více? Kurz Computational Genomics (Marc VanRanst) Bioinformatics bookmarks ( Úvod do bioinformatiky/Základy bioinformatiky (F. Cvrčková) Molekulární ekologie (letní semestr, populační genetika, analýza paternity)

Kde najdu adresy stránek z tohoto praktika? (

DATABÁZE Primární databáze DNA sekvencí GenBank (Amerika) EMBL (Evropa) DDBJ (Japonsko) Databáze genů Entrez Gene RefSeq Databáze genových expresních dat UniGene GEO Databáze genomů NCBI Ensembl UCSC Genome Browser Důležité odkazy PROGRAMY BLAST Na stránkách NCBI, Ensembl BLAT Na stránkách USCS Primer3 – navrhování primerů In Silico PCR RepeatMasker NCBI - tam najdu skoro vše: GenBank, Entrez Gene, UniGene, MapViewer, BLAST… ENSEMBL - Genome Browser, BLAST USCS – Genome Browser, BLAT, In Silico PCR

Formáty sekvencí Fasta GenBank NEXUS Phylip

FASTA >gi|gi-number|gb|accession|locus – description GATCCTCCATATACAACGGTATCTCCACCTCAGGTTTAGATCTCAAC AACGGAACCATTGCCGACATGAGACAGTTAGGTATCGTCGAGAGTT ACAAGCTAAAACGAGCAGTAGTCAGCTCTGCATCTGAAGCCGCTGA AGTTCTACTAAGGGTGGATAACATCATCCGTGCAAGACCAAGAACC GCCAATAGACAACATATGTAACATATTTAGGATATACCTCGAAAAT AATAAACCGCCACACTGTCATTATTATAATTAGAAACAGAACGCAA AAATTATCCACTATATAATTCAAAGACGCGAAAAAAAAAGAACAA CGCGTCATAGAACTTTTGGCAATTCGCGTCACAAATAAATTTTGGC AACTTATGTTTCCTCTTCGAGCAGTACTCGAGCCCTGTCTCAAGAAT GTAATAATACCCATCGTAGGTATGGTTAAAGATAGCATCTCCACAA CCTCAAAGCTCCTTGCCGAGAGTCGCCCTCCTTTGTCGAGTAATTTT CACTTTTCATATGAGAACTTATTTTCTTATTCTTTACTCTCACATCCT GTAG

GenBank Obsahuje velmi podrobnou informaci o sekvenci: Locus Základní vlastnosti sekvence (název, délka, typ) Definition Výpis genů v sekvenci Accession Databázové přístupové číslo Version Verze dané sekvence Keywords Pod kterými klíčovými slovy ji lze najít Source organism Zařazení v systému Reference Článek, kde byla daná sekvence publikována Features Podrobný popis jednotlivých genů včetně jejich pozic Origin Sekvence

Sekvence v genetické bance Jsou známy nějaké sekvence mamuta (nejlépe cytochrom b)? Z jakého druhu mamuta jsou známé sekvence? Sekvence si chci stáhnout a porovnat Využijeme : 1. genetickou banku na stránkách NCBI (National Centre for Biotechnology Information ) 2. EMBL-EBI tools nebo volně dostupný program BioEdit

Alignment Přiřazení dvou i více sekvencí Sekvence si navzájem odpovídají Sekvence se liší Sekvence chybí

Pairwise Alignment (2 sekvence) –Globální: Zhruba stejně dlouhé sekvence Snaží se přiřadit od začátku až do konce sekvence –Lokální: Jen nejlépe shodující se místa obou sekvencí Sekvence různě dlouhé Např. BioEdit

Multiple Alignment –Více sekvencí –Hledá konzervativní místa –ClustalW Např. BioEdit, sms2/index.html

Příklad Zkuste provést alignment stažených sekvencí mamutů V programu BioEdit lze použít možnost: Accessory Applications – ClustalW Multiple Alignment

Čemu je tato sekvence podobná? BLAST B asic L ocal A lignment S earch T ool =========================================== Hledá lokální (částečné) podobnosti Na rozdíl od klasického alignmentu, umožňuje velmi rychle a efektivně prohledávat velké databáze

Úloha Vyhledejte sekvence nejpodobnější cytochromu b mamuta Použijeme BLAST na stránkách NCBI -

BLAST - Úloha ze života Sekvenuji mamuty Jedna ze sekvencí se mi nějak nezdá ctagccatgc actactcacc agacgcctca accgcctttt catcaatcgc ccacatcact cgagacgtaa attatggctg aatcatccgc taccttcacg ccaatggcgc ctcaatattc tttatctgcc tcttcctaca catcgggcga ggcctatatt acggatcatt tctctactca gaaacctgaa acatcggcat tatcctcctg cttgcaacta tagcaacagc cttcataggc tatgtcctcc cgtgaggaca aatatcattc tga V laboratoři se pracuje i s jinými zvířaty Chci zjistit, kdo mi zkontaminoval vzorky

Navržení vlastních primerů pro PCR

RepeatMasker Umožní vyhledat a „zakrýt“ oblasti, které jsou v genomu ve větším počtu (mikrosatelity, retrotranspozony a transpozony) Umožní nám to při navrhování primerů se vyvarovat nespecifickým amplifikacím při PCR Pouze ale organismy, které jsou již osekvenovány

Zamaskovaná sekvence Pomocí N nebo použitím malých písmen (většina programů určených pro analýzu sekvencí s nimi umí pracovat) >MusY.1 ACACTTTTTCTTTTGCATAATGCTGTGTGGAGATTTTGCAGACAGCATTGCTGTA AAATGCAGAGTAATTTCTGTAATGAGCTTGTGAAATATTGACTATTATGGCCCTCT CTAAGCATGGCTTTAATTATATTCTAGCACAGCAGCTTCTCTGGGGATACTCAGGT CAGATCACTGACTGAATGTTGTGTTCATTTGAAACNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCATTTGTTGGTGTGCTGA ATTCTGTTTTGTTTTGCTTTTAACCTAACTAGCTAGAAATTCTGTCAATCTTTTTTC CTTCCTAGAAAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGAAACACAGGCTTT

Primer3, Primer3Plus

TGCG{CGCTAAGA AA[CACACACACA]CGGAATTAGGGAAC}TT Included RegionTargetExcluded Region

Maskování repeatů Koncentrace Mg2+ Koncentrace dNTPs Rozestup primerů => délka amplifikované oblasti

Elektronická PCR Vezme dvojici primerů a zkouší, zda-li by PCR ve známém genomu amplifikovala pouze námi požadovanou oblast nebo i jiné oblasti Server UCSC ( Lze i na NCBI

Úloha: Zjistěte zda-li se nachází v sekvencích mikrosatelity Zamaskujte je pomocí Repeatmaskeru Navrhněte kolem nich primery v Primer3 Zjistěte, které z těchto primerů jsou dále použitelné pomocí e-PCR

Samostatná úloha Stáhnout sekvenci cytochromu b alky velké (Pinguinus impennis), tak aby před začátkem i koncem sekvence cyt b byly dostatečně dlouhé oblasti na navrhnutí primerů Navrhnout primery na vybranou část sekvence Vyhledat podobné sekvence přes BLAST nebo prověřit příbuzné druhy Udělat alignment sekvencí sekvencí cytochromu b

Celogenomová data Několik serverů skladujících celogenomická data:

Celogenomová data

Pozice genů v genomu Cytogenetická mapa (podle proužkování) Genetická mapa (cM) Fyzická mapa (bp, Mb) –pozice na chromosomu podle párů bazí –začátek chromosomu na centromeře – posice 1 (myš) –např. gen SRY chrY:1,918,381-1,919,568

Prohlížeče: Ensembl

BioMart (Ensembl) Efektivní získávání dat z celogenomových databází Pracuje na principu filtru – lze nastavit parametry výběru Výstup lze uložit jako.txt,.csv nebo.xls soubor

BioMart (Ensembl)

Výběr kritérií Požadovaná data ve výstupu Propojení s daty z jiných organismů (pokročilé)

BioMart: Příklad 1 Pomocí laboratorního křížení se podařilo identifikovat oblast na chromosomu 17 (15 – 20 Mb) zodpovědnou za poruchu meiósy během spermatogenese. Najděte některé kandidátní gen. Postup – použít filtr: –„Region“: chr7: –„Gene Ontology“: „meiosis“

BioMart: Příklad 1 Kritéria výběru Co ve výstupu

BioMart: Příklad 2 Připravte multiple alignment sekvencí myších proteinů z rodiny tzv. Major Urinary Proteins (MUPs).

BioMart: Příklad 2 Postup: –ID rodiny MUPs (na Ensemblu) –BioMart: Filtr => „Protein Domains“ => výběr rodiny (zadat ID rodiny) Výstup => „Sequences“ => „Protein“ => „Results“ –Multiple Alignment (ClustalW – nejlépe EBI)

BioMart: Příklad 3 Koncová část chromosomu 1 ( Mb) v lidském genomu byla asociována s velikostí mozku. Najděte kandidátní gen (předpoklad: gen ležící v této oblasti byl klíčový v evoluci člověka a sekvence tedy prošla velmi rychlou evolucí).