Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Bioinformatika pro PfUK 2002

Podobné prezentace


Prezentace na téma: "Bioinformatika pro PfUK 2002"— Transkript prezentace:

1 Bioinformatika pro PfUK 2002
Jiří Vondrášek Ústav organické chemie a biochemie Jan Pačes Ústav molekulární genetiky Úvodní stránka

2 syllabus L1 Úvod do bioinformatiky 7. říjen 2001
L2 Biologické databáze (Jan Pačes) 11. říjen L3 Alignment I (Jan Pačes) 21. říjen L4 Alignment II (Jan Pačes) 4. listopad L5 Predikce genů, fylogenetická analýza (Jan Pačes) 11. listopad L6 Vlastnosti proteinů (Jiří Vondrášek) L7 3D struktury, strukturní alignment (Jiří Vondrášek) L8 Sekundární motivy a jejich predikce (Jiří Vondrášek) L9 Protein folding (Jiří Vondrášek) L10 Molekulárni docking, drug design (Jiří Vondrášek) L11 Statistický aparát bioinformatiky

3 bioinformatika Informatika nad biologickými molekulami (daty).
Bioinformatika extrahuje molekulární informační systém pro molekulární biologii. Bioinformatika je konceptualizovaná molekulární biologie (ve smyslu fyzikálně chemickém) na níž je aplikována informatika (odvozená od matematické informatiky a statistiky). Aplikace: teorie biotechnologie farmacie medicína genetické inženýrství

4 bioinformatika sekvence geny kontigy funkce metabolismus (vše) struktura strukturovaná data (databáze), hypotézy experimentální data počítačová analýza

5 velikosti genomů Mycoplasma genitalium 0.58 Mbp
Escherichia coli 4.6 Mbp Saccharomyces cerevisiae 16 chr Mbp Arabidopsis thaliana 5 chr Mbp Drosophila melanogaster 5 chr. ~137.0 Mbp Homo sapiens 24 chr. ~ 3.3 Gbp

6 centrální dogma molekulární genetiky
DNA RNA protein transkripce translace replikace reverzní transkripce informace funkce

7 DNA evoluční vztahy mezi geny a organizmy funkce geny struktura proteiny

8 sekvence

9 sekvence >jana (4797 nt)
GAATTCGCCGCGGGGCTGCGCATCACCGATGCCGCCACCATCGAGATCGTCGAGATGGTACTGGCCGGCTCGATCAACAAGCAGCTCGTCGGCTACATCA ACGAAGCGGGCGGCAAGGCCGTCGGCCTGTGCGGCAAGGACGGCAACATGGTGTCCGCCACCAAGGCGACGCGCACCATGGTCGATCCGGATTCGCGGAT CGAAGAGGTGATCGACCTCGGTTTCGTCGGCGAGCCGGAGAAGGTCGACCTCACCCTGCTCAACCAGCTGATCGGCCACGAGTTGATCCCGGTGCTGGCG CCGCTGGCGACCTCCGCGTCGGGCCAGACCTTCAACGTCAATGCCGACACCTTTGCAGGTGCGGTTGCCGGTGCGCTGCGGGCCAAGCGCCTGCTGCTGC TGACCGACGTGCCGGGCGTGCTCGACCAGAACAAGAAGCTGATCCCCGAACTGTCGATCAAGGATGCCCGCAAGCTGATCGCAGACGGCACCATCTCGGG CGGCATGATCCCCAAGGTCGAGACCTGCATCTACGCGCTCGAACAGGGCGTCGAAGGCGTCGTCATCCTCGACGGCAAGGTCCCGCACGCAGTGCTGCTC GAATTGTTCACCAACCAGGGCACCGGCACGCTGATCCACAAGTGATGCGAGGCTGCGGCGACAACATCCGTCATGGCCGGGCTCGTCCCGGCCATCCACG TCTTTCCGGCGGTTTTCTCAGCAAGACGTGGATGCCCGGCACAAGGCCGGGCATGACGGGGTGGAGATCGCGCGCCCTCGCCGCCATTGTCACCACCCTC GCCCTCACCTCCGCCGCCCACGCCGACCTCAAGCTCTGCAACCGCATGAGCTACGTGGTCGAGACGGCGATCGGGGTCGATTCCAACGGCACCACCGCCT CGCGCGGATGGCTGCGGATTGATCCGGCGCAATGCCGGGTCGTGGTGCAAGGCGCGCTCAACGCCGACCGCATCATGCTGAATGCCCGCGCGCTGGCGGT GTACGGCGTCTCGCCGCTGCCGCAGAACGGCACTGACCGGCTGTGCATTGCCGAAGACAATTTCGTCATCGCCGCCGCGCGGCAATGCCGCGGCGGCCAA ACGCTCGCCGCCTTCACCGAGATCAAGCCCACCGACACCGAGGACGGCAACAAGATCGCTTATCTGGCGGAAGACTCCGGCTACGACGACGAACAGGCCA AACTCGCCGCGATCCAGCGGCTGCTGGTGATCGCCGGTTACGACGCCTCGCCGATCGACGGCGTCGACGGCCCGAAGACGCAGGCCGCGCTGTCCGCCTT CCTCAAGAGCCGAGGCCTGAAGCCCGAGATCGTCGATGCGCCGGATTTCTTCGACGTGATGATCAAGGCAGTGCAGCAGCCGTCCGGCAGCGGGCTGACC TGGTGCAACGACACCAAGTACAAGATCATGGCGGCCGTCGGCGAAGACGACGGCAAGACTGTCACCAGCCGCGGCTGGTACGGTGTTGCGCCCGGCCAAT GCCTGCGCCCCGACCTCGGCGCACAGCCGAAGCGGGTGTTCAGCTTCGCCGAAGCGGTCGACGGCAGCGGCAGGCCGGTGACCATCAAGGGCCGTGCGCT GAACTGGGGCGGCGGCGTGACGCTGTGCACGCGTGACAGCAAGTTCGAGATCGGCGAGCAAGGCGATTGCGCGGCGCGCGGCCTCGCCGCCACCGGCTTC GCCGCCGTCGATCTCAGTAGCGGCAAGACATTGAGGTTGTCCGCCCCATGATGCAGCTCGGCAAACGCGGCTTCGATCACGTCGAGACCTGGGTGTTCGA TCTCGACAACACGCTGTACCCGCATCACCTCAACCTATGGCAGCAGGTCGATGCGCGGATCCGCGACTTCGTCGCCGACTGGCTGAAGGTTTCGCCGGAA GAAGCCTTCCGTATCCAGAAGGATTACTACAAGCGCTACGGCACCACGATGCGCGGGATGATGACCGAGCACGGCGTTCACGCCGACGACTACCTGGCTT ATGTCCACGCCATCGACCATTCGCCGCTGCAGCCGAATCCGGCGATGGGCGATGCGATCGAGCGACTGCCGGGCCGCAAGCTGATCCTGACCAACGGCTC GACCGCCCATGCGGGCAAGGTGCTGGAGCGGCTCGGCATCGGCCATCATTTCGAGGCGGTGTTCGACATCATTGCGGCCGACCTCGAGCCGAAGCCGGCG CCGCAGACCTACCGCCGTTTTCTCGATCGCCATGGTGTCGACCCGGCCCGCGCCGCGATGTTCGAAGACCTCGCCCGCAACCTCACCGTGCCGCACCAGC TCGGCATGACCACCGTGCTGGTGGTGCCTGACGATAGCCAGGACGTGGTCCGCGAAGATTGGGAGCTTGAAGGCCGCGACGCCGCCCACGTCGATCACGT GACTGATGATTTGACAGGGTTCTTGGGGAAGCTGAGTTCGCTGTAGGCCGGGGACGCCTCCCAAGCGTCAATCGTCATCGCCGCCGGATGCAAGGCGGCT AGGTATTGCGGAGCGCTCGCGATCTTCCGTCCAATGCCCTGGGATACTGGATCGCCCGGACGAGCCGGGCGACGACGTTGAAGAGAGATGACGTGGCGTC ACCACATCCCCCGCCGTCATCGCCCGCGCAGGCGGGCGATGACTTGGCGGACGGGGCGGCGCCTTGACTCCGACCCGGCGAATCCGGACAACACTCCGCA AAACTCTCCCTGAAATCAGCCTCCCAAGGACCCGTCGATGCCGCTCACCGCCCTGGAATCTACCATCAACGCCGCTTTCGACGCGCGCGACACCGTTACC GCGGCGACGCAGGGCGAGATTCGTCAGGCCGTCGAGGATGCGCTCGATCTGCTCGACCAGGGCAAGGTGCGGGTGGCGCGGCGCGACGACTCCGGCGCCT GGACGGTCAATCAGTGGCTGAAGAAAGCAGTGCTGCTGTCGTTCCGGCTCAACGACATGGGCGTGATCGCCGGCGGCCCGGGCGGCGCCAACTGGTGGGA CAAGGTGCCGTCGAAGTTCGAGGGCTGGGGTGAGAACCGCTTCCGCGAGGCCGGCTTCCGCGCCGTGCCGGGCCGATCGTCGCGCGTCGGCCTTTATCGC CAAGACGCGGTACTGATCCGTCCTTCGTCAATCTCGGCGCTTACGTCGATGAAAGCACCATGGTCGAACACCTGGGCGACCGTCGGCTCCTGCGCCCAGA TCGGCAAGCGCGTGCACATCTCCGGCGGTGCCGGCATCGGCGGCGTGCTCGAGCCGCTGCAGGCCGGCCCGGTGATCATCGAGGACGACTGCTTCATCGG CGCCCGCTCCGAAGTCGCCGAAGGCGTGATCGTGCGCAAGGGTGCGGTGCTGGCGATGGGCGTTTTCCTCGGCGCCTCGACCAAGATCGTCGACCGCGAG ACCGGCGAAATCTTCGTCGGCGAAGTGCCGGAATATGCCGTGCTGGTGCCCGGCACCCTGCCCGGCAAGCCGATGAAGAACGGCGCCCCCGGCCCAGCCA CCGCCTGCGCGGTGATCGTCAAGCGCGTCGACGAGCGCACCCGTTCCAAGACCTCGATCAACGAATTGCTGCGGGACTGACACCTGTAGGAGGCGCGAAT GGACTGGACCACGCTGTTCTTCAGCTTTCGAGGTCGGATCAATCGCGCCAAATACTGGCTGGTCGGACTGATCTACGTCGCCGCCTGGATGG ….

10 všeobecná analýza Co lze v DNA najít? strukturní a organizační elementy evoluční vztahy geny promotory a další řídící elementy „cizí“ DNA

11 všeobecná analýza Rhodobacter capsulatus, GC profil

12 všeobecná analýza Homo sapiens, chromozóm 21, GC profil

13 všeobecná analýza Evoluční strom pTR5 rodiny lidských endogenních retrovirů

14 geny Jak najít geny?

15 geny Leucin Rhodobacter capsulatus antikodón počet % CUA <1 CUC CUG CUU UUA UUG Escherichia coli % 4 9 52 10 11 13

16 geny

17 geny Homo sapiens, chromozóm 21, predikce genů Sanger Ch21 (in Nature) cDNA GENESCAN EXOFISH

18 Jaké proteiny geny kódují?
alignment Jaké proteiny geny kódují?

19 alignment 1:1 1:n n:n n Dot plot Dot plot SSEARCH BLITZ
SSEARCH ftp://ftp.virginia.edu/pub/fasta BLITZ ... 1:n FASTA BLAST n:n PSI-BLAST HMMER ClustalW MultAlign n

20 alignment 1:1 1:n n:n n Dot plot SSEARCH BLITZ
FASTA BLAST FASTA BLAST n:n PSI-BLAST HMMER ClustalW MultAlign n

21 alignment 1:1 1:n n:n n Dot plot SSEARCH BLITZ FASTA BLAST PSI-BLAST
HMMER PSI-BLAST HMMER ClustalW MultAlign ClustalW MultAlign n

22 Jakou mají geny v buňce funkci?
funkce Jakou mají geny v buňce funkci?

23 ja1 ACETYLGLUTAMATE KINASE EC 2.7.2.8 ja2 ja3
funkce ja5 ja1 ja4 ja6 ja1 ja2 ja3 ja4 ja5 ja6 ja1 ACETYLGLUTAMATE KINASE EC ja2 ja3 ja4 TETRAHYDRODIPICOLINATE EC N-SUCCINYLTRANSFERASE ja5 ja6 SUCCINYL-DIAMINOPIMELATE EC DESUCCINYLASE

24 funkce

25 Bioinformatika Rhodopseudomonas palustris
může syntetizovat aminokyselinu lysine biochemickou dráhou přes enzym EC Bioinformatika


Stáhnout ppt "Bioinformatika pro PfUK 2002"

Podobné prezentace


Reklamy Google