Bioinformatika Jiří Vondrášek Jan Pačes

Slides:



Advertisements
Podobné prezentace
Aminokyseliny.
Advertisements

Výukový matriál byl zpracován v rámci projektu OPVK 1.5 EU peníze školám registrační číslo projektu:CZ.1.07/1.5.00/ Autor:Mgr. Daniela Hasníková.
Praktikum základů genomiky, zima 2007 Základy genomiky I. Úvod do bioinformatiky Jan Hejátko Masarykova univerzita, Laboratoř funkční genomiky a proteomiky.
1 Vyhledávání Principy vyhledávání Klasifikace klíče:  Interní klíč – je součástí prohlížených záznamů  Externí klíč – není jeho součástí, je jím např.
GYMNÁZIUM, VLAŠIM, TYLOVA 271
Počítačová grafika III – Sekvence s nízkou diskrepancí a metody quasi-Monte Carlo Jaroslav Křivánek, MFF UK
What is Bioinformatics?---The Tight Definition "Classical" bioinformatics Fredj Tekaia at the Institut Pasteur offers this definition of bioinformatics:
Aminokyseliny.
Výukový matriál byl zpracován v rámci projektu OPVK 1.5 EU peníze školám registrační číslo projektu:CZ.1.07/1.5.00/ Autor:Mgr. Daniela Hasníková.
1 © 2004, Cisco Systems, Inc. All rights reserved. CCNA 2 v3.1 Module 3 Configuring a Router.
Nová metoda pro generování 2D farmakoforového modelu David Hoksza 1,2, Daniel Svozil 2 SIRET Research Group MFF UK Laboratoř informatiky a chemie FCHT.
Grafické zobrazení příkladu RETURN MANAGEMENT J.Skorkovský KPH.
By Dagmar Machů Škola: SOU Val. Klobouky Ročník: třetí Obor: Kuchař/číšník Název projektu: Zkvalitnění výuky prostřednictvím ICT Předmět: Anglický jazyk.
BÍLKOVINY (AMINOKYSELINY)
KLÍŠE lázn ě 9:30 Na rycht ě 9:45 Mírové nám ě stí 11:00.
Bioinformatika Predikce genů, Fylogenetická analýza
O metodě konečných prvků Lect_6.ppt M. Okrouhlík Ústav termomechaniky, AV ČR, Praha Liberec, 2010 Pár slov o Matlabu a o zobrazení čísla na počítači.
Tutorial: Mechanic - electrician Topic: Basics of electrical engineering the 2nd. Year The measuring system1 Prepared by: Ing. Jiří Smílek Projekt Anglicky.
1 / 2X36DSA 2005The complexity of different algorithms varies: O(n), Ω(n 2 ), Θ(n·log 2 (n)), … Různé algoritmy mají různou složitost: O(n), Ω(n 2 ), Θ(n·log.
Tutorial:Business Academy Topic: Conditional Formatting Prepared by : Mgr. Zdeněk Hrdina Projekt Anglicky v odborných předmětech, CZ.1.07/1.3.09/
Číslo projektu CZ.1.07/1.5.00/ Číslo materiálu VY_32_INOVACE_ 007 Název školy Gymnázium, Tachov, Pionýrská 1370 Autor Mgr.Stanislava Antropiusová.
 -laktamázy Popsáno kolem 190 různých enzymů Přirozené  -laktamázy - Identifikace  -laktamáz Spektrum aktivity Citlivost k inhibitorům Isoelektrický.
1 Škola: Gymnázium, Brno, Slovanské náměstí 7 Šablona: III/2 – Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN prostřednictvím.
Jméno autora: Mgr. Mária Filipová Datum vytvoření: Číslo DUMu: VY_32_INOVACE_13_AJ_ACH Ročník: 1. – 4. ročník Vzdělávací oblast: Jazyk a jazyková.
Jméno autora: Mgr. Mária Filipová Datum vytvoření: Číslo DUMu: VY_32_INOVACE_18_AJ_EP Ročník: 1. – 4. ročník Vzdělávací oblast:Jazyk a jazyková.
Podpora rozvoje cizích jazyků pro Evropu 21. stol. INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Tento projekt je spolufinancován Evropským sociálním fondem a státním.
Bioinformatika pro PfUK 2002
Název a adresa školy: Střední odborné učiliště stavební, Opava, příspěvková organizace, Boženy Němcové 22/2309, Opava Název operačního programu:
Jan Pačes Ústav molekulární genetiky Jiří Vondrášek Ústav organické chemie a biochemie Alignment I
Mgr. Richard Horký.  esenciální aminokyseliny jsou nutnou součástí stravy, tělo si je neumí vytvořit samo  neesenciální aminokyseliny si organismus.
Tutorial: Obchodní akademie Topic: Creating Formulas Prepared by : Mgr. Zdeněk Hrdina Projekt Anglicky v odborných předmětech, CZ.1.07/1.3.09/
Tato prezentace je hrazena z projektu: Spolupráce s partnery – základ kvalitní odborné výuky Registrační číslo: CZ.1.07/1.1.01/
Scissor Jack (Nůžkový zvedák)
Jméno autora: Mgr. Mária Filipová Datum vytvoření: Číslo DUMu: VY_32_INOVACE_15_AJ_EP Ročník: 1. – 4. ročník Vzdělávací oblast:Jazyk a jazyková.
Jméno autora:Mgr. Mária Filipová Datum vytvoření: Číslo DUMu: VY_32_INOVACE_01_AJ_ACH Ročník: 1. – 4. ročník Vzdělávací oblast: Jazyk a jazyková.
Tutorial: Obchodní akademie Topic: Logical Functions Prepared by: Mgr. Zdeněk Hrdina Projekt Anglicky v odborných předmětech, CZ.1.07/1.3.09/ je.
Tutorial: Mechanic - electrician Topic: Basics of electrical engineering the 2nd. year Measuring the capacity Prepared by: Ing. Jiří Smílek Projekt Anglicky.
Tutorial: Mechanik - elektrotechnik Topic: Basics of electrical engineering the 2nd. year Measuring inductance Prepared by: Ing. Jiří Smílek Projekt Anglicky.
Proteinové databáze.
 Piston pumps are a type of water pumps which cause the liquid to flow using one or more oscillating pistons.
Tutorial: Mechanic - electrician Topic: Basics of electrical engineering the 2nd. year Measurement of current and voltage Prepared by: Ing. Jiří Smílek.
SOŠO a SOUŘ v Moravském Krumlově
CZECH STATISTICAL OFFICE Na padesátém 81, CZ Praha 10, Czech Republic Blind Friendly Website Helena Koláčková Czech Statistical Office.
TERCIE 2014 MENDEL´S LAWS Výukový materiál GE Tvůrce: Mgr. Šárka Vopěnková Tvůrce anglické verze: ThMgr. Ing. Jiří Foller Projekt: S anglickým.
Bílkoviny-Proteiny Přírodovědný seminář – chemie 9. ročník Základní škola Benešov, Jiráskova 888 Ing. Bc. Jitka Moosová.
VZORCE AMINOKYSELIN PŘIŘAZOVAČKA Přiřaďte ke vzorcům označených čísly 1 – 10 správný název z nabídky aminokyselin.
1 PROTEINY © Biochemický ústav LF MU (H.P.)
Bílkoviny - aminokyseliny. Složení bílkovin -aminokyseliny – stavební kameny bílkovin Známo asi 300 druhů Proteinogenních 20, jsou řady L–α –AK Pozn.
Z LEPŠOVÁNÍ PODMÍNEK PRO VÝUKU TECHNICKÝCH OBORŮ A ŘEMESEL Š VEHLOVY STŘEDNÍ ŠKOLY POLYTECHNICKÉ P ROSTĚJOV REGISTRAČNÍ ČÍSLO CZ.1.07/1.1.26/
ŠKOLA: Základní škola Velké Karlovice, okres Vsetín
DIGITÁLNÍ UČEBNÍ MATERIÁL
Gymnázium, Brno, Elgartova 3
Gymnázium, Brno, Elgartova 3
Metabolismus aminokyselin.
VY_32_Inovace_ Conjunctions Project 3
DIGITÁLNÍ UČEBNÍ MATERIÁL
Životní prostředí (Environment) B1
Predikce sekundárních struktur proteinů
Lékařská chemie Aminokyseliny Peptidy, proteiny Primární, sekundární, terciární a kvartérní struktura proteinů.
Chemická struktura aminokyselin
پروتئین ها.
Živá fáze.
Introduction to MS Dynamics NAV (Expected Costs)
Lékařská chemie Aminokyseliny.
Číslo projektu CZ.1.07/1.5.00/ Číslo materiálu
Různé algoritmy mají různou složitost: O(n), Ω(n2), Θ(n·log2(n)), …
C5720 Biochemie 01c-Aminokyseliny Petr Zbořil 5/6/2019.
GENETIKA RESISTENCE K ONEMOCNĚNÍM
Petr Michálek Datum konání:
Prognóza Exportu Raiffeisenbank a Asociace exportérů Praha
Transkript prezentace:

Bioinformatika Jiří Vondrášek Jan Pačes http://bio.img.cas.cz/kurs Ústav organické chemie a biochemie vondrasek@uochb.cas.cz Jan Pačes Ústav molekulární genetiky hpaces@img.cas.cz Úvodní stránka http://bio.img.cas.cz/kurs

Predikce sekundární struktury v proteinech

Secondary structure Elements in Protein

B Sheets – atom representations

a helices - atom representations

Metoda Chou-Fasman Využívá tabulky konformačních parametrů extrahovaných z reálných struktur a CD spektroskopie Tabulka obsahuje pravděpodobnosti pro jednotlivé sekundární prvky pro každou aminokyselinu

Assign all of the residues in the peptide the appropriate set of parameters. Scan through the peptide and identify regions where 4 out of 6 contiguous residues have P(a-helix) > 100. That region is declared an alpha-helix. Extend the helix in both directions until a set of four contiguous residues that have an average P(a-helix) < 100 is reached. That is declared the end of the helix. If the segment defined by this procedure is longer than 5 residues and the average P(a-helix) > P(b-sheet) for that segment, the segment can be assigned as a helix. Repeat this procedure to locate all of the helical regions in the sequence.

3. Scan through the peptide and identify a region where 3 out of 5 of the residues have a value of P(b-sheet) > 100. That region is declared as a beta-sheet. Extend the sheet in both directions until a set of four contiguous residues that have an average P(b-sheet) < 100 is reached. That is declared the end of the beta-sheet. Any segment of the region located by this procedure is assigned as a beta-sheet if the average P(b-sheet) > 105 and the average P(b-sheet) > P(a-helix) for that region. 4. Any region containing overlapping alpha-helical and beta-sheet assignments are taken to be helical if the average P(a-helix) > P(b-sheet) for that region. It is a beta sheet if the average P(b-sheet) > P(a-helix) for that region.

5. To identify a bend at residue number j, calculate the following value p(t) = f(j)f(j+1)f(j+2)f(j+3) 6. where the f(j+1) value for the j+1 residue is used, the f(j+2) value for the j+2 residue is used and the f(j+3) value for the j+3 residue is used. If: (1) p(t) > 0.000075; (2) the average value for P(turn) > 1.00 in the tetrapeptide; and (3) the averages for the tetrapeptide obey the inequality P(a-helix) < P(turn) > P(b-sheet), then a beta-turn is predicted at that location.

CHOU-FASMAN RULES FOR ALPHA HELIX: Helical residues = >1.0 for helix. Helical breakers = 4/6 >1.0 nucleates helix. Helix continues both ways until 4 contiguous Special rules for Proline. Segment 5 residues or longer and P(a) > P(b) = helix. CHOU-FASMAN RULES FOR BETA STRAND: Beta residues = >1.0 for strand. Beta breakers = 3/5 >1.0 nucleates strand. Strand continues both ways until 4 contiguous Segment with average P(b) > 1.05 and P(b) > P(a) = strand

Name P(a) P(b) P(turn)f(i) f(i+1) f(i+2) f(i+3) Alanine 142 83 66 0.06 0.076 0.035 0.058 Arginine 98 93 95 0.070 0.106 0.099 0.085 Aspartic Acid 101 54 146 0.147 0.110 0.179 0.081 Asparagine 67 89 156 0.161 0.083 0.191 0.091 Cysteine 70 119 119 0.149 0.050 0.117 0.128 Glutamic Acid 151 037 74 0.056 0.060 0.077 0.064 Glutamine 111 110 98 0.074 0.098 0.037 0.098 Glycine 57 75 156 0.102 0.085 0.190 0.152 Histidine 100 87 95 0.140 0.047 0.093 0.054 Isoleucine 108 160 47 0.043 0.034 0.013 0.056 Leucine 121 130 59 0.061 0.025 0.036 0.070 Lysine 114 74 101 0.055 0.115 0.072 0.095 Methionine 145 105 60 0.068 0.082 0.014 0.055 Phenylalanine 113 138 60 0.059 0.041 0.065 0.065 Proline 57 55 152 0.102 0.301 0.034 0.068 Serine 77 75 143 0.120 0.139 0.125 0.106 Threonine 83 119 96 0.086 0.108 0.065 0.079 Tryptophan 108 137 96 0.077 0.013 0.064 0.167 Tyrosine 69 147 114 0.082 0.065 0.114 0.125 Valine 106 170 50 0.062 0.048 0.028 0.053

Chou-Fasman propensities (partial table)

Garnier-Osguthorpe-Robson GOR Využívá tabulku tendencí určenou primárně z krystalových struktur Tabulka obsahuje jednu pravděpodobnost pro každou strukturu a každou aminokyselinu v okně dlouhém 17 aminokyselin

Teorie informace aplikovaná na predikci struktury Jakou informaci získáme o pravděpodobnosti, že residuum j je v jistém stavu (H,E,T,C), ze znalosti jaké residuum je v pozici jm (m £ 8), nezávisle na tom co je residuum j zač. Je li m=0, podobné Chou-Fasman

pro H

Přesnost predikce Obě metody mají přesnost kolem 55 – 65% Hlavní důvod je to, že přeceňují lokální kontext na úkor globálního, tedy typ proteinu Tytéž aminokyseliny mohou zaujímat různé konfigurace v cytoplazmatickém a v membránovém proteinu

PSIPred output window

PSIPRED PREDICTION RESULTS Key Conf: Confidence (0=low, 9=high) Pred: Predicted secondary structure (H=helix, E=strand, C=coil) AA: Target sequence Conf: 952010265389973742568774158851022313889854542110122124543202 Pred: CCCCEECCCEEEEEECCHHHHHHHHCCCCCHHHHHCCCCCCCCCCEEECCCCEEEEEEEC AA: PQITLWQRPLVTIKIGGQLKEALLDTGADDTVLEEMSLPGRWKPKMIGGIGGFIKVRQYD 10 20 30 40 50 60 Conf: 102122066401257647861344327778750531369 Pred: CEEEEECCCCCEEEEEECCCCHHHHHHHHHHHHCCCCCC AA: QIIIEICGHKAIGTVLVGPTPVNIIGRNLLTQIGCTLNF 70 80 90 Calculate PostScript, PDF and JPEG graphical output for this result using: http://bioinf.cs.ucl.ac.uk/cgi-bin/psipred/graphics/nph-view.cgi?id=103942638010041

Sekundární strukturní prvky – formulace problému • Daná proteinová sekvence – NWVLSTAADMQGVVTDGMASGLDKD... • Predikce sekvence sekundární struktury: – LLEEEELLLLHHHHHHHHHHLHHHL... • „3-state“ problém: {ARNDCQEGHILKMFPSTWYV}n-> {L,H,E}n

Predikce prvků sekundární struktury u proteinů motivace pro předpověď prvků sekundární struktury - efektivní konformační vzorek pro 3D protein folding - vylepšení ostatních sekvenčních a strukturně analytických metod : sekvenční alignment : homologické a „threading“ modelování (CASP) : analýza experimentálních dat : protein design

V proteinech se známou strukturou není určení sekundární struktury jednoznačným a jednoduchým úkolem Dva základní klasifikační proramy a postupy pro určení SS z krystalových struktur DSSP a STRIDE výsledky těchto dvou postupů se liší nepatrně Reference Dictionary of protein secondary structure: pattern recognition of hydrogen-bonded and geometrical features. Biopolymers. 1983 Dec;22(12):2577-637. http://www.embl-heidelberg.de/argos/stride/stride_info.html http://www.cmbi.kun.nl/gv/dssp/

Výskyt aminokyselin a jejich distribuce v příslušných prvcích sekundární struktury by měly být vodítkem při predikci prvků SS stupeň determinace Klasické metody Chou Fasman GOR (Garnier-Osguthorpe-Robson)

Adaptivní metody Metoda neuronových sítí pokusná síť používá sadu známých proteinů k predikci žádané struktury ze sekvenčních dat <nnpredict> -Metoda založená na homologii hledané sekvence se známými proteiny <SOPM> <PHD>

Neural Network methods A neural network with multiple layers is presented with known sequences and structures - network is trained until it can predict those structures given those sequences Allows network to adapt as needed (it can consider neighboring residues like GOR)