What is Bioinformatics?---The Tight Definition "Classical" bioinformatics Fredj Tekaia at the Institut Pasteur offers this definition of bioinformatics: "The mathematical, statistical and computing methods that aim to solve biological problems using DNA and amino acid sequences and related information." What is Bioinformatics?---The Loose definition What almost all bioinformatics has in common is the processing of large amounts of biologically-derived information, whether DNA sequences or breast X-rays.
Rozsah (vztahy) Hloubka (detail)
Cíl: Modely proteinů a nukleových kyselin jako reálných fyzikálních molekul
Experimentální metody pro získávání informací spojených se strukturou X-Ray krystalografie -CD Spektroskopie -Nukleární magnetická rezonance (NMR) -Vibrační spektroskopie
cílová sekvencetemplátová struktura ALIGNMENT CÍL...KLTDGYAAGLRNMTHPKLYNGTCSSVV... TEMPLÁT... KLTFRGYAAGILNMTHHLKJPKLYNGTNA.. Výsledný model START Identifikace příbuzné struktury (templát) Výběr templátu Porovnání cílové sekvence s templátovou strukturou Konstrukce modelu (využití informací z templátové struktury) Kontrola (vyhodnocení) modelu Je model vyhovující? KONEC ANO NE
Zařazení studované sekvence do širšího kontextu a hledání příbuznosti genetický kód je degenerovaný = nejednoznačné přiřazení triplet => aminokyselina metody které porovnávají sekvence musí tuto skutečnost zohlednit sekvenční a strukturní alignment -sekvenční zohledňuje některé význačné vlastnosti AA a jejich podobnost, pokud tato existuje -strukturní alignment může a nemusí brát v úvahu sekvenční
Predikce prvků sekundární struktury u proteinů motivace pro předpověď prvků sekundární struktury - efektivní konformační vzorek pro 3D protein folding - vylepšení ostatních sekvenčních a strukturně analytických metod : sekvenční alignment : homologické a „threading“ modelování (CASP) : analýza experimentálních dat : protein design
Sekundární strukturní prvky – formulace problému Daná proteinová sekvence – NWVLSTAADMQGVVTDGMASGLDKD... Predikce sekvence sekundární struktury: – LLEEEELLLLHHHHHHHHHHLHHHL... „3-state“ problém: {ARNDCQEGHILKMFPSTWYV} n {L,H,E} n
-šroubovice, 3 typy
Sbalování proteinů problém prostorové superpozice Cíle:- vzájemné srovnání všech existujících struktur - klasifikace a organizace struktur podle logických schémat - nalezení obecných sbalovacích motivů a útvarů - výpočet evolučních vzdáleností - studium interakcí mezi strukturami a ostatními molekulami - využití známých struktur k předpovědi struktur ze sekvence - atd...
Klasifikace proteinových struktur Třída: -podobný obsah sekundárních struktur -všechny a, a/b, b, ostatní Architektura (Fold) -strukturní podobnost -SS prvky v podobném uspořádání Supertřída (Topologie) -možný stejný předek (ancestor) Homologická SuperTřída -jasná evoluční příbuznost -sekvenční podobnost < 25%
Ukázka l Fold Databáze SCOP ( Structural Classification of Proteinshttp://scop.stanford.edu/sco FSSP ( Fold classification based on Structure-Structure alignment of Proteins PClass ( l Nástroje strukturních alignmentů LOCK ( 3dSearch ( DALI (
The Dali server is a network service for comparing protein structures in 3D. You submit the coordinates of a query protein structure and Dali compares them against those in the Protein Data Bank. A multiple alignment of structural neighbours is mailed back to you.
Algoritmy pro strukturální superpozici l Distance based methods: l DALI (Holm and Sander): Aligning scalar distance plots l STRUCTAL (Gerstein and Levitt): Dynamic programming using pair wise inter-molecular distances l SSAP (Orengo and Taylor): Dynamic programming using intra-molecular vector distances l MINAREA (Falicov and Cohen): Minimizing soap-bubble surface area l Vector based methods: l VAST (Bryant): Graph theory based secondary structure alignment l 3dSearch (Singh and Brutlag): Fast secondary structure index lookup l Both l LOCK (Singh and Brutlag): Hierarchically uses both secondary structure vectors and atomic distances
Protein Docking Proč je docking důležitý a jeho postavení v kontextu bioinformatiky Biomolekulární interakce jsou základem všech regulačních a metabolických procesů které společně vytváří životní procesy. Počítačové simulace a analýzy těchto interakcí jsou stále ve větší míře a s větší přesností schopny popsat tyto mechanismy. S rostoucím množstvím experimentálně vyřešených struktur je přesnější i způsob popisu. Vývoj počítačů umožňuje analýzu a predikci molekulárních interakcí více dostupnou. Automatizovaná predikce molekulárních interakcí je klíčem k racionálnímu návrhu léčiv.
Návrh inhibitorů HIV-1 Proteázy
Formulace problému: Pro dané molekuly je nutno určit: Interagují tyto molekuly vzájemně mezi sebou? - existuje energeticky favorizovaná orientace těchto struktur tak, že mohou vzájemně plnit nějakou funkci? - interagují spolu tyto molekuly výše zmíněným způsobem? Pokud ano, jaká je jejich orientace, která maximalizuje interakci a minimalizuje energii systému? Cíl: nalézt v databázi molekulárních struktur takové, které mohou interagovat se studovaným systémem Komplikace: Obě molekuly jsou flexibilní a mohou během interakce ovlivnit vzájemně svou strukturu. - stovky až tisíce stupňů volnosti - množství konformací je astronomické
% Sekvenční identita srovnatelné se středním rozlišením NMR Přesný popis specificity Docking malých molekul a proteinů Molekulární nahrazování (replacement) v krystalografii Protein engineering Návrh experimentů pro mutagenezi NMR refinement Hledání a identifikace vazebných míst a 3D motivů Anotace podle sbalovacích znaků
Plán přednášek – zimní semestr 2002/2003 1: Úvod do bioinformatiky 7. Října Pačes, VondrášekÚvod do bioinformatiky 2: Molekulárně biologické databáze14. Října PačesMolekulárně biologické databáze 3. Alignment 1 – principy 21. Října PačesAlignment 1 – principy 4: Alignment 2 - programy a interpretace 28. Října PačesAlignment 2 - programy a interpretace 5: Predikce genů, evoluční stromy 4. Listopadu PačesPredikce genů, evoluční stromy 6: Analýza vybraných algoritmů, vlastnosti proteinů 11.listopadu VondrášekAnalýza vybraných algoritmů, vlastnosti proteinů 7: Geometrická analýza 3D struktur proteinů, strukturní alignmentGeometrická analýza 3D struktur proteinů, strukturní alignment 18. Listopadu Vondrášek 8: Sekundární strukturní motivy v proteinech a jejich predikce, 3D motivySekundární strukturní motivy v proteinech a jejich predikce, 3D motivy 25. Listopadu Vondrášek 9: Protein folding, prostorová superpozice struktur 2. Prosince VondrášekProtein folding, prostorová superpozice struktur 10: Molekulární docking, drug design 9. Prosince VondrášekMolekulární docking, drug design 11: Statistický aparát bioinformatiky 16. Prosince VondrášekStatistický aparát bioinformatiky