What is Bioinformatics?---The Tight Definition "Classical" bioinformatics Fredj Tekaia at the Institut Pasteur offers this definition of bioinformatics:

Slides:



Advertisements
Podobné prezentace
Zpracování informací a znalostí Booleovský model vyhledávání dokumentů a jeho rozšiřování Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního.
Advertisements

Stručný úvod do UML.
Přednáška č. 3 Normalizace dat, Datová a funkční analýza
Lekce 7 Metoda molekulární dynamiky I Úvod KFY/PMFCHLekce 7 – Metoda molekulární dynamiky Osnova 1.Princip metody 2.Ingredience 3.Počáteční podmínky 4.Časová.
Proč je čistý uhlík stále zajímavý? Miroslav Rubeš Školitel:RNDr.Ota Bludský CSc.
Hodnotový management Teorie rozhodování
Ústav organické chemie a biochemie
Lekce 6 Slabé mezimolekulové interakce Osnova 1. Původ a význam slabých mezimolekulových interakcí 2. Předpoklad párové aditivity 3. Modely párových interakčních.
Zarovnávání biologických sekvencí
Teoretická výpočetní chemie
Aplikace metrických indexovacích metod na data získaná hmotnostní spektrometrií Jiří Novák
Aplikace metrických indexovacích metod na data získaná hmotnostní spektrometrií Ing. Jiří Novák
Praktikum základů genomiky, zima 2007 Základy genomiky I. Úvod do bioinformatiky Jan Hejátko Masarykova univerzita, Laboratoř funkční genomiky a proteomiky.
Metody zpracování vybraných témat (projektů)
Mgr. Marek Pavlů Katedra Experimentální Fyziky 1 Modelování a simulace, Mgr. Marek Pavlů.
1 Vyhledávání Principy vyhledávání Klasifikace klíče:  Interní klíč – je součástí prohlížených záznamů  Externí klíč – není jeho součástí, je jím např.
Získávání informací Získání informací o reálném systému
Odhad genetických parametrů
Tloušťková struktura porostu
Bioinformatický a chemoinformatický výzkum v Loschmidtových laboratořích Loschmidtovy laboratoře, Ústav experimentální biologie, Výzkumné centrum toxických.
EKO/GISO – Modely prostorových dat.  Mnoho definic - jedno mají společné – Gisy pracují s prostorovými daty  Minimální GIS vždy spojuje databázi, prostorové.
Systémy pro podporu managementu 2
Numerické modelování terahertzových struktur ČES seminář 2008 J. Láčík, Z. Lukeš, Z. Raida Vysoké učení technické v Brně Praha, 11. června, 2008.
Metadata a metainformační systémy (seminář)
Microsoft Office InfoPath 2003 Tomáš Kutěj Account Technology Specialist
Základy molekulární taxonomie J.Flegr, Praha 2008.
Biologie.
Srovnání standardů CEN, FGDC a ISO pro metadata Ing. Jan Růžička Institut ekonomiky a systémů řízení, odd.GIS VŠB-TU Ostrava, HGF tř. 17.listopadu
Nová metoda pro generování 2D farmakoforového modelu David Hoksza 1,2, Daniel Svozil 2 SIRET Research Group MFF UK Laboratoř informatiky a chemie FCHT.
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Účel procedury: První a závazný krok jakékoli seriozní komparativní studie. Umožňuje vyloučit možnost, že distribuce studovaného znaku (vlastnosti, vzorce.
uložené procedury (stored procedures) triggery, sekvence, pohledy, funkce, parametrické dotazy (prepared statements) komplexní agregace a SQL dotazy jiné.
Aminokyseliny a bílkoviny
Bioinformatika Predikce genů, Fylogenetická analýza
Použití molekulárních znaků v systematice
Dolce: Databáze lokálních konformací DNA
Bioinformatika Jiří Vondrášek Jan Pačes
Molekulární základy dědičnosti
Karel Vlček, Modelování a simulace Karel Vlček,
Rozhodovací proces, podpory rozhodovacích procesů
BLAST (basic local alignment search tool) Vyhledává podobné sekvence v databázích. Stal se nástrojem pro všechno. Určitou dobu kolektiv autorů držel krok.
8. Syntéza a aplikace výsledků fylogenetických analýz
Základní principy geografického výzkumu
Monte Carlo simulace Experimentální fyzika I/3. Princip metody Problémy které nelze řešit analyticky je možné modelovat na základě statistického chování.
DISTANCE MATRIXCONTACT MAP 1AUG PDB -> CM. Kontakty – proč jsou zajímavé ? CM -> PDB ?
EXPRESE GENETICKÉ INFORMACE Transkripce
Molekulárně biologické databáze
Molekulárně biologické databáze Pro zajímavost, nebude součástí zkoušky… Důležité, pravděpodobně bude u zkoušky…
Bioinformatika pro PfUK 2002
Biologická sekvence (BS) ACAGTGCGAGCATGACGATGACGCAGCAGATTGACAGAGACGATAGCAGCAT MASAQSFYLLHLAVDDFMNGAGVLSHERELLFYDENKIHDIVISMNDENMNQ Jazyk THISISJUSTASIMPLESENTENCEINENGLISHFORYOURINSPIRATION.
Proteinové interakce Proteinové komplexy interaktom
HODNOCENÍ DOPRAVNÍ SÍTĚ (TEORIE GRAFŮ) Cíl cvičení:
Geometrical shapes - matematika Mgr. Jana Horáková - ZŠ Brno, Antonínská 3 Metodické pokyny pro učitele Předmět: matematika Jazyk: AJ Jazyková úroveň:
Proteinové databáze.
Osnova 1. Bioinformatická data 1.1. Makromolekuly 1.2. Od DNA k proteinu 1.3. Proteiny 1.4. Databáze 2. Strojové učení v bioinformatice 2.1. Motivace 2.2.
Postup při empirickém kvantitativním výzkumu
(aminokyseliny, peptidy…)
NMR II Martin Dračínský
České vysoké učení technické v Praze Fakulta dopravní Ústav dopravní telematiky Geografické informační systémy Doc. Ing. Pavel Hrubeš, Ph.D.
© Institut biostatistiky a analýz ÚVOD DO MATEMATICKÉ BIOLOGIE I. setkání t ř etí prof. Ing. Jiří Holčík, CSc. UKB, pav.A29, RECETOX, dv.č.112
Obsah a úvod do předmětu: Počítačová podpora řízení
1. Co mají společného násobky těchto čísel?
Databázové systémy přednáška 13 – Analýza a reporting
Modelování struktury proteinů
Metody analýzy mikroorganismů II
2018/6/10 Počítačový model Kateřina Růžičková.
Fylogenetická evoluční analýza
Úloha 8 Predikce terciární struktury proteinů
Proteomika Bruno Sopko.
VY_32_INOVACE_05-01 Úvod do studia chemie
Transkript prezentace:

What is Bioinformatics?---The Tight Definition "Classical" bioinformatics Fredj Tekaia at the Institut Pasteur offers this definition of bioinformatics: "The mathematical, statistical and computing methods that aim to solve biological problems using DNA and amino acid sequences and related information." What is Bioinformatics?---The Loose definition What almost all bioinformatics has in common is the processing of large amounts of biologically-derived information, whether DNA sequences or breast X-rays.

Rozsah (vztahy) Hloubka (detail)

Cíl: Modely proteinů a nukleových kyselin jako reálných fyzikálních molekul

Experimentální metody pro získávání informací spojených se strukturou X-Ray krystalografie -CD Spektroskopie -Nukleární magnetická rezonance (NMR) -Vibrační spektroskopie

cílová sekvencetemplátová struktura ALIGNMENT CÍL...KLTDGYAAGLRNMTHPKLYNGTCSSVV... TEMPLÁT... KLTFRGYAAGILNMTHHLKJPKLYNGTNA.. Výsledný model START Identifikace příbuzné struktury (templát) Výběr templátu Porovnání cílové sekvence s templátovou strukturou Konstrukce modelu (využití informací z templátové struktury) Kontrola (vyhodnocení) modelu Je model vyhovující? KONEC ANO NE

Zařazení studované sekvence do širšího kontextu a hledání příbuznosti genetický kód je degenerovaný = nejednoznačné přiřazení triplet => aminokyselina metody které porovnávají sekvence musí tuto skutečnost zohlednit sekvenční a strukturní alignment -sekvenční zohledňuje některé význačné vlastnosti AA a jejich podobnost, pokud tato existuje -strukturní alignment může a nemusí brát v úvahu sekvenční

Predikce prvků sekundární struktury u proteinů motivace pro předpověď prvků sekundární struktury - efektivní konformační vzorek pro 3D protein folding - vylepšení ostatních sekvenčních a strukturně analytických metod : sekvenční alignment : homologické a „threading“ modelování (CASP) : analýza experimentálních dat : protein design

Sekundární strukturní prvky – formulace problému Daná proteinová sekvence – NWVLSTAADMQGVVTDGMASGLDKD... Predikce sekvence sekundární struktury: – LLEEEELLLLHHHHHHHHHHLHHHL... „3-state“ problém: {ARNDCQEGHILKMFPSTWYV} n {L,H,E} n

 -šroubovice, 3 typy

Sbalování proteinů problém prostorové superpozice Cíle:- vzájemné srovnání všech existujících struktur - klasifikace a organizace struktur podle logických schémat - nalezení obecných sbalovacích motivů a útvarů - výpočet evolučních vzdáleností - studium interakcí mezi strukturami a ostatními molekulami - využití známých struktur k předpovědi struktur ze sekvence - atd...

Klasifikace proteinových struktur Třída: -podobný obsah sekundárních struktur -všechny a, a/b, b, ostatní Architektura (Fold) -strukturní podobnost -SS prvky v podobném uspořádání Supertřída (Topologie) -možný stejný předek (ancestor) Homologická SuperTřída -jasná evoluční příbuznost -sekvenční podobnost < 25%

Ukázka l Fold Databáze SCOP ( Structural Classification of Proteinshttp://scop.stanford.edu/sco FSSP ( Fold classification based on Structure-Structure alignment of Proteins PClass ( l Nástroje strukturních alignmentů LOCK ( 3dSearch ( DALI (

The Dali server is a network service for comparing protein structures in 3D. You submit the coordinates of a query protein structure and Dali compares them against those in the Protein Data Bank. A multiple alignment of structural neighbours is mailed back to you.

Algoritmy pro strukturální superpozici l Distance based methods: l DALI (Holm and Sander): Aligning scalar distance plots l STRUCTAL (Gerstein and Levitt): Dynamic programming using pair wise inter-molecular distances l SSAP (Orengo and Taylor): Dynamic programming using intra-molecular vector distances l MINAREA (Falicov and Cohen): Minimizing soap-bubble surface area l Vector based methods: l VAST (Bryant): Graph theory based secondary structure alignment l 3dSearch (Singh and Brutlag): Fast secondary structure index lookup l Both l LOCK (Singh and Brutlag): Hierarchically uses both secondary structure vectors and atomic distances

Protein Docking Proč je docking důležitý a jeho postavení v kontextu bioinformatiky Biomolekulární interakce jsou základem všech regulačních a metabolických procesů které společně vytváří životní procesy. Počítačové simulace a analýzy těchto interakcí jsou stále ve větší míře a s větší přesností schopny popsat tyto mechanismy. S rostoucím množstvím experimentálně vyřešených struktur je přesnější i způsob popisu. Vývoj počítačů umožňuje analýzu a predikci molekulárních interakcí více dostupnou. Automatizovaná predikce molekulárních interakcí je klíčem k racionálnímu návrhu léčiv.

Návrh inhibitorů HIV-1 Proteázy

Formulace problému: Pro dané molekuly je nutno určit: Interagují tyto molekuly vzájemně mezi sebou? - existuje energeticky favorizovaná orientace těchto struktur tak, že mohou vzájemně plnit nějakou funkci? - interagují spolu tyto molekuly výše zmíněným způsobem? Pokud ano, jaká je jejich orientace, která maximalizuje interakci a minimalizuje energii systému? Cíl: nalézt v databázi molekulárních struktur takové, které mohou interagovat se studovaným systémem Komplikace: Obě molekuly jsou flexibilní a mohou během interakce ovlivnit vzájemně svou strukturu. - stovky až tisíce stupňů volnosti - množství konformací je astronomické

% Sekvenční identita srovnatelné se středním rozlišením NMR Přesný popis specificity Docking malých molekul a proteinů Molekulární nahrazování (replacement) v krystalografii Protein engineering Návrh experimentů pro mutagenezi NMR refinement Hledání a identifikace vazebných míst a 3D motivů Anotace podle sbalovacích znaků

Plán přednášek – zimní semestr 2002/2003 1: Úvod do bioinformatiky 7. Října Pačes, VondrášekÚvod do bioinformatiky 2: Molekulárně biologické databáze14. Října PačesMolekulárně biologické databáze 3. Alignment 1 – principy 21. Října PačesAlignment 1 – principy 4: Alignment 2 - programy a interpretace 28. Října PačesAlignment 2 - programy a interpretace 5: Predikce genů, evoluční stromy 4. Listopadu PačesPredikce genů, evoluční stromy 6: Analýza vybraných algoritmů, vlastnosti proteinů 11.listopadu VondrášekAnalýza vybraných algoritmů, vlastnosti proteinů 7: Geometrická analýza 3D struktur proteinů, strukturní alignmentGeometrická analýza 3D struktur proteinů, strukturní alignment 18. Listopadu Vondrášek 8: Sekundární strukturní motivy v proteinech a jejich predikce, 3D motivySekundární strukturní motivy v proteinech a jejich predikce, 3D motivy 25. Listopadu Vondrášek 9: Protein folding, prostorová superpozice struktur 2. Prosince VondrášekProtein folding, prostorová superpozice struktur 10: Molekulární docking, drug design 9. Prosince VondrášekMolekulární docking, drug design 11: Statistický aparát bioinformatiky 16. Prosince VondrášekStatistický aparát bioinformatiky