Vyhledávání, porovnávání, validace a charakterizace strukturních motivů v rámci biomakromolekul Radka Svobodová Vařeková, David Sehnal, Lukáš Pravda, Stanislav.

Slides:



Advertisements
Podobné prezentace
Ing. David Pejčoch Tutorial
Advertisements

Přednáška č. 3 Normalizace dat, Datová a funkční analýza
Typy programů operační systémy programy pro práci se soubory
SAS Jan Blaťák Laboratoř vyhledávání znalostí Fakulta informatiky Masarykova Univerzita, Brno
TOOLBOX PRO ANALÝZU STRUKTURY KRAJINY
D ATABÁZE N VID D ATABÁZE N VID N OVÁ SPECIALIZOVANÁ ONLINE SLUŽBA SPOLEČNOSTI O VID PRO OŠETŘOVATELSTVÍ A DALŠÍ NELÉKAŘSKÉ ZDRAVOTNICKÉ.
Lekce 1 Modelování a simulace
Teoretická výpočetní chemie
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
Technologie pro CI. Od technologií pro CI vyžadujeme především funkce vyhledávání v rozsáhlých databázích na základě libovolných dotazů, propojování a.
Medians and Order Statistics Nechť A je množina obsahující n různých prvků: Definice: Statistika i-tého řádu je i-tý nejmenší prvek, tj., minimum = statistika.
Praha6.cz Nové trendy v e-publishingu Statické stránky, mapa stránek, menu a fulltextové vyhledávání.
Microsoft Access Prezentace základních uživatelských nástrojů
Bioinformatický a chemoinformatický výzkum v Loschmidtových laboratořích Loschmidtovy laboratoře, Ústav experimentální biologie, Výzkumné centrum toxických.
Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: III/2VY_32_inovace_33.
Chemická vazba Mgr. Jakub Janíček VY_32_INOVACE_Ch1r0118.
ŠablonaIII/2číslo materiálu392 Jméno autoraMgr. Alena Krejčíková Třída/ ročník1. ročník Datum vytvoření
Chemická stavba buněk Září 2009.
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
UČÍME V PROSTORU Název předmětu: Název a ID tématu: Zpracoval(a): Strojírenská technologie Poruchy v krystalu (ST11) Vrtací přípravky Vladimír Pata STROJÍRENSTVÍ.
Výukový materiál zpracován v rámci projektu EU peníze školám
PPíšeme vědecký článek. Jaký článek – domácí úkol o dvou brožurách o jaderné fyzice a zkušenostech z jejich použití (ověření použitelnosti, expertní posouzení)
Jaký vliv na přesnost QSPR modelů má metodika přípravy 3D struktury
Informatika pro ekonomy II přednáška 10
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
Využití vzorců a funkcí k úpravám v textu
I. ZÁKLADNÍ POJMY.
Jak funguje vyhledávání podobností Šimon Suchomel.
Dokumentace informačního systému
Nová metoda pro generování 2D farmakoforového modelu David Hoksza 1,2, Daniel Svozil 2 SIRET Research Group MFF UK Laboratoř informatiky a chemie FCHT.
EGEE is a project funded by the European Union under contract IST Gridové projekty LCG a D0 v ČR Jiří Kosina Fyzikální ústav AV ČR Seminář.
Autor výukového materiálu: Petra Majerčáková Datum vytvoření výukového materiálu: únor 2013 Ročník, pro který je výukový materiál určen: VIII Vzdělávací.
Dolce: Databáze lokálních konformací DNA
Mezimolekulové síly.
Vyhledávání dat podle určitých kritérií Lenka Havránková, 4.Y.
Automatizovaná podpora výběru nástroje pro dobývání znalostí Jakub Štochl.
KIV/ZIS cvičení 4 Tomáš Potužák. Dotazy - úvod Umožňují pracovat s databází –Získávat specifické informace z tabulky, případně z více tabulek najednou.
Jak vyhledávat informace na Internetu?
LCG2 LCG2 software Jiří Kosina. LCG2 – přehled ●... některé slajdy budou podobné loňským... ● ● GRID, který bude sloužit ke zpracování.
Infrastruktura pro dotazování nad sémantickými daty Jiří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarového inženýrství, MFF UK Praha
Počítačová chemie (5. přednáška)
Kanonické indexování vrcholů molekulového grafu Molekulový graf: G = (V, E, L, ,  ) Indexování vrcholů molekulového grafu G: bijekce  : V  I I je indexová.
POČÍTAČOVÝ SYSTÉM PRO NÁVRH TECHNOLOGIE BETONÁŽE ZA ZIMNÍCH PODMÍNEK Ing. Jan Čermák Ing. Vyacheslav Usmanov Ing. Kateřina Svobodová prof. Ing. Čeněk Jarský,
DISTANCE MATRIXCONTACT MAP 1AUG PDB -> CM. Kontakty – proč jsou zajímavé ? CM -> PDB ?
Jak učit databáze v tabulkovém procesoru. Učit vlastně databáze na ZŠ ??? Pro: Práce s velkými objemy dat je jedním z hlavních z hlavních využití PC.
Ústřední knihovna FSS MU Zprávám z médií a tisku na stopě!
14. června 2004Michal Ševčenko Architektura softwarového systému DYNAST Michal Ševčenko VIC ČVUT.
Základy pedagogické metodologie
Monte Carlo simulace hexameru vody Autor: Bc. Lenka Ličmanová Vedoucí práce: Mgr. Aleš Vítek Seminář KFY PŘF OU.
INFOMINE
Proteinové databáze.
Spektroskopie cirkulárního dichroismu -
Publikování výsledků skenování Ntrip Casters pomocí mapového serveru Autor: Bc. Filip Lombart Vedoucí: Ing. David Vojtek Ph.D.
Databáze MS ACCESS 2010.
Filtrování záznamů Filtr podle výběru Filtr podle formuláře Rozšířený filtr Symboly, výrazy Dotazy.
Využití sestavy Zobrazení a typy Části sestavy Vytvoření sestavy Ovládací prvky.
Vyhledávání na Internetu. Webové vyhledávače Webový vyhledávač je služba, která umožňuje na Internetu najít webové stránky, které obsahují požadované.
Databáze MS ACCESS 2010.
Ukládání dat biodiverzity a jejich vizualizace
Vyhledávání v Internetu
Výpočetní technika VY_32_INOVACE_17_16_internetový vyhledávač.
1. Co mají společného násobky těchto čísel?
NÁZEV ŠKOLY: Masarykova základní škola a mateřská škola Melč, okres Opava, příspěvková organizace ČÍSLO PROJEKTU: CZ.1.07/1.4.00/ AUTOR: Mgr. Vladimír.
Informatika pro ekonomy přednáška 8
Fylogenetická evoluční analýza
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úloha 8 Predikce terciární struktury proteinů
Tvary molekul Mezimolekulové síly.
Kalkulátor emisí skleníkových plynů
Transkript prezentace:

Vyhledávání, porovnávání, validace a charakterizace strukturních motivů v rámci biomakromolekul Radka Svobodová Vařeková, David Sehnal, Lukáš Pravda, Stanislav Geidl, Crina-Maria Ionescu, Michaela Wimmerová, Jaroslav Koča

Motivace  V současné době je dostupno obrovské množství informací o 3D struktuře biomakromolekul.  Konkrétně, počet struktur v Protein Data Bank nedávno překročil  Analýzou těchto dat můžeme získat velmi cenné informace, například:  Porozumět vztahu mezi strukturou a funkcí těchto biomakromolekul, případně být schopni příslušnou funkci predikovat na základě struktury  Identifikovat strukturní motivy, využitelné pro návrh léků  Identifikovat evoluční vztahy mezi proteiny a klasifikovat proteiny  …  Proto jsou v současné době vyvíjeny pokročilé softwarové nástroje pro analýzu struktury biomakromolekul.  Mezi ně patří i WebChemistry – sada softwarových nástrojů pro analýzu fragmentů (tzv. strukturních motivů) biomakromolekul 2

WebChemistry 3 SiteBinder MotiveQuery Mole MotiveValidator MotiveValidator DB Charge Calculator

MotiveQuery Popis MotiveQuery jazyk:  Jazyk pro popis strukturních motivů biomolekul  Umožňuje rovněž zahrnout obecné informace z PDB souboru (autor, rozlišení, typ experimetu, …)  Rozšíření programovacího jazyka Python MotiveQuery server:  Vyhledává strukturní motivy popsané pomocí jazyka MotiveQuery v rámci celé Protein Data Bank  Je schopen prohledat Protein Data Bank během 60 minut a vrátit všechny výskyty daného motivu  Obsahuje kopii Protein Data Bank, která je aktualizována každý týden 4

MotiveQuery Příklad 5 Vyber atomy Ca Atoms(“Ca“) Vyber skupinu atomů Ca, které jsou vzájemně vzdáleny 4 Å a méně Cluster(4,Atoms(“Ca“)) Najdi cyklus, obsahující 5 atomů C a 1 atom O (pyran) Rings(5 * [“C“] + [“O“]) Najdi dva motivy, vzdálené vzájemně 3 Å Near(3,, ) Najdi rezidua, kovalentně vázaná na motiv.ConnectedResidues(1) Potřebuji najít motiv, který obsahuje atomy Ca poblíž pyranového cukru a jejich nejbližší okolí. Výrazy: Kompletní výraz: Near(3, Cluster(4, Atoms(“Ca”)), Rings(5 * [“C”] + [“O”])).ConnectedResidues(1) Poznámka: Pokud se ozvete, rádi pro vás výraz vytvoříme. V nejbližší době doplníme možnost zadávání výrazů v přirozeném jazyce (např. "Find all residues with a pyran ring"). Výsledky: Nalezeno 532 vazebných míst, 311 z nich vykazuje výraznou strukturní podobnost

Mole Popis  Slouží k vyhledávání a charakterizaci tunelů v rámci biomakromolekul.  Poskytuje tyto informace o tunelech:  Geometrické vlastnosti tunelů  Aminokyselinové okolí tunelu  Základních fyzikálně-chemické vlastnosti tunelů  Získává informace o startovních místech tunelů z CSA databáze nebo je schopen tato místa predikovat  Je schopen filtrovat tunely – poskytnout informaci jen o tunelech, které jsou dostatečně odlišné a mají vyhovující vlastnosti 6

Mole Příklady 7 Gramicidin Velká podjednotka ribozomu Cytochrom c oxidáza Acetylcholinový receptor Anhydráza kyseliny uhličité Více viz prezentace Lukáše Pravdy

SiteBinder Popis  Porovnává strukturních motivy biomakromolekul  Konkrétně provádí přiložení těchto motivů a počítá jejich minimální RMSD (root mean square deviation)  Dokáže vyhledat největší společné podgrafy motivů  Je schopen přiložit tisíce molekul během několika sekund 8

SiteBinder Příklad  Přiložení vazebných míst cukrů, která obsahují dva atomy vápníku  Analýza struktury vazebného místa 9 Přiložení pyranového kruhu (červeně) Přiložení společných částí vazebného místa (červeně) Vazebná místa jsou velmi podobná, liší se jen v několika aminokyselinách

MotiveValidator Popis  Byl vytvořen pro validaci anotací ligandů a reziduí přítomných v rámci biomakromolekul.  Určuje, jestli topologie a stereochemie ligandu nebo rezidua odpovídá struktuře modelového rezidua se stejnou anotací.  Modelová rezidua jsou získávána z databáze wwPDB CCD případně zadána uživatelem.  Lze validovat jednu či více biomakromolekul nebo jeden či více ligandů 10

MotiveValidator Příklad 11 Nipah G glykoprotein v komplexu s ephrinem-B3 Obsahuje 30 instancí patřících 11 různým cukrům, každý s jedním cyklem a pěti chirálními atomy Výsledky: 13 z těchto 30 instancí má nesprávnou chiralitu V některých případech je nesprávná chiralita na všech atomech

MotiveValidatorDB Popis  Je databází výsledků validace pro ligandy a rezidua z Protein Data Bank (s vyjímkou aminokyselin, nukleotidů a reziduí s méně než 7 atomy).  Tato databáze poskytuje:  Přehled a interaktivní tabulku pro každý z více než PDB souborů  Přehled a interaktivní tabulku pro každé jméno rezidua (např. MAN, HEM; jmen reziduí, instancí reziduí)  Graf a statistická data s přehledem výsledků validace pro ligandy z celé Protein Data Bank

MotiveValidatorDB Příklad 13 Hlavní závěry: 91+ % reziduí má všechny atomy a cykly 81+ % reziduí má korektní strukturu (všechny atomy + korektní chiralitu) Souhrnné výsledky validace reziduí z Protein Data Bank: Database last updated 30/5/2014: entries from PDB.org, residues relevant for validation, residue models from wwPDB CCD.

ChargeCalculator Popis  Slouží k výpočtu parciálních atomových nábojů pomocí Electronegativity Equalization Method (EEM)  Je schopen počítat náboje velmi rychle i pro rozsáhlé biomakromolekuly (integruje sofistikované metody pro zanedbání velmi dlouhých elektrostatických interakcí)  Umožňuje využívat všechny dosud publikované EEM parametry  Obsahuje heuristiky pro výběr nejvhodnějších z těchto parametrů  Kromě výpočtu nábojů je schopen rovněž realizovat základní statistické analýzy a porovnávání nábojů

ChargeCalculator Příklad 15 Porovnání nábojů v rámci dvou typů vazebných míst cukrů

Reference  SiteBinder: Sehnal D., Svobodová Var ̌ eková R., Huber H. J., Geidl S., Ionescu C. M., Wimmerová M., Koc ̌ a J. SiteBinder: An improved approach for comparing multiple protein structural motifs. J. Chem. Inf. Model. 2012, 52(2), 343–359.  MoleOnline: Berka K., Hanák O., Sehnal D., Banáš P., Navrátilová V., Jaiswal D., Ionescu C. M., Svobodová Vařeková R., Koča J., Otyepka M. MOLEonline 2.0: interactive web- based analysis of biomacromolecular channels. Nucleic Acids Res. 2012, 40(W1), W222– W227.  Mole 2.0: Sehnal D., Svobodová Vařeková R., Berka K., Pravda L., Navrátilová V., Banáš P, Ionescu C. M., Michal Otyepka M., Koča J. MOLE 2.0: advanced approach for analysis of biomacromolecular channels. J. Cheminform. 2013, 5, 39.  MotiveValidator: Svobodová Vařeková R., Jaiswal D., Sehnal D., Ionescu C.-M., Geidl S., Pravda L., Horský V., Wimmerová M., Koča J.: MotiveValidator: interactive web-based validation of ligand and residue structure in biomolecular complexes. Nucleic Acids Res. 2014, in press (gku426). Všechny uvedené nástroje jsou volně dostupné na adrese: 16

Závěr 17 SiteBinder MotiveQuery Mole MotiveValidato r MotiveValidat orDB Charge Calculator Vytvořili jsme sadu nástrojů pro vyhledávání, přikládání, charakterizaci a validaci strukturních motivů biomakromolekul. Všechny tyto nástroje naleznete zde: Neostýchejte se je vyzkoušet :-).

Více informací na posteru Případně u těchto kolegů: David Sehnal Lukáš Pravda Standa Geidl

Poděkování Masarykova Univerzita, Brno, Laboratoř výpočetní chemie: Prof. Jaroslav Koča, Dr. David Sehnal, Dr. Crina-Maria Ionescu, Lukáš Pravda, Stanislav Geidl, Deepti Jaiswal, Vladimír Horský Masarykova Univerzita, Brno, Glycobiochemická skupina: Prof. Michaela Wimmerová Univerzita Palackého, Olomouc: Dr. Karel Berka, Prof. Michal Otyepka, CERIT-SC, Brno: Prof. Luděk Matyska, Dr. Aleš Křenek University of California, San Diego, USA, prof. Abagyan Radka Svobodová: 19

Poděkování Masarykova Univerzita, Brno, Laboratoř výpočetní chemie: Prof. Jaroslav Koča, Dr. David Sehnal, Dr. Crina-Maria Ionescu, Lukáš Pravda, Stanislav Geidl, Deepti Jaiswal, Vladimír Horský Masarykova Univerzita, Brno, Glycobiochemická skupina: Prof. Michaela Wimmerová Univerzita Palackého, Olomouc: Dr. Karel Berka, Prof. Michal Otyepka, CERIT-SC, Brno: Prof. Luděk Matyska, Dr. Aleš Křenek University of California, San Diego, USA, prof. Abagyan Radka Svobodová: 20 Děkuji za pozornost :-)