Jaký vliv na přesnost QSPR modelů má metodika přípravy 3D struktury

Slides:



Advertisements
Podobné prezentace
CIT Paměti Díl X.
Advertisements

Říjen 2007 Nobody’s Unpredictable Ipsos Tambor GALAXY SÉRIE 2007 Anketa – spokojenost závodníků.
Podpora personálních procesů v HR Vema Jaroslav Šmarda
PRŮZKUM NA TÉMA: „Dopady finanční krize“ eficia .
Skupinové kurzy snižování nadváhy
Zpracování informací a znalostí Booleovský model vyhledávání dokumentů a jeho rozšiřování Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního.
Autoevaluace školy Základní škola a Mateřská škola Karla Klostermanna Železná Ruda, p.o. Zahradní Železná Ruda Ctirad Drahorád, ředitel školy.
Metoda QFD metoda plánování jakosti založená na principu maticového diagramu umožňuje transformaci požadavků zákazníků do navrhovaného produktu a procesu.
Printforum 2011 Přednáška Technologická přeměna – a důsledky pro tiskárny Prof. Dr. Thomas Helbig Poradce podniků v polygrafickém průmyslu
1 DFT a empirické modely interakcí v Monte Carlo simulacích klastrů molekul vody Lenka Ličmanová
Proč je čistý uhlík stále zajímavý? Miroslav Rubeš Školitel:RNDr.Ota Bludský CSc.
Magnetohydrodynamický (MHD) generátor
Monte Carlo permutační testy & Postupný výběr
Zařízení pro měření fotopolymerních záznamových struktur
Téma 3 ODM, analýza prutové soustavy, řešení nosníků
Porovnání hodnotících škál bolesti v závislosti na kognitivní funkci
Teoretická výpočetní chemie
Regulační diagram je to základní grafický nástroj statistické regulace procesu, který umožňuje posoudit statistickou zvládnutost procesu statisticky zvládnutý.
ROZHODOVACÍ PROCESY PRO VÍCECESTNÉ TELEMATICKÉ APLIKACE Filip Ekl
Počítačová grafika III – Monte Carlo integrování
Diplomová práce Autorka: Ing. et Ing. Zuzana Hynoušová
ScanStation P20 – uživatelská kalibrace (procedura Check & Adjust)
Josef Keder Hana Škáchová
VLIV ZMĚN SVĚTA PRÁCE NA KVALITU ŽIVOTA 2005 – 2008 Moderní společnost a její proměny Seminář k výzkumu na úseku BOZP
Základní číselné množiny
VÍCEKRITERIÁLNÍ ROZHODOVÁNÍ I.
Získávání informací Získání informací o reálném systému
Мetafora a metonymie v české mluvnici
M O R A V S K O S L E Z S K Ý K R A J 1 Vedení správních řízení ve spisové službě a statistika vyřizování dokumentů.
Gymnázium Vítězslava Nováka Husova 333/II, Jindřichův Hradec Název dokumentu: Ročník: Autor: Gymnázium Vítězslava Nováka Husova 333/II, Jindřichův Hradec.
Statistika Vypracoval: Mgr. Lukáš Bičík
Josef Keder Hana Škáchová
Analýza vlivu cen elektřiny na ekonomiku průmyslových podniků Prezentace EGÚ Brno, a. s. Sekce provozu a rozvoje elektrizační soustavy Květen 2007.
Co je a k čemu slouží benchmarking?
RNDr. Ladislava Rohlová RNDr. Ladislava Rohlová Aplikace materiálových toků v průmyslovém podniku ENVIKONGRES BRNO 2006.
STANOVENÍ NEJISTOT PŘI VÝPOŠTU KONTAMINACE ZASAŽENÉHO ÚZEMÍ
Shrnutí z minula Molekulová mechanika/dynamika
1 Registrovaná (detekovaná) intenzita Polarizační faktor  22  z =  /2-2   y =  /2 x z Nepolarizované záření.
STECHIOMETRICKÉ VÝPOČTY Chemie 8. ročník
Richard Lipka Katedra informatiky a výpočetní techniky Fakulta aplikovaných věd Západočeská univerzita, Plzeň 1.
VII. Neutronová interferometrie II. cvičení KOTLÁŘSKÁ 7. DUBNA 2010 F4110 Kvantová fyzika atomárních soustav letní semestr
Stanovení objemu stojících stromů
1 O programu pro Informační Systém Investičního Controllingu n Dovolujeme si Vám představit základní schémata informačního systému ISIC n Programové řešení.
Definice, druhy, chyby, abstrakce
1 © Mediaresearch, a.s., 2008 NetMonitor a AdMonitoring Výsledky za říjen 2008.
Mgr. et Mgr. Pavel Římovský, Bc. Jaroslav Mudrák
Vlastní hodnocení školy a školní vzdělávací program
David Kubička VÚAnCH - UniCRE
Měření úhlů.
TRUHLÁŘ I.ročník Výrobní zařízení Střední škola stavební Teplice
Nová metoda pro generování 2D farmakoforového modelu David Hoksza 1,2, Daniel Svozil 2 SIRET Research Group MFF UK Laboratoř informatiky a chemie FCHT.
Vyhledávání, porovnávání, validace a charakterizace strukturních motivů v rámci biomakromolekul Radka Svobodová Vařeková, David Sehnal, Lukáš Pravda, Stanislav.
1 Mechanika s Inventorem 10. Shrnutí Petr SCHILLING, autor přednášky Ing. Kateřina VLČKOVÁ, obsahová korekce Tomáš MATOVIČ, publikace FEM výpočty Optimalizace.
Generování sítě MIDAS GTS. Prvky pro generování sítě MIDAS má několik typů prvků, jež využívá pro generování sítě. Každý prvek je určen svými uzly (konstrukčně).
Databáze velké množství dat pevně dané struktury
K OMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA Úvod do statistiky VY_32_INOVACE_M4r0117 Mgr. Jakub Němec.
S CENARIO - BASED METHODOLOGY FOR COMPARISON OF THE SOFTWARE TRAFFIC CONTROL AGENTS Seminář DSS – Richard Lipka.
Počítačová chemie (5. přednáška)
Kanonické indexování vrcholů molekulového grafu Molekulový graf: G = (V, E, L, ,  ) Indexování vrcholů molekulového grafu G: bijekce  : V  I I je indexová.
Monte Carlo simulace Experimentální fyzika I/3. Princip metody Problémy které nelze řešit analyticky je možné modelovat na základě statistického chování.
Nástroje pro prostorovou analýzu srážek v GIS
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
Monte Carlo simulace hexameru vody Autor: Bc. Lenka Ličmanová Vedoucí práce: Mgr. Aleš Vítek Seminář KFY PŘF OU.
11/2003Přednáška č. 41 Regulace výpočtu modelu Předmět: Modelování v řízení MR 11 (Počítačová podpora) Obor C, Modul M8 ZS, 2003, K126 EKO Předn./Cvič.:
Aplikace rentgenfluorescenční analýzy při studiu památek Z.Ferda, T.Kulatá, L.Bandas Rentgenfluorescenční analýza je fyzikální metoda, pomocí které snadno,
Grafické systémy II. Ing. Tomáš Neumann Interní doktorand kat. 340 Vizualizace, tvorba animací.
Doc. RNDr. František Koliba, CSc. Katedry Informatiky a matematiky OPF SU Budova A Informatika pro ekonomy II INM / BPNIE Přednáška.
Gravitační model v geografii dopravy
Logický výraz VY_32_INOVACE_08_153
Mezimolekulové síly.
Transkript prezentace:

Jaký vliv na přesnost QSPR modelů má metodika přípravy 3D struktury Jaký vliv na přesnost QSPR modelů má metodika přípravy 3D struktury? Případová studie pro predikci pKa. Stanislav Geidl, Radka Svobodová Vařeková, Lukáš Petrusek, David Sehnal, Jaroslav Koča

Obsah Principy QSPR Metody pro generování 3D struktury molekul Případová studie: Výpočet pKa z nábojových deskriptorů Význam pKa Nábojové deskriptory Metody pro výpočet nábojů QSPR modely Datová sada Metody a workflow Výsledky pro QM QSPR modely Výsledky pro EEM QSPR modely Závěr

PSE GSC 1.10.2005 Principy QSPR (Quantitative Structure-Property Relationship) modelování Chemoinformatický nástroj pro výpočet vlastností na základě struktury Obecné schéma: 3D struktura (prostorové uspořádání) Číselný popis (deskriptory) Vlastnost = funkce (deskriptory) Ilustrativní příklad ze života: BMI = váha / výška2 BMI (Body Mass Index): Podváha: BMI < 18,5 Obezita: BMI > 30 Tělo člověka Výška a váha Příklad reálné aplikace: qH qO pKa = cH.qH + cO.qO + cC1.qC1 qC1 Kde cH, cO a cC1 jsou parametry modelu 3D struktura molekuly Náboje na atomech 10.04.201710.04.2017 PSE Bereichspräsentation

Metody pro generování 3D struktury molekul Vstupem QSPR modelů jsou nejčastěji 3D struktury molekul Poznámka: Lze použít i 2D struktury, to ale vede k nižší přesnosti modelů Jak získat 3D struktury?: Experimentálně (pouze pro již syntetizované molekuly) Generovat na základě 2D struktury pomocí následujících metodik: Metody založené na pravidlech a datech: Využívají informace o délkách vazeb, vazebných úhlech a torzních úhlech, postupně vytvářejí cyklické a acyklické části molekuly. Software: Corina, OpenBabel, Omega, Confab Vzdálenostní geometrický přístup: Využívá matice největších a matice nejmenších vzdáleností v rámci molekuly. Generuje pomocí těchto matic náhodné konformery a ty optimalizuje. Software: Baloon, RDKit Další metody: Např. generování cyklických a acyklických částí molekuly spojené s Monte-Carlo výběrem konformerů. Software: Frog2

Metody pro generování 3D struktury molekul Vliv na přesnost QSPR modelů Protože máme k dispozici velké množství metod pro generování 3D struktur, stojíme před otázkou: Jaký vliv má volba metody pro generování 3D struktury na přesnost QSPR modelů? Konkrétně: Je možno použít libovolnou metodu? Jsou některé metody nevhodné? Nebo naopak nejvhodnější? Je nutná optimalizace? A pokud ano, stačí použít molekulovou mechaniku nebo musíme aplikovat kvantovou mechaniku? Odpovědět na tuto otázku na obecné rovině (libovolná vlastnost a libovolné deskriptory) je velmi obtížné. Základní trendy je však možno sledovat i na konkrétních aplikacích. Proto jsme realizovali tuto případovou studii: Vliv metody pro generování 3D struktury na výpočet pKa z nábojových deskriptorů

Výpočet pKa z nábojových deskriptorů Význam pKa & Nábojové deskriptory Disociační konstanta (pKa) je velmi důležitou vlastností molekul. Její hodnoty se využívají v oblasti návrhu léků, v environmentální chemii, v chemoinformatice, atd. Měření pKa je velmi náročné Predikce pKa zůstává stále výzvou a QSPR modely jsou velmi slibnou metodikou Nábojové deskriptory: Atomové náboje vykazují vysokou korelaci s pKa. Viz např.: Svobodová Vařeková, R.; Geidl, S.; Ionescu, C.M.; Skřehota, O.; Bouchal, T.; Sehnal, D.; Abagyan, R.; Koča, J. Predicting pK a values from EEM atomic charges. J. cheminf. 2013, 5(1), 1-15. Svobodová Vařeková, R.; Geidl, S.; Ionescu, C. M.; Skřehota, O.; Kudera, M.; Sehnal, D.; Bouchal, T.; Abagyan, R.; Huber, H. J.; Koča, J. Predicting pKa values of substituted phenols from atomic charges: comparison of different quantum mechanical methods and charge distribution schemes. J. Chem. Inf. Model. 2011, 51(8), 1795–1806. Dixon, S. L.; Jurs, P. C. Estimation of pKa for organic oxyacids using calculated atomic charges. J. Comput. Chem. 1993, 14, 1460–1467.

Výpočet pKa z nábojových deskriptorů Metody pro výpočet nábojů Kvantově mechanické metody (QM): Přesné, ale časově náročné Empirické metody: Výrazně rychlejší, přesnost srovnatelná s QM Metoda EEM (Electronegatitivty Equalization Method): Nejčastěji používaná empirická metoda pro výpočet náboje. Velmi rychlá, přesnost odpovídá QM metodě, pro kterou byla parametrizována Náš tým je zapojen do vývoje a parametrizace EEM: Ionescu, C. M.; Geidl, S.; Svobodová Vařeková, R.; Koca, J. Rapid Calculation of Accurate Atomic Charges for Proteins via the Electronegativity Equalization Method. J. Chem. Inf. Model. 2013, 53(10), 2548–2558. Jiroušková, Z.; Svobodová Vařeková, R.; Vaněk, J.; Koča J. Electronegativity equalization method: parameterization and validation for organic molecules using the Merz–Kollman–Singh charge distribution scheme. J. Comput. Chem. 2009, 30, 1174–1178. Svobodová Vařeková, R.; Jiroušková, Z.; Vaněk, J.; Suchomel, S.; Koča J. Electronegativity Equalization Method: Parameterization and Validation for Large Sets of Organic, Organohalogene and Organometal Molecule. Int. J. Mol. Sci. 2007, 8, 572. Svobodová Vařeková, R.; Koča, J. Optimized and parallelized implementation of the electronegativity equalization method and the atom‐bond electronegativity equalization method. J. Comput. Chem. 2006, 27(3), 396–405.

Výpočet pKa z nábojových deskriptorů QSPR modely qO qH qOD Fenoly: pKa = pH.qH + pO.qO + pC1.qC1 + + pOD.qOD + pC1D.qC1D + pphe Aniliny: pKa = pH.Avg(qH) + pN.qN + pC1.qC1 + + pHA.Avg(qHA) + pNA.qNA + pC1A.qC1A + panil Karboxylové kyseliny: pKa = pH.qH + pO.qO + pO2.qO2 + pC1.qC1 + pOD.qOD +pC1D.qC1D + + pO2D.qO2D + pcarb Kde q jsou náboje, p jsou parametry QSPR modelů a Avg označuje průměrnou hodnotu. qC1 qC1D qN qH qNA qHA qC1 qC1A qO2D qO2 qC1D qC1 qOD qO qH

Výpočet pKa z nábojových deskriptorů Datová sada Molekuly: Fenoly (68 molekul) Aniliny (48 molekul) Karboxylové kyseliny (82 molekul) Poznámka: Pro kadou molekulu potřebujeme neutrální formu a disociovanou (nebo asociovanou) formu Experimentální hodnoty pKa: Získány z databáze PhysProp Náboje: Vybrané typy QM nábojů, často používané pro predikci pKa EEM náboje odpovídající daným typům QM nábojů Detaily viz tabulka: QM náboje Odpovídající EEM parametry HF/STO-3G/MPA Svob2007_chal2 (Svobodova et al.) B3LYP/6-31G*/MPA Chaves2006 (Chaves et al.) B3LYP/6-31G*/NPA Bult2002_npa (Bultinck et al.)

Výpočet pKa z nábojových deskriptorů Metody pro generování 3D struktury Metody založené na pravidlech a datech: Software OpenBabel Databáze NCI (generováno softwarem Corina) Databáze Pubchem (generováno softwarem Omega) Vzdálenostní geometrický přístup: Software Baloon a RDKit Další metody: Software Frog2 Optimalizační metody: Bez optimalizace MM optimalizace (MMFF94 force field, navíc UFF force field pro RDkit) QM optimalizace (B3LYP/6-31G*)

Výpočet pKa z nábojových deskriptorů Workflow Příprava datové sady struktury (smiles) experimentální pKa Generování 3D struktury 6 různých zdrojů (2 databáze, 4 softwary) 3 optimalizace Výpočet nábojů 3 typy QM nábojů Odpovídající 3 typy EEM nábojů Tvorba QSPR modelů 3762 různých struktur molekul 342 QSPR modelů

Výpočet pKa z nábojových deskriptorů Výsledky: Porovnání kvality QM QSPR modelů Legend: red = low R2, green = high R2 Fenoly Aniliny Karb. kys. NCI, OpenBabel and PubChem: Velmi přesné predikce pKa i bez optimalizace . NCI poskytuje nejlepší QSPR modely MM a QM optimalizace nevedou ke zlepšení

Výpočet pKa z nábojových deskriptorů Výsledky: Porovnání kvality QM QSPR modelů II Legend: red = low R2, green = high R2 Fenoly Aniliny Karb. kys. Baloon a Frog2: Akceptovatelné pKa predikce i bez optimalizace MM a QM optimalizace přináší zlepšení ve většině případů

Výpočet pKa z nábojových deskriptorů Výsledky: Porovnání kvality QM QSPR modelů III Legend: red = low R2, green = high R2 Fenoly Aniliny Karb. kys. RDkit: Nízká kvalita pKa predikce, pokud nepoužijeme optimalizace MM a QM optimalizace přináší výrazné zlepšení kvality Zajímavý aspekt: MM optimalizace poskytuje lepší výsledky než QM

Výpočet pKa z nábojových deskriptorů Výsledky: Porovnání kvality EEM QSPR modelů Legend: red = low R2, green = high R2 Fenoly Aniliny Karb. kys. Podobné, ale méně výrazné trendy jako u QM QSPR modelů EEM náboje nejsou tak citlivé na kvalitu 3D struktury. EEM náboje poskytují méně přesné, ale stále ještě akceptovatelné hodnoty pKa

Závěry Zdroj 3D struktury je velmi důležitý pro přesnost QSPR modelů. Pokud máme 3D struktury z vhodných zdrojů, je predikce pKa přesná i bez optimalizace Vhodné 3D struktury lze získat z více zdrojů (např., NCI, PubChem, OpenBabel) Rovněž další generátory 3D struktur (např. Frog2, Baloon) umožňují akceptovatelně přesné predikce pKa Některé generátory 3D struktur (např. RDkit) nejsou pro predikci pKa pomocí QSPR vhodné. Struktury vytvořené pomocí těchto nástrojů však lze zlepšit optimalizací.

vám za vaši pozornost :-) Poděkování prof. Koča Dr. Svobodová LCC group Metacentrum a CERIT-SC vám za vaši pozornost :-) 17