Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Jaký vliv na přesnost QSPR modelů má metodika přípravy 3D struktury
Jaký vliv na přesnost QSPR modelů má metodika přípravy 3D struktury? Případová studie pro predikci pKa. Stanislav Geidl, Radka Svobodová Vařeková, Lukáš Petrusek, David Sehnal, Jaroslav Koča
2
Obsah Principy QSPR Metody pro generování 3D struktury molekul
Případová studie: Výpočet pKa z nábojových deskriptorů Význam pKa Nábojové deskriptory Metody pro výpočet nábojů QSPR modely Datová sada Metody a workflow Výsledky pro QM QSPR modely Výsledky pro EEM QSPR modely Závěr
3
PSE GSC Principy QSPR (Quantitative Structure-Property Relationship) modelování Chemoinformatický nástroj pro výpočet vlastností na základě struktury Obecné schéma: 3D struktura (prostorové uspořádání) Číselný popis (deskriptory) Vlastnost = funkce (deskriptory) Ilustrativní příklad ze života: BMI = váha / výška2 BMI (Body Mass Index): Podváha: BMI < 18,5 Obezita: BMI > 30 Tělo člověka Výška a váha Příklad reálné aplikace: qH qO pKa = cH.qH + cO.qO + cC1.qC1 qC1 Kde cH, cO a cC1 jsou parametry modelu 3D struktura molekuly Náboje na atomech PSE Bereichspräsentation
4
Metody pro generování 3D struktury molekul
Vstupem QSPR modelů jsou nejčastěji 3D struktury molekul Poznámka: Lze použít i 2D struktury, to ale vede k nižší přesnosti modelů Jak získat 3D struktury?: Experimentálně (pouze pro již syntetizované molekuly) Generovat na základě 2D struktury pomocí následujících metodik: Metody založené na pravidlech a datech: Využívají informace o délkách vazeb, vazebných úhlech a torzních úhlech, postupně vytvářejí cyklické a acyklické části molekuly. Software: Corina, OpenBabel, Omega, Confab Vzdálenostní geometrický přístup: Využívá matice největších a matice nejmenších vzdáleností v rámci molekuly. Generuje pomocí těchto matic náhodné konformery a ty optimalizuje. Software: Baloon, RDKit Další metody: Např. generování cyklických a acyklických částí molekuly spojené s Monte-Carlo výběrem konformerů. Software: Frog2
5
Metody pro generování 3D struktury molekul Vliv na přesnost QSPR modelů
Protože máme k dispozici velké množství metod pro generování 3D struktur, stojíme před otázkou: Jaký vliv má volba metody pro generování 3D struktury na přesnost QSPR modelů? Konkrétně: Je možno použít libovolnou metodu? Jsou některé metody nevhodné? Nebo naopak nejvhodnější? Je nutná optimalizace? A pokud ano, stačí použít molekulovou mechaniku nebo musíme aplikovat kvantovou mechaniku? Odpovědět na tuto otázku na obecné rovině (libovolná vlastnost a libovolné deskriptory) je velmi obtížné. Základní trendy je však možno sledovat i na konkrétních aplikacích. Proto jsme realizovali tuto případovou studii: Vliv metody pro generování 3D struktury na výpočet pKa z nábojových deskriptorů
6
Výpočet pKa z nábojových deskriptorů Význam pKa & Nábojové deskriptory
Disociační konstanta (pKa) je velmi důležitou vlastností molekul. Její hodnoty se využívají v oblasti návrhu léků, v environmentální chemii, v chemoinformatice, atd. Měření pKa je velmi náročné Predikce pKa zůstává stále výzvou a QSPR modely jsou velmi slibnou metodikou Nábojové deskriptory: Atomové náboje vykazují vysokou korelaci s pKa. Viz např.: Svobodová Vařeková, R.; Geidl, S.; Ionescu, C.M.; Skřehota, O.; Bouchal, T.; Sehnal, D.; Abagyan, R.; Koča, J. Predicting pK a values from EEM atomic charges. J. cheminf. 2013, 5(1), 1-15. Svobodová Vařeková, R.; Geidl, S.; Ionescu, C. M.; Skřehota, O.; Kudera, M.; Sehnal, D.; Bouchal, T.; Abagyan, R.; Huber, H. J.; Koča, J. Predicting pKa values of substituted phenols from atomic charges: comparison of different quantum mechanical methods and charge distribution schemes. J. Chem. Inf. Model. 2011, 51(8), 1795–1806. Dixon, S. L.; Jurs, P. C. Estimation of pKa for organic oxyacids using calculated atomic charges. J. Comput. Chem , 14, 1460–1467.
7
Výpočet pKa z nábojových deskriptorů Metody pro výpočet nábojů
Kvantově mechanické metody (QM): Přesné, ale časově náročné Empirické metody: Výrazně rychlejší, přesnost srovnatelná s QM Metoda EEM (Electronegatitivty Equalization Method): Nejčastěji používaná empirická metoda pro výpočet náboje. Velmi rychlá, přesnost odpovídá QM metodě, pro kterou byla parametrizována Náš tým je zapojen do vývoje a parametrizace EEM: Ionescu, C. M.; Geidl, S.; Svobodová Vařeková, R.; Koca, J. Rapid Calculation of Accurate Atomic Charges for Proteins via the Electronegativity Equalization Method. J. Chem. Inf. Model. 2013, 53(10), 2548–2558. Jiroušková, Z.; Svobodová Vařeková, R.; Vaněk, J.; Koča J. Electronegativity equalization method: parameterization and validation for organic molecules using the Merz–Kollman–Singh charge distribution scheme. J. Comput. Chem. 2009, 30, 1174–1178. Svobodová Vařeková, R.; Jiroušková, Z.; Vaněk, J.; Suchomel, S.; Koča J. Electronegativity Equalization Method: Parameterization and Validation for Large Sets of Organic, Organohalogene and Organometal Molecule. Int. J. Mol. Sci. 2007, 8, 572. Svobodová Vařeková, R.; Koča, J. Optimized and parallelized implementation of the electronegativity equalization method and the atom‐bond electronegativity equalization method. J. Comput. Chem. 2006, 27(3), 396–405.
8
Výpočet pKa z nábojových deskriptorů QSPR modely
qO qH qOD Fenoly: pKa = pH.qH + pO.qO + pC1.qC1 + + pOD.qOD + pC1D.qC1D + pphe Aniliny: pKa = pH.Avg(qH) + pN.qN + pC1.qC1 + + pHA.Avg(qHA) + pNA.qNA + pC1A.qC1A + panil Karboxylové kyseliny: pKa = pH.qH + pO.qO + pO2.qO2 + pC1.qC1 + pOD.qOD +pC1D.qC1D pO2D.qO2D + pcarb Kde q jsou náboje, p jsou parametry QSPR modelů a Avg označuje průměrnou hodnotu. qC1 qC1D qN qH qNA qHA qC1 qC1A qO2D qO2 qC1D qC1 qOD qO qH
9
Výpočet pKa z nábojových deskriptorů Datová sada
Molekuly: Fenoly (68 molekul) Aniliny (48 molekul) Karboxylové kyseliny (82 molekul) Poznámka: Pro kadou molekulu potřebujeme neutrální formu a disociovanou (nebo asociovanou) formu Experimentální hodnoty pKa: Získány z databáze PhysProp Náboje: Vybrané typy QM nábojů, často používané pro predikci pKa EEM náboje odpovídající daným typům QM nábojů Detaily viz tabulka: QM náboje Odpovídající EEM parametry HF/STO-3G/MPA Svob2007_chal2 (Svobodova et al.) B3LYP/6-31G*/MPA Chaves2006 (Chaves et al.) B3LYP/6-31G*/NPA Bult2002_npa (Bultinck et al.)
10
Výpočet pKa z nábojových deskriptorů Metody pro generování 3D struktury
Metody založené na pravidlech a datech: Software OpenBabel Databáze NCI (generováno softwarem Corina) Databáze Pubchem (generováno softwarem Omega) Vzdálenostní geometrický přístup: Software Baloon a RDKit Další metody: Software Frog2 Optimalizační metody: Bez optimalizace MM optimalizace (MMFF94 force field, navíc UFF force field pro RDkit) QM optimalizace (B3LYP/6-31G*)
11
Výpočet pKa z nábojových deskriptorů Workflow
Příprava datové sady struktury (smiles) experimentální pKa Generování 3D struktury 6 různých zdrojů (2 databáze, 4 softwary) 3 optimalizace Výpočet nábojů 3 typy QM nábojů Odpovídající 3 typy EEM nábojů Tvorba QSPR modelů 3762 různých struktur molekul 342 QSPR modelů
12
Výpočet pKa z nábojových deskriptorů Výsledky: Porovnání kvality QM QSPR modelů
Legend: red = low R2, green = high R2 Fenoly Aniliny Karb. kys. NCI, OpenBabel and PubChem: Velmi přesné predikce pKa i bez optimalizace . NCI poskytuje nejlepší QSPR modely MM a QM optimalizace nevedou ke zlepšení
13
Výpočet pKa z nábojových deskriptorů Výsledky: Porovnání kvality QM QSPR modelů II
Legend: red = low R2, green = high R2 Fenoly Aniliny Karb. kys. Baloon a Frog2: Akceptovatelné pKa predikce i bez optimalizace MM a QM optimalizace přináší zlepšení ve většině případů
14
Výpočet pKa z nábojových deskriptorů Výsledky: Porovnání kvality QM QSPR modelů III
Legend: red = low R2, green = high R2 Fenoly Aniliny Karb. kys. RDkit: Nízká kvalita pKa predikce, pokud nepoužijeme optimalizace MM a QM optimalizace přináší výrazné zlepšení kvality Zajímavý aspekt: MM optimalizace poskytuje lepší výsledky než QM
15
Výpočet pKa z nábojových deskriptorů Výsledky: Porovnání kvality EEM QSPR modelů
Legend: red = low R2, green = high R2 Fenoly Aniliny Karb. kys. Podobné, ale méně výrazné trendy jako u QM QSPR modelů EEM náboje nejsou tak citlivé na kvalitu 3D struktury. EEM náboje poskytují méně přesné, ale stále ještě akceptovatelné hodnoty pKa
16
Závěry Zdroj 3D struktury je velmi důležitý pro přesnost QSPR modelů.
Pokud máme 3D struktury z vhodných zdrojů, je predikce pKa přesná i bez optimalizace Vhodné 3D struktury lze získat z více zdrojů (např., NCI, PubChem, OpenBabel) Rovněž další generátory 3D struktur (např. Frog2, Baloon) umožňují akceptovatelně přesné predikce pKa Některé generátory 3D struktur (např. RDkit) nejsou pro predikci pKa pomocí QSPR vhodné. Struktury vytvořené pomocí těchto nástrojů však lze zlepšit optimalizací.
17
vám za vaši pozornost :-)
Poděkování prof. Koča Dr. Svobodová LCC group Metacentrum a CERIT-SC vám za vaši pozornost :-) 17
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.