Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Jaký vliv na přesnost QSPR modelů má metodika přípravy 3D struktury? Případová studie pro predikci pK a. Stanislav Geidl, Radka Svobodová Vařeková, Lukáš.

Podobné prezentace


Prezentace na téma: "Jaký vliv na přesnost QSPR modelů má metodika přípravy 3D struktury? Případová studie pro predikci pK a. Stanislav Geidl, Radka Svobodová Vařeková, Lukáš."— Transkript prezentace:

1 Jaký vliv na přesnost QSPR modelů má metodika přípravy 3D struktury? Případová studie pro predikci pK a. Stanislav Geidl, Radka Svobodová Vařeková, Lukáš Petrusek, David Sehnal, Jaroslav Koča

2 Obsah  Principy QSPR  Metody pro generování 3D struktury molekul  Případová studie: Výpočet pK a z nábojových deskriptorů  Význam pKa  Nábojové deskriptory  Metody pro výpočet nábojů  QSPR modely  Datová sada  Metody a workflow  Výsledky pro QM QSPR modely  Výsledky pro EEM QSPR modely  Závěr 2

3 Principy QSPR (Quantitative Structure-Property Relationship) modelování Chemoinformatický nástroj pro výpočet vlastností na základě struktury Obecné schéma: Tělo člověka 3D struktura (prostorové uspořádání) Číselný popis (deskriptory) Vlastnost = funkce (deskriptory) Ilustrativní příklad ze života: Výška a váha BMI = váha / výška 2 BMI (Body Mass Index): Podváha: BMI < 18,5 Obezita: BMI > 30 Příklad reálné aplikace: 3D struktura molekuly Náboje na atomech pK a = c H.q H + c O.q O + c C1.q C1 Kde c H, c O a c C1 jsou parametry modelu qHqH qOqO q C1

4 Metody pro generování 3D struktury molekul Vstupem QSPR modelů jsou nejčastěji 3D struktury molekul  Poznámka: Lze použít i 2D struktury, to ale vede k nižší přesnosti modelů Jak získat 3D struktury?:  Experimentálně (pouze pro již syntetizované molekuly)  Generovat na základě 2D struktury pomocí následujících metodik:  Metody založené na pravidlech a datech: Využívají informace o délkách vazeb, vazebných úhlech a torzních úhlech, postupně vytvářejí cyklické a acyklické části molekuly. Software: Corina, OpenBabel, Omega, Confab  Vzdálenostní geometrický přístup: Využívá matice největších a matice nejmenších vzdáleností v rámci molekuly. Generuje pomocí těchto matic náhodné konformery a ty optimalizuje. Software: Baloon, RDKit  Další metody: Např. generování cyklických a acyklických částí molekuly spojené s Monte-Carlo výběrem konformerů. Software: Frog2 4

5 Metody pro generování 3D struktury molekul Vliv na přesnost QSPR modelů Protože máme k dispozici velké množství metod pro generování 3D struktur, stojíme před otázkou: Jaký vliv má volba metody pro generování 3D struktury na přesnost QSPR modelů? Konkrétně:  Je možno použít libovolnou metodu?  Jsou některé metody nevhodné? Nebo naopak nejvhodnější?  Je nutná optimalizace? A pokud ano, stačí použít molekulovou mechaniku nebo musíme aplikovat kvantovou mechaniku? Odpovědět na tuto otázku na obecné rovině (libovolná vlastnost a libovolné deskriptory) je velmi obtížné. Základní trendy je však možno sledovat i na konkrétních aplikacích. Proto jsme realizovali tuto případovou studii: Vliv metody pro generování 3D struktury na výpočet pK a z nábojových deskriptorů 5

6 Výpočet pKa z nábojových deskriptorů Význam pKa & Nábojové deskriptory Význam pK a : Disociační konstanta (pK a ) je velmi důležitou vlastností molekul. Její hodnoty se využívají v oblasti návrhu léků, v environmentální chemii, v chemoinformatice, atd. Měření pK a je velmi náročné Predikce pK a zůstává stále výzvou a QSPR modely jsou velmi slibnou metodikou Nábojové deskriptory: Atomové náboje vykazují vysokou korelaci s pK a. Viz např.:  Svobodová Vařeková, R.; Geidl, S.; Ionescu, C.M.; Skřehota, O.; Bouchal, T.; Sehnal, D.; Abagyan, R.; Koča, J. Predicting pK a values from EEM atomic charges. J. cheminf. 2013, 5(1),  Svobodová Vařeková, R.; Geidl, S.; Ionescu, C. M.; Skřehota, O.; Kudera, M.; Sehnal, D.; Bouchal, T.; Abagyan, R.; Huber, H. J.; Koča, J. Predicting pKa values of substituted phenols from atomic charges: comparison of different quantum mechanical methods and charge distribution schemes. J. Chem. Inf. Model. 2011, 51(8), 1795–1806.  Dixon, S. L.; Jurs, P. C. Estimation of pKa for organic oxyacids using calculated atomic charges. J. Comput. Chem. 1993, 14, 1460–

7 Výpočet pKa z nábojových deskriptorů Metody pro výpočet nábojů  Kvantově mechanické metody (QM): Přesné, ale časově náročné  Empirické metody: Výrazně rychlejší, přesnost srovnatelná s QM Metoda EEM (Electronegatitivty Equalization Method):  Nejčastěji používaná empirická metoda pro výpočet náboje.  Velmi rychlá, přesnost odpovídá QM metodě, pro kterou byla parametrizována  Náš tým je zapojen do vývoje a parametrizace EEM:  Ionescu, C. M.; Geidl, S.; Svobodová Var ̌ eková, R.; Koca, J. Rapid Calculation of Accurate Atomic Charges for Proteins via the Electronegativity Equalization Method. J. Chem. Inf. Model. 2013, 53(10), 2548–2558.  Jiroušková, Z.; Svobodová Vařeková, R.; Vaněk, J.; Koča J. Electronegativity equalization method: parameterization and validation for organic molecules using the Merz–Kollman–Singh charge distribution scheme. J. Comput. Chem. 2009, 30, 1174–1178.  Svobodová Vařeková, R.; Jiroušková, Z.; Vaněk, J.; Suchomel, S.; Koča J. Electronegativity Equalization Method: Parameterization and Validation for Large Sets of Organic, Organohalogene and Organometal Molecule. Int. J. Mol. Sci. 2007, 8, 572.  Svobodová Vařeková, R.; Koča, J. Optimized and parallelized implementation of the electronegativity equalization method and the atom ‐ bond electronegativity equalization method. J. Comput. Chem. 2006, 27(3), 396–405. 7

8 Výpočet pKa z nábojových deskriptorů QSPR modely Fenoly: pK a = p H.q H + p O.q O + p C1.q C1 + + p OD.q OD + p C1D.q C1D + p phe Aniliny: pK a = p H.Avg(q H ) + p N.q N + p C1.q C1 + + p HA.Avg(q HA ) + p NA.q NA + p C1A.q C1A + p anil Karboxylové kyseliny: pK a = p H.q H + p O.q O + p O2.q O2 + p C1.q C1 + p OD.q OD +p C1D.q C1D + + p O2D.q O2D + p carb Kde q jsou náboje, p jsou parametry QSPR modelů a Avg označuje průměrnou hodnotu. 8 qHqH qOqO q OD qHqH qNqN qHqH qOqO q C1 q OD q O2 q O2D q C1D q C1 q C1A q C1 q C1D q HA q NA

9 Výpočet pKa z nábojových deskriptorů Datová sada  Molekuly:  Fenoly (68 molekul)  Aniliny (48 molekul)  Karboxylové kyseliny (82 molekul) Poznámka: Pro kadou molekulu potřebujeme neutrální formu a disociovanou (nebo asociovanou) formu  Experimentální hodnoty pKa: Získány z databáze PhysProp  Náboje:  Vybrané typy QM nábojů, často používané pro predikci pKa  EEM náboje odpovídající daným typům QM nábojů  Detaily viz tabulka: 9 QM nábojeOdpovídající EEM parametry HF/STO-3G/MPASvob2007_chal2 (Svobodova et al.) B3LYP/6-31G*/MPAChaves2006 (Chaves et al.) B3LYP/6-31G*/NPABult2002_npa (Bultinck et al.)

10 Výpočet pKa z nábojových deskriptorů Metody pro generování 3D struktury Metody pro generování 3D struktury:  Metody založené na pravidlech a datech: Software OpenBabel Databáze NCI (generováno softwarem Corina) Databáze Pubchem (generováno softwarem Omega)  Vzdálenostní geometrický přístup: Software Baloon a RDKit  Další metody: Software Frog2 Optimalizační metody:  Bez optimalizace  MM optimalizace (MMFF94 force field, navíc UFF force field pro RDkit)  QM optimalizace (B3LYP/6-31G*) 10

11 Výpočet pK a z nábojových deskriptorů Workflow 11 Příprava datové sady struktury (smiles) experimentální pK a Generování 3D struktury 6 různých zdrojů (2 databáze, 4 softwary) 3 optimalizace Výpočet nábojů 3 typy QM nábojů Odpovídající 3 typy EEM nábojů Tvorba QSPR modelů 3762 různých struktur molekul 342 QSPR modelů

12 12 Legend: red = low R 2, green = high R 2 NCI, OpenBabel and PubChem: Velmi přesné predikce pK a i bez optimalizace. NCI poskytuje nejlepší QSPR modely MM a QM optimalizace nevedou ke zlepšení Výpočet pKa z nábojových deskriptorů Výsledky: Porovnání kvality QM QSPR modelů

13 13 Legend: red = low R 2, green = high R 2 Baloon a Frog2: Akceptovatelné pK a predikce i bez optimalizace MM a QM optimalizace přináší zlepšení ve většině případů Výpočet pKa z nábojových deskriptorů Výsledky: Porovnání kvality QM QSPR modelů II

14 14 Legend: red = low R 2, green = high R 2 RDkit: Nízká kvalita pK a predikce, pokud nepoužijeme optimalizace MM a QM optimalizace přináší výrazné zlepšení kvality Zajímavý aspekt: MM optimalizace poskytuje lepší výsledky než QM Výpočet pKa z nábojových deskriptorů Výsledky: Porovnání kvality QM QSPR modelů III

15 15 Legend: red = low R 2, green = high R 2 Podobné, ale méně výrazné trendy jako u QM QSPR modelů EEM náboje nejsou tak citlivé na kvalitu 3D struktury. EEM náboje poskytují méně přesné, ale stále ještě akceptovatelné hodnoty pK a Výpočet pKa z nábojových deskriptorů Výsledky: Porovnání kvality EEM QSPR modelů

16 Závěry  Zdroj 3D struktury je velmi důležitý pro přesnost QSPR modelů.  Pokud máme 3D struktury z vhodných zdrojů, je predikce pK a přesná i bez optimalizace  Vhodné 3D struktury lze získat z více zdrojů (např., NCI, PubChem, OpenBabel)  Rovněž další generátory 3D struktur (např. Frog2, Baloon) umožňují akceptovatelně přesné predikce pK a  Některé generátory 3D struktur (např. RDkit) nejsou pro predikci pK a pomocí QSPR vhodné. Struktury vytvořené pomocí těchto nástrojů však lze zlepšit optimalizací. 16

17 Poděkování  prof. Koča  Dr. Svobodová  LCC group  Metacentrum a CERIT-SC  vám za vaši pozornost :-) 17


Stáhnout ppt "Jaký vliv na přesnost QSPR modelů má metodika přípravy 3D struktury? Případová studie pro predikci pK a. Stanislav Geidl, Radka Svobodová Vařeková, Lukáš."

Podobné prezentace


Reklamy Google