Dolce: Databáze lokálních konformací DNA Petr Čech Laboratoř informatiky a chemie VŠCHT Praha
Motivace biologické makromolekuly se účastní procesů probíhajícíh v živých organismech biomakromolekuly spolu interagují interakce mění jejich strukturu DNA protein protein/DNA
Struktura DNA
Struktura DNA stavební jednotky nukleotid
variabilita na lokální úrovni Struktura DNA variabilita na lokální úrovni dinukleotid
variabilita na lokální úrovni Struktura DNA variabilita na lokální úrovni „suite“ dinukleotid
Cíle Vyvinout automatický proces klasifikace lokálních konformací DNA aplikace metod strojového učení ve strukturní biologii Vytvořit databázi strukturních dat do databáze zahrnout klasifikaci lokálních konformací DNA
lokálních konformací DNA Klasifikace lokálních konformací DNA Datová množina – „zlatý standard“ 447 struktur ≈ 7 739 dinukleotidů 18 tříd Publikace IF = 8.278 Svozil D., Kalina J., Omelka M., Schneider B. DNA conformations and their sequence preferences. Nucleic Acids Research, 2008, 36 (11)
Automatizace klasifikace lokálních konformací DNA přiřazení dat do již známých tříd metody strojového učení, klasifikátory k-NN (k – Nearest Neighbour) MLP (Multi-layer perceptron) RBF (Radial Basis Function) RR (Regularised Regression) v nepřiřazených datech najít nové třídy shluková analýza vlastní algoritmus, maximální odchylka torzních úhlů 20° : α, ε, ζ, χ | 30° : β | 15° : γ | 10° : δ
pro klasifikaci lokálních konformací DNA Automatický postup pro klasifikaci lokálních konformací DNA Publikace IF = 3.02 Čech P., Kukal J., Černý J., Schneider B., Svozil D., Automatic workflow for the classification of local DNA conformations. BMC Bioinformatics, 2013, 14(1)
pro klasifikaci lokálních konformací DNA Automatický postup pro klasifikaci lokálních konformací DNA Aplikace na DNA struktury (~ únor 2013) => 11 461 dinukleotidů 91 % přiřazeno nalezeno 6 nových tříd Publikace IF = 3.02 Čech P., Kukal J., Černý J., Schneider B., Svozil D., Automatic workflow for the classification of local DNA conformations. BMC Bioinformatics, 2013, 14(1)
Databáze lokálních konformací DNA Dolce Databáze lokálních konformací DNA
aktuální stav databáze Dolce aktuální stav databáze 2 819 struktur strukturní parametry 505 643 db záznamů Publikace v přípravě Čech P., Svozil D., Dolce: database of local DNA conformers. Nucleic Acids Research, 2014
Závěr Vyvinut automatický postup pro klasifikaci lokálních konformací DNA http://ich.vscht.cz/projects/dolce
Děkuji za pozornost.