Informační tok
NázevSymbolVýskyt (%) AlanineA, Ala7.49 ArginineR, Arg5.22 AsparagineN, Asn4.53 Aspartic acidD, Asp5.22 CysteineC, Cys1.82 GlutamineQ, Gln4.11 Glutamic acidE, Glu6.26 GlycineG, Gly7.10 HistidineH, His2.23 IsoleucineI, Ile5.45 LeucineL, Leu9.06 LysineK, Lys5.82 MethionineM, Met2.27 PhenylalanineF, Phe3.91 ProlineP, Pro5.12 SerineS, Ser7.34 ThreonineT, Thr5.96 TryptophanW, Trp1.32 TyrosineY, Tyr3.25 ValineV, Val6.48 NázevSymbolVýskyt (%) 20 základních L- aminokyselin
asparagineargininealanine glutamineglycinehistidine aspartic acidcysteine glutamic acidisoleucine leucinelysinemethioninephenylalanineproline serine threonine tryptophantyrosinevaline
SQ Sequence BP; 2589 A; 4068 C; 3455 G; 2735 T; 0 other; aagcttgata aataaatgga gggacagcag cgttatctcc acctcccata atgaaaaaac 60 ttgtctcatg tataatatta taatattaaa taattggttc tacaaatata caagagtcga 120 gggcattgaa ttgcagaaac tttgagtaga agtgtagtcc aatctttttt attaccaata 180 tttctcaatt ataattttct tcactatata tatatttttt taaaaggtgt catcctaaca 240 cattttatta aaataaatat gattagatat aataattata ccttgaagag atacaaaata 300 cagtgcataa aactagccct tgaacaattt aattgtgtaa tctacaaatt aggttctcaa 360 gttgagcaaa tatatatata tacatatatg ttgaaaaaac ataaatagaa aaggttgtta 420 tcaacataac cctatggaga cctataattc cctaaatcaa catgccctca tacattacgc 480 ttaaactcac ttggtagagg tggtcttgat ctaatccatg cacttccatt gacaacaata 540 tgctttatac gtttacacaa actctctaag gcaatatgat cttgaaaaat acctaggtgg 600 tgatagaaag agaagtgggg aattggagta gccaatctta tatgtttttg tatatgtggg 660 gcaataccat ttatatttcc ttaagttcaa aatcattttt gccaatcaaa tgtcttgagt 720 gattagactt ataaaaatgc aataatggct cttggttggt tgttctaagt tgcttaaaaa 780 aatattaaca tgaatcaaaa ttaactgctt caaggagttg aacattgact actaaaatgc 840 aaatgtcctt taaacaaatg agtaggaaca cttaacttag atcaaacata acatcctaat 900 cactttaaaa tgtcaattcc aaccccttta tcaacttcaa tcccaagatg tcctctctct 960 tattgatatt tgaacaacaa caaagataaa caaccattat ccctaccaag caagtaactt 1020 gtagaaaaaa agaaaaaaga aaaaaggaaa aaggatcctt taaaaagcca aaagccacca 1080 caattccaac cctttgatca acttcaatcc caagatgtcc tctctcttat tgatatttga 1140 acaacaacaa agataaacaa cctttatcct taccaagcag gtaacttgta gaaaaaaaaa 1200
Syntéza proteinu během translace
>1HCO:A|PDBID|CHAIN|SEQUENCE VLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHG SAQVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLS HCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVLTSKYR >1HCO:B|PDBID|CHAIN|SEQUENCE VHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTP DAVMGNPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPEN FRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH
Afinsenův postulát Sekvence proteinu obsahuje veškerou nutnou informaci která určuje prostorovou strukturu proteinu. SPERM WHALE MYOGLOBIN
MYSSSPCKLPSLSPVARSFSACSVGLGRSSYRATSCLPALCLPAGGFA TSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRHVEQENASLE SRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDN AKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVE SLKEELLCLKKNHEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMR CQYETLVENNRRDAEDWLDTQSEELNQQVVSSSEQLQSCQAEIIELRR TVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMITNVEAQL AEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCA PDYSPSKSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF KÓDUJÍCÍ SEKVENCE (TEXT,PROTEIN,ČÍSLA??) Jaký druh statistických dat hledat?? - ČETNOST ZASTOUPENÍ JEDNOTLIVÝCH PÍSMEN? - ZNAKOVÉ MOTIVY ? - PROSTOROVÉ ZOBRAZENÍ ? - PŘÍBUZNÉ SEKVENCE V DATABÁZÍCH?
>sp|Q92764|K1H5_HUMAN Keratin, type I cuticular Ha5 (Hair keratin, type I Ha5) - Homo sapiens (Human). MYSSSPCKLPSLSPVARSFSACSVGLGRSSYRATSCLPALCLPAGGFA TSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRHVEQENASLE SRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDN AKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVE SLKEELLCLKKNHEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMR CQYETLVENNRRDAEDWLDTQSEELNQQVVSSSEQLQSCQAEIIELRR TVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMITNVEAQL AEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCA PDYSPSKSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF
Energetická hyperplocha proteinu zaujímajícího svou nativní strukturu z denaturovaného stavu
Department of Molecular Modeling ÚOCHB AV ČR
Schematický model Proteinu
Rotamerní stavy aminokyselin ve struktuře proteinu
Sbalování proteinů je řízeno především aminokyselinami proteinového jádra Aminokyseliny uvnitř molekuly proteinu jsou z hlediska nativní konformace nejdůležitější Sbalování proteinů je řízeno hydrofobními interakcemi
Jak se proteiny sbalují a na čem opravdu záleží? Kontakty mezi jednotlivými aminokyselinami korelují s rychlostí sbalování Sbalování proteinů a jejich mechanismus je z velké části determinován proteinovou topologií.
Mutační studie prokazují že převážná většina aminokyselin může být mutována s nulovým efektem na celkovou strukturu
Role lokálních kontaktů při sbalování proteinů -Proteiny jejichž residua sousedící v sekvenci spolu interagují i ve struktuře mají tendenci se sbalovat rychleji než proteiny s převahou nelokálních kontaktů -Interakce mezi vzdálenými aminokyselinami je z entropického hlediska nevýhodná OTÁZKA: Může vybraná aminokyselina a její fyzikální vlastnosti hrát zásadní roli v procesu nukleace či stabilizace nativní struktury? Jakou vlastnost máme hledat?
Životní cyklus viru HIV Definované terapeutické cíle -Fúze -Reversní transkripce -Integrace -maturace
HIV Proteáza - terapeutický cíl
Folding, unfolding, misfolding, and aggregation Choroby způsobené chybným sbalením popř. agregací Mad cow (human forms, too), Parkinson’s, Huntington’s, ataxia, Alzheimer’s, LCDD, amyloidoses
Amyloidní fibrily z pohledu sbalování proteinů
Neural Network methods A neural network with multiple layers is presented with known sequences and structures - network is trained until it can predict those structures given those sequences Allows network to adapt as needed (it can consider neighboring residues like GOR)
Základní popis genetického algoritmu 1)Je stvořena populace individualit - individua jsou charakterizována a vyjádřena jako sekvence bitů. (obecně – řada) - je definována tzv. fittness funkce. je definována tak, že vezme jako vstup individuum a poskytne jako výstup číslo nebo vektor který udává kvalitu individua - určí se hierarchie individuí podle fittness funkce 2)Provede se ohodnocení všech individuí v první populaci 3)Vytvoří se nová individua. Reprodukční schopnost individuí je proporcionální jejich hierarchii v danné populaci. Zahrnuje následující operace
MutaceVariaceKřížení
4)Výběr individuí pro novou generaci rodičů - v originálním genet. algoritmu se zavrhnou rodiče a pouze individua z nové generace mohou tvořit příští rodiče - upravovaný GA uvažuje pro zhodnocení celou populaci včetně rodičů. Do další generace jsou selektováni fittness funkcí. (tzv. elitářská výměna) 5)opakuj kroky 2 až 4 dokud není dosaženo požadované vlastnosti, nebo dokud neproběhne předepsaný počet iterací Matematické základy GA položil J.H.Holland v tzv. „schemata theorem“ -schema je generalizací nebo částí individua