Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Informační tok. NázevSymbolVýskyt (%) AlanineA, Ala7.49 ArginineR, Arg5.22 AsparagineN, Asn4.53 Aspartic acidD, Asp5.22 CysteineC, Cys1.82 GlutamineQ,

Podobné prezentace


Prezentace na téma: "Informační tok. NázevSymbolVýskyt (%) AlanineA, Ala7.49 ArginineR, Arg5.22 AsparagineN, Asn4.53 Aspartic acidD, Asp5.22 CysteineC, Cys1.82 GlutamineQ,"— Transkript prezentace:

1 Informační tok

2

3 NázevSymbolVýskyt (%) AlanineA, Ala7.49 ArginineR, Arg5.22 AsparagineN, Asn4.53 Aspartic acidD, Asp5.22 CysteineC, Cys1.82 GlutamineQ, Gln4.11 Glutamic acidE, Glu6.26 GlycineG, Gly7.10 HistidineH, His2.23 IsoleucineI, Ile5.45 LeucineL, Leu9.06 LysineK, Lys5.82 MethionineM, Met2.27 PhenylalanineF, Phe3.91 ProlineP, Pro5.12 SerineS, Ser7.34 ThreonineT, Thr5.96 TryptophanW, Trp1.32 TyrosineY, Tyr3.25 ValineV, Val6.48 NázevSymbolVýskyt (%) 20 základních L- aminokyselin

4 asparagineargininealanine glutamineglycinehistidine aspartic acidcysteine glutamic acidisoleucine leucinelysinemethioninephenylalanineproline serine threonine tryptophantyrosinevaline

5 SQ Sequence BP; 2589 A; 4068 C; 3455 G; 2735 T; 0 other; aagcttgata aataaatgga gggacagcag cgttatctcc acctcccata atgaaaaaac 60 ttgtctcatg tataatatta taatattaaa taattggttc tacaaatata caagagtcga 120 gggcattgaa ttgcagaaac tttgagtaga agtgtagtcc aatctttttt attaccaata 180 tttctcaatt ataattttct tcactatata tatatttttt taaaaggtgt catcctaaca 240 cattttatta aaataaatat gattagatat aataattata ccttgaagag atacaaaata 300 cagtgcataa aactagccct tgaacaattt aattgtgtaa tctacaaatt aggttctcaa 360 gttgagcaaa tatatatata tacatatatg ttgaaaaaac ataaatagaa aaggttgtta 420 tcaacataac cctatggaga cctataattc cctaaatcaa catgccctca tacattacgc 480 ttaaactcac ttggtagagg tggtcttgat ctaatccatg cacttccatt gacaacaata 540 tgctttatac gtttacacaa actctctaag gcaatatgat cttgaaaaat acctaggtgg 600 tgatagaaag agaagtgggg aattggagta gccaatctta tatgtttttg tatatgtggg 660 gcaataccat ttatatttcc ttaagttcaa aatcattttt gccaatcaaa tgtcttgagt 720 gattagactt ataaaaatgc aataatggct cttggttggt tgttctaagt tgcttaaaaa 780 aatattaaca tgaatcaaaa ttaactgctt caaggagttg aacattgact actaaaatgc 840 aaatgtcctt taaacaaatg agtaggaaca cttaacttag atcaaacata acatcctaat 900 cactttaaaa tgtcaattcc aaccccttta tcaacttcaa tcccaagatg tcctctctct 960 tattgatatt tgaacaacaa caaagataaa caaccattat ccctaccaag caagtaactt 1020 gtagaaaaaa agaaaaaaga aaaaaggaaa aaggatcctt taaaaagcca aaagccacca 1080 caattccaac cctttgatca acttcaatcc caagatgtcc tctctcttat tgatatttga 1140 acaacaacaa agataaacaa cctttatcct taccaagcag gtaacttgta gaaaaaaaaa 1200

6 Syntéza proteinu během translace

7 >1HCO:A|PDBID|CHAIN|SEQUENCE VLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHG SAQVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLS HCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVLTSKYR >1HCO:B|PDBID|CHAIN|SEQUENCE VHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTP DAVMGNPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPEN FRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH

8 Afinsenův postulát Sekvence proteinu obsahuje veškerou nutnou informaci která určuje prostorovou strukturu proteinu. SPERM WHALE MYOGLOBIN

9 MYSSSPCKLPSLSPVARSFSACSVGLGRSSYRATSCLPALCLPAGGFA TSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRHVEQENASLE SRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDN AKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVE SLKEELLCLKKNHEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMR CQYETLVENNRRDAEDWLDTQSEELNQQVVSSSEQLQSCQAEIIELRR TVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMITNVEAQL AEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCA PDYSPSKSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF KÓDUJÍCÍ SEKVENCE (TEXT,PROTEIN,ČÍSLA??) Jaký druh statistických dat hledat?? - ČETNOST ZASTOUPENÍ JEDNOTLIVÝCH PÍSMEN? - ZNAKOVÉ MOTIVY ? - PROSTOROVÉ ZOBRAZENÍ ? - PŘÍBUZNÉ SEKVENCE V DATABÁZÍCH?

10 >sp|Q92764|K1H5_HUMAN Keratin, type I cuticular Ha5 (Hair keratin, type I Ha5) - Homo sapiens (Human). MYSSSPCKLPSLSPVARSFSACSVGLGRSSYRATSCLPALCLPAGGFA TSYSGGGGWFGEGILTGNEKETMQSLNDRLAGYLEKVRHVEQENASLE SRIREWCEQQVPYMCPDYQSYFRTIEELQKKTLCSKAENARLVVEIDN AKLAADDFRTKYETEVSLRQLVESDINGLRRILDDLTLCKSDLEAQVE SLKEELLCLKKNHEEEVNSLRCQLGDRLNVEVDAAPPVDLNRVLEEMR CQYETLVENNRRDAEDWLDTQSEELNQQVVSSSEQLQSCQAEIIELRR TVNALEIELQAQHSMRDALESTLAETEARYSSQLAQMQCMITNVEAQL AEIRADLERQNQEYQVLLDVRARLECEINTYRGLLESEDSKLPCNPCA PDYSPSKSCLPCLPAASCGPSAARTNCSPRPICVPCPGGRF

11

12

13 Energetická hyperplocha proteinu zaujímajícího svou nativní strukturu z denaturovaného stavu

14 Department of Molecular Modeling ÚOCHB AV ČR

15 Schematický model Proteinu

16

17 Rotamerní stavy aminokyselin ve struktuře proteinu

18 Sbalování proteinů je řízeno především aminokyselinami proteinového jádra Aminokyseliny uvnitř molekuly proteinu jsou z hlediska nativní konformace nejdůležitější Sbalování proteinů je řízeno hydrofobními interakcemi

19 Jak se proteiny sbalují a na čem opravdu záleží? Kontakty mezi jednotlivými aminokyselinami korelují s rychlostí sbalování Sbalování proteinů a jejich mechanismus je z velké části determinován proteinovou topologií.

20 Mutační studie prokazují že převážná většina aminokyselin může být mutována s nulovým efektem na celkovou strukturu

21 Role lokálních kontaktů při sbalování proteinů -Proteiny jejichž residua sousedící v sekvenci spolu interagují i ve struktuře mají tendenci se sbalovat rychleji než proteiny s převahou nelokálních kontaktů -Interakce mezi vzdálenými aminokyselinami je z entropického hlediska nevýhodná OTÁZKA: Může vybraná aminokyselina a její fyzikální vlastnosti hrát zásadní roli v procesu nukleace či stabilizace nativní struktury? Jakou vlastnost máme hledat?

22

23

24

25 Životní cyklus viru HIV Definované terapeutické cíle -Fúze -Reversní transkripce -Integrace -maturace

26 HIV Proteáza - terapeutický cíl

27

28

29

30

31 Folding, unfolding, misfolding, and aggregation Choroby způsobené chybným sbalením popř. agregací Mad cow (human forms, too), Parkinson’s, Huntington’s, ataxia, Alzheimer’s, LCDD, amyloidoses

32 Amyloidní fibrily z pohledu sbalování proteinů

33

34 Neural Network methods A neural network with multiple layers is presented with known sequences and structures - network is trained until it can predict those structures given those sequences Allows network to adapt as needed (it can consider neighboring residues like GOR)

35

36

37 Základní popis genetického algoritmu 1)Je stvořena populace individualit - individua jsou charakterizována a vyjádřena jako sekvence bitů. (obecně – řada) - je definována tzv. fittness funkce. je definována tak, že vezme jako vstup individuum a poskytne jako výstup číslo nebo vektor který udává kvalitu individua - určí se hierarchie individuí podle fittness funkce 2)Provede se ohodnocení všech individuí v první populaci 3)Vytvoří se nová individua. Reprodukční schopnost individuí je proporcionální jejich hierarchii v danné populaci. Zahrnuje následující operace

38 MutaceVariaceKřížení

39 4)Výběr individuí pro novou generaci rodičů - v originálním genet. algoritmu se zavrhnou rodiče a pouze individua z nové generace mohou tvořit příští rodiče - upravovaný GA uvažuje pro zhodnocení celou populaci včetně rodičů. Do další generace jsou selektováni fittness funkcí. (tzv. elitářská výměna) 5)opakuj kroky 2 až 4 dokud není dosaženo požadované vlastnosti, nebo dokud neproběhne předepsaný počet iterací Matematické základy GA položil J.H.Holland v tzv. „schemata theorem“ -schema je generalizací nebo částí individua


Stáhnout ppt "Informační tok. NázevSymbolVýskyt (%) AlanineA, Ala7.49 ArginineR, Arg5.22 AsparagineN, Asn4.53 Aspartic acidD, Asp5.22 CysteineC, Cys1.82 GlutamineQ,"

Podobné prezentace


Reklamy Google