Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Bioinformatika Jan Pačes Ústav molekulární genetiky Jiří Vondrášek Ústav organické chemie a biochemie

Podobné prezentace


Prezentace na téma: "Bioinformatika Jan Pačes Ústav molekulární genetiky Jiří Vondrášek Ústav organické chemie a biochemie"— Transkript prezentace:

1 Bioinformatika Jan Pačes Ústav molekulární genetiky hpaces@img.cas.cz Jiří Vondrášek Ústav organické chemie a biochemie vondrasek@uochb.cas.cz http://bio.img.cas.cz/kurs

2 Predikce sekundární struktury v proteinech

3

4

5

6

7

8

9

10

11

12

13

14

15 Secondary structure Elements in Protein

16 B Sheets – atom representations

17

18

19

20

21  helices - atom representations

22

23

24 Metoda Chou-Fasman Využívá tabulky konformačních parametrů extrahovaných z reálných struktur a CD spektroskopie Tabulka obsahuje pravděpodobnosti pro jednotlivé sekundární prvky pro každou aminokyselinu

25 1.Assign all of the residues in the peptide the appropriate set of parameters. 2.Scan through the peptide and identify regions where 4 out of 6 contiguous residues have P(a- helix) > 100. That region is declared an alpha- helix. Extend the helix in both directions until a set of four contiguous residues that have an average P(a-helix) P(b-sheet) for that segment, the segment can be assigned as a helix. 3.Repeat this procedure to locate all of the helical regions in the sequence.

26 3. Scan through the peptide and identify a region where 3 out of 5 of the residues have a value of P(b-sheet) > 100. That region is declared as a beta-sheet. Extend the sheet in both directions until a set of four contiguous residues that have an average P(b-sheet) 105 and the average P(b-sheet) > P(a-helix) for that region. 4. Any region containing overlapping alpha-helical and beta-sheet assignments are taken to be helical if the average P(a-helix) > P(b-sheet) for that region. It is a beta sheet if the average P(b-sheet) > P(a- helix) for that region.

27 5. To identify a bend at residue number j, calculate the following value p(t) = f(j)f(j+1)f(j+2)f(j+3) 6. where the f(j+1) value for the j+1 residue is used, the f(j+2) value for the j+2 residue is used and the f(j+3) value for the j+3 residue is used. If: (1) p(t) > 0.000075; (2) the average value for P(turn) > 1.00 in the tetrapeptide; and (3) the averages for the tetrapeptide obey the inequality P(a-helix) P(b-sheet), then a beta-turn is predicted at that location.

28 CHOU-FASMAN RULES FOR ALPHA HELIX: Helical residues = >1.0 for helix. Helical breakers = 4/6 >1.0 nucleates helix. Helix continues both ways until 4 contiguous Special rules for Proline. Segment 5 residues or longer and P(  ) > P(  ) = helix. CHOU-FASMAN RULES FOR BETA STRAND: Beta residues = >1.0 for strand. Beta breakers = 3/5 >1.0 nucleates strand. Strand continues both ways until 4 contiguous Segment with average P(  ) > 1.05 and P(  ) > P(  ) = strand

29 Name P(a) P(b) P(turn)f(i) f(i+1) f(i+2) f(i+3) Alanine 142 83 66 0.06 0.076 0.035 0.058 Arginine 98 93 950.0700.106 0.099 0.085 Aspartic Acid 101 54 146 0.147 0.110 0.179 0.081 Asparagine 67 89 156 0.161 0.083 0.191 0.091 Cysteine 70 119 119 0.149 0.050 0.117 0.128 Glutamic Acid 151 037 74 0.056 0.060 0.077 0.064 Glutamine 111 110 98 0.074 0.098 0.037 0.098 Glycine 57 75 156 0.102 0.085 0.190 0.152 Histidine 100 87 95 0.140 0.047 0.093 0.054 Isoleucine 108 160 47 0.043 0.034 0.013 0.056 Leucine 121 130 59 0.061 0.025 0.036 0.070 Lysine 114 74 101 0.055 0.115 0.072 0.095 Methionine 145 105 60 0.068 0.082 0.014 0.055 Phenylalanine 113 138 60 0.059 0.041 0.065 0.065 Proline 57 55 152 0.102 0.301 0.034 0.068 Serine 77 75 143 0.120 0.139 0.125 0.106 Threonine 83 119 96 0.086 0.108 0.065 0.079 Tryptophan 108 137 96 0.077 0.013 0.064 0.167 Tyrosine 69 147 114 0.082 0.065 0.114 0.125 Valine 106 170 50 0.062 0.048 0.028 0.053

30 Chou-Fasman propensities (partial table)

31

32

33 Garnier-Osguthorpe-Robson GOR Využívá tabulku tendencí určenou primárně z krystalových struktur Tabulka obsahuje jednu pravděpodobnost pro každou strukturu a každou aminokyselinu v okně dlouhém 17 aminokyselin

34 Teorie informace aplikovaná na predikci struktury Jakou informaci získáme o pravděpodobnosti, že residuum j je v jistém stavu (H,E,T,C), ze znalosti jaké residuum je v pozici j  m (m  8), nezávisle na tom co je residuum j zač. Je li m=0, podobné Chou-Fasman

35 pro H

36 Přesnost predikce Obě metody mají přesnost kolem 55 – 65% Hlavní důvod je to, že přeceňují lokální kontext na úkor globálního, tedy typ proteinu Tytéž aminokyseliny mohou zaujímat různé konfigurace v cytoplazmatickém a v membránovém proteinu

37

38

39

40

41

42 PSIPred output window

43

44

45

46

47

48

49

50

51

52

53

54 PSIPRED PREDICTION RESULTS Key Conf: Confidence (0=low, 9=high) Pred: Predicted secondary structure (H=helix, E=strand, C=coil) AA: Target sequence Conf: 952010265389973742568774158851022313889854542110122124543202 Pred: CCCCEECCCEEEEEECCHHHHHHHHCCCCCHHHHHCCCCCCCCCCEEECCCCEEEEEEEC AA: PQITLWQRPLVTIKIGGQLKEALLDTGADDTVLEEMSLPGRWKPKMIGGIGGFIKVRQYD 10 20 30 40 50 60 Conf: 102122066401257647861344327778750531369 Pred: CEEEEECCCCCEEEEEECCCCHHHHHHHHHHHHCCCCCC AA: QIIIEICGHKAIGTVLVGPTPVNIIGRNLLTQIGCTLNF 70 80 90 Calculate PostScript, PDF and JPEG graphical output for this result using: http://bioinf.cs.ucl.ac.uk/cgi-bin/psipred/graphics/nph-view.cgi?id=103942638010041

55

56

57

58

59

60

61 Sekundární strukturní prvky – formulace problému Daná proteinová sekvence – NWVLSTAADMQGVVTDGMASGLDKD... Predikce sekvence sekundární struktury: – LLEEEELLLLHHHHHHHHHHLHHHL... „3-state“ problém: {ARNDCQEGHILKMFPSTWYV} n -> {L,H,E} n

62 Predikce prvků sekundární struktury u proteinů motivace pro předpověď prvků sekundární struktury - efektivní konformační vzorek pro 3D protein folding - vylepšení ostatních sekvenčních a strukturně analytických metod : sekvenční alignment : homologické a „threading“ modelování (CASP) : analýza experimentálních dat : protein design

63 V proteinech se známou strukturou není určení sekundární struktury jednoznačným a jednoduchým úkolem Dva základní klasifikační proramy a postupy pro určení SS z krystalových struktur DSSP a STRIDE výsledky těchto dvou postupů se liší nepatrně Reference Dictionary of protein secondary structure: pattern recognition of hydrogen-bonded and geometrical features. Biopolymers. 1983 Dec;22(12):2577-637. http://www.embl-heidelberg.de/argos/stride/stride_info.html http://www.cmbi.kun.nl/gv/dssp/

64 Výskyt aminokyselin a jejich distribuce v příslušných prvcích sekundární struktury by měly být vodítkem při predikci prvků SS stupeň determinace Klasické metody -Chou Fasman Garnier-Osguthorpe-Robson) -GOR ( Garnier-Osguthorpe-Robson)

65 Adaptivní metody -Metoda neuronových sítí pokusná síť používá sadu známých proteinů k predikci žádané struktury ze sekvenčních dat -Metoda založená na homologii hledané sekvence se známými proteiny

66 Neural Network methods A neural network with multiple layers is presented with known sequences and structures - network is trained until it can predict those structures given those sequences Allows network to adapt as needed (it can consider neighboring residues like GOR)

67

68

69

70

71

72

73

74

75

76

77

78


Stáhnout ppt "Bioinformatika Jan Pačes Ústav molekulární genetiky Jiří Vondrášek Ústav organické chemie a biochemie"

Podobné prezentace


Reklamy Google