Biologická sekvence (BS) ACAGTGCGAGCATGACGATGACGCAGCAGATTGACAGAGACGATAGCAGCAT MASAQSFYLLHLAVDDFMNGAGVLSHERELLFYDENKIHDIVISMNDENMNQ Jazyk THISISJUSTASIMPLESENTENCEINENGLISHFORYOURINSPIRATION.

Slides:



Advertisements
Podobné prezentace
Analýza kvantitativních dat I./II. Typy dat Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 26/2/2012 UK FHS Historická sociologie, Řízení a supervize.
Advertisements

Číslo: Digitální učební materiál vznikl v rámci projektu "Inovace + DVPP", EU peníze do škol, CZ.1.07/1.4.00/ Název: Adverbs of frequency Autor:
Hodnocení způsobilosti měřících systémů
ENVIRONMENTÁLNÍ INFORMATIKA A REPORTING
Plošná interpolace (aproximace)
Teoretická výpočetní chemie
Gymnázium, SOŠ a VOŠ Ledeč nad Sázavou I NFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE Ing. Jan Roubíček.
Fugacitní modely distribuce látek v životním prostředí
Lichoběžník Obsah lichoběžníku.
Pedosféra VLASTNOSTI PŮD A ZNAKY PŮDNÍHO PROFILU
Obsah statistiky Jana Zvárová
Vizualizace dat Jan Vágner 3MA381. Co je vizualizace dat?  Matematická nebo fyzikální nebo jiná data či informace, která jsou převedena do grafického.
Fyzika.
Algoritmizace a základy programování
 vytváření signálů a jejich interpretace ve formě bitů  přenos bitů po přenosové cestě  definice rozhraní (pro připojení k přenosové cestě)  technická.
Izomery izomery jsou organické sloučeniny, jejichž molekuly mají stejný molekulový vzorec, ale rozdílný strukturní vzorec díky rozdílnému strukturnímu.
MÍRY ZÁVISLOSTI Oddělení antropomotoriky, rekreologie a metodologie Katedra kinantropologie, humanitních věd a managementu sportu © 2009 FTVS UK.
POUŽIVÁNÍ FUNKCÍ V EXCELU DOMÁCÍ ÚKOL - KURZ PRÁCE S POČÍTAČI „POKROČILÍ“ NA TÉMA FUNKCE V EXCELU Vypracoval: Petr Šimek
Association for Computing Machinery - Založena v r Zaměření informační technologie - Podporující publikace počítačové literatury (portál ACM) -
Title of the document The content of the document Úroveň 1 Úroveň 2 Úroveň 3 Titulek Výrobky Služby O nás Autorem materiálu a všech jeho částí, není-li.
Chemická stavba bílkovin
Fyzikální systémy hamiltonovské Celková energie systému je vyjádřená Hamiltonovou funkcí H – hamiltoniánem Energie hamiltonovského systému je funkcí zobecněné.
Charakteristiky variability
Chemie anorganických materiálů I.
Possessive Pronouns In each of the following sentences, change the possessive pronouns from singular to plural and vice versa. Vzor: Mám jeho sešity. Mám.
Nová metoda pro generování 2D farmakoforového modelu David Hoksza 1,2, Daniel Svozil 2 SIRET Research Group MFF UK Laboratoř informatiky a chemie FCHT.
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
Tato prezentace byla vytvořena
Aminokyseliny a bílkoviny
NIST WebBook Chemie (NIST Chemistry Webbook)‏. NIST WebBook Chemie (NIST Chemistry Webbook) NIST- National Institute for Standarts and Technology
Gymnázium, Žamberk, Nádražní 48 Projekt: CZ.1.07/1.5.00/ Inovace ve vzdělávání na naší škole Název: Grafické formáty Autor: Mgr. Petr Vanický.
URL v HTML URL - Unique Resource Locator Příklad:
Hledání SPZ Irena Váňová. Přehled Stabilní oblasti Algoritmus hledání SPZ Evoluce hledání příznaků.
Dolce: Databáze lokálních konformací DNA
Molekulární základy dědičnosti
VY_32_INOVACE_ 01 - Ekologie. Ekologie se užívá v několika významech. V původním významu je ekologie biologická věda, která se zabývá vztahem organismů.
Digitální učební materiál
Department of Electrical Engineering Název projektu/publikace Jméno Příjmení.
ANOTACE V prezentaci si žáci procvičují a upevňují používání sloves v přítomném čase prostém ve větách oznamovacích, slovní zásobu tematického okruhu volný.
IV108 - Bioinformatika II Ing. Matej Lexa, PhD. Út 12:00B204Přednáška 13:00B116Cvičení Čt 13:00 – 15:00B308Konzultace Navazuje.
Digitální měřící přístroje
GENETICKÁ INFORMACE je informace, která je primárně obsažena v nukleotidové sekvenci v nukleotidových sekvencích jsou obsaženy následující informace: o.
DISTANCE MATRIXCONTACT MAP 1AUG PDB -> CM. Kontakty – proč jsou zajímavé ? CM -> PDB ?
Přednáška č.5 controlling cash-flow
Proteinové interakce Proteinové komplexy interaktom
Běžně používané fyzikální veličiny pro vyjádření množství látky:
Geometrical shapes - matematika Mgr. Jana Horáková - ZŠ Brno, Antonínská 3 Metodické pokyny pro učitele Předmět: matematika Jazyk: AJ Jazyková úroveň:
PREV v. 3.1DCL, 2012 PREV v. 3.1 P. Dlask Presented for DCL 2012, Prague Extended in the frame of Decision Laboratory Centralized development project 7th.
Druhá mocnina rozdílu.
Molekulová fyzika 3. přednáška „Statistický přístup jako jediná funkční strategie kinetické teorie“
Ústav technických zařízení budov MĚŘENÍ A REGULACE Ing. Václav Rada, CSc. ZS – 2003/
Geografické informační systémy pojetí, definice, součásti
REGRESNÍ ANALÝZA Vysoká škola technická a ekonomická v Českých Budějovicích Institute of Technology And Business In České Budějovice.
Naše půda ZŠ Sokolovská 1 Svitavy.
vektorová fyzikální veličina vyjadřuje míru vzájemného působení dvou těles Účinky: a)statické b) dynamické měří se siloměrem je příčinou pohybu.
Ch_060_Nukleové kyseliny Ch_060_Přírodní látky_Nukleové kyseliny Autor: Ing. Mariana Mrázková Škola: Základní škola Slušovice, okres Zlín, příspěvková.
Anotace Materiál je určen pro 1. ročník studijního oboru M/01 PROVOZ A EKONOMIKA DOPRAVY, předmětu Informační a komunikační technologie, inovuje.
Stavová rovnice ideálního plynu
Erasmus Internship Cagliari, Itálie 2013
Objem tělesa Tematická oblast Fyzika Datum vytvoření Ročník
Protilátky Nejdůležitější Vlastnosti:
Název projektu/publikace
Mikrobiální oživení zeminy po procesu termické desorpce
Organizace výroby Organizace a řízení výroby
Teorie informace z latiny, už 1stol. př. n. l.
AUTOMATIZAČNÍ TECHNIKA Spojité a nespojité řízení
Proteomika Bruno Sopko.
Základy genomiky V. Analýza protein-proteinových interakcí Jan Hejátko
IRP 2017 (Internacionalizace) Výměnná laboratorní praktika FM TUL/HSZG
Fyzikální veličiny Míry fyzikálních vlastností: X = x [X]
Transkript prezentace:

Biologická sekvence (BS) ACAGTGCGAGCATGACGATGACGCAGCAGATTGACAGAGACGATAGCAGCAT MASAQSFYLLHLAVDDFMNGAGVLSHERELLFYDENKIHDIVISMNDENMNQ Jazyk THISISJUSTASIMPLESENTENCEINENGLISHFORYOURINSPIRATION

Frekvence F(x) = P(x) N Je vyšší u řetězců, které jsou součástí často používaných struktur Vzájemná informace MI(x,y) = P(x,y) log ( P(x,y) / (P(x)*P(y)) ) Je vyšší uvnitř struktur než na jejich rozhraní, vyjádřuje korelaci Entropie H(x) = -Σ p(x)*log(p(x)) Určuje míru neuspořádanosti, nebo taky potřebu informace pro definování určitého stavu

Strukturní interpretace frekvence fyzikálně-chemické a prostorové vlastnosti

Strukturní interpretace vzájemné informace ZINC FINGER vazební místo

Další možnosti strukturní interpretace statistických veličin a výpočtů doména vysoká f SHLQFNMIDIVISK nízká f

Matej Lexa, Faculty of Informatics MU BrnoMethods in Plant Sciences, Srni Oct 1-4, 2006 Bioinformatics at the intersection of biology, linguistics and computer science Why bother? BUCKDIDNOTREADTHENEWSPAPERSORHEWOULDHAVEKNOWNTHATTROUBLE WASBREWING MASAQSFYLLHLAVDDFMNGAGVLSHERELLFYIMASKRDLDENCVIGARAKIHDIVISMN DENMN BUCKDIDNOTREADTHENEWSPAPERSORHEWOULDHAVEKNOWNTHATTROUBLE WASBREWING Mental image: Protein: MASAQSFYLLHLAVDDFMNGAGVLSHERELLFYIMASKRDLDENCVIGARAKIHDIVISMN DENMN

Kubota, Lee, Mostly-unsupervised statistical segmentation of Japanese: application to kanji. kanji, hiragana, katakana – znaky různé úrovně kanji jsou na úrovni našich slabik a tvoří polovinu slov sekvence kanji se často dají segmentovat různými způsoby _______ s1 _______ s2 A B C D'W X Y Z _______ t1 _______ t2 _______ t3 _______ t4

Kubota, Lee, Mostly-unsupervised statistical segmentation of Japanese: application to kanji. Pro každou mezeru se vypočítá hodnota (s1+s2)/(t1+...+tn) ____*___________*____ * * * * * * * * * * * * * * A|B C D|W X Y|Z

>SENTENCE THECALLOFTHEWILD >SENTENCE BYJACKLONDON >SENTENCE CHAPTERONE >SENTENCE BUCKDIDNOTREADTHENEWSPAPERSORHEWOULDHAVEKNOWNTHATTROUBLEW ASBREWING Vstupní data pro analýzu textu ve formátě FASTA

__<BUC KDIDNO _<BUCK DIDNOT <BUCKD IDNOTR BUCKDI DNOTRE UCKDID NOTREA CKDIDN OTREAD KDIDNO TREADT DIDNOT READTH IDNOTR EADTHE DNOTRE ADTHEN NOTREA DTHENE OTREAD THENEW TREADT HENEWS READTH ENEWSP EADTHE NEWSPA ADTHEN EWSPAP DTHENE WSPAPE THENEW SPAPER HENEWS PAPERS ENEWSP APERSO NEWSPA PERSOR EWSPAP ERSORH WSPAPE RSORHE SPAPER SORHEW PAPERS ORHEWO APERSO RHEWOU PERSOR HEWOUL ERSORH EWOULD Vyhodnocení frekvence 4-gramů v textu

< THE CALL OF THE 3.37 WILD < BY JACK LOND ON < CHAP TER ONE 1.69 < INTO THE PRIM ITI VE < BU CK DID NOT READ THE NEW SPAP ER SOR HE WOU 2.25 LD 2.73 HA VE KNOW 6.71 NTH ATT 1.74 ROU BLEWASB REW ING < THEC ALL OFTHEW 4.86 ILD 19.2 < BY JACK LONDON < CHAPTERONE < IN TOTHEP RIMI 3.24 TIVE < BUCK DI DNOT REA 6.81 DTHEN EWS PAPERSOR HEW OULD HAVE KNOWN THAT TROUBL EWAS BREWING Segmentace textu v angličtině ~50% ~20% ~20% ~35% 2-gram4-gram2-gram4-gram

CGVGFIANLRGKPDH TLVE QALKALGC MEH RGG CSAD NDSGD GAGV MTAIP Obr. - Stereo pohled na identifikované segmenty RELLAQ WFNT RNLPM PDGDRLGVGM VFLPQ EPSAREVARAY VEEVV RLEKLTVLG WREVPVNS DVLGI QAKN 1.57 NQ PHIEQILVT CPEG 2.37 CAGDELDRRL YIARSIIGKKLAEDF Segmentace sekvence z PDB

Weisser D, Klein-Seetharaman J (2004). Identification of fundamental building blocks in protein sequences using statistical association measures. ACM SAC 2004

Jedním z důvodů spoluvýskytu krátkých sekvencí je, že spolu vytvářejí samostatní doménu, která se vyskytuje ve větším počtu proteinů Spoluvýskyt krátkých sekvencí v proteinech a = SHLQFMV b = DHLDDRK c =...

Vyhodnocení hledání domén >512 Počet korelací procházejících daným místem proteinu Atg07210 porovnaný se záznamem v databáze PRODOM

Celková struktura sekvence jak se jeví při srovnání s ostatními sekvencemi v databázích pomocí BLASTu

Weisser D, Klein-Seetharaman J (2004). Identification of fundamental building blocks in protein sequences using statistical association measures. ACM SAC 2004