IV108 - Bioinformatika II Ing. Matej Lexa, PhD. Út 12:00B204Přednáška 13:00B116Cvičení Čt 13:00 – 15:00B308Konzultace Navazuje.

Slides:



Advertisements
Podobné prezentace
Výukový materiál VY_52_INOVACE_22_ Nukleové kyseliny
Advertisements

Tvorba stránek  komu jsou stránky určeny  grafická úprava stránek  obsah  motivy vzhledu stránky
1 Počítačové sítě Úvodní přednáška Cíl předmětu –seznámit se s principy datové komunikace –seznámit se s principy distribučních systémů –seznámit se s.
Albertina a Report Mgr. Libuše Simandlová
Základy informatiky přednášky Kódování.
Teoretická výpočetní chemie
PřF UP Bc. Milan Glabazňa, diplomová práce 2012 A1.
Praktikum základů genomiky, zima 2007 Základy genomiky I. Úvod do bioinformatiky Jan Hejátko Masarykova univerzita, Laboratoř funkční genomiky a proteomiky.
Obsah a organizace Počítačová grafika POG 2
XII/2007 Gepro, spol. s r.o. Ing. Stanislav Tomeš Struktura výkresu - titulní strana Struktura výkresu WKOKEŠ.
Biologická diverzita a Indexy biodiverzity
Informatika pro ekonomy II přednáška 1
Gymnázium, SOŠ a VOŠ Ledeč nad Sázavou I NFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE Ing. Jan Roubíček.
Výukový materiál zpracován v rámci oblasti podpory 1.5 „EU peníze středním školám“ Název školy Obchodní akademie a Hotelová škola Havlíčkův Brod Název.
Bioinformatický a chemoinformatický výzkum v Loschmidtových laboratořích Loschmidtovy laboratoře, Ústav experimentální biologie, Výzkumné centrum toxických.
Vizualizace dat Jan Vágner 3MA381. Co je vizualizace dat?  Matematická nebo fyzikální nebo jiná data či informace, která jsou převedena do grafického.
Modelovací jazyk UML. Jazyk UML je víceúčelový modelovací jazyk, který byl vyvinut speciálně pro účely softwarového inženýrství. Obsahuje formalizovaný.
Systémy pro podporu managementu 2
Strategie řízení informačních a komunikačních služeb ve škole PROČ ?
Co jsou to multimédia Bohumil Bareš.
Úvodní setkání Ing. Zuzana Khendriche Trhlínová, Ph.D.
BRVKA. BRVKA ZKOUŠKA  ZÁPOČET:  aktivní účast na cvičeních (max. 3 absence)  úspěšně zvládnutý test na 6. a 13. cvičení (aspoň 40%) (bude 5 příkladů.
Digitální fotografie Struktura a organizace. Digitální fotografie úvod doc. Ing. Stanislav Horný, CSc,
Základy molekulární taxonomie J.Flegr, Praha 2008.
ANOTACEPrezentace obsahuje informace o práci s vyhledávačem Google. Druh učebního materiáluDUM Očekávané výstupy Žáci umí použít vyhledávač Google k vyhledávání.
Molekulární biologie v oboru šlechtitelské praxe vojtech pivnicka.
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA Úvod, kombinatorika
ŠkolaStřední průmyslová škola Zlín Název projektu, reg. č.Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávací.
Jiří Vondrášek Ústav organické chemie a biochemie AV ČR Bioinformatika podzimní škola výpočetní chemie, Praha 2006.
B130P16: Praktické základy vědecké práce Katedra experimentální biologie rostlin PřF UK iHOP - plnotextové vyhledávání Pubmed.
Marketing v EU Ing. Alena Klapalová. 1.setkání: úvod do problematiky „povinnosti“ ke zkoušce zdroje informací brainstorming.
Molekulární základy dědičnosti
1.1. Podpora prodeje TUTORIAL Ing. Vilém Kunz,Ph.D.
DNA.
ŠkolaStřední průmyslová škola Zlín Název projektu, reg. č.Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávací.
VY_32_INOVACE_4.2.IVT4N,1,2.03/Če Gymn á zium, Český Tě ší n, př í spěvkov á organizace Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je.
DISTANCE MATRIXCONTACT MAP 1AUG PDB -> CM. Kontakty – proč jsou zajímavé ? CM -> PDB ?
Informační zdroje pro molekulární biologii M. Jurajda.
Molekulárně biologické databáze
Molekulárně biologické databáze Pro zajímavost, nebude součástí zkoušky… Důležité, pravděpodobně bude u zkoušky…
Počítačové sítě Úvodní přednáška Cíl předmětu –seznámit se s principy datové komunikace –seznámit se s principy přenosových systémů –seznámit se s architekturou.
Biologická sekvence (BS) ACAGTGCGAGCATGACGATGACGCAGCAGATTGACAGAGACGATAGCAGCAT MASAQSFYLLHLAVDDFMNGAGVLSHERELLFYDENKIHDIVISMNDENMNQ Jazyk THISISJUSTASIMPLESENTENCEINENGLISHFORYOURINSPIRATION.
Účetní systémy na PC (MPF_USPC)
Z0026 Fyzická geografie Vyučující: Prof. RNDr. Rudolf Brázdil DrSc.
Tvorba aplikace pro evidenci rybářských úlovků, využívající službu WWW Vedoucí diplomové práce : Ing. Kateřina Růžičková, Ph.D. Název diplomové práce:
Fyzická geografie Podzim 2014 Z0026/2 – čtvrtek 18 – 18.50, Z4 Z0026/3 – čtvrtek 19 – 19.50, Z4 Cvičení 1 - Organizační pokyny Mgr. Ondřej.
Ústav technických zařízení budov MĚŘENÍ A REGULACE Ing. Václav Rada, CSc. ZS – 2003/
Základy sociální politiky PVZASP Jaro 2006 Katedra veřejné ekonomie Mirka Wildmannová 5. patro, místnost 523 Konzultační hodiny: úterý.
FINANČNÍ TRHY doc. Ing. Martin Svoboda, Ph. D
Marketing v EU Ing. Alena Klapalová, Ph.D. č.d.634.
Diplomový projekt pro studijní obor Finance – II. přednáška Zásady a osnova DP Plán zpracování DP.
BIOKYBERNETIKA Organizace výuky BIO/LS Kontakty Ing. Lucie Houdová, Ph.D. – přednášející, cvičící Místnost: UN526 Konzultační.
Biotechnologie, technologie budoucnosti Aleš Eichmeier.
Replikace genomu Mechanismus replikace Replikace u bakterií Replikace u eukaryotnich buněk.
Ch_060_Nukleové kyseliny Ch_060_Přírodní látky_Nukleové kyseliny Autor: Ing. Mariana Mrázková Škola: Základní škola Slušovice, okres Zlín, příspěvková.
Název SŠ: SŠ-COPT Uherský Brod Autoři: Ing. Hana Ježková Název prezentace (DUMu): 1. Charakteristika a historie ekologie Název sady: Základy ekologie pro.
Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem České republiky. Navrhování a hodnocení technického produktu z hlediska.
Počítače a programování 2
Veřejná politika Garant kursu a přednášející:
NÁZEV ŠKOLY: ČÍSLO PROJEKTU: NÁZEV MATERIÁLU: TÉMA SADY: ROČNÍK:
Osnova přednášek Předmět Abeceda mzdových systémů
Informační modelování budov (BIM)
Z0026 Fyzická geografie Vyučující: Prof. RNDr. Rudolf Brázdil DrSc.
Metody analýzy mikroorganismů II
Geografické informační systémy
Molekulární základy genetiky
NUKLEOVÉ KYSELINY Dusíkaté báze Cukry Fosfát guanin adenin tymin
Informační modelování budov (BIM)
Kurz 1FU191 Metodologický seminář
Transkript prezentace:

IV108 - Bioinformatika II Ing. Matej Lexa, PhD. Út 12:00B204Přednáška 13:00B116Cvičení Čt 13:00 – 15:00B308Konzultace Navazuje na IV107 (Bioinformatika) Projekt: Program pro hodnocení sekvenčních vzorů Termín: Bloky přednášek: 1) Informační obsah a struktura biologických sekvencí 2) Vyhledávací nástroje 3) Předpovídání struktury nukleových kyselin a proteinů Zkouška: Písemná 45 bodů. Hodnocené práce ve cvičení a projekt můžou přispívat k celkovému bodovému hodnocení u zkoušky do výše 10+5 bodů. Základním studijním materiálem jsou přednášky a učebnice. Další studijní materiály budou specifikovány průběžně.

 A – %  B – %  C – %  D – %  E – %  F – % Klasifikace Kolokvium Projekt splňující zadání odevzdán Zkouška Projekt splňující zadání odevzdán – podmínka zkoušky. Projekt v termínu a hodnocen v horním mediánu projektů = 5b (5%) Vyřešen problém z cvičení = 1b (bonus 20%, max 10x) Písemná zkouška max. 45b (95%)

Umí pracovat s velkými datovými soubory Moudrými triky ovláda výkonné počítače V datech hledá zajímavé subsekvence Srovnává podobné sekvence Předpovídá strukturu a funkci genů a proteinů Studuje vývoj sekvencí a organizmů Data a výsledky analýz zobrazuje graficky Co dělá bioinformatik

1.0. Problém identifikace genů 2.1. Problém hodnocení podobnosti biologických sekvencí 2.2. Problém identifikace historických změn sekvence 3.1. Problém předpovídání funkce genů 3.2. Problém předpovídání struktury DNA, RNA a proteinů 4.0. Problém intuitivního zobrazení komplexních dat Problémy řešené v bioinformatice

Michael S Waterman (1995). Introduction to computational biology” Maps, sequences and genomes. Chapman&Hall/CRC, Boca Raton, 431 s. ISBN Studijní literatura

D.E.Krane and M.L.Raymer (2003). Fundamental Concepts of Bioinformatics. Benjamin Cummings, London, 320 s. ISBN J.-M.Claverie. (2003). Bioinformatics for dummies. Hoboken, Wiley Publishing, 452 s. ISBN: Doplňková literatura

NCBI

DNA – RNA – PROTEIN SEKVENCE – STRUKTURA – FUNKCE

>chs1 atgacagaat acaggatgac tatgacgtga cggcttatat gatgacc... GENOTYPFENOTYP >chs1 MFVDDHLA VNQNFYLR SHRQL... GEN.KÓDSTRUKTURAFUNKCE

Biologická sekvence (BS) ACAGTGCGAGCATGACGATGACGCAGCAGATTGACAGAGACGATAGCAGCAT MASAQSFYLLHLAVDDFMNGAGVLSHERELLFYDENKIHDIVISMNDENMNQ Jazyk THISISJUSTASIMPLESENTENCEINENGLISHFORYOURINSPIRATION

Informace

ZDROJ PŘÍJEMCE Mateřská buňka nebo organizmus Molekulární aparát potomství DNA Biologická sekvence jako informace, život jako komunikace mezi buňkami, DNA jako komunikační kanál šum

Q C N A A 0.2 C 0.5 N 0.3 Sekvence jako Markovův řetězec NCMKLFQCDSHL P(Xi+1|Xi) = P(Xi+1|X0,...,Xi)

LFQ FQC FQN FQA A 0.2 C 0.5 N 0.3 Sekvence jako Markovův řetězec NCMKLFQCDSHL NCM,CMK,MKL,KLF,LFQ,FQC,QCD,CDS,DSH,SHL

Frekvence a pravděpodobnost výskytu F(x) = P(x) N Je vyšší u řetězců, které jsou součástí často používaných struktur Vzájemná informace MI(x,y) = P(x,y) log ( P(x,y) / (P(x)*P(y)) ) Je vyšší uvnitř struktur než na jejich rozhraní, vyjádřuje korelaci Entropie H(x) = -Σ p(x)*log(p(x)) Určuje míru neuspořádanosti, nebo taky potřebu informace pro definování určitého stavu

prot]$ egrep -c "SSS" ATH1.fa prot]$ egrep -c "WWW" ATH1.fa 75 Co vyjádřuje frekvence v biologických sekvencích

TATATAA TATAAAA TATATAT TATAAAT TATA.A.konsensus TATAWAWRE, W=[TA] entropie Co vyjádřuje entropie v biologických sekvencích H(x) = -Σ p(x)*log(p(x))

Jiný pohled na entropii (podmíněná entropie) prot]$ egrep -c MASAL. ATH1.fa 19 prot]$ egrep -c MASALL ATH1.fa 0 prot]$ egrep -c MASALE ATH1.fa 7 H(x) = -Σ p(x)*log(p(x))

$ egrep -c "." ATH1.fa $ egrep -c "C..C" ATH1.fa 8196 $ egrep -c "H..H" ATH1.fa 7398 $ egrep -c C..C.+H..H\|H..H.+C..C ATH1.fa 1005 $ bc bc *1000/ *1000/ *0.031* Co vyjádřuje MI v biologických sekvencích MI(x,y) = P(x,y)log(P(x,y)/(P(x)*P(y)))

$ egrep -c "." ATH1.fa $ egrep -c "C..C" ATH1.fa 8196 $ egrep -c "H..H" ATH1.fa 7398 $ egrep -c C..C.+H..H\|H..H.+C..C ATH1.fa 1005 $ bc bc *1000/ *1000/ *0.031* Co vyjádřuje MI v biologických sekvencích ZINC FINGER MI(x,y) = P(x,y)log(P(x,y)/(P(x)*P(y)))

Shannon A mathematical theory of communication.

Pracovná verzia analógie biológia/jazyk pre proteíny proteínveta doména, motívfráza segment (?)slovo perióda sekundárnej štruktúryslabika aminokyselinapísmeno, hláska funkcia domény, proteínuvýznam frázy, vety funkcia segmentu, vazbavýznam slova malé molekulymentálne reprezentácie objektov chemické reakciemyslenie, učenie metabolická dráharozhovor štruktúra proteínuneurologický obraz, myšlienka pravidlá skladania proteínovsyntax

agi Nazdar Agi! Podarilo sa mi zohnat tie listky do kina, stav sa u mna po skole a dohodneme co a ako. Milan. Běžná sekvence proteinu má informační obsah několika SMS zpráv.

bunke Defosforylujemribozus adeninomktorusomdostal odsvojhopartneravlavoak mamfosforylovanyserin