Zpracování dat Lenka Radová

Slides:



Advertisements
Podobné prezentace
Expresní DNA microarray
Advertisements

10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ.
Testy hypotéz - shrnutí Testy parametrické Testy neparametrické.
Období vzniku: duben _inovace_FG.9.48 Autor : Vladimír TesaříkČlověk a svět práce, finanční gramotnost, nové auto.
Uvedení autoři, není-li uvedeno jinak, jsou autory tohoto výukového materiálu a všech jeho částí. Tento projekt je spolufinancován ESF a státním rozpočtem.
© Institut biostatistiky a analýz SPEKTRÁLNÍ ANALÝZA Č ASOVÝCH Ř AD prof. Ing. Jiří Holčík, CSc.
Spolupráce Vězeňské služby NGO na Slovensku / možnosti a zaměření v oblasti drogových služeb / Olga Škvařilová, Sdružení Podané ruce Brno, CZ TWINNING.
Maticové počítače. Při operacích s maticí se větší počet prvků matice zpracovává současně a to při stejné operaci. Proto se pro tyto operace hodí nejlépe.
Experimentální metody oboru – Pokročilá tenzometrie – Měření vnitřního pnutí Další využití tenzometrie Měření vnitřního pnutí © doc. Ing. Zdeněk Folta,
Diplomové práce pro CE WOOD a) Bilance toku materiálu pilařského provozu b) Závislost kvality vstupní suroviny na kvalitu výstupních produktů pilařského.
1 Obhajoba diplomové práce Sluneční záření a atmosféra Autor: Tomáš Miléř Vedoucí: Doc. RNDr. Petr Sládek, CSc. Oponent: RNDr. Jan Hollan BRNO 2007Katedra.
TŘENÍ Tato práce je šířena pod licencí CC BY-SA 3.0. Odkazy a citace jsou platné k datu vytvoření této práce. VY_32_INOVACE_18_29.
Digitální učební materiál Název projektu: Inovace vzdělávání na SPŠ a VOŠ PísekČíslo projektu: CZ.1.07/1.5.00/ Škola: Střední průmyslová škola a.
Interpolační metody digitálního fotoaparátu. Princip barevného snímání.
Failure Mode and Effect Analysis Fehler Möglichkeit und Einflüss Analyse Analýza možností vzniku chyb ANALÝZA RIZIK – FMEA.
Didaktická analýza dějepisného učiva Přednáška č. 6 AR 2014/2015.
VYSOKÁ ŠKOLA TECHNICKÁ A EKONOMICKÁ ČESKÉ BUDĚJOVICE ÚSTAV PODNIKOVÉ STRATEGIE Autor bakalářské práce: Jitka Macháčková Vedoucí bakalářské práce: Ing.
Analýza variance (ANOVA).
Věcné autority v roce 2016
Geografické informační systémy
Pasivní součástky Nejrůznější formy a tvary
Základy automatického řízení 1
Oxford WordSmith Tools 4.0
Organizace výroby Organizace a řízení výroby
Procesní management v oddělení logistiky
Detekce malware na základě informací z PE hlaviček
Interpolace funkčních závislostí
POUŠTĚ A POLOPOUŠTĚ.
Zpětná vazba od zákazníků ve vybrané společnosti
Polární oblasti.
Evaluace předmětů studenty (Anketky)
Vysoká škola technická a ekonomická v Českých Budějovicích Ústav podnikové strategie Firemní kultura zahraniční společnosti na území ČR Autor bakalářské.
Základní škola Děčín VI, Na Stráni 879/2 – příspěvková organizace
Jednotné principy klasifikace na GJKT
Střední odborná škola a Střední odborné učiliště, Vocelova 1338
Kompetenční modely Mgr. Andrea Drdáková.
Základy zpracování geologických dat testování statistických hypotéz
Škola ZŠ Masarykova, Masarykova 291, Valašské Meziříčí Autor
Příspěvek na konferenci
Výroba II.. Výroba II. Organizace výrobních pracovišť V jedné dílně jsou příbuzné stroje Výrobek prochází několika dílnami Technologické uspořádání.
PhDr.Hana Pazlarová, Ph.D
Název školy Gymnázium, střední odborná škola, střední odborné učiliště a vyšší odborná škola, Hořice Číslo projektu CZ.1.07/1.5.00/ Název materiálu.
Základy zpracování geologických dat testování statistických hypotéz
SÁRA ŠPAČKOVÁ MARKÉTA KOČÍBOVÁ MARCELA CHROMČÁKOVÁ LUKÁŠ BARTOŠ B3E1
PSY Statistická analýza dat v psychologii Přednáška 3
Stabilizátory napětí Jejich úkolem je udržovat stálé napětí na zátěži.
Digitální učební materiál
C7188 Úvod do molekulární medicíny 4/12
Spojité VELIČINY Vyšetřování normality dat
Autor: Mgr. Yvetta Kałužová
PSY252 Statistická analýza dat v psychologii II
Jak postupovat při měření?
Metagenomika - Metatranskriptomika
Energetický management
Vizualizace interakčních dat
XII. Binomické rozložení
Úvod do praktické fyziky
Porovnání výsledků manuálních a automatických měření meteorologických parametrů na OBK Karel Dejmal Observatoř Košetice.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Lineární činitel prostupu
Projekt Anglicky v odborných předmětech, CZ.1.07/1.3.09/
PhDr.Hana Pazlarová, Ph.D
Počítačová podpora konstruování
Hodnocení výsledků KO Bourková L., OKH FN Brno.
DNN - Deep neural networks (Hluboké neuronové sítě)
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Název školy Gymnázium, střední odborná škola, střední odborné učiliště a vyšší odborná škola, Hořice Číslo projektu CZ.1.07/1.5.00/ Název materiálu.
Porovnání modelů SYMOS’97 a ATEM Emisní model MEFA
KŘIVKA DEFORMACE.
Teorie chyb a vyrovnávací počet 2
Transkript prezentace:

Zpracování dat Lenka Radová 3.10.2014 LÉKAŘSKÁ FAKULTA MASARYKOVY UNIVERSITY Interní hematoonkologická klinika LF MU a FN Brno Centrum molekulární biologie a genové terapie Zpracování dat Lenka Radová 3.10.2014

Převod obrazové informace na numerická data Adresace Segmentace Extrakce intenzit Příprava dat Kontrola kvality Normalizace Filtry Analýza dat Class discovery vs. Class prediction Supervised vs. Unsupervised Integrace s dalšími zdroji informací Meta-analýza

Zpracování obrazu Adresace (gridding) Určení pozice jednotlivých spotů Většinou úprava předem daných očekávaných pozic Pozice spotů bývají součástí anotace dodané výrobcem Různé automatické a poloautomatické algoritmy Většinou možnost manuální úpravy

Zpracování obrazu Segmentace Klasifikace jednotlivých pixelů Popředí Pozadí Různé algoritmy Fixed circle – velmi jednoduchý, neadaptivní Adaptive circle Histogram Adaptive shape – např. Watershed algoritmus Shluková analýza

Zpracování obrazu Extrakce intenzit Různé vyjádření Medián Průměr Poměr (červená/zelená) Průměr poměrů jednotlivých pixelů Výpočet parametrů kvality Poměr signál/šum Rozptyl intenzit pixelů (SD) Cirkularita Posun od očekávané pozice Affymetrix Probe sets = více sond pro jeden gen Speciální metody pro výpočet výsledné hodnoty

Příprava dat Normalizace Dovoluje porovnávat naměřené hodnoty mezi sebou V rámci jedné array Mezi arrays Jedna array Mezi kanály (červená/zelená) Mezi regiony Dvoukanálové => poměry R/G Jednokanálové => intenzity Transformace Log2 (poměry, intenzity) Log10 (intenzity)

Příprava dat Normalizace Metody Lineární vs. nelineární Vydělení průměrem Scaling Quantile LOESS Scaling s využitím housekeeping genů/spike-in kontrol

Příprava dat Kontrola kvality Obecné Pozadí Distribuce intenzit Distribuce poměrů Specifické Negativní, pozitivní kontroly Spike-in 3'/5' poměr Filtry Odstranění nekvalitních/nepotřebných dat

Analýza dat Class discovery Nalezení vztahů v datech – skupiny vzorků, genů Metody Shluková analýza Hierarchické shlukování, k-means, self organising maps,.. Analýza hlavních komponent (PCA) Class prediction Klasifikace vzorků na základě expresních dat Metody Support vector machines K-nearest neighbor Neural networks Decision trees Nearest shrunken centroids

Analýza dat Unsupervised Bez informace o vzorcích (genech) (= Class discovery) Supervised Vzorky (geny) předem rozděleny do skupin Class prediction – algoritmy se učí na známých vzorcích Statistické testy 2 a více skupin (vzorků) – hledání rozdílů (dif. exprimovaných genů) t-test, ANOVA, neparametrické testy, SAM (significance analysis of microarrays) ! korekce mnohonásobného testování (Bonferoni,...), odhad chyby (FDR)

Analýza dat Integrace s dalšími daty Funkce genů Gene Ontology, KEGG, BioCarta Genové interakce, možné funkční vztahy Transkripční faktory, microRNA motivy, publikace Metody Testy vyššího výskytu termínů mezi zvolenými geny (GSEA) Sítě (Networks) Dráhy (Pathways)

Analýza dat Metaanalýza Analýza více experimentů Úložiště dat GEO – gene expression omnibus (NCBI) ArrayExpress (EBI) Standardy MAGE-ML – formát dat (jazyk) MIAME – Minimum Information About Microarray Experiment Informace umožňuje zopakování experimentu Nedostatek informací o vzorcích Porovnatelnost platforem, laboratoří

17.10.2014 Resekvenační čipy, „tilling arrays“, ChIP on chip, čipy pro stanovení metylace, arrayCGH, SNP a Cytočipy (K. Plevová)