Biostatistika 4. přednáška

Slides:



Advertisements
Podobné prezentace
Základní statistická analýza dat z pre- a klinických studií
Advertisements

Statistika.
Statistické funkce v tabulkovém kalkulátoru Excel MS
Základní statistické pojmy
Testování parametrických hypotéz
Testování neparametrických hypotéz
Odhady parametrů základního souboru
4EK416 Ekonometrie Úvod do předmětu – obecné informace
EXPLORATORNÍ STATISTIKA
Charakteristiky variability
MĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL
Statistika Vypracoval: Mgr. Lukáš Bičík
Charakteristiky polohy hodnoty znaku - čísla popisující polohu znaku na číselné ose -můžeme zvolit: -Aritmetický průměr -Modus, medián -Harmonický průměr.
Základní statistické pojmy a postupy
Obsah statistiky Jana Zvárová
Analýza dat.
MUDr. Michal Jurajda, PhD. ÚPF LF MU
Biostatistika 9. přednáška Aneta Hybšová
Biostatistika 10. přednáška
Řízení a supervize v sociálních a zdravotnických organizacích
Charakteristické rysy a typy jednorozměrného rozdělení četností.
Základní statistické charakteristiky
Biostatistika 5. přednáška Aneta Hybšová
Charakteristiky variability
Biostatistika 6. přednáška
Biostatistika 7. přednáška
- Pojmy - SPSS Statistické zpracování kvantitativních šetření.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Charakteristiky variability
Teorie psychodiagnostiky a psychometrie
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
Pohled z ptačí perspektivy
Na co ve výuce statistiky není čas
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Biostatistika 1. přednáška Aneta Hybšová
RNDr. Monika Pávková Goldbergová
Popisná analýza v programu Statistica
1. cvičení
STATISTICKÝ ROZCESTNÍK aneb CO S DATY Martin Sebera.
Základy popisné statistiky
Základy statistiky Základní pojmy. Základy statistiky Statistiku můžeme chápat jako činnost - získávání stat. údajů, jejich zpracování a vyhodnocení jako.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Kontingenční tabulky v Excelu Základní popisné statistiky.
Statistika 1 Ústav lékařské informatiky, 2. LF UK 2008.
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
Statistika 2.cvičení
Popisná statistika: přehled
Popisná analýza v programu Statistica
Bi8600: Vícerozměrné metody – cvičení
METODOLOGIE MAGISTERSKÉ PRÁCE
Spojitá a kategoriální data Základní popisné statistiky
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Neparametrické testy pro porovnání polohy
Kapitola 3: Centrální tendence a variabilita
Koncepce normality/normálnosti v medicíně
Metodologie pro ISK 2 Úvod do práce s daty
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
Statistika a výpočetní technika
Analýza kardinálních proměnných
Autor: Honnerová Helena
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Základy popisné statistiky
Charakteristiky polohy
Transkript prezentace:

Biostatistika 4. přednáška Aneta Hybšová email: kurz.biostatistika@gmail.com

Náplň kurzu Úvod do biostatistiky. Význam biostatistiky v biologii a v učitelství. Biostatistický znak, náhodná veličina. Analýza jednorozměrných biostatistických dat, četnosti, střední hodnota, charakteristiky variability, grafické zobrazení. Grafy, tabulky. Vícerozměrná biostatistická data. Základní a výběrový soubor v biostatistice. Testování hypotéz v biostatistice, vybrané parametrické a neparametrické testy, testovací kritérium, kritická hodnota. T-testy, F-test, Mann-Whitneyův pořadový test, Wilcoxonův test, znaménkový test. Měření závislosti mezi kvantitativními a kvalitativními proměnnými (jednoduchá a vícenásobná regresní a korelační analýza, jednorozměrná analýza rozptylu, analýzy v kontingenčních tabulkách). Pearsonův koeficient, Spearmanův koeficient pořadové korelace. Obecný postup analýzy biostatistických dat. Prezentace biostatických výstupů. Úvod do vícerozměrných metod. Analýza rozptylu, Analýza kovariance, Analýza hlavních komponent, Faktorová analýza, Shluková analýza, Diskriminační analýza.

Postup vědeckého výzkumu stanovení vědeckého problému formulace hypotézy testování hypotézy plán experimentu stanovení postupu příprava pro analýzu sběr dat (reliabilita, validita) zpracování dat (uspořádání dat, popis dat) vyhodnocení výsledku interpretace výsledků publikace

Tabulka původních dat přepsaná data z protokolů řádek = jednotka očíslovat si jednotky sloupec = proměnná (znak) každý sloupec se musí jmenovat jinak kódování – vždy si vysvětlit pozor na slova! nespojité proměnné bez desetinného čísla spojité vždy se stejným desetinným rozvojem systém řádků a sloupců obsahující všechny informace z protokolů složitá matice dat

Základní pojmy jednotka proměnná (znak) a počet obměn znaku vlastnost jednotky výzkumu má více než jednu hodnotu (obměna znaku) např. u člověka je to národnost, pohlaví, věk, u billboardu barevnost nebo velikost písma hodnoty proměnné - u proměnné pohlaví to je muž či žena, u proměnné věk potom škála proměnné měříme soubor dat = datový soubor rozsah souboru

Typy proměnných a) nominální (kategoriální) hodnoty nelze seřadit podle velikosti rozdíl mezi přilehlými hodnotami není konstantní poměry hodnot a nula nemají smysl např. barva očí, bydliště, živočišný druh, obor studia ty nominální hodnoty, které nabývají jen dvou hodnot (muž-žena, ano-ne), nazýváme binární (alternativní) proměnné b) ordinální (pořadové) lze je seřadit podle velikosti např. malý-střední-vysoký, dětství-dospívání-dospělost-stáří, výborně-velmi dobře-dobře-vyhověl-nevyhověl mezi těmi jednotlivými hodnotami ale není stejný rozdíl

Typy proměnných c) měřitelné (kardinální) lze je seřadit podle velikosti existuje konstantní rozdíl mezi přilehlými hodnotami poměry hodnot a nula mají smysl např. výška postavy v centimetrech, věk v číslech, barva očí v pixelech nebo RGB dá se s nimi dělat nejvíc matematických operací, jsou informačně nejzajímavější dělí se na spojité a nespojité

Měřitelné proměnné SPOJITÉ nekonečně mnoho nebo mnoho obměn znaku NESPOJITÉ (DISKRÉTNÍ) spočetně obměn znaku

Popisná statistika prezentace dat jak zjednodušit množství informací z původních tabulek souhrn dat, přehledná informace o struktuře dat, ztráta informace a) tabulkové souhrny - četnostní tabulka b) grafické souhrny - sloupcový graf, histogram c) číselné souhrny - míry polohy a variability tabulky, grafy a číselné souhrny se odlišují podle typu proměnné

Tabulka četností tři sloupce - v prvním popisky, v druhém absolutní četnost a ve třetím relativní četnost v posledním řádku vždy součet oněch hodnot absolutní četnost - např. nedospělých je celkem 45 relativní četnost - procentuální vyjádření (absolutní četnost : celkem x 100 = relativní četnost), s tím, že se to píše s desetinnou čárkou, tedy nenapíšu 45%, ale 0,45; celkem musí vždycky relativní četnost vyjít 1,00 v MS Excel

Grafy – sloupcový graf jde do něj převést četnostní tabulka v grafu se musí doplnit popisky os sloupky řadit podle logického klíče, jako je to v četnostní tabulce (neřadit sloupce podle velikosti) vybrat vhodně podrobnou škálu (např. pokud jsou hodnoty do 800, nebudu dělat škálu až do 2000, udělám ji kratší, ale podrobnější) může mít více variant - může být vertikální nebo horizontální

Grafy – koláčový graf také výsečový, kruhový, … vyjadřuje poměr jednotek na celku výhodou je, že se hned vidí, jaká je to část z celku, nevýhodou je relativní nepřehlednost

Grafy – bodový a spojnicový vyjadřuje vývoj, posloupnost, shluk

Popis pomocí charakteristik n - velikost souboru míry polohy (průměry, medián, modus, odlehlá hodnota, kvantily) míry variability (variační rozpětí, kvartilové rozpětí, rozptyl, směrodatná odchylka)

Míry polohy a míry variability

Míry polohy aritmetický průměr - nejčastěji (y je značka pro jedince, y s čarou je průměrný jedinec) – náchylný na odlehlé hodnoty medián - hodnota proměnné, pro kterou platí, že polovina hodnot proměnné v souboru je větších a polovina menších, pokud je počet hodnot sudá, vypočítá se průměr z dvou prostředních hodnot, u nominálních proměnných medián počítat nelze (nejde to ani u ordinální proměnné) odlehlá hodnota - hodnota, která je daleko od mediánu kvartily - rozděluji rozdělení hodnoty proměnné na čtvrtiny (spodní Q1, střední Q2 a horní kvartil Q3 - střední kvartil = medián), kvartily se zase nedají počítat u nominálních a ordinálních proměnných (jen u těch proměnných, které se dají seřadit) kvantily - hodnota, pod níž leží definovaná část údajů (pokud budu chtít vědět 40. percentil, tak to bude ta hodnota, která má pod sebou 40% a nad sebou 60% hodnot) medián a kvartily jsou typy kvantilů modus - nejčastější hodnota proměnné v souboru

Míry variability variační rozpětí - rozdíl mezi největší a nejmenší hodnotou v souboru, rozsah = max - min mezikvartilové rozpětí - odečtení třetího a prvního kvartilu, mezikvartilové rozpětí = Q3 - Q1, není ovlivněn odlehlou hodnotou, protože nepočítá s extrémy rozptyl - průměrná hodnota druhé mocniny odchylky hodnot proměnné od průměru proměnné směrodatná odchylka - druhá odmocnina rozptylu, označuje se jako s, čím větší odchylka, tím je větší variabilita, je ovlivněna odlehlou hodnotou

Rozdělení proměnné - normalita

Výběrová šetření Úplná Neúplná = výběrová N – rozsah populace VS ZS n – počet sledovaných jednotek Průměr Modus Medián Rozložení výběrového souboru N – rozsah populace

Výběrová šetření Náhodný výběr Reprezentativnost Metody výběru Cíl VŠ – odhad stav v ZS (úsudky) Před provedením výběru stanovíme hypotézy a tu poté testujeme – shoda výšky mužů a žen