Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Biostatistika 4. přednáška

Podobné prezentace


Prezentace na téma: "Biostatistika 4. přednáška"— Transkript prezentace:

1 Biostatistika 4. přednáška
Aneta Hybšová

2 Náplň kurzu Úvod do biostatistiky. Význam biostatistiky v biologii a v učitelství. Biostatistický znak, náhodná veličina. Analýza jednorozměrných biostatistických dat, četnosti, střední hodnota, charakteristiky variability, grafické zobrazení. Grafy, tabulky. Vícerozměrná biostatistická data. Základní a výběrový soubor v biostatistice. Testování hypotéz v biostatistice, vybrané parametrické a neparametrické testy, testovací kritérium, kritická hodnota. T-testy, F-test, Mann-Whitneyův pořadový test, Wilcoxonův test, znaménkový test. Měření závislosti mezi kvantitativními a kvalitativními proměnnými (jednoduchá a vícenásobná regresní a korelační analýza, jednorozměrná analýza rozptylu, analýzy v kontingenčních tabulkách). Pearsonův koeficient, Spearmanův koeficient pořadové korelace. Obecný postup analýzy biostatistických dat. Prezentace biostatických výstupů. Úvod do vícerozměrných metod. Analýza rozptylu, Analýza kovariance, Analýza hlavních komponent, Faktorová analýza, Shluková analýza, Diskriminační analýza.

3 Postup vědeckého výzkumu
stanovení vědeckého problému formulace hypotézy testování hypotézy plán experimentu stanovení postupu příprava pro analýzu sběr dat (reliabilita, validita) zpracování dat (uspořádání dat, popis dat) vyhodnocení výsledku interpretace výsledků publikace

4 Tabulka původních dat přepsaná data z protokolů řádek = jednotka
očíslovat si jednotky sloupec = proměnná (znak) každý sloupec se musí jmenovat jinak kódování – vždy si vysvětlit pozor na slova! nespojité proměnné bez desetinného čísla spojité vždy se stejným desetinným rozvojem systém řádků a sloupců obsahující všechny informace z protokolů složitá matice dat

5 Základní pojmy jednotka proměnná (znak) a počet obměn znaku
vlastnost jednotky výzkumu má více než jednu hodnotu (obměna znaku) např. u člověka je to národnost, pohlaví, věk, u billboardu barevnost nebo velikost písma hodnoty proměnné - u proměnné pohlaví to je muž či žena, u proměnné věk potom škála proměnné měříme soubor dat = datový soubor rozsah souboru

6 Typy proměnných a) nominální (kategoriální)
hodnoty nelze seřadit podle velikosti rozdíl mezi přilehlými hodnotami není konstantní poměry hodnot a nula nemají smysl např. barva očí, bydliště, živočišný druh, obor studia ty nominální hodnoty, které nabývají jen dvou hodnot (muž-žena, ano-ne), nazýváme binární (alternativní) proměnné b) ordinální (pořadové) lze je seřadit podle velikosti např. malý-střední-vysoký, dětství-dospívání-dospělost-stáří, výborně-velmi dobře-dobře-vyhověl-nevyhověl mezi těmi jednotlivými hodnotami ale není stejný rozdíl

7 Typy proměnných c) měřitelné (kardinální)
lze je seřadit podle velikosti existuje konstantní rozdíl mezi přilehlými hodnotami poměry hodnot a nula mají smysl např. výška postavy v centimetrech, věk v číslech, barva očí v pixelech nebo RGB dá se s nimi dělat nejvíc matematických operací, jsou informačně nejzajímavější dělí se na spojité a nespojité

8 Měřitelné proměnné SPOJITÉ nekonečně mnoho nebo mnoho obměn znaku
NESPOJITÉ (DISKRÉTNÍ) spočetně obměn znaku

9 Popisná statistika prezentace dat
jak zjednodušit množství informací z původních tabulek souhrn dat, přehledná informace o struktuře dat, ztráta informace a) tabulkové souhrny - četnostní tabulka b) grafické souhrny - sloupcový graf, histogram c) číselné souhrny - míry polohy a variability tabulky, grafy a číselné souhrny se odlišují podle typu proměnné

10 Tabulka četností tři sloupce - v prvním popisky, v druhém absolutní četnost a ve třetím relativní četnost v posledním řádku vždy součet oněch hodnot absolutní četnost - např. nedospělých je celkem 45 relativní četnost - procentuální vyjádření (absolutní četnost : celkem x 100 = relativní četnost), s tím, že se to píše s desetinnou čárkou, tedy nenapíšu 45%, ale 0,45; celkem musí vždycky relativní četnost vyjít 1,00 v MS Excel

11 Grafy – sloupcový graf jde do něj převést četnostní tabulka
v grafu se musí doplnit popisky os sloupky řadit podle logického klíče, jako je to v četnostní tabulce (neřadit sloupce podle velikosti) vybrat vhodně podrobnou škálu (např. pokud jsou hodnoty do 800, nebudu dělat škálu až do 2000, udělám ji kratší, ale podrobnější) může mít více variant - může být vertikální nebo horizontální

12 Grafy – koláčový graf také výsečový, kruhový, …
vyjadřuje poměr jednotek na celku výhodou je, že se hned vidí, jaká je to část z celku, nevýhodou je relativní nepřehlednost

13 Grafy – bodový a spojnicový
vyjadřuje vývoj, posloupnost, shluk

14

15 Popis pomocí charakteristik
n - velikost souboru míry polohy (průměry, medián, modus, odlehlá hodnota, kvantily) míry variability (variační rozpětí, kvartilové rozpětí, rozptyl, směrodatná odchylka)

16 Míry polohy a míry variability

17 Míry polohy aritmetický průměr - nejčastěji (y je značka pro jedince, y s čarou je průměrný jedinec) – náchylný na odlehlé hodnoty medián - hodnota proměnné, pro kterou platí, že polovina hodnot proměnné v souboru je větších a polovina menších, pokud je počet hodnot sudá, vypočítá se průměr z dvou prostředních hodnot, u nominálních proměnných medián počítat nelze (nejde to ani u ordinální proměnné) odlehlá hodnota - hodnota, která je daleko od mediánu kvartily - rozděluji rozdělení hodnoty proměnné na čtvrtiny (spodní Q1, střední Q2 a horní kvartil Q3 - střední kvartil = medián), kvartily se zase nedají počítat u nominálních a ordinálních proměnných (jen u těch proměnných, které se dají seřadit) kvantily - hodnota, pod níž leží definovaná část údajů (pokud budu chtít vědět 40. percentil, tak to bude ta hodnota, která má pod sebou 40% a nad sebou 60% hodnot) medián a kvartily jsou typy kvantilů modus - nejčastější hodnota proměnné v souboru

18

19

20 Míry variability variační rozpětí - rozdíl mezi největší a nejmenší hodnotou v souboru, rozsah = max - min mezikvartilové rozpětí - odečtení třetího a prvního kvartilu, mezikvartilové rozpětí = Q3 - Q1, není ovlivněn odlehlou hodnotou, protože nepočítá s extrémy rozptyl - průměrná hodnota druhé mocniny odchylky hodnot proměnné od průměru proměnné směrodatná odchylka - druhá odmocnina rozptylu, označuje se jako s, čím větší odchylka, tím je větší variabilita, je ovlivněna odlehlou hodnotou

21 Rozdělení proměnné - normalita

22 Výběrová šetření Úplná Neúplná = výběrová N – rozsah populace VS ZS
n – počet sledovaných jednotek Průměr Modus Medián Rozložení výběrového souboru N – rozsah populace

23 Výběrová šetření Náhodný výběr Reprezentativnost Metody výběru
Cíl VŠ – odhad stav v ZS (úsudky) Před provedením výběru stanovíme hypotézy a tu poté testujeme – shoda výšky mužů a žen


Stáhnout ppt "Biostatistika 4. přednáška"

Podobné prezentace


Reklamy Google