Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Biostatistika 4. přednáška Aneta Hybšová

Podobné prezentace


Prezentace na téma: "Biostatistika 4. přednáška Aneta Hybšová"— Transkript prezentace:

1 Biostatistika 4. přednáška Aneta Hybšová

2 Náplň kurzu 1. Úvod do biostatistiky. Význam biostatistiky v biologii a v učitelství. Biostatistický znak, náhodná veličina. 2. Analýza jednorozměrných biostatistických dat, četnosti, střední hodnota, charakteristiky variability, grafické zobrazení. Grafy, tabulky. 3. Vícerozměrná biostatistická data. Základní a výběrový soubor v biostatistice. 4. Testování hypotéz v biostatistice, vybrané parametrické a neparametrické testy, testovací kritérium, kritická hodnota. T-testy, F-test, Mann-Whitneyův pořadový test, Wilcoxonův test, znaménkový test. 5. Měření závislosti mezi kvantitativními a kvalitativními proměnnými (jednoduchá a vícenásobná regresní a korelační analýza, jednorozměrná analýza rozptylu, analýzy v kontingenčních tabulkách). Pearsonův koeficient, Spearmanův koeficient pořadové korelace. 6. Obecný postup analýzy biostatistických dat. Prezentace biostatických výstupů. 7. Úvod do vícerozměrných metod. Analýza rozptylu, Analýza kovariance, Analýza hlavních komponent, Faktorová analýza, Shluková analýza, Diskriminační analýza.

3 Postup vědeckého výzkumu 1. stanovení vědeckého problému 2. formulace hypotézy 3. testování hypotézy 1. plán experimentu 2. stanovení postupu 3. příprava pro analýzu 4. sběr dat (reliabilita, validita) 5. zpracování dat (uspořádání dat, popis dat) 6. vyhodnocení výsledku 7. interpretace výsledků 4. publikace

4 Tabulka původních dat  přepsaná data z protokolů  řádek = jednotka  očíslovat si jednotky  sloupec = proměnná (znak)  každý sloupec se musí jmenovat jinak  kódování – vždy si vysvětlit  pozor na slova!  nespojité proměnné bez desetinného čísla  spojité vždy se stejným desetinným rozvojem  systém řádků a sloupců obsahující všechny informace z protokolů  složitá matice dat

5 Základní pojmy  jednotka  proměnná (znak) a počet obměn znaku  vlastnost jednotky výzkumu  má více než jednu hodnotu (obměna znaku)  např. u člověka je to národnost, pohlaví, věk, u billboardu barevnost nebo velikost písma  hodnoty proměnné - u proměnné pohlaví to je muž či žena, u proměnné věk potom škála  proměnné měříme  soubor dat = datový soubor  rozsah souboru

6 Typy proměnných a) nominální (kategoriální)  hodnoty nelze seřadit podle velikosti  rozdíl mezi přilehlými hodnotami není konstantní  poměry hodnot a nula nemají smysl  např. barva očí, bydliště, živočišný druh, obor studia  ty nominální hodnoty, které nabývají jen dvou hodnot (muž-žena, ano-ne), nazýváme binární (alternativní) proměnné b) ordinální (pořadové)  lze je seřadit podle velikosti  rozdíl mezi přilehlými hodnotami není konstantní  poměry hodnot a nula nemají smysl  např. malý-střední-vysoký, dětství-dospívání-dospělost-stáří, výborně-velmi dobře-dobře-vyhověl-nevyhověl  mezi těmi jednotlivými hodnotami ale není stejný rozdíl

7 Typy proměnných c) měřitelné (kardinální)  lze je seřadit podle velikosti  existuje konstantní rozdíl mezi přilehlými hodnotami  lze je seřadit podle velikosti  existuje konstantní rozdíl mezi přilehlými hodnotami  poměry hodnot a nula mají smysl  např. výška postavy v centimetrech, věk v číslech, barva očí v pixelech nebo RGB  dá se s nimi dělat nejvíc matematických operací, jsou informačně nejzajímavější  dělí se na spojité a nespojité

8 Měřitelné proměnné SPOJITÉ  nekonečně mnoho nebo mnoho obměn znaku NESPOJITÉ (DISKRÉTNÍ)  spočetně obměn znaku

9 Popisná statistika  prezentace dat  jak zjednodušit množství informací z původních tabulek  souhrn dat, přehledná informace o struktuře dat, ztráta informace a) tabulkové souhrny - četnostní tabulka b) grafické souhrny - sloupcový graf, histogram c) číselné souhrny - míry polohy a variability  tabulky, grafy a číselné souhrny se odlišují podle typu proměnné

10 Tabulka četností  tři sloupce - v prvním popisky, v druhém absolutní četnost a ve třetím relativní četnost  v posledním řádku vždy součet oněch hodnot  absolutní četnost - např. nedospělých je celkem 45  relativní četnost - procentuální vyjádření (absolutní četnost : celkem x 100 = relativní četnost), s tím, že se to píše  s desetinnou čárkou, tedy nenapíšu 45%, ale 0,45; celkem musí vždycky relativní četnost vyjít 1,00  v MS Excel

11 Grafy – sloupcový graf  jde do něj převést četnostní tabulka  v grafu se musí doplnit popisky os  sloupky řadit podle logického klíče, jako je to v četnostní tabulce (neřadit sloupce podle velikosti)  vybrat vhodně podrobnou škálu (např. pokud jsou hodnoty do 800, nebudu dělat škálu až do 2000, udělám ji kratší, ale podrobnější)  může mít více variant - může být vertikální nebo horizontální

12 Grafy – koláčový graf  také výsečový, kruhový, …  vyjadřuje poměr jednotek na celku  výhodou je, že se hned vidí, jaká je to část z celku, nevýhodou je relativní nepřehlednost

13 Grafy – bodový a spojnicový  vyjadřuje vývoj, posloupnost, shluk

14

15 Popis pomocí charakteristik  n - velikost souboru  míry polohy (průměry, medián, modus, odlehlá hodnota, kvantily)  míry variability (variační rozpětí, kvartilové rozpětí, rozptyl, směrodatná odchylka)

16 Míry polohy a míry variability

17 Míry polohy  aritmetický průměr - nejčastěji (y je značka pro jedince, y s čarou je průměrný jedinec) – náchylný na odlehlé hodnoty  medián - hodnota proměnné, pro kterou platí, že polovina hodnot proměnné v souboru je větších a polovina menších, pokud je počet hodnot sudá, vypočítá se průměr z dvou prostředních hodnot, u nominálních proměnných medián počítat nelze (nejde to ani u ordinální proměnné)  odlehlá hodnota - hodnota, která je daleko od mediánu  kvartily - rozděluji rozdělení hodnoty proměnné na čtvrtiny (spodní Q1, střední Q2 a horní kvartil Q3 - střední kvartil = medián), kvartily se zase nedají počítat u nominálních a ordinálních proměnných (jen u těch proměnných, které se dají seřadit)  kvantily - hodnota, pod níž leží definovaná část údajů (pokud budu chtít vědět 40. percentil, tak to bude ta hodnota, která má pod sebou 40% a nad sebou 60% hodnot)  medián a kvartily jsou typy kvantilů  modus - nejčastější hodnota proměnné v souboru

18

19

20 Míry variability  variační rozpětí - rozdíl mezi největší a nejmenší hodnotou v souboru, rozsah = max - min  mezikvartilové rozpětí - odečtení třetího a prvního kvartilu, mezikvartilové rozpětí = Q3 - Q1, není ovlivněn odlehlou hodnotou, protože nepočítá s extrémy  rozptyl - průměrná hodnota druhé mocniny odchylky hodnot proměnné od průměru proměnné  směrodatná odchylka - druhá odmocnina rozptylu, označuje se jako s, čím větší odchylka, tím je větší variabilita, je ovlivněna odlehlou hodnotou

21 Rozdělení proměnné - normalita

22  Úplná  Neúplná = výběrová VS Výběrová šetření ZS N – rozsah populace n – počet sledovaných jednotek Průměr Modus Medián Rozložení výběrového souboru

23  Náhodný výběr  Reprezentativnost  Metody výběru  Cíl VŠ – odhad stav v ZS (úsudky)  Před provedením výběru stanovíme hypotézy a tu poté testujeme – shoda výšky mužů a žen Výběrová šetření


Stáhnout ppt "Biostatistika 4. přednáška Aneta Hybšová"

Podobné prezentace


Reklamy Google