Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Základy statistiky MUDr. Michal Jurajda, PhD. ÚPF LF MU.

Podobné prezentace


Prezentace na téma: "Základy statistiky MUDr. Michal Jurajda, PhD. ÚPF LF MU."— Transkript prezentace:

1 Základy statistiky MUDr. Michal Jurajda, PhD. ÚPF LF MU

2 Definice n Statistika - věda n Statistika - statisticky vyjádřené šetření

3 n soubor postupů užívaných při sběru, zpracování a interpretaci dat směřujících ke zlepšení rozhodování n Soubor metod, které nám umožňují činit rozumná rozhodnutí v případě nejistoty. Statistika jako věda - definice

4 n Slovo statistika má stejný původ jako slovo stát n Statistika vychází jako matematická věda především z počtu pravděpodobnosti a teorie her. n Studuje převážně tak zvané hromadné jevy

5 Statistika n popisná –základní charakteristika získaných dat n vyčerpávající šetření n analytická, induktivní –charakterizace určitého vzorku populace, ze které usuzujeme na vlastnosti celého základního souboru n výběr

6 Statistika n testování hypotéz n explorativní statistika n data mining

7 Statistika a lékař n „sběratel“ dat n „konzument“ výsledků

8 Statistika se zabývá variabilitou měření n Metodologická, přesnost měření n Časová, v rámci individua = intraindividuální variabilita n Interindividuální variabilita = populační

9 Statistika opakovaných měření n Sledujeme správnost a přesnost měření n Měření –Správné a přesné –Správné a nepřené –Nesprávné a přesné –Nesprávné a nepřesné

10

11 Zpracování naměřených dat n Kontrola konzistence dat n Zobrazení dat n Testy normality n (Vyřazení výsledků ovlivněných velkou chybou) n Odhad středních hodnot a variability

12 Variabilita populací n Srovnávání populace s teoretickým předpokladem n Srovnávání populací mezi sebou

13 Statistika n experimentální design n popisná analýza n testování hypotéz n explorativní statistika n data mining

14 Sběr dat n data –kvalitativní kategoriální, nominální (např. pohlaví)  potřeba kódování –kvantitativní diskrétní x kontinuální (spojitá) ordinální (např. známky ve škole 1,2,3,4,5) intervalová poměrová

15 Sběr dat n měřítka –přímo naměřená hodnota –intervalové (o kolik?) –poměrové (kolikrát?)

16 Sběr dat n Vztah základní soubor x výběr –každý prvek základního souboru musí mít stejnou pravděpodobnost, že se stane prvkem výběru!!!! n Definice výběrových kritérií / kritérií exkluze n Opakovatelnost výběru

17 Sběr dat n dostupnost dat n úplnost dat n spolehlivost dat n cena dat Úvahy zahrnuté v plánování experimentu!!!!

18 Sběr dat n Databáze –záznam: nositel znaku –pole: znaky/proměnné

19 Zobrazení dat n tabulka, četnostní tabulka, histogram četností) originálnísetříděnáhistogramdata 115<100: : : : : : : : 11.>171: 0.

20 hodnota sledované veličiny četnostčetnost

21 Zobrazení dat n histogram n box and whisker plot n sloupcový graf n koláčový graf

22 Zobrazení dat n Tabulky absolutních četností n Relativní četnost –porovnání zastoupení jednotlivých kategorií mezi různě velikými skupinami –vyjádření struktury, vztahu části k celku –indexy pro porovnání vývoje v čase (pevný základ a zřetězený index)

23 Popis dat n Distribuce –normální –Poissonova –binomická n Testy normality

24 Popis dat n míry polohy –průměr (  ) –medián (= 50 percentil, frekvenční střed) –modus (= nejčastější hodnota)

25 Popis dat n míry variability –min-max (=rozsah, range) –kvantily (horní 25%, dolní 75%) –směrodatná odchylka (SD,  ) –rozptyl (  2 )

26 Normální rozložení

27 symetrické průměr =medián =modus asymetrická medián průměr

28 -3  -2  -1   +1  +2  +3  =medián =modus

29 -3  -2  -1   +1  +2  +3  =medián =modus 68% 95,5% 99,7%

30 Variabilita - příčiny opakovaná měření, např. teploty 18,2°C 18,5°C 19,1°C 18,7°C variabilita výšky v populaci 180cm 175cm 165cm 157cm proměnlivost biologických společenstev mezipopulační rozdíly rasové rozdíly = BIODIVERZITA časová proměnlivost fluktuace čas

31 symetrické průměr =medián =modus asymetrická medián průměr

32 Transformace dat

33 Odhady parametrů rozložení n Vztahujeme na základní soubor –průměr μ, směrodatná odchylka σ n Výběrové charakteristiky –průměr, směrodatná odchylka s

34 Příklady n Popisná statistika a zobrazení získaných dat

35 Statistická indukce n základní soubor (populace) –soubor prvků, o kterém chceme statistickými metodami něco zjistit n výběr –reprezentativní část dané populace (zákl. souboru), která má sloužit k odvození závěrů platných pro celou populaci

36 Testování hypotéz n porovnání výběrového souboru a teorie o základním souboru n porovnání dvou základních souborů na základě porovnání dvou výběrů nulová hypotézaalternativní hypotéza

37 Chyba 1. a 2. typu

38 Postup při testování hypotéz n vyslovení hypotéz n volba testu n volba pravděpodobnosti chyby zamítnutí, hladiny významnosti α n výpočet n zamítnutí/nezamítnutí nulové hypotézy

39 Statistické testy parametrické (pro normální nebo téměř normální rozložení) neparametrické (pro jiné než normální rozložení) testy nepárovépárové t-test nezávislý (klasický t-test, two-sample) Mann-Whitney (=Wilcoxon nezávislý) mediánový test t-test závislý (one-sample) Wilcoxon závislý znaménkový test srovnání parametru mezi 2 skupinami objektů srovnání parametru u stejných objektů v časové souslednosti

40 Kontingenční tabulky n Chi-square n Fischer exact test

41 Regresní a korelační analýza n Sleduje závislost dvou proměnných –Formální korelace –Korelace způsobená nehomogenitou –Korelace způsobená třetí veličinou

42 Mnohorozměrná analýza dat n Shluková analýza

43 Příklad 1 n Porovnejte mzdy ve dvou virtuálních nemocnicích. n Stanovte hlavní rozdíly a porovnejte vypovídací schopnost aritmetického průměru o skutečném stavu

44 Příklad 2 n Porovnejte hmotnosti pacientů a zdravých jedinců n Vyslovte nulovou a alternativní hypotézu. n Otestujte normalitu distribuce znaku, rozhodněte jaký typ testů na testování hypotéz je možno použít, otestujte nulovou hypotézu a komentujte výsledek

45 Příklad 3 n Porovnejte systolický krevní tlak u pacientů před terapií a po terapii. n Vyslovte nulovou a alternativní hypotézu. n Otestujte normalitu distribuce znaku, rozhodněte jaký typ testů na testování hypotéz je možno použít, otestujte nulovou hypotézu a komentujte výsledek

46 Příklad 4 n Porovnejte hladiny IgE u pacientů a zdravých jedinců n Vyslovte nulovou a alternativní hypotézu. n Otestujte normalitu distribuce znaku, rozhodněte jaký typ testů na testování hypotéz je možno použít, otestujte nulovou hypotézu a komentujte výsledek

47 Příklad 5 n Analyzujte tabulku 2x2 n Vyslovte nulovou a alternativní hypotézu. n Otestujte tabulky Fischer exact testem

48 Příklad 6 n Korelujte 10 řad náhodných čísel a interpretujte výsledek korelace


Stáhnout ppt "Základy statistiky MUDr. Michal Jurajda, PhD. ÚPF LF MU."

Podobné prezentace


Reklamy Google