MUDr. Michal Jurajda, PhD. ÚPF LF MU

Slides:



Advertisements
Podobné prezentace
Základní statistická analýza dat z pre- a klinických studií
Advertisements

Statistika.
“Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky.”
kvantitativních znaků
Testování parametrických hypotéz
Testování statistických hypotéz
Statistické metody v ochraně kulturního dědictví
Odhady parametrů základního souboru
Statistika II Michal Jurajda.
4EK416 Ekonometrie Úvod do předmětu – obecné informace
Popisná statistika - pokračování
Základní statistické pojmy a postupy
Tloušťková struktura porostu
Obsah statistiky Jana Zvárová
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Odhady parametrů základního souboru
Charakteristiky variability
Biostatistika 6. přednáška
Biostatistika 7. přednáška
- Pojmy - SPSS Statistické zpracování kvantitativních šetření.
Test dobré shody Fisherův přesný test McNemar test
Biostatistika 4. přednáška
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Popisná statistika III
Teorie psychodiagnostiky a psychometrie
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
Pohled z ptačí perspektivy
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Na co ve výuce statistiky není čas
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Biostatistika 1. přednáška Aneta Hybšová
RNDr. Monika Pávková Goldbergová
Popisná analýza v programu Statistica
1. cvičení
Základy testování hypotéz
IV..
Základy popisné statistiky
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Statistika 1 Ústav lékařské informatiky, 2. LF UK 2008.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
INDUKTIVNÍ STATISTIKA
Biostatistika Opakování – základy testování hypotéz
Statistické testování – základní pojmy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
Popisná analýza v programu Statistica
Normální rozdělení a ověření normality dat Modelová rozdělení
Bi8600: Vícerozměrné metody – cvičení
Proč statistika ? Dva důvody Popis Inference
Spojitá a kategoriální data Základní popisné statistiky
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Deskriptivní statistika
Neparametrické testy pro porovnání polohy
Koncepce normality/normálnosti v medicíně
Úvod do induktivní statistiky
Statistika a výpočetní technika
Analýza kardinálních proměnných
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Základy popisné statistiky
Náhodné výběry a jejich zpracování
Transkript prezentace:

MUDr. Michal Jurajda, PhD. ÚPF LF MU Základy statistiky MUDr. Michal Jurajda, PhD. ÚPF LF MU

Definice Statistika - věda Statistika - statisticky vyjádřené šetření

Statistika jako věda - definice soubor postupů užívaných při sběru, zpracování a interpretaci dat směřujících ke zlepšení rozhodování Soubor metod, které nám umožňují činit rozumná rozhodnutí v případě nejistoty.

Slovo statistika má stejný původ jako slovo stát Statistika vychází jako matematická věda především z počtu pravděpodobnosti a teorie her. Studuje převážně tak zvané hromadné jevy

Statistika popisná vyčerpávající šetření analytická, induktivní výběr základní charakteristika získaných dat vyčerpávající šetření analytická, induktivní charakterizace určitého vzorku populace, ze které usuzujeme na vlastnosti celého základního souboru výběr

Statistika testování hypotéz explorativní statistika data mining

Statistika a lékař „sběratel“ dat „konzument“ výsledků

Statistika se zabývá variabilitou měření Metodologická, přesnost měření Časová, v rámci individua = intraindividuální variabilita Interindividuální variabilita = populační

Statistika opakovaných měření Sledujeme správnost a přesnost měření Měření Správné a přesné Správné a nepřené Nesprávné a přesné Nesprávné a nepřesné

Zpracování naměřených dat Kontrola konzistence dat Zobrazení dat Testy normality (Vyřazení výsledků ovlivněných velkou chybou) Odhad středních hodnot a variability

Variabilita populací Srovnávání populace s teoretickým předpokladem Srovnávání populací mezi sebou

Statistika experimentální design popisná analýza testování hypotéz explorativní statistika data mining

Sběr dat data kvalitativní kvantitativní kategoriální, nominální (např. pohlaví)  potřeba kódování kvantitativní diskrétní x kontinuální (spojitá) ordinální (např. známky ve škole 1,2,3,4,5) intervalová poměrová

Sběr dat měřítka přímo naměřená hodnota intervalové (o kolik?) poměrové (kolikrát?)

Sběr dat Vztah základní soubor x výběr každý prvek základního souboru musí mít stejnou pravděpodobnost, že se stane prvkem výběru!!!! Definice výběrových kritérií / kritérií exkluze Opakovatelnost výběru

Úvahy zahrnuté v plánování experimentu!!!! Sběr dat dostupnost dat úplnost dat spolehlivost dat cena dat Úvahy zahrnuté v plánování experimentu!!!!

Sběr dat Databáze záznam: nositel znaku pole: znaky/proměnné

Zobrazení dat tabulka, četnostní tabulka, histogram četností) originální setříděná histogram data data 115 <100: 0 135 100-110: 1 120 111-120: 0 140 121-130: 2 125 131-140: 4 130 141-150: 8 150 151-160: 4 145 161-170: 11 . >171: 0 .

hodnota sledované veličiny četnost hodnota sledované veličiny

Zobrazení dat histogram box and whisker plot sloupcový graf koláčový graf

Zobrazení dat Tabulky absolutních četností Relativní četnost porovnání zastoupení jednotlivých kategorií mezi různě velikými skupinami vyjádření struktury, vztahu části k celku indexy pro porovnání vývoje v čase (pevný základ a zřetězený index)

Popis dat Distribuce normální Poissonova binomická Testy normality

Popis dat míry polohy průměr () medián (= 50 percentil, frekvenční střed) modus (= nejčastější hodnota)

Popis dat míry variability min-max (=rozsah, range) kvantily (horní 25%, dolní 75%) směrodatná odchylka (SD, ) rozptyl (2)

Normální rozložení

symetrické průměr =medián =modus asymetrická medián průměr

-3 -2 -1  +1 +2 +3 =medián =modus

-3 -2 -1  +1 +2 +3 =medián =modus 68% 95,5% 99,7%

Variabilita - příčiny proměnlivost biologických společenstev mezipopulační rozdíly rasové rozdíly = BIODIVERZITA opakovaná měření, např. teploty 18,2°C 18,5°C 19,1°C 18,7°C variabilita výšky v populaci 180cm 175cm 165cm 157cm časová proměnlivost fluktuace čas

symetrické průměr =medián =modus asymetrická medián průměr

Transformace dat

Odhady parametrů rozložení Výběrové charakteristiky průměr , směrodatná odchylka s Vztahujeme na základní soubor průměr μ, směrodatná odchylka σ

Příklady Popisná statistika a zobrazení získaných dat

Statistická indukce základní soubor (populace) výběr soubor prvků, o kterém chceme statistickými metodami něco zjistit výběr reprezentativní část dané populace (zákl. souboru), která má sloužit k odvození závěrů platných pro celou populaci

alternativní hypotéza Testování hypotéz porovnání výběrového souboru a teorie o základním souboru porovnání dvou základních souborů na základě porovnání dvou výběrů nulová hypotéza alternativní hypotéza

Chyba 1. a 2. typu

Postup při testování hypotéz vyslovení hypotéz volba testu volba pravděpodobnosti chyby zamítnutí, hladiny významnosti α výpočet zamítnutí/nezamítnutí nulové hypotézy

Statistické testy • t-test závislý • t-test nezávislý nepárové párové • t-test nezávislý (klasický t-test, two-sample) • Mann-Whitney (=Wilcoxon nezávislý) • mediánový test • t-test závislý (one-sample) • Wilcoxon závislý • znaménkový test srovnání parametru mezi 2 skupinami objektů u stejných objektů v časové souslednosti testy parametrické (pro normální nebo téměř normální rozložení) neparametrické (pro jiné než normální rozložení)

Kontingenční tabulky Chi-square Fischer exact test

Regresní a korelační analýza Sleduje závislost dvou proměnných Formální korelace Korelace způsobená nehomogenitou Korelace způsobená třetí veličinou

Mnohorozměrná analýza dat Shluková analýza

Příklad 1 Porovnejte mzdy ve dvou virtuálních nemocnicích. Stanovte hlavní rozdíly a porovnejte vypovídací schopnost aritmetického průměru o skutečném stavu

Příklad 2 Porovnejte hmotnosti pacientů a zdravých jedinců Vyslovte nulovou a alternativní hypotézu. Otestujte normalitu distribuce znaku, rozhodněte jaký typ testů na testování hypotéz je možno použít, otestujte nulovou hypotézu a komentujte výsledek

Příklad 3 Porovnejte systolický krevní tlak u pacientů před terapií a po terapii. Vyslovte nulovou a alternativní hypotézu. Otestujte normalitu distribuce znaku, rozhodněte jaký typ testů na testování hypotéz je možno použít, otestujte nulovou hypotézu a komentujte výsledek

Příklad 4 Porovnejte hladiny IgE u pacientů a zdravých jedinců Vyslovte nulovou a alternativní hypotézu. Otestujte normalitu distribuce znaku, rozhodněte jaký typ testů na testování hypotéz je možno použít, otestujte nulovou hypotézu a komentujte výsledek

Příklad 5 Analyzujte tabulku 2x2 Vyslovte nulovou a alternativní hypotézu. Otestujte tabulky Fischer exact testem

Příklad 6 Korelujte 10 řad náhodných čísel a interpretujte výsledek korelace