Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Rozdělení tématu 1.Populace a výběr 2.Intervaly spolehlivosti 3.Hypotézy a významnost 4.Hypotézy o průměru 5.Hypotézy o rozptylu 6.Hypotézy o pořadových číslech 7.Hypotézy o alternativních hodnotách 8.Další statistické metody
Populace a výběr Výběr: vzorek vybraný z celé populace Populace: kompletní množina výskytů daného jevu (přibližně ji vyjadřují velká měření – řádově stovky jedinců, vyšetřených kupř. pro určení normálních hodnot
Interval spolehlivosti (IS) Jak přesně odhadujeme populační průměr Výpočet: IS = x 2s/ n Význam: v intervalu se nachází populační průměr s 95% pravděpodobností (=5% riziko, že tomu bude v populaci jinak) Použití: srovnání zkoumané populace s normou dny po porodu počet měření hmotnost (g)
Hypotéza a významnost H 0 : H A : μ 1 = μ 2 μ 1 ≠ μ 2 VÝZNAMNOST – riziko chyby CHYBA α - (=přijata nesprávná hypotéza) α : p<0.05 (riziko chyby =1:20) CHYBA β - (= odmítnuta správná hypotéza) Nulová a alternativní hypotéza
T-TEST příklad
Posouzení významnosti Výpočet významnosti nt 52,31 102,10 202,00 302,00 361,99 501,98 Statistické tabulky Porovnání výsledku s kritickou hodnotou pro dané n Kritická hodnota překročena VÝSLEDEK 2,4 P < 0,05 Významné Nevýznamné P > 0,05 P < 0,05 Výsledek významný Vzorec pro t-test Konkrétní příklad
Testy hypotéz II. Rozdílnost průměrů 1. Srovnání výběru s populací – metoda u-test, interval spolehlivosti Příklad: hodnoty FVC u zdravých (normální populace) a fibrózy 2. Srovnání dvou výběrů (nezávislé, různé výběry) – metoda t-test Příklad: hodnoty FVC astmatiků ve srovnání s fibrózou 3. Srovnání dvou výběrů (závislé, tytéž v různých situacích) – párový t-test Příklad: FVC u skupiny astmatiků před léčbou a po ní Fibróza astma léčené zdravá populace 1 23 neléčené Hypotézy o průměru
Testy hypotéz III. Rozdílnost rozptylů Příklad: tatáž sada krevních vzorků byla vyšetřena ve třech laboratořích s následujícím výsledkem: Grafická reprezentace Který sloupec (A,B,C) znázorňuje křivky rozložení pravděpodobnosti (1,2,3)? Která laboratoř pracuje s odlišnou kalibrací, přesně, nepřesně? Srovnání rozdílu rozptylů – F-test Hypotézy o rozptylu
Hypotézy o pořadových číslech 1)Není normální rozložení 2)Vstupní data pořadová Wilcoxonův test Srovnávání mediánů Příklad: Srovnávání výsledků písemných testů podle pohlaví
Srovnání četností u souborů, kde je znak přítomen – nepřítomen Metoda: X 2 test Příklad: testování léků A a B, s výsledkem efektu „zabral“ a „nezabral“ Rozdílnost četností alternativních dat A B Hypotézy o alternativních hodnotách
Data metrická (měřitelná) symetrická, ordinální (pořadí) nebo asymetrická alternativní (ano-ne) Srovnáváme střední hodnoty nebo variability Hodnocen 1 faktor v různých situacích nebo 2 faktory (závislost) Nezávislé – různé výběry Závislé (př. tíž pacienti v různých situacích) Srovnání s populací, dva nebo více výběrů
Kuchařka postupu
Korekce významnosti Kolikrát lze sáhnout do pytle s ořechy? Výsledek nutno korigovat počtem pokusů! Příklad: HLA a nemoci
Sekvenční testy Grafický postup – výsledek trvale pod vizuální kontrolou.
Metoda Monte Carlo Vše si lze nasimulovat i hodem mincí! Př.: Zánět Achillovy šlachy byl u 59 ze 100 pacientů na levé noze. Je to náhoda?
Statistický software Co vše máme k dispozici? -tabulkový procesor (Excel) -specializovaný statistický SW
Spolupráce se statistikem