Možnosti biostatistiky RNDr. Karel Hrach, Ph.D. Ústav zdravotnických studií UJEP Biomedicínský výzkum s podporou evropských zdrojů v nemocnicích ( )
Dobrá zpráva je, že statistická analýza se stává snazší a dostupnější. Špatná zpráva je, že statistická analýza se stává snazší a dostupnější. (C.F.Hofacker)
Dobrá zpráva je, že statistická analýza se stává snazší a dostupnější. Špatná zpráva je, že statistická analýza se stává snazší a dostupnější. (C.F.Hofacker)
VHODNÝ TYP VELIČINY Statistika zpracovává různé typy veličin: slovní (neuspořádané / uspořádané); číselné (diskrétní / spojité). Př.: (statistickou jednotkou vždy 1 pacient) zvolený typ léčby spokojenost s lékařskou péčí počet prodělaných operací tělesná teplota KATEGORIE
POZNÁMKA: Oba číselné typy lze převést do tvaru uspořádané veličiny Př.: Tělesná teplota pacienta. Možnosti? kategorie 1 … do 37°C; kategorie 2 … 37-40°C; kategorie 3 … více než 40°C ? Proč je důležité rozlišovat typy veličin ? VHODNÝ TYP VELIČINY
každý typ má svůj specifický způsob zpracování Př.: Určení průměrné hodnoty … VHODNÝ TYP VELIČINY
ČASOVÉ ŘADY PROBLÉMY S PROCENTY
KOEFICIENTY RŮSTU Interpretace hodnoty např. 0,79? Údaj za rok 2002 činí 79 % hodnoty roku předešlého (tj.meziroční pokles o 21 %) PROBLÉMY S PROCENTY
PRŮMĚRNÁ HODNOTA KOEF.RŮSTU? Jaká byla průměrná meziroční % změna? =PRŮMĚR(C3:F3) = (0,94+0,79+1,04+0,74) / 4 = 0,88 tj. v průměru meziroční pokles o 12 % PROBLÉMY S PROCENTY
Kontrola: 104 0,88 4 = 61 … proč nevyšlo 59? Chyba – zde nutný GEOMETRICKÝ PRŮMĚR =GEOMEAN(C3:F3) Výsledek = 0,87 (interpretace? kontrola?) PROBLÉMY S PROCENTY
Příklad: Dvacet dva pacientů, kteří podstoupili operaci srdce, bylo náhodně rozděleno do tří skupin. Skupina 1: Pacienti dostali 50 % oxidu dusného a 50 % kyslíkové směsi nepřetržitě po dobu 24 hodin; Skupina 2: Pacienti dostali 50 % oxidu dusného a 50 % kyslíkové směsi pouze během operace; Skupina 3: Pacienti nedostali žádný oxid dusný, ale dostali % kyslíku po dobu 24 hodin. (zdroj: Zvárová–Základy statistiky…) PROBLÉMY S ANOVOU
Výsledek: p=0,0148 (<0,05) Rozhodnutí? zamítáme H 0 Odpověď? Byl prokázán významný vliv faktoru „typ ventilace“ na (střední) hodnoty veli- činy koncentrace soli kyseliny listové. PROBLÉMY S ANOVOU
Jinak řečeno: Mezi sledovanými třemi kategoriemi (dle typu ventilace) byl zjištěn významný rozdíl ve střední hodnotě koncentrace soli kys.listové (ve „střední koncentraci“). Nezodpovězený problém? Které kategorie se (významně) liší? PROBLÉMY S ANOVOU
„Mnohonásobná porovnávání“ – možné metody : Bonferroniho Tukeyova Scheffého …
Tukeyho metoda (výsledky) (v záhlaví průměry, uvnitř p-hodnoty, červené=významné) Výsledek : 1 – 2 – 3 Významný rozdíl ve střední koncentraci shledán jen mezi 1. a 2. typem ventilace.
Regrese – dummy proměnné Stejný úkol ale cestou modelu závislosti spojité veličiny na kategoriální; Data je nutno přepsat:
Dummy proměnné - interpretace Model : KYSEL = 317 – 60·SKUP2 – 41·SKUP3 střední koncentrace pro „baseline“ (zde SKUP1) činí 317 mj (měrných jednotek) oproti bázi je stř.konc. ve SKUP2 významně nižší, a to o 60 mj; oproti bázi je stř.konc. ve SKUP3 nižší o 41 mj (ale rozdíl není významný)
Další možnosti statistiky?
„Rekonstrukce“
Význam byť jediného pacienta…
Vliv času? Pokud by všech 100 pacientů bylo možno sledovat po stanovené období a u každého zaznamenat dobu do výskytu (prvního) MACE, lze aplikovat SURVIVAL ANALYSIS
Veličina „Doba do události“
SURVIVAL FUNCTION S: S (t ) = P (T ≥ t) KAPLAN-MEIER ESTIMATE: S KM (t ) … cumulative relative frequency of surviving at the time t = time of event LIFE-TABLE ESTIMATE : S LT (t ) … cumulative relative frequency of surviving inside given time-interval
Porovnání S mezi 2 skupinami (Gehan-Wilcoxon test; Mantel-Haenszel logrank test) H 0 : S 1 (t)=S 2 (t) Porovnání S mezi více skupinami (generalized Gehan-Wilcoxon test) H 0 : S 1 (t)=S 2 (t)=…=S m (t) Modelování S (Cox – Regression; significant regressors)