Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Kontingenční tabulky Závislost dvou kvalitativních proměnných.

Podobné prezentace


Prezentace na téma: "Kontingenční tabulky Závislost dvou kvalitativních proměnných."— Transkript prezentace:

1 Kontingenční tabulky Závislost dvou kvalitativních proměnných

2 Příklady problémů Závisí přežití osoby vyslané do tropů do cholerické oblasti na tom, zda byla dotyčná osoba očkovaná proti choleře? Je nějaká souvislost mezi barvou vlasů a pohlavím osoby. Je výskyt dvou druhů parazitů vzájemně nezávislý?

3 Kontingenční tabulka

4 Závislost přežití na očkování Vzájemná závislost dvou druhů

5 Vztah dvou kvalitativních proměnných v tabulce jak v případě, že je jedna z proměnných manipulovaná tak v případě, že jedna z proměnných je zřejmě příčinou a druhá důsledkem, ale jedná se o pozorování tak i v případě, že se jedná o dvě stejnocenné proměnné

6 Základní pravidla z teorie pravděpodobnosti Pravděpodobnost společného výskytu dvou nezávislých jevů P i,j = P i. P j Příklad: V populaci je polovina samců (P samec =0,5) a jedna desetina všech individuí jsou albíni (P albín =0,1). Pokud jsou albíni stejně zastoupeni mezi oběma pohlavími (tj. albinismus a pohlaví jsou nezávislé jevy), pak pravděpodobnost, že náhodně vybrané individuum je albinotický samec je P samec. P albín 0,5. 0,1 =0,05

7 Základní pravidla z teorie pravděpodobnosti Očekávaný počet úspěchů E(a) z n pokusů, kde pravděpodobnost úspěchu je P a je E(a)=P a. n Příklad: Pravděpodobnost výskytu mutace je 0,02 - mezi 100 náhodně vybranými jedinci očekáváme dva jedince nesoucí danou mutaci

8 Jak spočteme  2 ? A jak získáme očekávané hodnoty? H 0 praví - jevy jsou nezávislé - takže pomocí pravděpodobnosti společného výskytu dvou nezávislých jevů.

9 Výpočet očekávaných hodnot Pomocí marginálních součtů P i. = R i /n P.j = C j / n P ij =P i. P.j, E (f ij ) = P ij. n = (R i / n). (C j / n). n = R i. C j / n

10 Co potřebuji znát, abych znal celý výsledek pokusu (při daných marginálních četnostech?) df = (c-1). (r - 1) počet sloupců počet řádků

11 Kritická hodnota na 5% hladině významnosti při df=3.

12 Nyní spíše Tahle plocha je 0,029, takže píšeme  2 =8,99, df=3, P=0,029

13 I tady se někdy (když jsou extrémně nízké očekávané četnosti) používá Yatesova korekce lepší ochrana proti chybě 1, druhu, ale slabší test

14 Jiné testové kriterium, ale také s  2 rozdělením tzv.  2 likelihood ratio (LR)

15 Vychází podobně “Normální”  2 =8,99

16 Čtyřpolní tabulky Všimněte si, že pro tabulku nulové hypotézy platí ad = bc

17 Když prezentuji výsledky kontingenčních tabulek Nestačí napsat, že výsledek je průkazný Vždy je třeba i uvést, kterým směrem jde odchylka od H 0 Nestačí tedy, že očkování má vliv, ale důležité je, že chrání před infekcí (i kdyby zvyšovalo pravděpodobnost infekce, H 0 bychom zamítali) obvykle se uvádějí procenta marginálních četností, tj. z očkovaných v tropech přežilo 95%, z neočkovaných 55%.

18 Statistická a kauzální závislost Kauzální závislost můžu přímo prokázat jen manipulativním experimentem Pro “správný” experiment musí být „očkováni“ všichni, ale půlka dostane jen placebo (srov. co lze a co chce statistika).

19 Zásady experimentátora Každý zásah musí mít kontrolu Kontrola se liší od zásahu pouze tím, čeho vliv chci prokázat (často je to velmi obtížné) Pro všechno musím mít nezávislá opakování

20 Výhody experimentu a observační studie Experimentem prokážu kauzalitu Rozsah experimentálních manipulací je vetšinou omezený Skoro každý experimentální zásah má vedlejší účinky, často nepředvídané

21 Fisherův exaktní text Jaká je pravděpodobnost, že tuto, nebo ještě více odlišnou tabulku dostanu za daných marginálních četností (za předpokladu, že nulová hypotéza platí, spočteno pomocí kombinatoriky). Používá se pro čtyřpolní tabulku při nízkých počtech pozorování.

22 Mám-li tabulku Potom Fisherův test přímo spočítá pravěpodobnost této tabulky, a všech (z hlediska H 0 ) extrémnějších, tj. Součet všech těchto pravděpodobností je dosaženou hladinou významnosti pro jednostranný test (proto statistika také tiskne 2*p)

23 Srovnejme dvě tabulky:  2 i síla testu roste s počtem pozorování - přitom jsou obě tabulky velmi pravděpodobně výběrem ze stejného základního souboru

24 Míry síly vazby ve čtyřpolní tabulce - nezávislé na velikosti výběru Y = ad/bc =f 11 f 22 / f 21 f 12 - nevýhoda - od 0 pro zápornou vazbu, po 1 pro nezávislost, do + nekonečno pro kladnou vazbu od -1 přes 0 pro nezávislost do + 1; -1 a + 1 (maximální možné vazby pro dané hodnoty marg. četností) od -1 přes 0 pro nezávislost do + 1; -1 a + 1 (maximální možné vazby pro jakékoliv hodnoty marg. četností)

25 Vícerozměrné kontingenční tabulky Dnes se pro stejný účel častěji užívají zobecněné lineární modely


Stáhnout ppt "Kontingenční tabulky Závislost dvou kvalitativních proměnných."

Podobné prezentace


Reklamy Google