Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

ODDS RATIO Relationships between categorical variables in contingency table Jiří Šafr jiri.safr(AT)seznam.cz updated 29/12/2014 Quantitative Data Analysis.

Podobné prezentace


Prezentace na téma: "ODDS RATIO Relationships between categorical variables in contingency table Jiří Šafr jiri.safr(AT)seznam.cz updated 29/12/2014 Quantitative Data Analysis."— Transkript prezentace:

1 ODDS RATIO Relationships between categorical variables in contingency table Jiří Šafr jiri.safr(AT)seznam.cz updated 29/12/2014 Quantitative Data Analysis II. UK FHS Historical sociology (2014+)

2 ODDS RATIO (OR) OR shows an association in contingency tables Odds (O) = proportion (usually „positive“ category within a dichotomous variable 0/1) likelihood ratio of one option p1 (event occurred) to another one p2 (event does not occur) (also called risk) Odds Ratio (OR) = the ratio of two odds OR = f11 f22 / f12 f21 OR = f 11 *f 22 / f 12 *f 21 =

3 Features of Odds Ratio (OR) OR - odds proportion of occurrence (the risk of occurrence) for two different values of two variables. OR: A to B and B to A are complementary, but always in the opposite direction 1:3 =0.33 and 1/0.33 =3 OR is a positive number where: > 1 higher odds and <1 is less odds, but beware margin is asymmetrical: 0 to 1 and 1 to ∞ Therefore, we also use the natural logarithm of the odds ratio LOR which is symmetrical OR is not sensitive to marginal distribution (If you resize the sample size using some constant, OR remains the same) Use the OR can express relationships between categories in the contingency table (and not only in fourfold 2x2)

4 Example - relationship between two variables: Odds ratio of participation at the polls by education (university vs. lower education levels) OR = (424*68)/(19*674) = 2,25 For university graduates compared to others there is 2,25x higher chance that they will go to vote. (Adequately for people without university degree there is a chance to participate in the elections compared to graduates only 0.44.) In CROSSTABS in SPSS beware of coding categories (can not be set, only recoded). OR = f11 f22 / f12 f21 =

5 Vlastnosti ODDS RATIO (příklad) Šance nabývá hodnoty 0 – nekonečno, kdy:  0 – 1 menší šance jevu A (oproti jevu B)  >1 větší šance na jev A (oproti jevu B)  1 je stejný výskyt jevu A i B, tj. stejná šance obou konkurenčních možností, tj. nezávislost Šance jsou inverzní Odds-Ratio p1 p2: 2,25 Inverse p2 p1: 0,44

6 Interval spolehlivosti a standardní chyba ODDS RATIO Pro Odds-Ratio z výběrových dat lze odhadnout standardní chybu (SE) a interval spolehlivosti (CI), např. v programu SISA. p1↔p2: 2,25 (~SE: 0,600) 95,0% CI: 1,33 ← 2,25 →3,798 (Wald's) Inverzně p2 ↔ p1: 0,44 (~SE: 0,118) 95,0% CI: 0,263 ← 0,44 → 0,749 (Wald's)

7 Kde spočítat ODDS RATIO CROSSTAB v SPSS pro mikrodata i tabelární (viz komplikované načtení frekvencí pomocí vah). Pozor, pouze pro dichotomické proměnné. v SPSS pozor na kódování kategorií. CROSSTABS volil BY Praha /FORMAT=AVALUE TABLES /STATISTICS=CMH(1). Nebo lépe v Excelu, kde zadáme vzoreček do buňky viz SPSS zároveň testuje, zda je OR statisticky významně odlišné od 1 (tj. stejné šance), nebo jiné zvolené hodnoty.

8 Kde spočítat ODDS RATIO V různých apletech/aplikacích, např. SISA Odds-Ratio p1 p2: 0, (~SE: 0,140196) 95,0% CI: 0,470523

9 Úkol Procvičit v SPSS 2 x 2 tabulky Pohlaví a volil v 2006 Pohlaví a Vzdělání n x n Velikost bydliště x Vzdělání → sloučení nebo vybraná pole tabulky

10 ODDS RATIO v mobilitní tabulce

11 mobilitní šance potomků vysokoškoláků získat rovněž VŠ vzdělání oproti tomu, že skončí nanejvýše s výučním listem v porovnání s šancí potomků rodičů s nanejvýše vyučením skončit s VŠ vzděláním: OR = (40/23)/(31/305), nebo (40*305)/(23*31) = 17,1 Dtto ale pro potomky rodičů s maturitou: OR = (40/59)/(60/197), nebo (40*305)/(23*31) = 2,3 Šance na VŠ pro SŠ oproti VYUČ: (60/126)/(31/305) = 4,7 Data: Distinkce a hodnoty 2008 (kohorta let) ČR [Šafr a kol. 2012] ODDS RATIO v mobilitní tabulce Vzdělání rodičů (vyšší) x Vzdělání potomka (generace naroz )

12 OR nyní pro sloučené kategorie (např. VŠ vs. zbytek) Šance potomků vysokoškoláků, že vystudují VŠ oproti šancím potomků nejvýše vyučených (na VŠ diplom). Vzdělání potomka ZŠ+VYSŠVŠTotal Vzdělání rodičůZŠ+VY SŠ VŠ Total pro min. SŠ ORVŠ/VY7,02 ORVŠ/SŠ2,11 ORSŠ/VY3,33 pro VŠ ORVŠ/VY7,25 ORVŠ/SŠ2,63 ORSŠ/VY2,76 Data: Distinkce a hodnoty 2008 (kohorta let) ČR Zdroj: [Šafr a kol. 2012: 30-31] Zadání v Excelu naleznete na

13 ODDS RATIO v mobilitní tabulce - úkol Vzdělanostní mobilita (otec → syn/dcera) populace 18+ (v roce 2007) Porovnejte stejné šance (na VŠ pro VŠ/VY) jako v předchozím příkladu: 1. pro celou dospělou populaci, 2. odděleně pro kohorty narozené před rokem 1970 a po roce Data ISSP 2007, ČR Tabulku získáte v SPSS jednoduše: CROSSTABS vzd3_Ot BY vzd3. *třídit podle věkových kohort můžete přidáním třetí proměnné (narození před/ po 1970 je třeba vytvořit). CROSSTABS vzd3_Ot BY vzd3 BY vekkat.

14 Mobilitní tabulka (absolutní četnosti) [Katrňák 2006: 139]

15 Mobilitní tabulka. A – mobilitní šance pouze v rámci jedné třídy (kategorie) původu Šance VM dostat se do VN /oproti do NN: 1043 / 587 = 1,78 [Katrňák 2006: 139, 160]

16 mobilitní šance potomků z třídy vyšších nemanuálů (VN) zůstat v této třídě (VN) oproti tomu, že skončí ve třídě nižších nemanuálů (NN) v porovnání s šancí potomků z třídy nižších nemanuálů (NN) skončit ve stejných třídách (VN resp. NN): OR = (VN=VN / VN→NN) / (NN→VN / NN=NN) OR = (1275/364)/(1055/597), nebo (1275*597)/(1055*364) = 1,98 [Katrňák 2006: 139, 161] Mobilitní tabulka. B – porovnání tj. poměr šancí dvou tříd (kategorií) původu

17 Odds Ratio v mobilitní tabulce Obecně můžeme vyjádřit OR pro kterákoliv políčka tabulky (větší než 2x2): F i *F j / G i *G j, kde i = řádky, j= sloupce

18 ODDS RATIO v mobilitní tabulce → relativní mobilita Vlastností poměru šancí je, že jsou invariantní k marginálním četnostem v mobilitní tabulce. → Vyjadřují relativní mobilitu, nejsou tedy ovlivněny strukturní mobilitou (změna ve struktuře vzdělanostních/ profesních kategorií mezi generacemi).


Stáhnout ppt "ODDS RATIO Relationships between categorical variables in contingency table Jiří Šafr jiri.safr(AT)seznam.cz updated 29/12/2014 Quantitative Data Analysis."

Podobné prezentace


Reklamy Google