Jiří Šafr jiri.safr(zavináč)seznam.cz UK FHS Historická sociologie (LS 2012) Analýza kvantitativních dat II. Poměr šancí - ODDS RATIO Vztahy mezi kategorizovanými znaky v kontingenční tabulce Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace 10.5. 2013
Poměr šancí - ODDS RATIO
Poměr šancí - ODDS RATIO (OR) OR ukazuje asociaci v kontingenčních tabulkách šance (O) = poměr pravděpodobnosti jedné možnosti p1 (událost nastala) ke druhé p2(událost nenastala) (šance nebo také riziko) OR = poměr dvou šancí (odds) OR = f11*f22 / f12*f21 =
Vlastnosti poměru šancí (OR) OR - podíl šancí výskytu (rizika výskytu) pro dvě různé hodnoty dvou proměnných. OR: A k B a B k A jsou komplementární, vždy však s opačným směrem 1:3 =0,33 a 1/0,33 =3 OR je kladné číslo, kdy: >1 vyšší šance a <1 nižší šance, ale pozor rozpětí je nesymetrické: 0 až 1 a 1 až ∞ Proto se také používá přirozený logaritmus poměru šance LOR <∞;∞> OR není citlivé na marginální distribuce (změníme-li velikost n o konstantu, OR zůstávají stejné) Pomocí OR můžeme vyjádřit vztahy mezi kategoriemi v kontingenční tabulce (a to nejen ve čtyřpolní 2 x 2)
Příklad ODDS RATIO: vztah dvou proměnných „šance na účast u voleb podle vzdělání (VŠ)“ OR = f11 f22 / f12 f21 = OR = (424*68)/(19*674) = 2,25 U vysokoškoláků je v porovnání s ostatními 2,25x vyšší šance, že půjdou volit. V CROSSTABS v SPSS pozor na kódování kategorií (nelze nastavit, pouze překódovat).
Vlastnosti ODDS RATIO (příklad) Šance nabývá hodnoty 0 – nekonečno, kdy: 0 – 1 menší šance jevu A (oproti jevu B) >1 větší šance na jev A (oproti jevu B) 1 je stejný výskyt jevu A i B, tj. stejná šance obou konkurenčních možností, tj. nezávislost Šance jsou inverzní Odds-Ratio p1<->p2: 2,25 Inverse p2<->p1: 0,44
Interval spolehlivosti a standardní chyba ODDS RATIO Pro Odds-Ratio na výběrových datech lze odhadnout standardní chybu a interval spolehlivosti p1↔p2: 2,25 (~SE: 0,600) 95,0% CI: 1,33 ← 2,25 →3,798 (Wald's) Inverzně p2 ↔ p1: 0,44 (~SE: 0,118) 95,0% CI: 0,263 ← 0,44 → 0,749 (Wald's)
Kde spočítat ODDS RATIO CROSSTAB v SPSS pro mikrodata i tabelární (viz komplikované načtení frekvencí pomocí vah). Pozor, pouze pro dichotomické proměnné. v SPSS pozor na kódování kategorií. CROSSTABS volil BY Praha /FORMAT=AVALUE TABLES /STATISTICS=CMH(1). Nebo lépe v Excelu, kde zadáme vzoreček do buňky viz http://metodykv.wz.cz/odds_ratio_volil.xls SPSS zároveň testuje, zda je OR statisticky významně odlišné od 1 (tj. stejné šance), nebo jiné zvolené hodnoty.
Kde spočítat ODDS RATIO V různých apletech/aplikacích, např. SISA Odds-Ratio p1<->p2: 0,697649 (~SE: 0,140196) 95,0% CI: 0,470523<O.R.<1,034411 (Wald's) Inverse p2<->p1: 1,433386 (~SE: 0,288046) 95,0% CI: 0,966734<O.R.<2,125296 (Wald's) Log-odds: -0,360040; s.e=0,200955 Umí i LOGIT (Log-odds) a obrácené OR http://www.quantitativeskills.com/manuals/tablesman.htm
Úkol Procvičit v SPSS 2 x 2 tabulky Pohlaví a volil v 2006 Pohlaví a Vzdělání n x n Velikost bydliště x Vzdělání → sloučení nebo vybraná pole tabulky
ODDS RATIO v mobilitní tabulce
ODDS RATIO v mobilitní tabulce Vzdělanostní mobilita (otec → syn/dcera) Data ISSP 2007, ČR
ODDS RATIO v mobilitní tabulce mobilitní šance potomků vysokoškoláků získat rovněž VŠ vzdělání oproti tomu, že skončí nanejvýše s výučním listem v porovnání s šancí potomků rodičů s nanejvýše vyučením skončit s VŠ vzděláním: OR = (40/23)/(31/305), nebo (40*305)/(23*31) = 17,1 Dtto ale pro potomky rodičů s maturitou: OR = (40/59)/(60/197), nebo (40*305)/(23*31) = 2,3 Šance na VŠ pro SŠ oproti VYUČ: (60/126)/(31/305) = 4,7 Data: Distinkce a hodnoty 2008 (kohorta 30-34 let) ČR [Šafr a kol. 2012]
OR nyní pro sloučené kategorie (např. VŠ vs. zbytek) Vzdělání potomka ZŠ+VY SŠ VŠ Total Vzdělání rodičů 305 156 31 492 126 197 60 383 23 59 40 122 454 412 131 997 Šance potomků vysokoškoláků, že vystudují VŠ oproti šancím potomků nejvýše vyučených na VŠ diplom. pro VŠ OR VŠ/VY 7,25 VŠ/SŠ 2,63 SŠ/VY 2,76 pro min. SŠ OR VŠ/VY 7,02 VŠ/SŠ 2,11 SŠ/VY 3,33 Data: Distinkce a hodnoty 2008 (kohorta 30-34 let) ČR Zdroj: [Šafr a kol. 2012: 30-31]
Mobilitní tabulka (absolutní četnosti) [Katrňák 2006: 139]
Mobilitní tabulka. A – mobilitní šance pouze v rámci jedné třídy (kategorie) původu Šance VM dostat se do VN /oproti do NN: 1043 / 587 = 1,78 [Katrňák 2006: 139, 160]
Mobilitní tabulka. B – porovnání tj Mobilitní tabulka. B – porovnání tj. poměr šancí dvou tříd (kategorií) původu mobilitní šance potomků z třídy vyšších nemanuálů (VN) zůstat v této třídě (VN) oproti tomu, že skončí ve třídě nižších nemanuálů (NN) v porovnání s šancí potomků z třídy nižších nemanuálů (NN) skončit ve stejných třídách (VN resp. NN): OR = (VN=VN / VN→NN) / (NN→VN / NN=NN) OR = (1275/364)/(1055/597), nebo (1275*597)/(1055*364) = 1,98 [Katrňák 2006: 139, 161]
Odds Ratio v mobilitní tabulce Obecně můžeme vyjádřit OR pro kterákoliv políčka tabulky (větší než 2x2): Fi*Fj / Gi*Gj , kde i = řádky, j= sloupce
ODDS RATIO v mobilitní tabulce → relativní mobilita Vlastností poměru šancí je, že jsou invariantní k marginálním četnostem v mobilitní tabulce. → Vyjadřují relativní mobilitu, nejsou tedy ovlivněny strukturní mobilitou (změna ve struktuře vzdělanostních/ profesních kategorií mezi generacemi).