Analýza kvantitativních dat I./II. Typy dat Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 26/2/2012 UK FHS Historická sociologie, Řízení a supervize (LS 2013)
2 Typy dat, která můžeme analyzovat 2-way individuální „mikro“ data: Případy x proměnné na individuální úrovni, někdy označovaná také jako „SPSS data“. Příklad: Důvěra lidí v prezidenta (informace o hodnotě proměnné u každého respondenta). Agregovaná (2-way). Agregovaná data do podskupin původně zjišťovaná za jednotlivce (tj. z mikrodat) nebo oficiálních statistik za celky. Princip „případy x proměnné“ je stejný, jen menší počet případů (a více proměnných). Příklad: Důvěra v prezidenta v zemích EU (zprůměrovaná proměnná za respondenty z každé země). Kombinovaná mikrodata s kontextuálními daty buď na agregované úrovni nebo jako kontext společný určité skupině individuí. Např. individuální mikrodata: žáci a informace o jejich rodičích, kontextuální data: informace o typu školy společná pro žáky ze stejných škol a případně také analytické/strukturní data na agregované úrovni: průměrný prospěch ve třídě (agregováno z individuálních dat žáků konkrétní třídy). Tabelární data – dříve publikovaná. Vyjadřují pouze dané třídění, proto možnosti analýzy jsou výrazně omezené (nicméně lze slučovat kategorie, vážit, spočítat míry asociace, testovat hypotézy o ne/závislosti). Příklad: mobilitní tabulka (otec x syn) publikovaná v roce way sítová data (pro full-network) – vyjadřují relace. Případy x Případy pro dannou relaci. Příklad 1: Kdo s kým komunikuje ve třídě (vpodstatě mikrodata zjišťovaná pomocí výpovědí v dotazníku nebo pozorováním).
3 Typy dat, která můžeme analyzovat 2-mode individuální „mikro“ data: Případy x proměnné na individuální úrovni, někdy označovaná také jako „SPSS data“. Příklad: Důvěra lidí v prezidenta (informace o hodnotě proměnné u každého respondenta). Agregovaná (2-mode). Agregovaná data do podskupin původně zjišťovaná za jednotlivce (tj. z mikrodat) nebo oficiálních statistik za celky. Princip „případy x proměnné“ je stejný, jen menší počet případů (a více proměnných). Příklad: Důvěra v prezidenta v zemích EU (zprůměrovaná proměnná za respondenty z každé země). Kombinovaná mikrodata s kontextuálními daty buď na agregované úrovni nebo jako kontext společný určité skupině individuí. Příklad: individuální mikrodata: žáci a informace o jejich rodičích, kontextuální data: informace o typu školy společná pro žáky ze stejných škol a případně také analytické/strukturní data na agregované úrovni: průměrný prospěch ve třídě (agregováno z individuálních dat žáků konkrétní třídy). Tabelární data – dříve publikovaná. Vyjadřují pouze dané třídění, proto možnosti analýzy jsou výrazně omezené (nicméně lze slučovat kategorie, vážit, spočítat míry asociace, testovat hypotézy o ne/závislosti). Příklad: mobilitní tabulka (otec x syn) publikovaná v roce mode sítová data (pro full-network) – vyjadřují relace. Případy x Případy pro danou relaci. Příklad 1: Kdo s kým komunikuje ve třídě (v podstatě mikrodata zjišťovaná pomocí výpovědí v dotazníku nebo pozorováním). Příklad 2: Vzájemný obchod mezi státy (z oficiálních statistik vývozu a dovozu)
Odlišný typ dat (úrovně měření) vyžaduje použití odlišných přístupů k analýze, ale také odlišný způsob interpretace výsledků (a její možnosti resp. limity)!
5 V SPSS se tak lze setkat se 4 typy dat Mikrodata – individuální data, tj. případy v řádcích (nejčastěji respondenti, ale např. také novinové články, země nebo regiony) Agregovaná data – analytické/strukturní proměnné = individuální údaje sumované za určitou jednotku (např. území jako regiony/ státy nebo časová období) Vznikají agregací mikrodat (sumování, průměrování). Kombinovaná mikrodata s kontextuálními daty buď na agregované úrovni nebo jako kontext společný určité skupině individuí. Např. individuální mikrodata: žáci a informace o jejich rodičích, kontextuální data: informace o typu školy společná pro žáky ze stejných škol a případně také analytické/strukturní data na agregované úrovni: průměrný prospěch ve třídě (agregováno z individuálních dat žáků konkrétní třídy). Tabelární data – agregovaná do tabulek (kontingenční tabulky) Např. dříve publikované výsledky mobilitní tabulky.
6 1. Mikrodata – individuální data V řádcích jsou případy (respondenti), ve sloupcích proměnné (otázky)
7 2. Agregovaná data Příklad: 16 znaků podle zemí
8 Příklad prezentace agregovaných dat: Hodnoty více agregovaných proměnných
9 Dva hlavní typy dat 1-way a 2 - way Tradiční přístup → vlastnosti individuí data: individuum x atributy (2-mode data) Analýza sítí → vlastnosti párů individuí (sociální vztahy) data: individuum A x individuum B (1-mode data) V SPSS pouze omezeně → specializovaný software, např. UCINET (NetDraw), PAJEK
10 „klasická“ 2 – mode data (SPSS)
11 1-mode data – relace Sociomatice “Jak často komunikuje s …“ 1. = méně než 1x týdně,2. = 1x týdně,3. = více jak 2x týdně,4. = denně
12 1-mode data – relace: “Jak často komunikuje s …“ K E M M V D A D J L E M I J A K J J V K B L N P Karla Edita Monika Matej Vladimír Daniel Alena David Jirina Lenka Emil Martin Iva Jolana Andrea Kuba Judita Jiří Vladimír Karolína Bernardeta Lucie Nataša Patrika symetrizace, dichotomizace
13 1-mode data – relace Sociogram “Jak často komunikuje s …“
14 Více o tom, jak s daty zacházet najdete v: Data management v SPSS/PSPP Agregace dat