Reprezentativita: chyba pokrytí populace (coverage error) Jindřich Krejčí Management sociálních dat a datové archivy Kurz ISS FSV UK.

Slides:



Advertisements
Podobné prezentace
Základní typy rozdělení pravděpodobnosti diskrétní náhodné veličiny
Advertisements

Regionální kontaktní organizace – kontakty pro Evropský výzkumný prostor jsou součástí sítě regionálních a oborových kontaktních organizací NINET, které.
Obyvatelstvo zaměstnaní nezaměstnaní.
Reprezentativita: chyba plynoucí z výpadků návratnosti Jindřich Krejčí Management sociálních dat a datové archivy Kurz ISS FSV UK.
Otázky kvality výběrových šetření Jindřich Krejčí Sociologický ústav AV ČR Doktorandský seminář Katedry sociologie FF UK 31. října 2012, Sociologický ústav.
Jiří Šafr jiri.safr(zavináč)seznam.cz
Základní soubor a výběrový vzorek
Statistická chyba a hladina statistické významnosti
Mapování kreativních průmyslů na krajské a místní úrovni: metodika v podmínkách České republiky Pavel Bednář.
Základní soubor a výběrový vzorek
ISS Úvodní informace o kurzu Sekundární analýza Management sociálních dat a datové archivy Jindřich Krejčí.
Etapy práce na sociologickém výzkumu. 2 I. Formulace problému II. Rozhodnutí o populaci a vzorku III. Pilotní studie IV. Rozhodnutí o technice sběru dat.
Získávání informací Získání informací o reálném systému
Statistická chyba a hladina statistické významnosti
Varianty výzkumu Kroky výzkumu Výběrový soubor
4. KONSTRUKCE DOTAZNÍKU Pravidla a doporučení.
Fakulty informatiky a statistiky
ČESKÝ STATISTICKÝ ÚŘAD Na padesátém 81, Praha 10 Vývoj registru sčítacích obvodů České republiky jako GIS řešení.
Název školy: Střední odborná škola stavební Karlovy Vary, Sabinovo náměstí 16, Karlovy Vary Autor: ING. JANA KOVAŘÍKOVÁ Název materiálu: VY_32_INOVACE_11_MARKETINGOVÝ.
Kvantitativní metody výzkumu v praxi (KMVP) 0. Poučení z minulých ročníků a novinky od ZS 2013 (2011) poslední aktualizace Jiří Šafr jiri.safr(at)seznam.cz.
Sociologický výzkum.
Jak jste dopadli? Kvaliťák nebo kvantiťák? Kreativec nebo analytik?
Manažerské přístupy k informačnímu systému města
VÝZKUM POSLECHOVOSTI ROZHLASOVÝCH STANIC (Výsledky II/ III/2006)
Podniková ekonomika Personální činnost.
ZÁKLADNÍ SOUBOR Základní soubor (populace) je většinou myšlenková konstrukce, která obsahuje veškerá data, se kterými pracujeme a není vždy snadné jej.
Statistická přejímka statistická přejímka představuje postupy zaměřené na následnou přejímací kontrolu (vstupní, mezioperační, výstupní) produktů cílem.
Role vysokoškolského pedagoga ve WBL PaedDr.Vanda Hájková, Ph.D
ISS Chybějící hodnoty, standardizace Semináře ke kurzu Analytické metody výzkumu Jindřich Krejčí.
Statistika 2. přednáška Ing. Marcela Čapková.
ČESKÝ STATISTICKÝ ÚŘAD Na padesátém 81, Praha 10 Využívání služeb e-governmentu jednotlivci ISSS 2007, Hradec Králové Andrej.
Tvorba simulačních modelů. Než vznikne model 1.Existence problému 2.Podrobnosti o problému a o systému 3.Jiné možnosti řešení ? 4.Existence podobného.
Základy zpracování geologických dat
ISS Úlohy o podobnosti objektů, mnohorozměrné škálování Semináře ke kurzu Analytické metody výzkumu Jindřich Krejčí.
Rozhodovací proces, podpory rozhodovacích procesů
Diplomový seminář I – 3. hodina Kontrola domácích úkolů – Úvod do DP 2. Návrh výzkumu: Cíle výzkumné práce a formulace výzkumných otázek.
Reprezentativita: chyba pokrytí populace (coverage error) Jindřich Krejčí Management sociálních dat a datové archivy Kurz ISS FSV UK.
1 Tazatelé a dotazovací situace Jan Hartl. 2 CO a JAK?
ČESKÝ STATISTICKÝ ÚŘAD Na padesátém 81, Praha 10 Šetření o využívání informačních technologií ve veřejné správě Konference ISSS 2006.
Terciární vzdělávání v ČR podíl veřejných vysokých škol (VVŠ): 84% Nárůst počtu studentů a zaměstnanců VVŠ nárůst [%] studenti
Reporting.
Marketingový průzkum Milan Mrázek Matematika & Business
ČESKÝ STATISTICKÝ ÚŘAD Na padesátém 81, Praha 10 Sběr a zpracování statistických dat Praha, 21. dubna 2008 Ústav informačních studií.
Reprezentativita: chyba výběru Jindřich Krejčí Management sociálních dat a datové archivy Kurz ISS FSV UK.
Kvantitativní výzkum, kvalitativní výzkum a smíšený výzkumný design
Diplomová práce Autor: Ondřej Renner
Metody sociálního výzkumu 5. blok Denní studium LS 2007/
Strategie a metodologie sociálněvědního výzkumu
Postup při empirickém kvantitativním výzkumu
Výběrové šetření pracovních sil (VŠPS)
Aplikovaná statistika 2.
ESPAD Evropská školní studie o alkoholu a jiných drogách Přehled hlavních výsledků Evropské školní studie o alkoholu a jiných drogách v České republice.
ČESKÝ STATISTICKÝ ÚŘAD Na padesátém 81, Praha 10 POČÍTAČE A INTERNET V ČESKÉ SPOLEČNOSTI DOMÁCNOSTI A JEDNOTLIVCI Využívání informačních.
Gender Pay Gap a jeho determinanty s využitím dat EU-SILC 2005 PhDr. Martina Mysíková IES FSV UK ČSÚ.
České vysoké učení technické v Praze Fakulta dopravní Ústav dopravní telematiky Geografické informační systémy Doc. Ing. Pavel Hrubeš, Ph.D.
Zásady tvorby dotazníků Radka Štěpánová, IBA MU. Stavba dotazníku Úvod Otázky Identifikace.
IS jako nástroj moderního personálního managementu Vít Červinka
Prameny demografických dat Všechny prameny běžné demografické statistiky i výsledky speciálních výběrových šetření Poskytují údaje pro analýzu procesu.
Varianty výzkumu Kroky výzkumu Výběrový soubor
Výběrové šetření pracovních sil (VŠPS)
Reprezentativita: chyba pokrytí populace (coverage error)
Reprezentativita: chyba výběru Jindřich Krejčí
Úlohy o podobnosti objektů, mnohorozměrné škálování
Sociologický výzkum II.
Geografické informační systémy
Reprezentativita: chyba plynoucí z výpadků návratnosti Jindřich Krejčí
Statistika a výpočetní technika
Reprezentativita: chyba pokrytí populace (coverage error)
Co říká česká veřejnost?
Základy statistiky.
Transkript prezentace:

Reprezentativita: chyba pokrytí populace (coverage error) Jindřich Krejčí Management sociálních dat a datové archivy Kurz ISS FSV UK

Reprezentativita - coverage error Snímek 2 Chyba pokrytí populace jednotky výběru cílová populace: populace, ke které vztahujeme dokazování populace šetření: populace, ke které se výzkum vztahuje reálně (nezahrnuje některé skupiny; např. určíme, že nezkoumáme institucionální populace, bezdomovce...) opora výběru: seznam(-y) nebo sada materiálů a procedur (např. mapa, kartotéka...) použitých k identifikaci jednotek cílové populace populace opory: populace skutečně zachycená v opoře nezachycené jednotky, nežádoucí jednotky, duplikace, klastry DOSTUPNOST VHODNÉ OPORY ! Cílová populace Populace opory nezahrnutá část populace nežádoucí jednotky populace zachycená ve výzkumu

Reprezentativita - coverage error Snímek 3 příklady opory ► telefonní seznam ► seznam oblastí, seznam adres domácností, seznam členů domácnosti -> komplexní design výběru chyby pokrytí na všech úrovních ► systematické chyby (problém mladých, znevýhodněné skupiny...) ► pravidlo rezidence de facto/de jure nežádoucí jednotky ► identifikace až při pokusu o kontakt: problém s výběrem - odhad a navýšení výběru?; snížení efektivity jednotky, u nichž nevíme, zda do výzkumu patří klastry - podvýběr RDD - random digit dialing výběr v průběhu sběru dat (počítač, Kish grid, datum narození...) kompenzační váhy (klastry, duplicity - identifikace v průběhu sběru dat)

Snímek 4 obecná populace v ČR - domácnosti a jednotlivci ► adresy domácností ČSÚ, databáze adres budov, výběr oblastí - soupis domácností, databáze adres plátců (INKASO), náhodná procházka zákazníci, zaměstnanci, členové organizací ► seznamy (aktuálnost; různé charakteristiky - prozkoumat, zjistit kontext), ochrana osobních údajů, někdy problém vymezit populaci (zaměstnání na DPČ, faktury...) firmy, organizace ► různé velikosti, různé struktury, problém geografické lokace, formální/ administrativní vs reálný stav, dynamický vývoj události (narození, zakoup. něčeho, výskyt něčeho, nezaměstnanost, kriminální čin...) ► různé opory (časová škála, seznam jiných jednotek - osob,.. př. time use survey) specifické populace ► špatně identifikovatelné populace, malé, řídké, rozptýlené chyba pokrytí populace: rozdíl mezi hodnotou cílové populace a populace opory Reprezentativita - coverage error

Str. 5 kombinace více opor v jednom kroku ► různé výb. pravděpodobnosti, konstrukce design. vah ► překryv opor (výběr tazatelem v terénu / zahrnutí všech vybraných jedn. - různé pravděpodobnosti / zpřesnění odhadů pomocí překryvu), ► Př. kombinace RDD a oblast/soupis dom. P tel.. = P RDD + P OBL - P RDD * P OBL P non-tel. = P OBL ► Př. zpřesnění (RDD domácnosti a OBL domácnosti bez tel. - soubor / OBL domácnosti s tel. - zjistí se podíl a stanoví se váhy pro soubor) napůl otevřený interval (half-open interval) ► uspořádaný seznam s chybějícími jednotkami (např. neaktuální) ► prozkoumá se oblast od vybrané jednotky k nejbližší další jednotce v seznamu ► zahrnou se všechny jednotky a přiřadí se jim pravděpodobnost vybrané jednotky / provede se podvýběr / nové jednotky konstituují nové stratum (překvapení) a v něm se samostatně provede výběr Redukce počtu chybějících jednotek

Redukce počtu chybějících jednotek II. vícenásobný výběr (multiplicity sampling) ► obdoba snow-ball ► z opory se vyberou jednotky, s každou jednotkou se vybere celá síť jednotek ► nutnost přesné definice vymezení sítě, nesmí se překrývat ► váhy podle velikosti sítě ► nepřesnosti při stanovení sítě (respondenti ji často přesně neurčí) Snímek 6 Reprezentativita - coverage error