Reprezentativita: chyba výběru Jindřich Krejčí Management sociálních dat a datové archivy Kurz ISS FSV UK.

Slides:



Advertisements
Podobné prezentace
Statistická indukce Teorie odhadu.
Advertisements

Regionální kontaktní organizace – kontakty pro Evropský výzkumný prostor jsou součástí sítě regionálních a oborových kontaktních organizací NINET, které.
Testování statistických hypotéz
Odhady parametrů základního souboru
Rozhodování spotřebitele v podmínkách rizika
Reprezentativita: chyba plynoucí z výpadků návratnosti Jindřich Krejčí Management sociálních dat a datové archivy Kurz ISS FSV UK.
Otázky kvality výběrových šetření Jindřich Krejčí Sociologický ústav AV ČR Doktorandský seminář Katedry sociologie FF UK 31. října 2012, Sociologický ústav.
Jiří Šafr jiri.safr(zavináč)seznam.cz
Počítačová grafika III – Monte Carlo integrování
Statistická chyba a hladina statistické významnosti
Reprezentativita: chyba pokrytí populace (coverage error) Jindřich Krejčí Management sociálních dat a datové archivy Kurz ISS FSV UK.
Diskrétní rozdělení a jejich použití
t-rozdělení, jeho použití
Základní soubor a výběrový vzorek
ISS Úvodní informace o kurzu Sekundární analýza Management sociálních dat a datové archivy Jindřich Krejčí.
64. Odhady úplných chyb a vah funkcí BrnoLenka Bocková.
Získávání informací Získání informací o reálném systému
Jak přistupovat ke kvalitě výběrových šetření Jindřich Krejčí
Statistika Vypracoval: Mgr. Lukáš Bičík
Statistická chyba a hladina statistické významnosti
Jak správně interpretovat ukazatele způsobilosti a výkonnosti
Odhady parametrů základního souboru
Systém rizikové analýzy při statickém návrhu podzemního díla Jan Pruška.
Odhady odhady bodové a intervalové odhady
Náhodný jev A E na statistickém experimentu E - je určen vybranou množinou výsledků experimentu: výsledku experimentu lze přiřadit číslo, náhodnou proměnnou.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
ISS Chybějící hodnoty, standardizace Semináře ke kurzu Analytické metody výzkumu Jindřich Krejčí.
Lineární regrese.
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Přesnost a spolehlivost v účelových sítích Bc. Jindřich Poledňák.
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Metrologie   Přednáška č. 5 Nejistoty měření.
1 Tazatelé a dotazovací situace Jan Hartl. 2 CO a JAK?
Časová analýza stochastických sítí - PERT
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Normální rozdělení a ověření normality dat
TECHNIKY SBĚRU DAT KVANTITATIVNÍ KVALITATIVNÍ VÝZKUM VÝZKUM
T - testy Párový t - test Má se zjistit, zda se sjíždějí přední pravé pneumatiky stejně jako přední levé pneumatiky. Bylo vybráno 6 vozů stejné značky:
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
Marketingový průzkum Milan Mrázek Matematika & Business
Metody sociálního výzkumu 5. blok Denní studium LS 2007/
(Popis náhodné veličiny)
Hustota pravděpodobnosti – případ dvou proměnných
Statistické odhady (inference) Výběr Nepotřebujeme sníst celého vola jenom proto, abychom poznali, že to jde ztuha. Samuel Johnson (anglický básník a.
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
Inferenční statistika - úvod
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Odhady odhady bodové a intervalové odhady
Statistické testování – základní pojmy
Reprezentativita: chyba výběru Jindřich Krejčí
Základy statistické indukce
Induktivní statistika
Induktivní statistika
t-test Počítání t-testu t statistika Měření velikosti efektu
Induktivní statistika
- váhy jednotlivých studií
Odhady parametrů základního souboru
Induktivní statistika
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
Úvod do statistického testování
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Sociologický výzkum II.
Reprezentativita: chyba plynoucí z výpadků návratnosti Jindřich Krejčí
Induktivní statistika
Základy statistiky.
Náhodné výběry a jejich zpracování
Transkript prezentace:

Reprezentativita: chyba výběru Jindřich Krejčí Management sociálních dat a datové archivy Kurz ISS FSV UK

Str. 2 Kish, L Survey Sampling. NY: John Wiley. velikost výběru a výběrový design: podmínka statistického dokazování velký výběr, velikost základní populace pravděpodobnostní výběr ► známá nenulová šance pro každou jednotku v populaci opory ► pravděpodobnosti nemusí být stejné různé realizace výběru, výběrový rozptyl, standardní chyba, konfidenční interval realizace pravděpodobnostního výběru: odhad neznámých charakteristik populace opory se známou velikostí standardní chyby design výběru - postup výběru ► jak velký je výběr? ► jaké jsou pravděpodobnosti výběru? ► jsou jednotky vybírány navzájem nezávisle nebo ve skupinách? ► je kontrolováno zastoupení některých skupin (stratifikace)?

Jindřich Krejčí, Str. 3 prostý náhodný výběr ► pravděpodobnosti výběru všechny stejné ► (pokud populace dost velká ve srovnání s výběrem) std. chyba závisí na 1) velikosti výběru a 2) rozptylu hodnot ► obvyklé východisko pro statistické dokazování realita: minimum prostých náhodných výběrů ► více výběrových kroků, kombinace technik = komplexní design výběru; primární jednotky výběru, sekundární jednotky... (sídlo - ulice - adresa domácnosti - respondent) efekt designu: poměr výběrového rozptylu statistiky získané určitým konkrétním výběrovým postupem a rozptylu, který bychom pro danou statistiku získali za použití prostého náhodného výběru efektivní velikost výběru ► velikost prostého náhodného výběru s jakou by se dosáhlo stejného výběrového rozptylu jako je u aktuálního designu (n eff = 200 / 3,13 = 64) ► cíl dosáhnout urč, přesnost: jak má být za daného výběrového postupu velký výběr, abychom dosáhly stejného výběrového rozptylu jako u prostého náhodnéh výpočet chyby ve stat. software předpokládá prostý náhodný výběr (lze upravit designovou váhou)

Jindřich Krejčí, Str. 4 skupinový výběr (cluster sampling) ► opora zákl. jednotek není k dispozici nebo redukce nákladů (cestovních) ► předpokl. větší homogenity uvnitř skupinek => větší std. chyba ► efekt skupinového výběru: čím větší heterogenita mezi skupinkami, tím větší homogenita uvnitř co nového se dozvíme, když přidáme další jednotku ze skupiny? průměrná vnitroskupinová korelace (intraclass correlation; tendence hodnot proměnné korelovat uvnitř skupiny ve srovnání s ostatními skupinami) -> poměr homogenity -> designový efekt stratifikovaný výběr ► zajištění reprezentace zvolených podskupin (exkluzivita strat, znalost členství jednotek a váhy strata, shodné výběrové procedury v rámci strat) ► pravděpodobnosti v rámci strat - designové váhy ► různé velikosti strat, různý rozptyl v rámci strat, různé výsledné hodnoty ► designový efekt závisí na velikosti výběru v rámci strat, pokud jsou dost velká zpravidla se designový efekt a std. chyba sníží ► proporcionální vs. neproporcionální alokace (pokud známe standardní odchylku v rámci strat, vyplatí se pořídit větší výběr u těch strat, kde je vyšší (Neyman) - zvýšení přesnosti) systematický výběr ► jednodušší implementace stratifikace ► seřazená opora, náhodný počátek, interval