Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Základní soubor a výběrový vzorek

Podobné prezentace


Prezentace na téma: "Základní soubor a výběrový vzorek"— Transkript prezentace:

1 Základní soubor a výběrový vzorek
Zpravidla při zkoumání nějakého problému nezjišťujeme údaje o všech jednotkách, ale sledujeme ho jen na dílčím souboru jednotek. Výsledky takového zkoumání jsou pak zobecňovány na soubor zahrnující všechny uvažované jednotky. V sociologickém výzkumu v souvislosti s výběrovým šetřením, užíváme některé důležité pojmy: cílová populace, základní populace, vzorek (výběrový soubor). CÍLOVÁ POPULACE je soubor jednotek, o kterém předpokládáme, že jsou pro něj závěry platné, ZÁKLADNÍ POPULACE je soubor jednotek, které v dané situaci zastupují cílovou populaci, protože některé jednotky jsou nedostupné (např. ve vězení, v zahraničí) RÁMEC VÝBĚRU je seznam jednotek výběru, z kterého je vzorek nebo některý jeho stupeň vybírán VZOREK (neboli výběrový soubor) je skupina jednotek, které skutečně pozorujeme. Př.: cílová populace - soubor obyvatel ČR základní populace - obyvatelé ČR mimo dlouhodobě žijících v cizině výběrový soubor - občané ČR, které skutečně zkoumáme Proč musíme dělat výběrová šetření? finanční důvody - levnější časové důvody – v kratším čase, není tolik času technická nemožnost - “sčítání“ je jednou za 10 let a to se celou dobu něco dělá = příprava, zpracování výsledků, jiný příklad – sčítání obyvatel celého světa. nedostupnost některých jednotek (např. nelze zastihnout všechny respondenty

2 Reprezentativita Reprezentativita vyjadřuje spolehlivost zastupování základního souboru výběrovým souborem. Úkolem výběrového šetření totiž je, aby údaje o zkoumaných jednotkách zároveň přinášely informaci také o všech jednotkách, které do výběru nebyly zařazeny. Reprezentativita závisí na: ·přesnosti vymezení populace (populace musí být definována přesně – roste spolehlivost výběru, např. musí existovat přesný seznam mužů, studentů, seznam - záleží na povaze zkoumání). ·adekvátnosti výběru (důležité uvažovat u malých výběrů, adekvátní výběr musí být dostatečně rozsáhlý, aby mohl výzkumník důvěřovat závěrům - nestačí zobecnit výsledky od 10 mužů na všechny muže ve státě, apod.) ·heterogenitě (homogenitě) populace (problémy s národní a etnickou příslušností, jazykem, kulturou, protože rozsáhlé státy mají diferencovaná území. Konkrétně, 100 fotbalistů na otázky kolem fotbalu než 100 televizních diváků na celou diváckou obec týkající se všech TV pořadů ) Pozn. reprezentativitu je obtížné, ne-li nemožné kontrolovat v těch případech, kdy nejsou známy charakteristiky základního souboru – tedy není s čím srovnávat: např. vegetariáni, abstinenti, majitelé okrasného ptactva atd.).

3 Výběrová šetření Schopnost výběru reprezentovat celek primárně závisí na 2 skutečnostech: Počtu dotazovaných Metodě výběru Metoda výběru: Pravděpodobnostní (náhodný) , ale za předpokladu, že je k dispozici opora výběru (pokrývá sledovanou populaci), máme znalost o šancích výběru jednotek do souboru a existuje možnost začlenit všechny klíčové podskupiny do výběru Nepravděpodobnostní -Kvótní , ale za předpokladu znalosti statistik – kvót o cílové populaci Pravděpodobnější výběry – jsou obecně považovány za přesnější, vědecky ověřené zákonitosti matematické statistiky. Kvótní výběry – postupy podložené logickými úvahami o zajištění reprezentativity, opírá se o znalost základního souboru. Přináší výsledky využitelné pro běžné požadavky.

4 Typy výběrů Způsob, jak lze provádět výběry jednotek pro výzkumné účely je v podstatě dvojí: · náhodný - pravděpodobnostní - máme stanovenu pravděpodobnost výběru každé z částí základního souboru do výběrového souboru, všechny jednotky mají stejnou šanci být vybrány a reprezentovat populaci - rozeznáváme různé typy pravděpodobnostního výběru – viz níže ·záměrný - nepravděpodobnostní - rozeznáváme různé typy nepravděpodobnostních výběrů – viz níže Pravděpodobnostní výběry: prostý náhodný výběr stratifikovaný náhodný výběr - proporcionální a neproporcionální Klastrový, skupinkový výběr vícestupňový náhodný výběr. Nepravděpodobnostní výběry: kvótní výběr systematický výběr výběr úsudkem výběr nabalováním.

5 Pravděpodobnostní výběry
PROSTÝ NÁHODNÝ VÝBĚR 1.Vybíráme ze seznamu nebo z množiny čísel zastupující seznam jednotek základního souboru buď losem nebo podle tabulky náhodných čísel, hodem mincí nebo jiným postupem, který zajišťuje, že výzkumník neovlivní výběrový postup svým zásahem. STRATIFIKOVANÝ NÁHODNÝ VÝBĚR Základní soubor je rozdělen do podsouborů, které nazýváme strata. Strata jsou takové podmnožiny základního souboru, jejichž jednotky mají v rámci strata společnou vlastnost nebo více společných vlastností. Strata se liší mezi sebou, jednotky uvnitř se z hlediska vybrané vlastnosti neliší. V každém stratu provedeme prostý náhodný výběr. SKUPINKOVÝ VÝBĚR Základní soubor je rozdělen na podsoubory, skupinky. Skupinky jsou vzájemně zastupitelné, od sebe se neliší, rozdíly jsou spíše mezi jednotkami. Náhodným postupem vybereme jen některé ze skupinek a vyčerpávajícím způsoben šetříme všechny jejich jednotky. VÍCESTUPŇOVÝ NÁHODNÝ VÝBĚR Ze souboru vybraných skupinek provedeme náhodně buď přímo výběr jednotek nebo výběr dalších podskupinek a v nich výběr jednotek.

6 Pravděpodobnostní výběry
JEDNODUCHÝ NÁHODNÝ VÝBĚR (MENŠÍ ZÁKLADNÍ SOUBOR) předpoklad – je k dispozici kompletní seznam základního souboru. Manuální náhodný výběr (rozstříhat seznam na jednotlivá jména a losovat je z klobouku; použít tabulku náhodných čísel; počítačem generovaná náhodná čísla). STRATIFIKOVANÝ NÁHODNÝ VÝBĚR Základní soubor je rozdělen do podsouborů, které nazýváme strata. Strata jsou takové podmnožiny základního souboru, jejichž jednotky mají v rámci strata společnou vlastnost nebo více společných vlastností. Strata se liší mezi sebou, jednotky uvnitř se z hlediska vybrané vlastnosti neliší. V každém stratu provedeme prostý náhodný výběr. Při stratifikovaném výběru musíme určit správně podíly jednotlivých strat na základním souboru. Jestliže se to podaří snížíme možnou chybu, která mohla nastat v důsledku většího možného zastoupení určitých kategoriích v rámci prostého náhodného výběru. Např. názory mužů a žen a jednotlivých věkových kategorií na otázky privatizace. Výběr tedy uspořádáme stratifikovaně podle pohlaví a věkových skupin a musíme znát podíly obyvatelstva těchto skupin v základním souboru, abychom mohli stanovit podíl jednotlivých strat na výběru.

7 Pravděpodobnostní výběry
SKUPINKOVÝ VÝBĚR Základní soubor je rozdělen na podskupiny (klastry). Náhodně se vybírají některé podskupiny, jejichž všichni členové vstupují do vzorku. Základní soubor je rozdělen na podsoubory, skupinky. Skupinky jsou vzájemně zastupitelné, od sebe se neliší, rozdíly jsou mezi jednotkami (tedy uvnitř skupinek). Logika výběru vychází s toho, že vybrané skupiny reprezentují ostatní skupiny (i ty, co se nedostaly do výběru), tedy celek – základní soubor. Základní soubor je rozdělen na podsoubory, skupiny Náhodným postupem vybereme ze základního souboru jen některé ze skupinek a vyčerpávajícím způsoben šetříme všechny jejich jednotky. Například při výzkumu dětí školou povinných se ze základního souboru všech tříd vybere např. 15 tříd a zkoumají se všichni žáci těchto tříd. Hlavní výhodou skupinového výběru jsou nízké náklady

8 Pravděpodobnostní výběry
VÍCESTUPŇOVÝ NÁHODNÝ VÝBĚR Procedura výběru vzorku sestává z několika návazně použitých metod výběru vzorku. Omezuje rozptýlenost základního souboru. Základní soubor je rozdělen na podsoubory, skupinky. Skupinky jsou vzájemně zastupitelné, od sebe se neliší, rozdíly jsou spíše mezi jednotkami. Ze souboru vybraných skupinek provedeme náhodně buď přímo výběr jednotek nebo výběr dalších podskupinek a v nich výběr jednotek. Např. máme soubor okresů a náhodně vybereme 4 okresy. Ve vybraných okresech provedeme náhodný výběr obcí a v nich pak menší prostorové jednotky - např. volební obvody, v nich potom vybíráme jedince. Nebo jiný příklad: Například při výzkumu dětí školou povinných se v prvním stupni (např) klastrově vyberou primární jednotky - školy, v následujícím stupni se v rámci primárních jednotek (např) klastrově vybírají sekundární jednotky - třídy, a v dalším stupni se (např) systematický náhodně vybírají finální cílové osoby - žáci.

9 Výběrová šetření Sledování návratnosti:
Míra spolupráce: podíl kompletních rozhovorů ze všech kontaktovaných (co-operation rate) Míra odmítnutí: podíl případů, kdy odmítli spolupráci nebo předčasně ukončili rozhovor (refusal rate) Míra kontaktování: (contact rate): podíl případů, kdy se nepodařilo vybranou jednotku kontaktovat ze všech platných případů ve výběru Uvádí se obvykle: Kompletní rozhovor Částečný rozhovor Odmítnutí Přerušení Respondent není schopen rozhovoru Neplatná adresa, Není bytová jednotka Prázdná btová jednotka jiné

10 Výběrová šetření Sledování návratnosti u panelových šetření:
Tato metoda má 3 specifika Dochází k postupné úmrtnosti panelu, s každou vlnou šetření (motivace a odpad) Vybraný vzorek, který je připraven jako reprezentativní postupně ztrácí v následných vlnách a s delším časovým odstupem schopnost reprezentace Nároky na reprezentativitu klesají – pak přichází řešení (doplňování, velký vzorek) Účast v panelu musí být podpořena různými druhy pobídek včetně finančních odměn Zvláštnost: Rotující panelová šetření – část panelu je periodicky obměńována

11 Výběrová šetření – náhodný výběr
Průzkum bude realizován pomocí stratifikovaného vícestupňového náhodného výběru. V rámci stratifikace bude celé území České republiky rozděleno na 57 částí – strat, ve kterých bude realizován třístupňový náhodný výběr. Při prvním stupni výběru budou vybrány základní sídelní jednotky (ZSJ), při druhém stupni domácnosti a ve třetím stupni budou určeni jednotlivci – respondenti. Stratifikace Česká republika bude geograficky rozdělena do 57 strat, která budou vzájemně disjunktní a přitom pokryjí celé území republiky. Tato strata budou definována na základě kombinace čtrnácti krajů a pěti velikostních skupin obcí. Jednotlivé kategorie velikostí obce jsou určeny následovně: 0 až obyvatel 2 000 až obyvatel 5 000 až obyvatel až obyvatel a více obyvatel .

12 Výběrová šetření – náhodný výběr
Základní sídelní jednotky (ZSJ) Základní sídelní jednotky jsou základní skladebnou částí sídelního útvaru a pokrývají celé území státu s výjimkou neosídlených ploch. Ve vybraných městech jsou základními sídelními jednotkami takzvané urbanistické obvody, které jsou charakterizovány shodným funkčním využitím většiny objektů. V ostatních obcích jsou základními sídelními jednotkami sídelní lokality, které zahrnují pouze zastavěné části katastrálního území. Jsou tvořeny samostatnými seskupeními obytných objektů včetně území upraveného pro potřeby sídla a jsou vzájemně odděleny buď nezastavěnou plochou nebo hranicí katastrálního území. Typicky jsou základní sídelní jednotky tvořeny pospolitými skupinami rodinných domků nebo částmi sídlišť atd. Na území jedné základní sídelní jednotky většinou žije kolem 500 obyvatel. Výběrový postup V rámci výzkumu budou osloveni respondenti ve všech 57 stratech. Počet respondentů dotázaných v každém stratu bude proporčně odpovídat počtu obyvatel žijících na jeho území. Příklad počtů dotázaných ve všech stratech je uveden v tabulce. V prvním stupni výběru budou v rámci každého strata vybrány základní sídelní jednotky, ve kterých bude probíhat dotazování – výběrové body. Tyto budou vybrány z oficiálního seznamu základních sídelních jednotek distribuovaného ČSÚ, pomocí pravděpodobnostního náhodného výběru s vracením (jedna jednotka může být zahrnuta do výběru vícekrát). Pravděpodobnost zahrnutí každé ZSJ do výběru bude odpovídat počtu obyvatel v ní žijících; tyto počty jsou rovněž k dispozici na stránkách ČSÚ. Počet vybraných základních sídelních jednotek bude respektovat počet respondentů, kteří mají být v rámci strata dotázáni. Výběr bude nastaven tak, aby na území jednoho výběrového bodu bylo osloveno maximálně 10 respondentů. Ve druhém stupni výběru budou vybrány domácnosti, v nichž se rozhovory uskuteční. Konkrétní respondent, s nímž se uskuteční rozhovor, bude vybírán v posledním, třetím stupni výběru. Při tomto výběru je možné využít tzv. Švédský klíč nebo metodu nejbližších narozenin.

13 Výběrová šetření – náhodný výběr
Kontaktování respondenta Běžná návratnost při realizaci pravděpodobnostního náhodného výběru je cca %. Průzkum bude realizovat cca 250 tazatelů. Každý bude dotazovat v rámci jednoho výběrového bodu - přiřazené základní sídelní jednotky. Maximální počet rozhovorů uskutečněných jedním tazatelem tedy nepřekročí hodnotu 10, nejčastěji pak bude jeden tazatel realizovat 6 rozhovorů. Vzhledem k očekávané návratnosti % bude nasazení výběru (počet vybraných adres, na nichž má být proveden rozhovor) nadhodnoceno o cca 66%. Očekáváme, že z vygenerovaných adres bude cca 1,5% nepoužitelných (na adrese nebydlí žádná domácnost). V takovém případě bude namísto této adresy vygenerována adresa nová, náhradní. Každý tazatel dostane seznam adres k dotazování spolu s konkrétními popisy, koho má na příslušné adrese oslovit (buďto to bude osoba s narozeninami nejblíže ke dni tazatelovi návštěvy, nebo bude cílový respondent identifikován pomocí metody Švédského klíče) – tím bude eliminován možný zásah tazatele do výběrového postupu. Jeho úkolem bude navštívit všechny tyto adresy a uskutečnit rozhovor s vybranými osobami. Pokud při návštěvě adresy nezastihne nikoho doma, vrátí se sem ještě dvakrát v různé dny a v různé denní doby (minimálně 1x o víkendu a 1x ve večerních hodinách). Pokud na dané adrese někoho zastihne, ale nebude to cílová osoba, pokusí se domluvit si s cílovou osobou schůzku (např. požádá o telefonický kontakt na ni, zeptá se, kdy bude cílová osoba doma atd.). Pro dosažení běžné 60-65ti procentní návratnosti stačí navštívit cílovou adresu pouze třikrát. Za neúspěšný může být rozhovor klasifikován tedy po třech neúspěšných návštěvách domácnosti, nebo v případě, kdy vybraný respondent je sice kontaktován, ale rozhovor odmítne. Při neúspěšném rozhovoru tazatel do speciálního protokolu zaznamená důvod neúspěchu, tedy zda na adrese nikoho nezastihl, nebo zda se jednalo o odmítnutý rozhovor. U odmítnutého rozhovoru navíc zaznamená základní údaje o „respondentovi“, tedy pohlaví a jeho přibližný věk. Navíc se ho pokusí doptat na důvody, proč rozhovor odmítl (např. špatné téma, nedostatek času atd.) K neuskutečněnému rozhovoru se pak přidělí i stratum, kde měl rozhovor proběhnout.

14 Výběrová šetření – náhodný výběr

15 Nepravděpodobnostní výběry
KVÓTNÍ VÝBĚR Z nepravděpodobnostních výběrů bývá používán v sociologickém výzkumu nejčastěji, např. ve výzkumu veřejného mínění. Základem tohoto výběru jsou kvóty, kterými je vymezen rozsah výběru jednotlivých, nejčastěji demografických nebo sociálních skupin. Kvóta říká tazateli, kolik má dotazovat žen, mužů, kolik obyvatel se základním, středním apod. vzděláním atd. Postup: Zvolíme výběrové charakteristiky, pro něž budou stanoveny kvóty, v praxi nejvýše 5 znaků. Vhodné jsou relativně snadno zjistitelné údaje, které jsou buď viditelné nebo které je dotazovaný ochoten sdělit, zároveň to bývají hlediska, která populaci výrazně rozlišují. Nejčastěji se používá - pohlaví, věková kategorie, vzdělání, region, velikost místa bydliště, profese, rodinný stav. Pro stanovené kvóty vyhledáme ve statistikách údaje. Rozhodneme se, zda budeme kvóty zadávat nezávisle na sobě nebo ve vzájemných vazbách. Stanovíme výběrové kvóty pro každého tazatele tak, aby pokrývaly potřebný počet strukturu dotázaných ÚČELOVÝ VÝBĚR Předem definované skupiny (např. studenti ZUŠ) Při použití účelového výběru musí výzkumník jasně, přesně a otevřeně definovat populaci, kterou jeho vzorek opravdu zastupuje

16 Nepravděpodobnostní výběry
VÝBĚR ÚSUDKEM Při tomto výběru musí být výzkumník velice dobře obeznámen se zkoumanou problematikou nebo musí velice úzce spolupracovat se zasvěceným odborníkem. Jde o výběry v řádu několika desítek osob. Např. Kriminolog vybírá určitý typ vězňů, nebo pedagog určitý vzorek žáků. Při tomto výběru však vstupuje prvek subjektivity a výsledky těchto výběru nelze spolehlivě zobecnit. Např. pracovník manželské poradny může spolehlivě vybrat typické manželské dvojice navštěvující poradnu. VÝBĚR NABALOVÁNÍM (snowball sampling) Tento výběr má využití především při zkoumání specifických skupin obyvatelstva, pro které neexistují seznamy ani jiná spolehlivá opora výběru. Např. výzkum lidových léčitelů či sběratelů starožitností. Např. kontinuální výzkum – panel domácností, spolupracující domácnosti získávají další domácnosti. Předpokládáme totiž, že každá z jednotek má alespoň některé ze svých kolegů a nebude se bránit sdělit nám jejich adresy. Obrátíme se na zárodečný soubor jednotek (jednotlivci, organizace). Žádáme o kontakty na jiné jednotky odpovídající našim požadavkům (počet kol je závislý na velikosti zárodečné skupiny). Výběr ukončíme jestliže se opakují nově nabízená jména či adresy.

17 Pravdě/Nepravděpodobnostní výběry
SYSTEMATICKÝ VÝBĚR Pravděpodobnostní výběr. Máme k dispozici seznam všech subjektů (základní seznam) a z něho vybíráme náhodně Např. určíme intervaly a z nich vybíráme každý n-tý subjekt Neravděpodobnostní výběr. Není zajištěna náhodnost pořadí jednotek v seznamu Každá x-tá jednotka může mít určitou vlastnost, kterou se od ostatních liší, může se objevit otevřená či skrytá pravidelnost uspořádání jednotek v seznamu. Např. bloky v New Yorku - každý x-tý dům je rohový a tudíž odlišný, může se stát, že majitele rohových domů ve vzorku vůbec nebudeme mít nebo tak budou pouze oni.

18 Výběrová šetření – kvótní výběr
Průzkum bude realizován pomocí kvótního výběru. Metoda sběru dat odpovídá standardně zavedené praxi. Sledované kvóty jsou nevázané, uvedené zvlášť pro každý kraj (kvóty jsou vypsány níže), což zajišťuje reprezentativnost vzorku pro každý jednotlivý kraj i Českou republiku celkem. Tazatel standardně dostává rozpis, kde jsou uvedeny požadované kvóty. Nejčastěji 1 tazatel realizuje 6-8 kompletních rozhovorů (přičemž je praxí vyzkoušeno, že se míra odmítnutí poskytnutí rozhovoru pohybuje okolo 30 – 40 %). Kraj a velikost místa bydliště jsou určeny supervizorem, který zajišťuje rozmístění tazatelů. Tazatel tedy nemůže tyto kvóty porušit. Zároveň je tímto krokem zajištěno určení přesné velikosti sídla (tj. není závislé na odpovědi respondenta, ale je přiřazeno z databáze). Tazatel sám má za úkol navštěvovat v dané lokalitě různé typy zástavby (tj. zachytit různé sociální skupiny obyvatel) a také se v dané lokalitě pohybovat v různé denní době (tj. zachycení opravdu všech potenciálních respondentů). Do lokality se alespoň 1x vrací. Výzkum je prováděn v domácnostech a smí se ho zúčastnit jen jedna osoba z dané domácnosti. Tazatelé mají pokyn na tuto skutečnost respondenty upozorňovat. V případě odmítnutí a příslibu jiné doby, vhodnější pro dotazování se tazatel k respondentovi vrací. Respondent nesmí být vybrán do dalšího výzkumu dříve než 1 rok u měst nad obyvatel a dříve než 0,5 roku v případě měst do obyvatel. Tuto skutečnost kontrolují supervizoři pomocí kontrolních lístků se jmény a adresami (viz. oddíl „Příprava tazatelské sítě“).

19 Výběrová šetření – kvótní výběr

20 Kvótní výběry Kvótní výběr
 Příklad 3 propojených výběrových kvót pro tazatele:

21 Populace opory Výběrová šetření Cílová populace cílová populace: populace, ke které vztahujeme dokazování populace šetření: populace, ke které se výzkum vztahuje reálně (nezahrnuje některé skupiny; např. určíme, že nezkoumáme vězně, vojáky, bezdomovce...) opora výběru: seznam(-y) nebo sada materiálů a procedur (např. mapa, kartotéka...) použitých k identifikaci jednotek cílové populace populace opory: populace skutečně zachycená v opoře nezachycené jednotky, nežádoucí jednotky, duplikace, klastry DOSTUPNOST VHODNÉ OPORY !

22 Usilujeme o přijatelnou přesnost za přijatelnou cenu
Výběrová šetření Usilujeme o přijatelnou přesnost za přijatelnou cenu Chyba náhodná (daná statistikou , velikostí výběrového souboru, různé odchylky výsledků při stejném dodržení designu šetření) a chyby v šetření- viz níže: Měření u části populace neproběhlo Chyba v procesu dotazování Chyba v pokrytí populace Vliv tazatele Výpadky v návratnosti Chyba respondenta Chyba vlastního výběru Nevhodný nástroj Chyba metody sběru dat

23 Výběrová šetření Měření u části populace neproběhlo
Chyba v procesu dotazování Chyba v pokrytí populace Vliv tazatele Výpadky v návratnosti Chyba respondenta Chyba vlastního výběru Nevhodný nástroj Chyba metody sběru dat Pokrytí populace: měření u části neproběhlo Návratnost: optimální je sebrat data od všech jednotek výběru, podrobněji viz dále Chyba vlastního výběru: jaký vzorek vybereme, distribuce vybraného vzorku Vliv tazatele: mnoho aspektů, formulace a záznam otázek Chyba respondenta: neschopnosti odpovědět správně na otázku Chybný nástroj: formulace otázek Chyba metody sběru dat: nevhodný nástroj (telefon, osobní dotazování, internet aj.

24 Výběrová šetření Pravděpodobnostní šetření – kardinální otázka – dostupnost opory pro výběr: U nás ČR – existují 4 možnosti Česká pošta – využití databáze SIPO Databáze adres domů – územně identifikační registr, bytové a nebytové prostory Organizace vlastní výběrové opory Náhodná procházka – náhodný počátek, určité místo a pak systém náhodných kroků Situace v Evropě: K dispozici jsou registry občanů (centrální – severské země, místní SRN) Databáze domácností, adres (podobné jako ČR) Není žádná opora (Francie, Portugalsko). 0chrana osobních údajů a organizace pravděpodobnostních šetření – databáze adres a databáze odpovědí na otázky v dotazníku nesmí být propojena.

25 Výběrové chyby Rozdíl mezi hodnotou, kterou bychom získali ze základního souboru a údaji z výběrového šetření se nazývá výběrovou chybou Tyto chyba může být: ·náhodná (s velikostí výběrového souboru se zmenšuje, její výše se při opakovaných šetřeních provedených stejným postupem nemění, je způsobena skutečností, že výběrový soubor nikdy nereprezentuje základní soubor přesně). Příčina – rozdíl ve velikosti obou souborů. ·systematická (projevuje se v situacích, kdy je porušena náhodnost výběru, např. když některé jednotky mají větší pravděpodobnost dostat se do výběrového souboru, nebo je špatně vymezena populace, systematická chyba narušuje reprezentativitu výběru). Např. výzkum Literary Digest viz Disman, nebyli zahrnuti chudí, lidé bez telefonu, prezidenstské volby v USA 1936, apod. Vychýlení (posun) je pak veličina, o níž se liší hodnota výběrového souboru od hodnoty základního souboru. Kromě vychýlení je třeba vzít v úvahu přesnost (rozptýlení pozorovaných hodnot kolem výběrového průměru, tedy, jestliže je rozptýlení naměřených hodnot kolem výběrového souboru malé, je přesnost vysoká, a naopak, jestliže je rozptýlení velké, přesnost je malá). K eliminaci chyby výběru a k tomu, abychom byli schopni zvolit výběrový soubor, jehož výsledky by zastoupily celek, slouží opora výběru, což je: seznam jednotek základní populace, z nějž je vybírán zkoumaný výběrový soubor jednoznačný výběrový předpis, kterým je získán výběrový soubor.

26 Velikost vzorku Neexistuje jednoznačný návod na stanovení optimální velikosti vorku. Velikost vzorku závisí v podstatě na těchto 4 faktorech: počet skupin a podskupin, které budou v rámci vzorku analyzovány požadovaná přesnost výsledků, hodnota přikládaná informacím vyplývajícím ze vzorku (dána mírou spolehlivosti) náklady na získání vzorku variabilita populace (dána standardní odchylkou) Existují statistické teorie dávající návod, jak velikost vzorku stanovit. Tyto metody stanovují velikost vzorku na základě požadované úrovně spolehlivosti výsledků a přípustné chyby (a dalších parametrů). Je i několik ad hoc metod stanovení velikosti vzorku, které jsou jednoduše prakticky využitelné. ·     Praktická zásada - vzorek by měl být tak velký, aby při jeho rozdělení na skupiny, měla každá z nich alespoň 100 jedinců (např. výzkum volebních preferencí – jednotlivé regiony – tak jak si je zvolíme - alespoň 100 respondentů). Pokud je třeba mít srovnání v rámci ještě hlouběji členěných skupin, musí tato podskupina obsahovat cca 50 osob (ženy vs. muži). Jestliže má určitá skupina relativně nízké zastoupení v populaci, může být vzorek stanoven disproporčně (jestliže se srovnávají názory úzké skupiny osob sledujících kulturní a vzdělávací pořady v TV s ostatní populací, vzorek se stanoví tak, že diváci těchto pořadů mají na vzorku stejný podíl, jako nediváci.). Rozpočet - omezení velikosti vzorku mohou vyplývat z omezených prostředků na výzkum. Srovnatelné výzkumy - vodítkem mohou být již provedené výzkumy se srovnatelnými podskupinami.

27 Systematická a náhodná odchylka
skutečnost

28 systematickáodchylka se nezmenší
Velikost vzorku respondentů velikost vzorku je až druhořadou záležitostí z pohledu kvality výsledků 18% 19% 20% 21% 22% 23% 24% 25% 26% 1000 respondentů 2000 respondentů změřená data skutečnost Interval spolehlivosti pro změřená data četnost } { systematickáodchylka se nezmenší zmenší se jen interval spolehlivosti Velikost vzorku

29 Velikost vzorku Prvním zásadou, při úvahách o velikosti vzorku, je prostudovat velikost a složení populace, ze které bude vybírán vzorek výzkumu. Pro výběr vzorků z malých populací je statistická teorie vcelku složitá, obvykle ze základního souboru do 100 jednotek je zapotřebí dotazovat všechny respondenty. U větších populací než 100 respondentů se výběr vzorku volí kromě požadované přesnosti i s ohledem na velikost základního souboru. Počítáme-li s velkou populací (nad jednotek), toto pravidlo neplatí a velikost vzorku je již možné stanovit bez ohledu na velikost populace. Např. vzorek 1000 respondentů ze populace bude stejně přesný jako vzorek 1000 respondentů ze tří milionové populace. (viz níže tabulka). Tabulka na určování doporučené velikosti vzorku s 5% chybou vzorku pro 95% spolehlivost (předpokládaná úroveň vzorku je 50% a bez možnosti jeho dalšího členění na podskupiny) základní soubor vzorek 210 136 2 400 331 320 175 4 000 351 550 228 8 000 367 1 100 285 20 000 377 1 700 313 384

30 Statistical deviation
Statistical deviation, 95% confid. interval 100 3,4 4,4 6,0 7,1 8,0 8,7 9,2 9,8 10,0 200 2,4 3,1 4,2 5,0 5,7 6,1 6,5 6,9 300 2,0 2,5 3,5 4,1 4,6 5,3 5,8 400 1,7 2,2 3,0 3,6 4,0 4,3 4,9 500 1,5 1,9 2,7 3,2 3,9 4,5 750 1,2 1,6 2,6 2,9 3,3 3,7 1 000 1,1 1,4 2,3 1 250 1,0 2,8 1 500 0,9 1,8 2,1 2 000 0,8 1,3 2 500 0,7 3 000 0,6 3 500 4 000 0,5 5 000 7 500 0,4 počet případů 3 / 97 % 5 / 95 10 / 90 15 / 85 20 / 80 25 / 75 30 / 70 40 / 60 50 10 000 0,3 3 / / / / / / / / cases 8 5,7 2,9 2,5 10 000 0,3 0,4 0,6 0,7 0,8 0,9 0,9 1,0 1,0


Stáhnout ppt "Základní soubor a výběrový vzorek"

Podobné prezentace


Reklamy Google