Základní soubor a výběrový vzorek

Základní soubor a výběrový vzorek
Zpravidla při zkoumání nějakého problému nezjišťujeme údaje o všech jednotkách, ale sledujeme ho jen na dílčím souboru jednotek. Výsledky takového zkoumání jsou pak zobecňovány na soubor zahrnující všechny uvažované jednotky. V sociologickém výzkumu v souvislosti s výběrovým šetřením, užíváme některé důležité pojmy: cílová populace, základní populace, vzorek (výběrový soubor). CÍLOVÁ POPULACE je soubor jednotek, o kterém předpokládáme, že jsou pro něj závěry platné, ZÁKLADNÍ POPULACE je soubor jednotek, které v dané situaci zastupují cílovou populaci, protože některé jednotky jsou nedostupné (např. ve vězení, v zahraničí) VZOREK (neboli výběrový soubor) je skupina jednotek, které skutečně pozorujeme. Př.: cílová populace - soubor obyvatel ČR základní populace - obyvatelé ČR mimo dlouhodobě žijících v cizině výběrový soubor - občané ČR, které skutečně zkoumáme Proč musíme dělat výběrová šetření? finanční důvody - levnější časové důvody – v kratším čase, není tolik času technická nemožnost - “sčítání“ je jednou za 10 let a to se celou dobu něco dělá = příprava, zpracování výsledků, jiný příklad – sčítání obyvatel celého světa. nedostupnost některých jednotek (např. nelze zastihnout všechny respondenty

Reprezentativita Reprezentativita vyjadřuje spolehlivost zastupování základního souboru výběrovým souborem. Úkolem výběrového šetření totiž je, aby údaje o zkoumaných jednotkách zároveň přinášely informaci také o všech jednotkách, které do výběru nebyly zařazeny. Reprezentativita závisí na: ·přesnosti vymezení populace (populace musí být definována přesně – roste spolehlivost výběru, např. musí existovat přesný seznam mužů, studentů, seznam - záleží na povaze zkoumání). ·adekvátnosti výběru (důležité uvažovat u malých výběrů, adekvátní výběr musí být dostatečně rozsáhlý, aby mohl výzkumník důvěřovat závěrům - nestačí zobecnit výsledky od 10 mužů na všechny muže ve státě, apod.) ·heterogenitě (homogenitě) populace (problémy s národní a etnickou příslušností, jazykem, kulturou, protože rozsáhlé státy mají diferencovaná území. Konkrétně, 100 fotbalistů na otázky kolem fotbalu než 100 televizních diváků na celou diváckou obec týkající se všech TV pořadů ) Pozn. reprezentativitu je obtížné, ne-li nemožné kontrolovat v těch případech, kdy nejsou známy charakteristiky základního souboru – tedy není s čím srovnávat: např. vegetariáni, abstinenti, majitelé okrasného ptactva atd.).

Typy výběrů Způsob, jak lze provádět výběry jednotek pro výzkumné účely je v podstatě dvojí: · náhodný - pravděpodobnostní - máme stanovenu pravděpodobnost výběru každé z částí základního souboru do výběrového souboru, všechny jednotky mají stejnou šanci být vybrány a reprezentovat populaci - rozeznáváme různé typy pravděpodobnostního výběru – viz níže ·záměrný - nepravděpodobnostní - rozeznáváme různé typy nepravděpodobnostních výběrů – viz níže Pravděpodobnostní výběry: prostý náhodný výběr stratifikovaný náhodný výběr - proporcionální a neproporcionální skupinkový výběr vícestupňový náhodný výběr. Nepravděpodobnostní výběry: kvótní výběr systematický výběr výběr úsudkem výběr nabalováním.

Pravděpodobnostní výběry
PROSTÝ NÁHODNÝ VÝBĚR 1.Vybíráme ze seznamu nebo z množiny čísel zastupující seznam jednotek základního souboru buď losem nebo podle tabulky náhodných čísel, hodem mincí nebo jiným postupem, který zajišťuje, že výzkumník neovlivní výběrový postup svým zásahem. STRATIFIKOVANÝ NÁHODNÝ VÝBĚR Základní soubor je rozdělen do podsouborů, které nazýváme strata. Strata jsou takové podmnožiny základního souboru, jejichž jednotky mají v rámci strata společnou vlastnost nebo více společných vlastností. Strata se liší mezi sebou, jednotky uvnitř se z hlediska vybrané vlastnosti neliší. V každém stratu provedeme prostý náhodný výběr. SKUPINKOVÝ VÝBĚR Základní soubor je rozdělen na podsoubory, skupinky. Skupinky jsou vzájemně zastupitelné, od sebe se neliší, rozdíly jsou spíše mezi jednotkami. Náhodným postupem vybereme jen některé ze skupinek a vyčerpávajícím způsoben šetříme všechny jejich jednotky. VÍCESTUPŇOVÝ NÁHODNÝ VÝBĚR Ze souboru vybraných skupinek provedeme náhodně buď přímo výběr jednotek nebo výběr dalších podskupinek a v nich výběr jednotek.

STRATIFIKOVANÝ NÁHODNÝ VÝBĚR Základní soubor je rozdělen do podsouborů, které nazýváme strata. Strata jsou takové podmnožiny základního souboru, jejichž jednotky mají v rámci strata společnou vlastnost nebo více společných vlastností. Strata se liší mezi sebou, jednotky uvnitř se z hlediska vybrané vlastnosti neliší. V každém stratu provedeme prostý náhodný výběr. Při stratifikovaném výběru musíme určit správně podíly jednotlivých strat na základním souboru. Jestliže se to podaří snížíme možnou chybu, která mohla nastat v důsledku většího možného zastoupení určitých kategoriích v rámci prostého náhodného výběru. Např. názory mužů a žen a jednotlivých věkových kategorií na otázky privatizace. Výběr tedy uspořádáme stratifikovaně podle pohlaví a věkových skupin a musíme znát podíly obyvatelstva těchto skupin v základním souboru, abychom mohli stanovit podíl jednotlivých strat na výběru.

SKUPINKOVÝ VÝBĚR Základní soubor je rozdělen na podskupiny (klastry). Náhodně se vybírají některé podskupiny, jejichž všichni členové vstupují do vzorku. Základní soubor je rozdělen na podsoubory, skupinky. Skupinky jsou vzájemně zastupitelné, od sebe se neliší, rozdíly jsou mezi jednotkami (tedy uvnitř skupinek). Logika výběru vychází s toho, že vybrané skupiny reprezentují ostatní skupiny (i ty, co se nedostaly do výběru), tedy celek – základní soubor. Základní soubor je rozdělen na podsoubory, skupiny Náhodným postupem vybereme ze základního souboru jen některé ze skupinek a vyčerpávajícím způsoben šetříme všechny jejich jednotky. Například při výzkumu dětí školou povinných se ze základního souboru všech tříd vybere např. 15 tříd a zkoumají se všichni žáci těchto tříd. Hlavní výhodou skupinového výběru jsou nízké náklady

VÍCESTUPŇOVÝ NÁHODNÝ VÝBĚR Procedura výběru vzorku sestává z několika návazně použitých metod výběru vzorku. Omezuje rozptýlenost základního souboru. Základní soubor je rozdělen na podsoubory, skupinky. Skupinky jsou vzájemně zastupitelné, od sebe se neliší, rozdíly jsou spíše mezi jednotkami. Ze souboru vybraných skupinek provedeme náhodně buď přímo výběr jednotek nebo výběr dalších podskupinek a v nich výběr jednotek. Např. máme soubor okresů a náhodně vybereme 4 okresy. Ve vybraných okresech provedeme náhodný výběr obcí a v nich pak menší prostorové jednotky - např. volební obvody, v nich potom vybíráme jedince. Nebo jiný příklad: Například při výzkumu dětí školou povinných se v prvním stupni (např) klastrově vyberou primární jednotky - školy, v následujícím stupni se v rámci primárních jednotek (např) klastrově vybírají sekundární jednotky - třídy, a v dalším stupni se (např) systematický náhodně vybírají finální cílové osoby - žáci.

Nepravděpodobnostní výběry
KVÓTNÍ VÝBĚR Z nepravděpodobnostních výběrů bývá používán v sociologickém výzkumu nejčastěji, např. ve výzkumu veřejného mínění. Základem tohoto výběru jsou kvóty, kterými je vymezen rozsah výběru jednotlivých, nejčastěji demografických nebo sociálních skupin. Kvóta říká tazateli, kolik má dotazovat žen, mužů, kolik obyvatel se základním, středním apod. vzděláním atd. Postup: Zvolíme výběrové charakteristiky, pro něž budou stanoveny kvóty, v praxi nejvýše 5 znaků. Vhodné jsou relativně snadno zjistitelné údaje, které jsou buď viditelné nebo které je dotazovaný ochoten sdělit, zároveň to bývají hlediska, která populaci výrazně rozlišují. Nejčastěji se používá - pohlaví, věková kategorie, vzdělání, region, velikost místa bydliště, profese, rodinný stav. Pro stanovené kvóty vyhledáme ve statistikách údaje. Rozhodneme se, zda budeme kvóty zadávat nezávisle na sobě nebo ve vzájemných vazbách. Stanovíme výběrové kvóty pro každého tazatele tak, aby pokrývaly potřebný počet strukturu dotázaných SYSTEMATICKÝ VÝBĚR Máme základní seznam. Z něho vybíráme jednotky na základě pevně zvoleného kroku, např. každou 10. jednotku. Tento výběr se velice blíží výběrům pravděpodobnostním, ale s dostatečnou jistotou není zajištěna náhodnost pořadí jednotek v seznamu. (není s dostastečnou jistotou zajištzěno náhodné pořadí jednotek v souboru). Každá x-tá jednotka může mít určitou vlastnost, kterou se od ostatních liší, může se objevit skrytá pravidelnost uspořádání jednotek v seznamu. Např. bloky v New Yorku - každý x-tý dům je rohový a tudíž odlišný, může se stát, že majitele rohových domů ve vzorku vůbec nebudeme mít nebo tak budou pouze oni.

Nepravděpodobnostní výběry
VÝBĚR ÚSUDKEM Při tomto výběru musí být výzkumník velice dobře obeznámen se zkoumanou problematikou nebo musí velice úzce spolupracovat se zasvěceným odborníkem. Jde o výběry v řádu několika desítek osob. Např. Kriminolog vybírá určitý typ vězňů, nebo pedagog určitý vzorek žáků. Při tomto výběru však vstupuje prvek subjektivity a výsledky těchto výběru nelze spolehlivě zobecnit. Např. pracovník manželské poradny může spolehlivě vybrat typické manželské dvojice navštěvující poradnu. VÝBĚR NABALOVÁNÍM (snowball sampling) Tento výběr má využití především při zkoumání specifických skupin obyvatelstva, pro které neexistují seznamy ani jiná spolehlivá opora výběru. Např. výzkum lidových léčitelů či sběratelů starožitností. Např. kontinuální výzkum – panel domácností, spolupracující domácnosti získávají další domácnosti. Předpokládáme totiž, že každá z jednotek má alespoň některé ze svých kolegů a nebude se bránit sdělit nám jejich adresy. Obrátíme se na zárodečný soubor jednotek (jednotlivci, organizace). Žádáme o kontakty na jiné jednotky odpovídající našim požadavkům (počet kol je závislý na velikosti zárodečné skupiny). Výběr ukončíme jestliže se opakují nově nabízená jména či adresy.

Výběrové chyby Rozdíl mezi hodnotou, kterou bychom získali ze základního souboru a údaji z výběrového šetření se nazývá výběrovou chybou Tyto chyba může být: ·náhodná (s velikostí výběrového souboru se zmenšuje, její výše se při opakovaných šetřeních provedených stejným postupem nemění, je způsobena skutečností, že výběrový soubor nikdy nereprezentuje základní soubor přesně). Příčina – rozdíl ve velikosti obou souborů. ·systematická (projevuje se v situacích, kdy je porušena náhodnost výběru, např. když některé jednotky mají větší pravděpodobnost dostat se do výběrového souboru, nebo je špatně vymezena populace, systematická chyba narušuje reprezentativitu výběru). Např. výzkum Literary Digest viz Disman, nebyli zahrnuti chudí, lidé bez telefonu, prezidenstské volby v USA 1936, apod. Vychýlení (posun) je pak veličina, o níž se liší hodnota výběrového souboru od hodnoty základního souboru. Kromě vychýlení je třeba vzít v úvahu přesnost (rozptýlení pozorovaných hodnot kolem výběrového průměru, tedy, jestliže je rozptýlení naměřených hodnot kolem výběrového souboru malé, je přesnost vysoká, a naopak, jestliže je rozptýlení velké, přesnost je malá). K eliminaci chyby výběru a k tomu, abychom byli schopni zvolit výběrový soubor, jehož výsledky by zastoupily celek, slouží opora výběru, což je: seznam jednotek základní populace, z nějž je vybírán zkoumaný výběrový soubor jednoznačný výběrový předpis, kterým je získán výběrový soubor.

Velikost vzorku Neexistuje jednoznačný návod na stanovení optimální velikosti vorku. Velikost vzorku závisí v podstatě na těchto 4 faktorech: počet skupin a podskupin, které budou v rámci vzorku analyzovány požadovaná přesnost výsledků, hodnota přikládaná informacím vyplývajícím ze vzorku (dána mírou spolehlivosti) náklady na získání vzorku variabilita populace (dána standardní odchylkou) Existují statistické teorie dávající návod, jak velikost vzorku stanovit. Tyto metody stanovují velikost vzorku na základě požadované úrovně spolehlivosti výsledků a přípustné chyby (a dalších parametrů). Je i několik ad hoc metod stanovení velikosti vzorku, které jsou jednoduše prakticky využitelné. · Praktická zásada - vzorek by měl být tak velký, aby při jeho rozdělení na skupiny, měla každá z nich alespoň 100 jedinců (např. výzkum volebních preferencí – jednotlivé regiony – tak jak si je zvolíme - alespoň 100 respondentů). Pokud je třeba mít srovnání v rámci ještě hlouběji členěných skupin, musí tato podskupina obsahovat cca 50 osob (ženy vs. muži). Jestliže má určitá skupina relativně nízké zastoupení v populaci, může být vzorek stanoven disproporčně (jestliže se srovnávají názory úzké skupiny osob sledujících kulturní a vzdělávací pořady v TV s ostatní populací, vzorek se stanoví tak, že diváci těchto pořadů mají na vzorku stejný podíl, jako nediváci.). Rozpočet - omezení velikosti vzorku mohou vyplývat z omezených prostředků na výzkum. Srovnatelné výzkumy - vodítkem mohou být již provedené výzkumy se srovnatelnými podskupinami.

Výtěžnost x návratnost
adresní výběr předepsáno 1000 adres, 200 nebylo kontaktovaných (tazatel, chyba databáze apod.) 200 rozhovorů bylo neúspěšných z důvodu odmítnutí či nezastižení výtěžnost 600/800=75% návratnost 600/1000=60% Kvótní výběr předepsáno provést 1200 rozhovorů, 1000 rozhovorů bylo provedeno na jeden rozhovor bylo třeba kontaktovat v průměru 4 domácnosti výtěžnost 1000/4000=25% návratnost 1000/1200=83%

Systematická a náhodná odchylka
skutečnost

systematickáodchylka se nezmenší
Velikost vzorku respondentů velikost vzorku je až druhořadou záležitostí z pohledu kvality výsledků 18% 19% 20% 21% 22% 23% 24% 25% 26% 1000 respondentů 2000 respondentů změřená data skutečnost Interval spolehlivosti pro změřená data četnost } { systematickáodchylka se nezmenší zmenší se jen interval spolehlivosti Velikost vzorku

Základní soubor a výběrový vzorek

Podobné prezentace

Prezentace na téma: "Základní soubor a výběrový vzorek"— Transkript prezentace:

Podobné prezentace

O projektu

Kontaktní formulář

Přihlásit se

Přihlásit se přes sociální síť:

Základní soubor a výběrový vzorek

Podobné prezentace

Prezentace na téma: "Základní soubor a výběrový vzorek"— Transkript prezentace:

Podobné prezentace

O projektu

Kontaktní formulář