Základní soubor a výběrový vzorek

Slides:



Advertisements
Podobné prezentace
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ ÚSTAV GEODÉZIE
Advertisements

Statistická indukce Teorie odhadu.
Statistická indukce Teorie odhadu.
Třídění dat OA a VOŠ Příbram. Třídění  rozdělení jednotek souboru do takových skupin, aby co nejlépe vynikly charakteristické vlastnosti zkoumaných jevů.
Regionální kontaktní organizace – kontakty pro Evropský výzkumný prostor jsou součástí sítě regionálních a oborových kontaktních organizací NINET, které.
Testování statistických hypotéz
Hodnocení způsobilosti měřících systémů
Základní soubor a výběrový vzorek
Statistická chyba a hladina statistické významnosti
Reprezentativita: chyba pokrytí populace (coverage error) Jindřich Krejčí Management sociálních dat a datové archivy Kurz ISS FSV UK.
Regresní analýza a korelační analýza
Získávání informací Získání informací o reálném systému
Statistika Vypracoval: Mgr. Lukáš Bičík
CHYBY MĚŘENÍ.
Statistická chyba a hladina statistické významnosti
Varianty výzkumu Kroky výzkumu Výběrový soubor
Obsah statistiky Jana Zvárová
Testování hypotéz vymezení důležitých pojmů
Analýza dat.
Obchodní činnosti - Kapitola 8 1 VÝZKUM TRHU KAPITOLA 8 Pavlíčková.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Název školy: Střední odborná škola stavební Karlovy Vary, Sabinovo náměstí 16, Karlovy Vary Autor: ING. JANA KOVAŘÍKOVÁ Název materiálu: VY_32_INOVACE_11_MARKETINGOVÝ.
Jak jste dopadli? Kvaliťák nebo kvantiťák? Kreativec nebo analytik?
Tazatelská síť.
Metody sociálního výzkumu 2. Ročník LS 2010 Jabok, ETF 2. výukový blok.
Charakteristické rysy a typy jednorozměrného rozdělení četností.
Projekt OP VK č. CZ.1.07/1.5.00/ Šablony Mendelova střední škola, Nový Jičín Tento projekt je spolufinancován ESF a státním rozpočtem ČR. Byl uskutečněn.
1 Metody a techniky výzkumu veřejného mínění Kombinované studium - II. cyklus LS 2007/08 Eliška Jungová, IKSŽ, FSV UK.
VÝZKUM V OŠETŘOVATELSTVÍ
ZÁKLADNÍ SOUBOR Základní soubor (populace) je většinou myšlenková konstrukce, která obsahuje veškerá data, se kterými pracujeme a není vždy snadné jej.
Statistika 2. přednáška Ing. Marcela Čapková.
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUMVY_32_INOVACE_09/C1 AutorIng. Liběna Krchňáková Období vytvořeníSrpen.
Fakulta sociálních studií
Výukový program: Obchodní akademie Název programu: Marketingový výzkum – zjišťování informací Vypracoval : Ing. Adéla Hrabcová Projekt Anglicky v odborných.
VÝZKUMNÝ VZOREK, validita a reliabilita
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Základy zpracování geologických dat
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
K OMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA Úvod do statistiky VY_32_INOVACE_M4r0117 Mgr. Jakub Němec.
Metrologie   Přednáška č. 5 Nejistoty měření.
1 Tazatelé a dotazovací situace Jan Hartl. 2 CO a JAK?
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
TECHNIKY SBĚRU DAT KVANTITATIVNÍ KVALITATIVNÍ VÝZKUM VÝZKUM
Základy pedagogické metodologie
Reprezentativita: chyba výběru Jindřich Krejčí Management sociálních dat a datové archivy Kurz ISS FSV UK.
Základy pedagogické metodologie
Metody sociálního výzkumu 5. blok Denní studium LS 2007/
Úvod do metod sociologického výzkumu
METODY STŘEDNĚDOBÉHO PROGNÓZOVÁNÍ SURO jaro 2010.
Inferenční statistika - úvod
Typy výzkumu  Kvantitativní  Kvalitativní  Smíšený  První zkoumá kolik lidí si co myslí atd …  Druhý co přesně si lidé myslí  Třetí je kombinací.
Výzkumné techniky Neintervenující výzkumné techniky Sekundární analýza
Odhady odhady bodové a intervalové odhady
Varianty výzkumu Kroky výzkumu Výběrový soubor
Číslo a název projektu: CZ /1. 5
Reprezentativita: chyba výběru Jindřich Krejčí
Základy statistické indukce
Induktivní statistika
Induktivní statistika
Induktivní statistika
- váhy jednotlivých studií
Induktivní statistika
Logika a metody výběru vzorku
Spojitá a kategoriální data Základní popisné statistiky
Sociologický výzkum II.
Statistika a výpočetní technika
Co říká česká veřejnost?
Induktivní statistika
Základy statistiky.
Náhodné výběry a jejich zpracování
Transkript prezentace:

Základní soubor a výběrový vzorek Zpravidla při zkoumání nějakého problému nezjišťujeme údaje o všech jednotkách, ale sledujeme ho jen na dílčím souboru jednotek. Výsledky takového zkoumání jsou pak zobecňovány na soubor zahrnující všechny uvažované jednotky. V sociologickém výzkumu v souvislosti s výběrovým šetřením, užíváme některé důležité pojmy: cílová populace, základní populace, vzorek (výběrový soubor). CÍLOVÁ POPULACE je soubor jednotek, o kterém předpokládáme, že jsou pro něj závěry platné, ZÁKLADNÍ POPULACE je soubor jednotek, které v dané situaci zastupují cílovou populaci, protože některé jednotky jsou nedostupné (např. ve vězení, v zahraničí) VZOREK (neboli výběrový soubor) je skupina jednotek, které skutečně pozorujeme.   Př.: cílová populace - soubor obyvatel ČR základní populace - obyvatelé ČR mimo dlouhodobě žijících v cizině výběrový soubor - občané ČR, které skutečně zkoumáme Proč musíme dělat výběrová šetření? finanční důvody - levnější časové důvody – v kratším čase, není tolik času technická nemožnost - “sčítání“ je jednou za 10 let a to se celou dobu něco dělá = příprava, zpracování výsledků, jiný příklad – sčítání obyvatel celého světa. nedostupnost některých jednotek (např. nelze zastihnout všechny respondenty

Reprezentativita Reprezentativita vyjadřuje spolehlivost zastupování základního souboru výběrovým souborem. Úkolem výběrového šetření totiž je, aby údaje o zkoumaných jednotkách zároveň přinášely informaci také o všech jednotkách, které do výběru nebyly zařazeny. Reprezentativita závisí na: ·přesnosti vymezení populace (populace musí být definována přesně – roste spolehlivost výběru, např. musí existovat přesný seznam mužů, studentů, seznam - záleží na povaze zkoumání). ·adekvátnosti výběru (důležité uvažovat u malých výběrů, adekvátní výběr musí být dostatečně rozsáhlý, aby mohl výzkumník důvěřovat závěrům - nestačí zobecnit výsledky od 10 mužů na všechny muže ve státě, apod.) ·heterogenitě (homogenitě) populace (problémy s národní a etnickou příslušností, jazykem, kulturou, protože rozsáhlé státy mají diferencovaná území. Konkrétně, 100 fotbalistů na otázky kolem fotbalu než 100 televizních diváků na celou diváckou obec týkající se všech TV pořadů ) Pozn. reprezentativitu je obtížné, ne-li nemožné kontrolovat v těch případech, kdy nejsou známy charakteristiky základního souboru – tedy není s čím srovnávat: např. vegetariáni, abstinenti, majitelé okrasného ptactva atd.).

Typy výběrů Způsob, jak lze provádět výběry jednotek pro výzkumné účely je v podstatě dvojí:   · náhodný - pravděpodobnostní - máme stanovenu pravděpodobnost výběru každé z částí základního souboru do výběrového souboru, všechny jednotky mají stejnou šanci být vybrány a reprezentovat populaci - rozeznáváme různé typy pravděpodobnostního výběru – viz níže ·záměrný - nepravděpodobnostní - rozeznáváme různé typy nepravděpodobnostních výběrů – viz níže Pravděpodobnostní výběry: prostý náhodný výběr stratifikovaný náhodný výběr - proporcionální a neproporcionální skupinkový výběr vícestupňový náhodný výběr. Nepravděpodobnostní výběry: kvótní výběr systematický výběr výběr úsudkem výběr nabalováním.

Pravděpodobnostní výběry PROSTÝ NÁHODNÝ VÝBĚR 1.Vybíráme ze seznamu nebo z množiny čísel zastupující seznam jednotek základního souboru buď losem nebo podle tabulky náhodných čísel, hodem mincí nebo jiným postupem, který zajišťuje, že výzkumník neovlivní výběrový postup svým zásahem. STRATIFIKOVANÝ NÁHODNÝ VÝBĚR Základní soubor je rozdělen do podsouborů, které nazýváme strata. Strata jsou takové podmnožiny základního souboru, jejichž jednotky mají v rámci strata společnou vlastnost nebo více společných vlastností. Strata se liší mezi sebou, jednotky uvnitř se z hlediska vybrané vlastnosti neliší. V každém stratu provedeme prostý náhodný výběr. SKUPINKOVÝ VÝBĚR Základní soubor je rozdělen na podsoubory, skupinky. Skupinky jsou vzájemně zastupitelné, od sebe se neliší, rozdíly jsou spíše mezi jednotkami. Náhodným postupem vybereme jen některé ze skupinek a vyčerpávajícím způsoben šetříme všechny jejich jednotky. VÍCESTUPŇOVÝ NÁHODNÝ VÝBĚR Ze souboru vybraných skupinek provedeme náhodně buď přímo výběr jednotek nebo výběr dalších podskupinek a v nich výběr jednotek.

Pravděpodobnostní výběry STRATIFIKOVANÝ NÁHODNÝ VÝBĚR Základní soubor je rozdělen do podsouborů, které nazýváme strata. Strata jsou takové podmnožiny základního souboru, jejichž jednotky mají v rámci strata společnou vlastnost nebo více společných vlastností. Strata se liší mezi sebou, jednotky uvnitř se z hlediska vybrané vlastnosti neliší. V každém stratu provedeme prostý náhodný výběr.   Při stratifikovaném výběru musíme určit správně podíly jednotlivých strat na základním souboru. Jestliže se to podaří snížíme možnou chybu, která mohla nastat v důsledku většího možného zastoupení určitých kategoriích v rámci prostého náhodného výběru. Např. názory mužů a žen a jednotlivých věkových kategorií na otázky privatizace. Výběr tedy uspořádáme stratifikovaně podle pohlaví a věkových skupin a musíme znát podíly obyvatelstva těchto skupin v základním souboru, abychom mohli stanovit podíl jednotlivých strat na výběru.

Pravděpodobnostní výběry SKUPINKOVÝ VÝBĚR   Základní soubor je rozdělen na podskupiny (klastry). Náhodně se vybírají některé podskupiny, jejichž všichni členové vstupují do vzorku. Základní soubor je rozdělen na podsoubory, skupinky. Skupinky jsou vzájemně zastupitelné, od sebe se neliší, rozdíly jsou mezi jednotkami (tedy uvnitř skupinek). Logika výběru vychází s toho, že vybrané skupiny reprezentují ostatní skupiny (i ty, co se nedostaly do výběru), tedy celek – základní soubor. 1. Základní soubor je rozdělen na podsoubory, skupiny 2. Náhodným postupem vybereme ze základního souboru jen některé ze skupinek a vyčerpávajícím způsoben šetříme všechny jejich jednotky. Například při výzkumu dětí školou povinných se ze základního souboru všech tříd vybere např. 15 tříd a zkoumají se všichni žáci těchto tříd. Hlavní výhodou skupinového výběru jsou nízké náklady

Pravděpodobnostní výběry VÍCESTUPŇOVÝ NÁHODNÝ VÝBĚR Procedura výběru vzorku sestává z několika návazně použitých metod výběru vzorku. Omezuje rozptýlenost základního souboru. Základní soubor je rozdělen na podsoubory, skupinky. Skupinky jsou vzájemně zastupitelné, od sebe se neliší, rozdíly jsou spíše mezi jednotkami. Ze souboru vybraných skupinek provedeme náhodně buď přímo výběr jednotek nebo výběr dalších podskupinek a v nich výběr jednotek.   Např. máme soubor okresů a náhodně vybereme 4 okresy. Ve vybraných okresech provedeme náhodný výběr obcí a v nich pak menší prostorové jednotky - např. volební obvody, v nich potom vybíráme jedince. Nebo jiný příklad: Například při výzkumu dětí školou povinných se v prvním stupni (např) klastrově vyberou primární jednotky - školy, v následujícím stupni se v rámci primárních jednotek (např) klastrově vybírají sekundární jednotky - třídy, a v dalším stupni se (např) systematický náhodně vybírají finální cílové osoby - žáci.

Nepravděpodobnostní výběry KVÓTNÍ VÝBĚR Z nepravděpodobnostních výběrů bývá používán v sociologickém výzkumu nejčastěji, např. ve výzkumu veřejného mínění. Základem tohoto výběru jsou kvóty, kterými je vymezen rozsah výběru jednotlivých, nejčastěji demografických nebo sociálních skupin. Kvóta říká tazateli, kolik má dotazovat žen, mužů, kolik obyvatel se základním, středním apod. vzděláním atd. Postup: Zvolíme výběrové charakteristiky, pro něž budou stanoveny kvóty, v praxi nejvýše 5 znaků. Vhodné jsou relativně snadno zjistitelné údaje, které jsou buď viditelné nebo které je dotazovaný ochoten sdělit, zároveň to bývají hlediska, která populaci výrazně rozlišují. Nejčastěji se používá - pohlaví, věková kategorie, vzdělání, region, velikost místa bydliště, profese, rodinný stav. Pro stanovené kvóty vyhledáme ve statistikách údaje. Rozhodneme se, zda budeme kvóty zadávat nezávisle na sobě nebo ve vzájemných vazbách. Stanovíme výběrové kvóty pro každého tazatele tak, aby pokrývaly potřebný počet strukturu dotázaných SYSTEMATICKÝ VÝBĚR Máme základní seznam. Z něho vybíráme jednotky na základě pevně zvoleného kroku, např. každou 10. jednotku. Tento výběr se velice blíží výběrům pravděpodobnostním, ale s dostatečnou jistotou není zajištěna náhodnost pořadí jednotek v seznamu. (není s dostastečnou jistotou zajištzěno náhodné pořadí jednotek v souboru). Každá x-tá jednotka může mít určitou vlastnost, kterou se od ostatních liší, může se objevit skrytá pravidelnost uspořádání jednotek v seznamu. Např. bloky v New Yorku - každý x-tý dům je rohový a tudíž odlišný, může se stát, že majitele rohových domů ve vzorku vůbec nebudeme mít nebo tak budou pouze oni.

Nepravděpodobnostní výběry VÝBĚR ÚSUDKEM Při tomto výběru musí být výzkumník velice dobře obeznámen se zkoumanou problematikou nebo musí velice úzce spolupracovat se zasvěceným odborníkem. Jde o výběry v řádu několika desítek osob. Např. Kriminolog vybírá určitý typ vězňů, nebo pedagog určitý vzorek žáků. Při tomto výběru však vstupuje prvek subjektivity a výsledky těchto výběru nelze spolehlivě zobecnit. Např. pracovník manželské poradny může spolehlivě vybrat typické manželské dvojice navštěvující poradnu. VÝBĚR NABALOVÁNÍM (snowball sampling) Tento výběr má využití především při zkoumání specifických skupin obyvatelstva, pro které neexistují seznamy ani jiná spolehlivá opora výběru. Např. výzkum lidových léčitelů či sběratelů starožitností. Např. kontinuální výzkum – panel domácností, spolupracující domácnosti získávají další domácnosti. Předpokládáme totiž, že každá z jednotek má alespoň některé ze svých kolegů a nebude se bránit sdělit nám jejich adresy. Obrátíme se na zárodečný soubor jednotek (jednotlivci, organizace). Žádáme o kontakty na jiné jednotky odpovídající našim požadavkům (počet kol je závislý na velikosti zárodečné skupiny). Výběr ukončíme jestliže se opakují nově nabízená jména či adresy.  

Výběrové chyby Rozdíl mezi hodnotou, kterou bychom získali ze základního souboru a údaji z výběrového šetření se nazývá výběrovou chybou Tyto chyba může být: ·náhodná (s velikostí výběrového souboru se zmenšuje, její výše se při opakovaných šetřeních provedených stejným postupem nemění, je způsobena skutečností, že výběrový soubor nikdy nereprezentuje základní soubor přesně). Příčina – rozdíl ve velikosti obou souborů.   ·systematická (projevuje se v situacích, kdy je porušena náhodnost výběru, např. když některé jednotky mají větší pravděpodobnost dostat se do výběrového souboru, nebo je špatně vymezena populace, systematická chyba narušuje reprezentativitu výběru). Např. výzkum Literary Digest viz Disman, nebyli zahrnuti chudí, lidé bez telefonu, prezidenstské volby v USA 1936, apod. Vychýlení (posun) je pak veličina, o níž se liší hodnota výběrového souboru od hodnoty základního souboru. Kromě vychýlení je třeba vzít v úvahu přesnost (rozptýlení pozorovaných hodnot kolem výběrového průměru, tedy, jestliže je rozptýlení naměřených hodnot kolem výběrového souboru malé, je přesnost vysoká, a naopak, jestliže je rozptýlení velké, přesnost je malá). K eliminaci chyby výběru a k tomu, abychom byli schopni zvolit výběrový soubor, jehož výsledky by zastoupily celek, slouží opora výběru, což je: seznam jednotek základní populace, z nějž je vybírán zkoumaný výběrový soubor jednoznačný výběrový předpis, kterým je získán výběrový soubor.

Velikost vzorku Neexistuje jednoznačný návod na stanovení optimální velikosti vorku. Velikost vzorku závisí v podstatě na těchto 4 faktorech: počet skupin a podskupin, které budou v rámci vzorku analyzovány požadovaná přesnost výsledků, hodnota přikládaná informacím vyplývajícím ze vzorku (dána mírou spolehlivosti) náklady na získání vzorku variabilita populace (dána standardní odchylkou)   Existují statistické teorie dávající návod, jak velikost vzorku stanovit. Tyto metody stanovují velikost vzorku na základě požadované úrovně spolehlivosti výsledků a přípustné chyby (a dalších parametrů). Je i několik ad hoc metod stanovení velikosti vzorku, které jsou jednoduše prakticky využitelné. ·     Praktická zásada - vzorek by měl být tak velký, aby při jeho rozdělení na skupiny, měla každá z nich alespoň 100 jedinců (např. výzkum volebních preferencí – jednotlivé regiony – tak jak si je zvolíme - alespoň 100 respondentů). Pokud je třeba mít srovnání v rámci ještě hlouběji členěných skupin, musí tato podskupina obsahovat cca 50 osob (ženy vs. muži). Jestliže má určitá skupina relativně nízké zastoupení v populaci, může být vzorek stanoven disproporčně (jestliže se srovnávají názory úzké skupiny osob sledujících kulturní a vzdělávací pořady v TV s ostatní populací, vzorek se stanoví tak, že diváci těchto pořadů mají na vzorku stejný podíl, jako nediváci.). Rozpočet - omezení velikosti vzorku mohou vyplývat z omezených prostředků na výzkum. Srovnatelné výzkumy - vodítkem mohou být již provedené výzkumy se srovnatelnými podskupinami.

Výtěžnost x návratnost adresní výběr předepsáno 1000 adres, 200 nebylo kontaktovaných (tazatel, chyba databáze apod.) 200 rozhovorů bylo neúspěšných z důvodu odmítnutí či nezastižení výtěžnost 600/800=75% návratnost 600/1000=60% Kvótní výběr předepsáno provést 1200 rozhovorů, 1000 rozhovorů bylo provedeno na jeden rozhovor bylo třeba kontaktovat v průměru 4 domácnosti výtěžnost 1000/4000=25% návratnost 1000/1200=83%

Systematická a náhodná odchylka skutečnost

systematickáodchylka se nezmenší Velikost vzorku respondentů velikost vzorku je až druhořadou záležitostí z pohledu kvality výsledků 18% 19% 20% 21% 22% 23% 24% 25% 26% 1000 respondentů 2000 respondentů změřená data skutečnost Interval spolehlivosti pro změřená data četnost } { systematickáodchylka se nezmenší zmenší se jen interval spolehlivosti Velikost vzorku