Výběrové metody (Výběrová šetření) účel: v praxi potřebujeme znát informace o celé populaci (základním souboru), které mnohdy nelze přímo získat (rozsáhlý soubor, nákladnost, dlouhá doba zjišťování apod). Lze ale s určitou mírou nepřesnosti tyto informace získat na základě poznatků z vybrané části souboru. Musí ale být splněny určité předpoklady použitelnost takových postupů a použity vhodné metody. Základní pojmy šetření vyčerpávající soubor základní výběrová výběrový typy výběrů - náhodný výběr - záměrný výběr representativní soubor
Náhodný výběr náhodný výběr: o tom, které jednotky budou zařazeny do výběrového souboru rozhoduje náhoda a ne záměr nebo úsudek vybírajícího Základní typy náhodného výběru prostý náhodný výběr oblastní výběr vícestupňový výběr Základní výběrové techniky náhodného výběru přímý výběr ze ZS losování pomocí tabulek náhodných čísel (generátor náhodných čísel) systematický výběr (vybíráme každou k-tou jednotku, kde k = N/n )
NÁHODNÝ VÝBĚR – každý objekt základního souboru má stejnou pravděpodobnost zahrnutí do výběru. Prostý náhodný výběr prostý náhodný výběr s vracením – po vybrání ze základního souboru se každý objekt vrací zpět, takže se další objekt vybírá z úplného základního souboru prostý náhodný výběr bez vracení – vybraný objekt se nevrací do základního souboru, takže se pravděpodobnost výběru dalšího objektu mění. Pro n << N však prakticky není třeba rozlišovat výběr s vracením a bez vracení.
dvoustupňový výběr oblastní (stratifikovaný) výběr – základní soubor rozdělíme na homogenní části a v každé z nich pak provedeme náhodný výběr. dvoustupňový výběr – v prvním stupni vybereme náhodně skupiny objektů, v těch pak náhodně jednotlivé objekty.
MATEMATICKÁ STATISTIKA (statistická indukce) se zabývá problematikou konstrukce zásad úsudků o základním souboru na základě poznání z části souboru pořízené náhodným výběrem statistické odhady - metody odhadování neznámých parametrů základního souboru na základě informací o charakteristikách náhodného výběru testování statistických hypotéz - induktivní postupy, které vedou k zamítnutí nebo potvrzení určitých tvrzení (hypotéz) o základním souboru
Teorie statistických odhadů PARAMETRY ZÁKLADNÍHO SOUBORU Populační střední hodnota Populační rozptyl Populační relativní četnost (podíl)
Teorie statistických odhadů VÝBĚROVÉ CHARAKTERISTIKY (STATISTIKY) ( jsou to náhodné veličiny) Výběrový průměr Výběrový rozptyl Výběrová relativní četnost
Bodový odhad Neznámou hodnotu parametru G základního souboru odhadneme pomocí vypočtené hodnoty vhodné výběrové charakteristiky (statistiky) g. Zápis nebo znamená, že statistika g je bodovým odhadem parametru G základního souboru. Vlastnosti bodového odhadu: nezkreslenost (nevychýlenost) vydatnost konzistence
Rozdíl G - g se nazývá výběrová chyba (zkreslení, vychýlení) Statistika g představuje nevychýlený (nestranný, nezkreslený) odhad parametru G, jestliže E(G - g) = 0 E(g) = G Rozdíl G - g se nazývá výběrová chyba (zkreslení, vychýlení) Statistika g představuje vydatný odhad parametru G, má-li ze všech nevychýlených odhadů nejmenší rozptyl. Statistika g představuje konzistentní odhad parametru G, jestliže tj., pokud s rostoucím rozsahem výběru roste i pravděpodobnost, že statistika g bude mít hodnotu lišící se od parametru G libovolně málo (pravděpodobnost větších odchylek klesá)
Přesnost nevychýleného bodového odhadu posuzujeme pomocí směrodatné odchylky výběrové charakteristiky ……výběrový průměr je nevychýleným odhadem střední hodnoty základního souboru Přesnost odhadu střední hodnoty základního souboru posuzujeme směrodatnou odchylkou výběrového průměru
……výběrová relativní četnost p je nevychýleným odhadem relativní četnosti v základním souboru Přesnost odhadu relativní četnosti základního souboru posuzujeme směrodatnou odchylkou výběrové relativní četnosti …výběrový rozptyl je nevychýleným odhadem rozptylu základního souboru
Intervalové odhady Intervalový odhad je odhad neznámého parametru základního souboru pomocí intervalu, který pokrývá skutečnou hodnotu odhadovaného parametru s určitou pravděpodobností P = 1 - , které říkáme spolehlivost odhadu P = 1 - volíme nejčastěji 0,95 (nebo 0,99) 95 % - ní interval spolehlivosti Interval spolehlivosti oboustranný jednostranný levostranný (zajímá nás jen dolní mez ) pravostranný (zajímá nás jen horní mez)
Intervalový odhad parametru µ případ velkého výběru z libovolného rozdělení nebo z normálního rozdělení se známým rozptylem 2 oboustranny interval přípustná chyba odhadu
levostranný interval spolehlivosti pro parametr µ pravostranný interval spolehlivosti pro parametr µ velké výběry z normálního rozdělení s neznámým rozptylem rozptyl ve vzorcích nahrazujeme výběrovým rozptylem
malé výběry z normálního rozdělení rozdělení výběrového průměru není v takovém případě ale Studentovo t ( = n - 1) , proto ve všech vzorcích vystupují kvantity Studentova rozdělení t ( = n - 1)
Příklad. Z 12 pozorování byla zjištěna průměrná doba trvání montážní operace 44 sec. a výběrová směrodatná odchylka 4,178 sec. Sestrojte 90 interval spolehlivosti pro očekávanou délku montáže za předpokladu, že tato veličina má N rozdělení. n = 12, = 44, s‘ = 4,178; P = 1 - = 0,9. P(41,83 46,17) = 0,90 Jak by se změnil interval spolehlivosti, kdybychom požadovali spolehlivost odhadu 0,99 ? P( 40,254 µ 47,746) = 0,99
• Přesnost intervalového odhadu klesá s rostoucí spolehlivostí • Přesnost intervalového odhadu roste s rostoucím rozsahem výběru
Odhad relativní četnosti základního souboru (parametru alternativního rozdělení) uvažujeme případ výběrů velkého rozsahu (velké výběry) oboustranný interval přípustná chyba levostranný interval pravostranný interval
Příklad. Ze skladu bylo náhodně odebráno 320 konzerv Příklad. Ze skladu bylo náhodně odebráno 320 konzerv. Bylo zjištěno, že 59 z nich má prošlou záruční dobu. Chceme s 95 spolehlivostí odhadnout nejnižší podíl prošlých konzerv v celém skladu. n = 320; m = 59; P = 1 - = 0,95. est = p = m / n = 59 / 320 = 0,184 P(0,1485 ) = 0,95
Určení potřebného rozsahu výběru na základě znalosti o přípustné chybě odhadu a spolehlivosti, s níž chceme odhad provádět
Jaká bude spolehlivost odhadu, vybereme-li a) 64 ks, b) 400 ks. ? Příklad. Při přepravě 4000 přístrojů došlo k nehodě, při níž se část přístrojů poškodila. Pro přesnější odhad rozsahu škody chceme znát přesněji počet poškozených kusů. Připouštíme chybu odhadu 200 ks. Jaká bude spolehlivost odhadu, vybereme-li a) 64 ks, b) 400 ks. ? a) n = 64 ks p = 0,5 = 200 / 4000 = 0,05 n=64 1 - /2 = 0,7881 1 - = 0,576 n=400 b) n = 400 ks 1 - /2 = 0,9773 1 - = 0,9542