Odhady parametrů základního souboru
Základní soubor (populace) vs. Výběrový soubor
Základní soubor (populace) Výběrový soubor (výběr) Parametry základního souboru (populace) = konstantní hodnoty X Výběrové charakteristiky = náhodné veličiny (na základě různosti jednotlivých výběrů nelze hodnoty výběrových charakteristik určit předem) Základní soubor (populace) střední hodnota μ (EX) rozptyl σ2 směrodatná odchylka σ podíl (rel. četnost) π Výběrový soubor (výběr) průměr výběrový rozptyl s2 výběrová s výběrový p
Náhodná veličina Proměnná nabývající různých reálných čísel v závislosti na náhodě Výsledek náhodného pokusu vyjádřený reálným číslem NV - spojitá - diskrétní NV má svoje rozdělení pravděpodobnosti = výběrová rozdělení známe-li výběrové rozdělení, dokážeme odhadnout parametr základního souboru
Rozdělení náhodné veličiny Empirické - hodnoty sledované veličiny Teoretické - matematický model Umíme-li pro každé reálné x určit pravděpodobnost, že náhodná veličina X nabyde hodnoty menší nebo rovné x, pak známe tzv. rozdělení pravděpodobnosti náhodné veličiny X (= známe hodnoty všech kvantilů).
Odhady parametrů Bodový odhad - číselná hodnota prezentující hledaný parametr Intervalový odhad - číselný interval, který s předem danou spolehlivostí vymezí prostor obsahující hledaný parametr
Odhady parametrů Bodový odhad – parametr zákl. souboru aproximujeme jediným číslem (např. výběrový průměr je bodovým odhadem střední hodnoty μ) Neposkytuje informaci o kvalitě tohoto odhadu, neříká k jakému největšímu rozdílu mezi odhadem a skutečnou hodnotou parametru může dojít Používá se, když potřebujeme hledaný parametr vyjádřit jedinou hodnotou, např. když jej budeme používat v dalších výpočtech
Odhady parametrů Intervalový odhad – parametr zákl. souboru aproximujeme intervalem, v němž daný parametr leží s předem zvolenou pravděpodobností = odhad vyjádříme pomocí dvou čísel (dolní a horní mez intervalu), mezi nimiž se pohybuje skutečná hodnota hledaného parametru s předem zvolenou pravěpodobností 100(1-α)%-ní interval spolehlivosti = konfidenční interval Číslo 1- α = koeficient spolehlivosti = spolehlivost odhadu Číslo α = hladina významnosti (nejčastěji α=0,05 či α=0,01) Čím ↑ spolehlivost odhadu, tím širší interval spolehlivosti bude a tím ↓ bude jeho vypovídací schopnost (např. 100% interval spolehlivosti průměrného věku všech lidí na Zemi)
Základní pojmy z terorie odhadu interval spolehlivosti (konfidenční interval) spolehlivost odhadu (1-α) hladina významnosti α odhad parametru θ bodový odhad parametru θ
Typy intervalových odhadů Jednostranné Levostranné , Pravostranné , Dvoustranné ,
Graf. prezentace intervalového odhadu Nechť interval spolehlivosti obsahuje hledaný parametr s 95%-ní spolehlivostí – připouštíme 5%-ní chybu odhadu (α=0,05) Dvoustranný interval Jednostranný interval (prav.) f(θ) 5% 2,5% 2,5% θ
Intervalové odhady pro střední hodnotu Známe rozptyl známe Volba vhodné testové statistiky: Levostranný interval spolehlivosti:
Intervalové odhady pro střední hodnotu Známe rozptyl známe Volba vhodné testové statistiky: Pravostranný interval spolehlivosti:
Intervalové odhady pro střední hodnotu Známe rozptyl Volba vhodné testové statistiky: Dvoustranný interval spolehlivosti:
Intervalové odhady pro střední hodnotu Neznáme rozptyl neznáme Volba vhodné testové statistiky: Levostranný interval spolehlivosti: Pravostranný interval spolehlivosti: Dvoustranný interval spolehlivosti:
Přípustná chyba odhadu Δ hodnota, o kterou jsme ochotni se zmýlit oproti skutečné hodnotě odhadovaného parametru při dané spolehlivosti odhadu (hladině významnosti) je rovna polovině šířky oboustranného intervalu spolehlivosti
Rozsah výběru při odhadu střední hodnoty Známe rozptyl Oboustranný intervalový odhad : Příslušný intervalový odhad tedy můžeme vyjádřit ve tvaru: Přípustná chyba odhadu Δ : Požadujeme:
Rozsah výběru při odhadu střední hodnoty Neznáme rozptyl Přípustná chyba odhadu: PŘEDVÝBĚR