Parametry polohy Modus Medián Aritmetický průměr (pokud má smysl sčítání) Geometrický průměr (pokud má smysl násobení) Harmonický průměr (pro veličiny s jednotkami ve tvaru zlomku)
Míry variability Variační rozpětí Kvartilové rozpětí Rozptyl – čtvercová míra variability (proměnlivosti) dat Směrodatná odchylka (stejné jednotky jako veličina) Relativní mírou variability je variační koeficient může porovnávat variabilitu souborů, v nichž je veličina zaznamenána v různých měrných jednotkách – např. platy u nás v Kč versus platy v Německu v Euro), či je na jiné úrovni (poloze)
Obecné momenty V momentech jsou sledovány určité odchylky jednotlivých naměřených hodnot statistického znaku od předem dané konstanty. l-tý moment kolem konstanty a
OBECNÉ MOMENTY pro a = 0 dostáváme l-tý moment x kolem nuly a takovýto moment nazýváme l-tý obecný moment x. První obecný moment – aritmetický průměr, „těžiště“ dat, používáme v případě, kdy má smysl sčítat jednotlivé hodnoty statistického znaku.
Centrované momenty momenty kolem centra, tzn. kolem prvního obecného momentu, nebo-li kolem aritmetického průměru. Druhý centrovaný moment = ROZPTYL aneb „průměrná čtvercová odchylka od aritmetického průměru“
Rozptyl pro ordinální data variantou rozptylu (míry variability) pro ordinální data je dorvar
Základy statistické indukce BODOVÉ ODHADY (tj. odhady jedním číslem) Tn (např. aritm.průměr či medián) je z dat získaný bodový odhad pro neznámý parametr q v pravděpodobnostním modelu pro sledovanou veličinu (např. pro střední hodnotu v normálním rozdělení). Je to odhad nestranný E(Tn)= q.
Základy statistické indukce Zákony velkých čísel (chování bodových odhadů): Např. rel.čet. → pravděpodobnost Hod kostkou – sledujeme relativní četnost padnutí 6 1 5 6 4 2 3 … 0,00 0,33 0,25 0,20 0,17 0,14 0,13 0,11 0,10 0,18
Základy statistické indukce Zákony velkých čísel (chování bodových odhadů): Např. rel.čet. → pravděpodobnost (zde π=0,15) Dotáza-ný č. 1 2 3 4 5 … 498 499 500 nezam.? (1-ano) rel.čet. nezam. 0,25 0,20 0,155 0,154 0,156
Základy statistické indukce Zákony velkých čísel (pokračování ilustrace):
Základy statistické indukce Zákony velkých čísel (chování bodových odhadů): Např. průměr → střední hodnotě (zde EX=3,5) Pořadí hodu 1 2 3 4 5 … 98 99 100 Hozeno Průměr 2.000 2.500 2.250 2.800 3.622 3.636 3.630
Základy statistické indukce Zákony velkých čísel (pokračování ilustrace):
Základy statistické indukce Centrální limitní věty (CLV) Popisují asymptotické (tj. v limitě, v praxi pro „dostatečně velký“ počet stat. dat) chování testových charakteristik Tn jakožto náhodných veličin. Např.
Důsledky ZVČ a CLV Čím větší výběr, tím větší pravděpodobnost, že je aritmetický průměr blízko stř.hodnoty. Čím větší výběr, tím větší pravděpodobnost, že je výběrový rozptyl blízko rozptylu. Čím větší výběr, tím větší pravděpodobnost, že je výběrová směr.odch. blízko směr.odch. Čím větší výběr, tím větší pravděpodobnost, že je relativní četnost blízko pravděpodobnosti.
Základy statistické indukce Tabulka teoretických (neznámých a tudíž odhadovaných) parametrů a jejich nejvhodnějších (nestranných) odhadů: PARAMETR q JEHO BODOVÝ ODHAD Tn π = P(A) p = relativní četnost jevu A μ (střední hodnota) aritmetický průměr σ2 (rozptyl) výběrový rozptyl s2 =M2·n/(n-1)
Intervaly spolehlivosti = intervalové odhady neznámého parametru (odhad pro , , 2,…), odvozují se z příslušné CLV spolehlivost = 1– = pravděpodobnost, že neznámá hodnota parametru je intervalem pokryta; nejčastěji volba 1– = 0,95 (95% I.S.)
Oboustranné intervaly spolehlivosti Pro střední hodnotu μ při známém σ: Pro střední hodnotu μ při neznámém σ: kde n-1= počet stupňů volnosti (DF)
Oboustranné intervaly spolehlivosti Pro střední hodnotu μ (pomocí Excelu):
Oboustranné intervaly spolehlivosti Pro střední hodnotu μ (pomocí Excelu):
Oboustranné intervaly spolehlivosti Pro střední hodnotu μ (pomocí Excelu): dolní mez: 13,625-1,177= =12,448; horní mez: 13,625+1,177= =14,802
Pro střední hodnotu μ (odpověď): Oboustranné intervaly spolehlivosti Pro střední hodnotu μ (odpověď): S 95% spolehlivostí je střední věk čtenářů daného časopisu z rozmezí 12,448 až 14,802 roku. Zpřesnění odhadu (tj. zúžení IS)? a) zvýšit n (=změna dat); b) snížit spolehlivost (data stejná); c) snížit variabilitu (=změna populace).
Oboustranné intervaly spolehlivosti Ilustrace vlivu zvýšení n (viz ZVČ):
Oboustranné intervaly spolehlivosti Pro neznámý rozptyl σ2: Pro pravděpodobnost π:
Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle „oboustranného“ vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme výrazem 1-α. Příklad: Odhadněte horní hranici nezaměstnanosti. Řešení: Určujeme p+1/(2n)+u1-α√[p(1-p)/(n-1)].