Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Statistické charakteristiky variability

Podobné prezentace


Prezentace na téma: "Statistické charakteristiky variability"— Transkript prezentace:

1 Statistické charakteristiky variability

2 Variabilita (proměnlivost) v datech
hodnoty mohou být více či méně rozptýleny okolo aritmetického průměru analogie s terčem – menší nebo větší rozptyl zásahů

3

4 Charakteristiky (míry) variability
rozptyl směrodatná odchylka variační koeficient kvartilová odchylka

5 Rozptyl Příklad 1: Zjištěnými hodnotami budou v jednom případě čísla 5, 6, 7 a ve druhém případě čísla 1, 7, 10. aritmetický průměr je v obou případech 6 Hodnota Odchylka Hodnota Odchylka 5 5 – 6 = – 6 = -5 6 6 – 6 = – 6 = 1 7 7 – 6 = – 6 = 4 ve druhém případě jsou hodnoty mnohem více rozptýleny

6 Rozptyl (značíme s2) Příklad 1 (pokračování):
Pro hodnoty 5, 6, 7 je rozptyl roven 2/3. Pro hodnoty 1, 7, 10 je rozptyl roven 14.

7 Odvození výpočetního tvaru rozptylu

8 Výpočetní tvar rozptylu
Tento tvar je často vhodnější pro ruční výpočet Příklad 1 (pokračování): Pro hodnoty 5, 6, 7 je rozptyl samozřejmě opět roven 2/3 a podobně pro hodnoty 1, 7, 10 je rozptyl opět roven 14.

9 Rozptyl – varianta pro data zadaná tabulkou četností
Výpočetní tvar (označíme n = n1+…+ nk):

10 Příklad 2: Určete rozptyl a směrodatnou odchylku výšek chlapců ve věku 16 let.
Snadno spočítáme, že průměrná výška je 174,3 cm. výška (xi) 160 165 170 175 180 185 190 četnost (ni) 9 20 36 82 35 14 4

11 Tentýž příklad řešený výpočetním tvarem rozptylu
(pro ruční výpočet je jednodušší a často i přesnější): výška (xi) 160 165 170 175 180 185 190 četnost (ni) 9 20 36 82 35 14 4

12 Směrodatná odchylka Výhoda – charakterizuje variabilitu v týchž jednotkách, v jakých jsou udány hodnoty stat. znaku (kdežto rozptyl v druhých mocninách těchto jednotek) V předchozím příkladě je:

13 Variační koeficient použijeme jej, pokud chceme charakterizovat variabilitu bezrozměrným číslem vyjadřuje se obvykle v procentech

14 Příklad 3: Máme porovnat dvě firmy co se týče variability platů.
V první firmě je průměrný plat Kč a směrodatná odchylka 3 000 Kč. Ve druhé je průměrný plat Kč a směrodatná odchylka 4 000 Kč. Na první pohled se zdá, že variabilita je vyšší ve druhé firmě, protože je tam vyšší směrodatná odchylka. Je tam však i vyšší plat. Lepším kriteriem je porovnat to, jakou část aritmetického průměru tvoří směrodatná odchylka: 1. firma …V = : = 0,20 = 20 %, 2. firma …V = : = 0,13 = 13 %, Vidíme, že ve druhé firmě je variabilita platů výrazně nižší než v první.

15 Hodnoty variačního koeficientu
Hodnoty variačního koeficientu do 0,10 (tj. 10 %) svědčí o malé variabilitě – aritmetický průměr je možné považovat za typickou hodnotu datového souboru. Hodnoty do 0,4 (tj. 40 %) svědčí o vyšší variabilitě – aritmetický průměr je možné považovat pouze za hodnotu orientační. Pokud je variační koeficient ještě vyšší, není dobré dávat aritmetickému průměru nějaký zvláštní význam, nemusí se jednat se o typickou hodnotu v datovém souboru.

16 Pozor! Je chybou popsat datový soubor pouze hodnotu aritmetického průměru. Aby se zabránilo jeho špatné interpretaci (nebo dokonce úmyslnému zneužití), je nutné doplnit jej některým z údajů o variabilitě (tj. rozptylem, směrodatnou odchylkou nebo variačním koeficientem).

17 Kvantily (percentily)
p-procentní kvantil – je taková hodnota statistického znaku, před níž leží právě p procent shromážděných dat (seřazených podle velikosti). Značíme jej Příklad: 10% kvantil pro statistický znak příjem rodiny udává takovou hodnotu, že 10 % rodin má nižší nebo stejný příjem.

18

19 Výpočet kvantilu Označíme-li z pořadové číslo p% kvantilu, pak platí:

20 Příklad určení pořadového čísla 20% kvantilu v souboru o rozsahu 153:
tj. 20% kvantil je v pořadí 31. hodnota mezi 153 údaji. Příklad určení pořadového čísla 25% kvantilu v souboru o rozsahu 108: tj. 25% kvantil leží mezi v pořadí 27. a 28. hodnotou v rozsahu 108 dat.

21 Příklad 2 (pokračování): Určete 75% kvantil v souboru tělesných výšek chlapců:
výška (xi) 160 165 170 175 180 185 190 četnost (ni) 9 20 36 82 35 14 4 kumulativní četnost 29 65 147 182 196 200 148. – 182. Hledáme 150. a 151. hodnotu v pořadí – obě jsou rovny 180 cm (obě tyto hodnoty se nachází v pátém sloupci tabulky, což poznáme podle kumulativních četností). Závěr: 75% kvantil je 180 cm.

22 Ve statistice se pro některé kvantily užívá dalšího pojmenování:
Kvartily – dělí data na čtyři části: dolní kvartil = 25% kvantil medián = 50% kvantil horní kvartil = 75% kvantil Decily – dělí data na deset částí: první decil = 10% kvantil druhý decil = 20% kvantil devátý decil = 90% kvantil

23 Kvartilové míry variability
Mezikvartilové rozpětí: Kvartilová odchylka Koeficient kvartilové odchylky

24 Krabičkový diagram (box plot)
medián horní kvartil dolní kvartil „vous“ = 1,5 IQR Pokud minimum hodnot je větší než dolní kvartil minus 1,5 IQR, zkracuje se levý „vous“ na tuto délku. Pokud maximum hodnot je menší než horní kvartil plus 1,5 IQR, zkracuje se pravý „vous“ na tuto délku.

25 Může se stát, že „vous“ zcela zmizí, pokud se minimum nebo maximum rovná dolnímu nebo hornímu kvartilu. Naopak, vyskytnou-li se hodnoty, které se nacházejí mimo maximální rozpětí, dané jeden a půl násobkem mezikvartilového rozpětí, jsou považovány za "podezřelé" (odlehlé) a je jim třeba věnovat zvláštní pozornost, neboť mohou obzvláště při malém počtu pozorování značně ovlivnit některé ukazatele. Odlehlé hodnoty mohou být zaviněny hrubou chybou při měření nebo při přenosu dat do počítače, ale mohou být také správné (existuje skutečně takový extrém). Pak závisí na zpracovateli, zda pro dané účely tento extrém do zpracování zahrne či nikoliv. V grafu bývají odlehlé hodnoty znázorněny tečkou nebo hvězdičkou.

26


Stáhnout ppt "Statistické charakteristiky variability"

Podobné prezentace


Reklamy Google