BOX - PLOT OA a VOŠ Příbram
Krabičkový diagram (Box-and-Whisker Plot) Krabičkový diagram je nástroj pro grafické zobrazení ukazatelů polohy. Zároveň slouží k odhalení hodnot v souboru, které lze považovat za odlehlé (extrémní hodnoty). Může se jednat o chybná měření, chyby v přepisu dat (např. špatně zapsaná desetinná čárka), neobvyklé extrémy atd. Odlehlé hodnoty jsou takové, které v krabičkovém diagramu leží vně vnitřních hradeb. Takových hodnot může být více. Pak se v grafu označují všechny. Pokud se takové hodnoty vyskytují, je to signál, že není vhodné používat např. prostý aritmetický průměr.
Grafické znázornění num. proměnné A.) Krabicový graf (Box plot) průměr Odlehlé pozorování Min (po odstranění odlehlých pozorování) Max (po odstranění odlehlých pozorování) X0,5 X0,25 X0,75
Krabičkový diagram (Box-and-Whisker Plot) Aritmetický průměr Horní kvartil x0,75 Horní vnitřní hradba hH = x0,75 + 1,5(x0,75 - x0,25) Extrémní (odlehlé) hodnoty – takových hodnot může být v souboru i více! + Medián x Dolní kvartil x0,25 Dolní vnitřní hradba hD = x0,25 – 1,5(x0,75 - x0,25)
Krabicový diagram (box-plot) krabicový diagram je grafická metoda, která umožňuje: znázornit robustní odhad střední hodnoty (medián), hodnoty dolního a horního kvartilu identifikovat odlehlé hodnoty posoudit symetrii v okolí kvantilů a u konců rozdělení
Interpretace box-plotu hodnoty x(i) 10 20 30 40 50 60 70 80 90 100 odlehlé hodnoty x50 … tzv. medián, který znamená, že 50 % hodnot je nižších než hodnota mediánu x25 … tzv. dolní kvartil (1. kvartil, 25 % percentil), který znamená, že 25 % hodnot je nižších než hodnota dolního kvartilu x75 … tzv. horní kvartil (3. kvartil, 75 % percentil), který znamená, že 75 % hodnot je nižších než hodnota dolního kvartilu A, B … přilehlé hodnoty
Box-plot šikmost a špičatost Tento tvar box plotu znázorňuje symetrické rozdělení hodnot sledovaného znaku. Tento tvar box plotu znázorňuje asymetrické rozdělení hodnot sledovaného znaku. Tento tvar box plotu znázorňuje sešikmení hodnot sledovaného znaku (kladná šikmost). Tento tvar box plotu znázorňuje sešikmení hodnot sledovaného znaku (záporná šikmost).
Box-plot kvantily Výpočet kvantilů x25 , x50 a x75 . Příklad: zp … pořadí kvantilu xp n … rozsah souboru Příklad: Urči dolní kvartil x25 , přičemž počet hodnot v souboru je n = 40. tzn., že 10,5 hodnota (resp. průměr desáté a jedenácté hodnoty) v uspořádaném souboru představuje dolní kvartil x25
Postup sestrojení box-plotu Výpočet délky obdélníku R (kvartilové rozpětí). Určení konců vodorovných paprsků. Konstrukce grafu. Měřítko na ose x odpovídá hodnotám sledovaného znaku. Měřítko na ose y je libovolné. x25 x50 x75