Charakteristické rysy a typy jednorozměrného rozdělení četností
Stojíme před úkolem porovnat navzájem několik statistických souborů z hlediska jednoho znaku: Ve 20 vybraných českých domácnostech jsme zjistili počty: 1, 0, 2, 0, 1, 3, 1, 2, 0, 1, 4, 1, 0, 3, 2, 1, 2, 1, 0 Ve 20 vybraných německých domácnostech jsme zjistili počty: 1, 3, 5, 7, 4, 0, 2, 5, 3, 4, 6, 2, 5, 3, 6, 4, 3, 4 např. počet kreditních karet v české a německé domácnosti (srovnatelného typu).
Rozdělení četností sice poskytuje užitečnou informaci a celkový přehled o základní struktuře zkoumaného statistického souboru, ale popisovat a zejména porovnávat několik souborů pouze pomocí tabulek rozdělení četností by bylo značně pracné a těžkopádné a je otázka, zda by to vedlo k nějakému rozumnému výsledku.
Vizualizace dat většinou nabídne názornou a přehlednou představu o tendencích a charakteristických rysech analyzovaných jevů, ale i vypovídací schopnost grafů je omezená a neumožní jednoznačně a přesně analyzovaná data popsat.
Tomuto číselnému vyjádření říkáme charakteristiky (míry, statistiky) a ty nám shrnují informace o statistickém souboru a vyjadřují je v koncentrované podobě. Několika málo charakteristikami tak nahradíme celé rozdělení četností daného znaku v konkrétním statistickém souboru při co nejmenší ztrátě informací. Hledáme proto určité obecné vlastnosti (charakteristické rysy) statistického souboru, které by šly číselně vyjádřit.
polohuúroveň Za základní vlastnost rozdělení četností stat. souboru považujeme jeho polohu, úroveň.
Pomocí nich můžeme nahradit a zobecnit hodnoty souboru. Rychle zjistitelnou mírou je modus (značíme ) = nejčastěji se vyskytující obměna znaku. Přesnějšími mírami jsou medián (značíme ) = prostřední hodnota uspořádaného souboru a průměry (značíme ). Měříme ji středními hodnotami (= míry úrovně, míry polohy).
variabilita rozptýlenostměnlivost Dalším důležitým rysem je variabilita, rozptýlenost, měnlivost.
Rychle zjistitelnou, ale i nejhrubší mírou je variační rozpětí (značíme R) = x max - x min. Přesnější mírou je rozptyl (značíme 2 ), respektive jeho odmocnina směrodatná odchylka (značíme ). Pro porovnávání variability mezi soubory se pak nejčastěji používá variační koeficient (značíme V) = Měříme ji mírami variability.