Autor: Honnerová Helena Investice do rozvoje vzdělávání Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Autor: Honnerová Helena 1
Základy statistiky aneb známe tři druhy lži: úmyslná neúmyslná statistika
Cílem statistiky je zjednodušit nějaká data tak, abychom se v nich lépe vyznali. Důsledkem je ztráta informací!
Základní pojmy Statistický soubor – konečná neprázdná množina Statistická jednotka – prvek statistického souboru Znak statistického souboru – vlastnost, kterou má každý prvek statistického souboru Statistické šetření – vyhodnocování statistických znaků
Rozsah souboru - počet statistických jednotek v souboru n = 28 Statistický znak – kvalitativní může být vyjádřen i číslem – např. měsíc narození se nezpracovává jako kvantitativní Statistický znak – kvantitativní lze s ním pracovat jako s číslem – např. určit průměr Statistická jednotka Rozsah souboru - počet statistických jednotek v souboru n = 28
Základní statistické funkce (způsob zpracování statistických znaků) Četnost, relativní četnost Aritmetický průměr, vážený průměr Medián Modus Odchylka Směrodatná odchylka Rozptyl
Četnost hodnot znaku x1 n1 Četnosti hodnot jsou čísla n1, n2,...., která udávají, kolikrát se v souboru vyskytují hodnoty znaků x1, x2, ... Podmnožiny statistického souboru, ve kterých mají mají všechny prvky stejné hodnoty vyhodnocovaného znaku nazýváme třídy. x1 n1
Relativní četnost hodnot znaku je číslo ni / n, resp. (ni / n) .100 % Př.: Relativní četnost znaku x3 je 2/12, tj. 16,66%.
Histogramy (= rozdělení četností) mohou mít různý tvar Normální Zešikmené (např. rozdělení bodů v písemné práci) Bimodální (např. výška ve smíšené skupině – chlapci a dívky)
Stanovení tříd četnosti je třeba přizpůsobit rozsahu souboru a počtu a rozsahu hodnot znaku. Př. - Výška osob: Rozsah souboru je 28, počet různých hodnot 19, rozsah hodnot 154 – 198 Třídy vytvoříme např. po 5 cm. Rozsah souboru je 5000, počet různých hodnot 45, rozsah hodnot 154 – 198 Třídy vytvoříme po 1 cm.
Aritmetický průměr (pouze pro kvantitativní znak): - hodnoty zpracovávaného znaku n - rozsah souboru Vážený průměr (k tříd s hodnotami znaku x1, x2,.. a četnostmi v jednotlivých třídách n1, n2, ..):
Harmonický průměr (pouze pro kvantitativní znak): n - rozsah souboru - hodnoty zpracovávaného znaku Harmonický průměr je převrácená hodnota aritmetického průměru převrácených hodnot zadaných členů, používá se například při výpočtu průměrné rychlosti na úsecích stejné délky
Geometrický průměr (pouze pro kvantitativní znak): G - geometrický průměr - hodnoty zpracovávaného znaku n - rozsah souboru Geometrický průměr se používá např. na koeficienty růstu pro výpočet průměrného tempa růstu
POZOR NA PRŮMĚRNÉ HODNOTY! Kdyby někdo stál jednou nohou ve sněhu a druhou na rozžhaveném uhlí, statistik řekne, že je mu průměrně teplo. Ve statistice proto používáme další funkce, které charakterizují hodnoty prvků optimálněji.
Modus – hodnota znaku, která se ve statistickém souboru vyskytuje nejčastěji.
Medián – hodnota znaku, ležící ve středu tabulky, uspořádané od nejmenší do největší hodnoty šetřeného znaku. Je – li počet prvků sudý, je medián aritmetickým průměrem dvou prostředních hodnot. Medián = 30,5
Odchylka od průměru Průměr ze všech odchylek = 0
Rozptyl – statistická veličina, která charakterizuje rozložení hodnot kolem aritmetického průměru
Rozptyl (variance) je průměrná hodnota druhé mocniny odchylky od průměru Směrodatná odchylka je odmocnina z rozptylu - čím menší, tím nižší variabilita dat
Odchylka od průměru Průměr ze všech odchylek = 0 Aritmetický průměr z absolutních hodnot odchylek = 7,73 Směrodatná odchylka = 9,66 22
Empirické pravidlo: většina hodnot se neodlišuje od průměru o více než jednu směrodatnou odchylku a skoro všechny hodnoty jsou v pásmu do dvou směrodatných odchylek od průměru.
Grafy vynikající prostředek pro zpřehlednění dat také pro klamání čtenáře
Pomocí grafů znázorňujeme výsledky statistického zpracování určitého znaku – celý soubor by byl nepřehledný.
Výsečový graf Sloupcový graf
Spojnicový graf – používáme především tehdy, jsou-li jednotlivé hodnoty souvislé (např. teplota „neskáče“, mění se plynule).
Autor: Honnerová Helena Investice do rozvoje vzdělávání Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Autor: Honnerová Helena