Základní statistické pojmy a postupy Katedra kinantropologie, humanitních věd a managementu sportu, FTVS UK
Statistika praktická činnost číselného zaznamenávání a zkoumání hromadných jevů předmět statistiky: zkoumání stavu a vývoje hromadných jevů hromadný jev: proměnlivé vlastnosti pozorované u dostatečně velkého množství takových jedinců (prvků), kteří mají některé podstatné vlastnosti shodné
Statistický soubor souhrn statistických jednotek statistická jednotka: jedinci nebo prvky, u kterých byly vymezeny shodné vlastnosti z hlediska věcného, časového a prostorového rozsah souboru „n“
Statistické znaky označení statistického znaku „xi“ charakteristiky vlastností statistických jednotek dělení statistických znaků kvantitativní znaky – vyjádřené čísly kvalitativní znaky – definované slovně (graficky) statistické znaky jsou předmětem vlastního statistického zkoumání
Zkoumání statistických znaků popisná (deskriptivní) statistika popisuje stav a dynamiku statistických znaků výběrová (induktivní) statistika zabývá se procesem zobecňování výsledků vybrané části na celý základní soubor (populaci)
Soubor základní soubor – cílový segment máme informace o všech statistických jednotkách souboru označuje se „N“ výběrový soubor – vzorek, který zastupuje základní soubor označuje se „n“
Výběrové soubory zajišťujeme je metodami záměrného nebo náhodného výběru záměrný výběr – opírá se o různé expertní odhady jak získat reprezentativní výběr reprezentativní výběr odráží strukturu celého zkoumaného souboru výběr, který není reprezentativní se označuje za selektivní výběr, a nelze z něj odvozovat charakteristiky základního souboru náhodné výběry- výběrové soubory, jejichž vznik je ponechán na náhodě
Metody výběru nenáhodné (empirické) výběry kvótní výběr účelový výběr anketa sněhová koule náhodné (pravděpodobnostní) výběry prostý náhodný výběr náhodný stratifikovaný výběr vícestupňový náhodný výběr
Popisná statistika zkoumá stav kvantitativně vyjádřených hromadných jevů (statistických znaků), které se snaží popsat zhušťujícími charakteristikami získaná data je nejprve nutné utřídit
Variační řada a četnosti seřazení hodnot znaku podle velikosti od nejmenší k největší (vzestupně) pokud se některé hodnoty opakují, je výhodnější tabulka jednorozměrného rozdělení četností různým hodnotám statistického znaku xi se přiřadí číslo ni (absolutní četnost) absolutní četnost lze doplnit relativní četností, kumulativní četností a relativní kumulativní četností
Relativní četnost relativní četnost vztažení absolutních četností k celkovému počtu prvků v souboru – rozsahu souboru přehledně charakterizuje strukturu zkoumaného souboru
Kumulativní (relativní) četnost vzniká postupným přičítáváním absolutních nebo relativních četností a informuje o tom, kolik statistických jednotek či jaká poměrná část souboru nabývá hodnot menších, než je daná hodnota absolutní kumulativní četnost relativní kumulativní četnost
Tabulka četností IQ (xi) ni fi Ni Fi 95 2 0,06 98 5 0,16 7 0,22 100 6 0,19 13 0,41 105 9 0,28 22 0,69 110 28 0,88 115 3 0,09 31 0,97 120 1 0,03 32 1,00
Míry polohy a variability míry polohy – střední hodnoty míry variability – vzájemná odlišnost hodnot (variabilita)
Míry polohy modus medián aritmetický průměr procentil kvartil
Míry variability variační rozpětí rozptyl směrodatná odchylka kvartilová odchylka
Box plot
Měrné škály Výsledky měření lze podle charakteristik a vlastností měřených dat vyjádřit na následujících stupnicích (měrných škálách): nominální ordinální intervalová poměrová
Stupnice nominální (klasifikační) Objektům přiřazujeme čísla, která určují příslušnost objektu do některé z se kategorii Číslo přiřazené objektu nevypovídá o kvalitě ani kvantitě, může být nahrazeno i symbolem Třídění zde není omezeno na dichotomický systém, můžeme objekty zařazovat do více kategorií
Stupnice ordinální (pořadová) Škálování Rozdělujeme objekty do tříd, na rozdíl od předchozí stupnice jsou již tyto třídy seřazeny v logice pořadí Sousední třídy se mohou navzájem lišit o nestejně velký interval Důležité je pořadí Výsledky ve formě různých rankigových pořadí, žebříčků Spadají sem i školní známky
Na stupnicích nominální a ordinální vyjadřujeme data neparametrické povahy.
Stupnice intervalová Posun v dokonalosti oproti předchozí stupnici Konstantní jednotka měření Mezi sousedními třídami jsou stejné intervaly Kromě pořadí tedy můžeme určit i rozdíl mezi jednotlivými daty Nulový bod je určen dohodou Příkladem je měření teploty ve ºC, nebo určování času (hodina, den)
Stupnice ekviintervalová (poměrová) Oproti intervalové stupnici má přirozený nulový bod Je zde možné využít všechny matematické operace Na stupnicích intervalové a ekvintervalové pracujeme s daty parametrické povahy
Statistické postupy podle měrných škál