Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Význam statistiky ve vědě Základní pojmy statistiky Statistická jednotka, znak a soubor,.. Elementární postupy statistiky - variační řada - statistické.

Podobné prezentace


Prezentace na téma: "Význam statistiky ve vědě Základní pojmy statistiky Statistická jednotka, znak a soubor,.. Elementární postupy statistiky - variační řada - statistické."— Transkript prezentace:

1

2 Význam statistiky ve vědě Základní pojmy statistiky Statistická jednotka, znak a soubor,.. Elementární postupy statistiky - variační řada - statistické třídění Grafické zpracování dat - diagramy - histogram - frekvenční polygony ÚVOD DO STATISTIKY „ Jsou tři druhy lží: lži, odsouze- níhodné lži a statistiky“ (Swoboda 1977) HENDL,J. Přehled statistických metod zpracování dat. 1.vyd. Praha, Portál, 2004.ISBN MELOUN, M. MILITKÝ, J. Kompendium statistického zpracování dat. 1. vyd. Praha: Academia, ISBN ANDĚL, J. Statistické metody. 3. vyd. Praha: matfyzpress, ISBNB

3 Význam statistiky ve vědě Za základní cíl vědy je možné považovat “obecné porozumění” pozorovaným jevům V současnosti se v něm objevují dvě obecné koncepce vědeckého poznávání: - kvantitativní výzkum - kvalitativní výzkum Kvantitativní výzkum je důkladně rozpracován a opírá se o hypoteticko deduktivní princip ověřování teorií a využití statistických metod STATISTICKÉ METODY TVOŘÍ MOST MEZI VĚDECKOU TEORIÍ A EMPIRICKÝM VÝZKUMEM. Význam statistických metod pro rozvoj vědy - při zjišťování jednotlivých zákonitostí přispívajících k dílčí explanaci jednotlivých jevů - při budování a formalizaci vědecké teorie, která má v kontextu explanační funkci

4 Pojetí statistiky, základní pojmy Statistika - teoretická disciplína, zabývající se metodami zkoumání stavu a vývoje kvantitativní stránky hromadných jevů Statistická jednotka je nositel hromadného jevu - jisté vlastnosti, která se vyskytuje u velkého počtu věcí, jedinců. Statistický znak je kvantitativní charakteristikou této vlastnosti statistických jednotek Statistický soubor je konečná neprázdná množina prvků, které mají určité společné vlastnosti (statistických jednotek stejného druhu - populace)

5 Základní soubor je soubor všech statistických jednotek, na něž se vzta- huje příslušné zkoumání Výběrový soubor podmnožina základního souboru jež je vytvářena podle určitých pravidel Empirická data Rozsah souboru je dán počtem statistických jednotek souboru

6 Typy proměnné (variable)

7 (Upraveno podle Swobody 1977) Nebezpečí selhání při statistickém zpracování dat

8 Rozdělení statistiky Popisná (deskriptivní) Výběrová (induktivní) Zobecňuje pravidelnosti (zákonitosti), které byly zjištěny na výběru, pro celý základní soubor Redukuje a vyjadřuje zjištěná data jednodušeji při dostateč- ném zachování informace?

9 ELEMENTÁRNÍ STATISTICKÉ POSTUPY

10 Statistické třídění statistického souboru podle znaku Výsledky uspořádání vyjadřujeme v přehledné formě tzv. tabulce jednorozměrného rozdělení četnosti

11 Histogram je sloupcovým grafem znázorňujícím vztah mezi hodnotami proměnné x i a jejich relativními četnostmi

12 Kolik zvolit intervalů histogramu?

13

14 Bodový graf (Scatter chart )

15 Grafické zpracování dat Sloupcový (2D – 3D) graf (Bar chart) Koláčový graf (Pie Chart)

16 Poslání statistiky Statistika nám pomáhá odhalovat zákonitosti v našem stochastickém světě. Umožňuje nám odfiltrovávat či alespoň kvantifikovat vliv náhody na naše experimentální data.

17 POPIS JEDNOROZMĚRNÝCH STATISTICKÝCH SOUBORŮ Úkolem statistického popisu je zhuštěné charakterizování vlastnosti jednorozměrného rozdělení četností

18 MĚŘENÍ ÚROVNĚ ZKOUMANÝCH VLASTNOSTÍ STATISTICKÉHO ZNAKU v jednorozměrné statistickém souboru Pro měření úrovně zkoumaných jevů jsou nutné charakteristiky - míry, které budou zevšeobecňovat : - velikost hodnot sledovaného znaku u všech jednotek souboru – střední hodnoty - vzájemnou odlišnost hodnot mezi sebou i od střední hodnoty – variability Kvantilové míry jsou vhodné pro znaky měřené na stupnici nominální a ordinální Momentové míry jsou vhodné pro znaky měřené na stupnici intervalové.

19 Vztah mezi mírami polohy

20 Míry Konstrukce kvantilovámomentová polohymodus, medián průměr aritmetický (harmonický, geometrický) variability absolutní variační a kvartilová odchylka rozptyl směrodatná odchylka relativní Variační koeficient nesouměrnosti Koeficent šikmosti α koncentrace Koeficent šikmosti β

21 Krabicový graf

22 Standardizace testových skórů Druhy standardních skóre T i = z i (T body) CEEB i = z i MQ i = z i (motorický kvocient) S i = 5,5 + 2 z i (steny… 1 bod 0,5 s) C i = z i (staniny… 1 bod 0,5 s) ZN i =3 - z i (školní známka Lienertova)

23 Klasický přístup k indexu ES – index velikosti vlivu ( effect of size) Index velikosti vlivu vyjadřuje podíl „vysvětleného“ rozptylu, tzv. Hayesův koeficient ω 2 vyjadřuje relativní podíl experimentálního faktoru na rozptylu velikosti efektu.

24 CELKOVÝ ROZPTYL A DÍLČÍ MÍRY VARIBILITY Celkový rozptyl var x = vážený aritmetický průměr dílčích rozptylů rozptylem dílčích průměrů Rozklad celkového rozptylu na složky je velmi důležitou součástí umožňující hlubší zkoumání statistických jevů: korelační počet, analýza rozptylu

25 Využití rozkladu celkového rozptylu ve statistice průměr dílčích rozptylůrozptyl dílčích průměrů meziskupinový rozptyl var xvnitroskupinový rozptyl var x rozptyl podmíněných průměrůprůměr podmíněných rozptylů rozptyl teoretický hodnot y, rozptyl kolem regresní funkce var y, var (y -y, ) rozptyl mezi výběryrozptyl uvnitř výběrů Výběry souborů jsou prováděny podle experimentálního pravidla

26 POPIS VÍCEROZMĚRNÝCH STATISTICKÝCH SOUBORŮ Statistická a korelační závislost Úkoly korelačního počtu –regrese –vlastní korelace Grafické vyjádření dvourozměrného rozdělení četností

27 Korelační závislost Mění-li se při změnách hodnot proměnné x podmíněná rozdělení relativních četností znaku y tak, že se mění rovněž podmíněné průměry, označujeme takovouto statistickou závislost za korelační.

28 Úkoly korelačního počtu určení regresních čar, sloužících k odhadům neznámých hodnot závisle proměnné (y) při známých hodnotách nezávisle proměnné (x) - regrese měření těsnosti korelační závislosti, aby bylo možno posuzovat přesnost regresních odhadů a sílu dané korelační závislosti - vlastní korelace 1. regrese 2. vlastní korelace

29 Jednoduchá regrese stanovení regresních čar odhad na základě podmíněných průměrůodhad na základě regresních funkcí určit typ funkce stanovit konkrétní funkční rovnici - na základě znalosti průběhu a vlastností hlavních analytických funkcí - logického rozboru zkoumané závislosti (empirického průběhu závislosti)

30 Odhad na základě podmíněných průměrů Odhad na základě lineární regresní funkce

31

32 Vlastní korelace MĚŘENÍ TĚSNOSTI KORELAČNÍ ZÁVISLOSTI –korelační poměr –index korelace –korelační koeficient

33 Vlastní korelace druhý úkol korelačního počtu měření těsnosti (síly) dané korelační závislosti vychází z posuzování přesnosti regresních odhadů ČÍM JE VARIABILITA HODNOT ZNAKU V PODMÍNĚNÝCH ROZDĚLENÍCH ZÁVISLE PROMĚNNÉ y MENŠÍ, TÍM TĚSNĚJŠÍ JE KORELAČNÍ ZÁVISLOST čím je těsnost korelační závislosti větší, tím jsou podmíněné průměry závisle proměnné typičtějšími charakteristikami a tím lépe lze prakticky využít znalosti o průběhu korelační závislosti

34 Měření těsnosti korelační závislosti Těsností korelační závislosti rozumíme průměrnou variabilitu závisle proměnné v podmíněných rozděleních četností Korelační poměrIndex korelace

35 Geometrická interpretace jednoduché lineární korelace

36

37 Tvary závislostí a hodnoty korelačního koeficientu r

38 r =1,000r =0,000 r =0,934 r =0,967 K posouzení míry vhodnosti regresní funkce může sloužit také pouze hodnota reziduální rozptyl.

39 Míry pro nominální proměnné Chí-kvadrát (test o nezávislosti ) Pearson chi-square statistic (Q P ) Koeficient Φí Phi-coefficient Cramérův koeficient kontingence Cramér's V Kontingenční koeficient (Pearsonův koeficient průměrné čtvercové kontingence) Contingency coefficient (coefficient of contingency), kde q = min {r, s} Asymetrická lambda (Goodmanova-Kruskalova lambda) Goodmanovo-Kruskalovo τ

40 Míry pro ordinální proměnné Gama Kendallův koeficient tau-b Kendallův koeficient tau-c Somersovo d Spearmanův koeficient pořadové korelace

41 Složitější závislosti – vícenásobná regrese y i - výška syna x i - výška otce z i - výška matky Koeficient vícenásobné korelace (koeficient determinace) r 2 - korelace mezi pozorovanými hodnotami a jejich odhadem na základě znalosti výšky obou rodičů tj. mezi y i a α+β x x i +β z z i 0 ≤ r 2 ≤ 1 nezávislost závislost α průsečík s osou Y β x regresní koeficient (výšky syna na výšce otce) β z regresní koeficient (výšky syna na výšce matky)

42


Stáhnout ppt "Význam statistiky ve vědě Základní pojmy statistiky Statistická jednotka, znak a soubor,.. Elementární postupy statistiky - variační řada - statistické."

Podobné prezentace


Reklamy Google