Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Popisná statistika: přehled

Podobné prezentace


Prezentace na téma: "Popisná statistika: přehled"— Transkript prezentace:

1 Popisná statistika: přehled
Míry střední hodnoty Modus Medián Průměr * Míry rozptýlenosti Rozpětí Inter-kvartilové rozpětí Rozptyl Směrodatná odchylka * Míry symetrie Šikmost Míry polohy Percentil Diferenční skór Z-skór *

2 Centrální tendence Poskytuje jednu hodnotu, která reprezentuje celé rozložení dat

3 Centrální tendence Hodiny spánku

4 Centrální tendence Příjem v dolarech (1000)

5 Centrální tendence Poskytuje jednu hodnotu, která reprezentuje celé rozložení dat. Typické míry (charakteristiky) jsou modus medián průměr

6 Modus Nejčastěji se vyskytující hodnota
Odpovídá nejvyššímu bodu histogramu nebo frekvenční funkce Pro daný výběr N=16: Modus = 39 Skór

7 Modus Modus není citlivý k vychýleným hodnotám Pro daný výběr N=16:
Modus = 39 Hodnota

8 Modus Rozložení může mít více vrcholů Pro daný výběr N=16:
Modus = 35 a 39 Hodnota

9 Modus Nemusí být jediný nebo definovaný= rektangulární rozložení
Pro daný výběr N=16: Není určený Hodnota

10 Medián Údaj, který dělí rozložení na polovinu 50% percentil Pro N = 15
medián je devátá hodnota = 37 Hodnota

11 Medián Pro N = 16 medián je průměr osmého a deváté hodnoty = 37.5
Hodnota

12 Průměr Znamená, co lidé obvykle považují za střední hodnotu.
Součet hodnot vydělený jejich počtem. Pro výběr: Po populaci: Změna jedné hodnoty nemění medián a modus, ale mění průměr.

13 Průměr __ V mnoha případech dáváme přednost průměru, jde o popis hodnot i odhad parametru. X=7.07 Aby to mělo smysl, musí se jednat o intervalovou škálu. 1 2 3 4 5 Budhista Protestant Katolík Žid Muslim Hodnota Frequency X=2.4 __ Hodiny spánku Hodnota

14 Průměr X=36.8 __ X=36.5 __ X=93.2 __ Hodnota Hodnota Průměr je citlivý k extrémním hodnotám a je vhodný pro symetrická rozložení. Příjem

15 Symetrie (pro jednovrcholové) Hodiny spánku
symetrické rozložení není šikmé pro symetrické rozložení platí Průměr = Medián = Modus (pro jednovrcholové) Hodiny spánku

16 Šikmá rozložení Šikmost označuje asymetrii rozložení
Kladně sešikmené rozložení je asymetrické a prodloužené do kladných hodnot. medián modus průměr Modus = 70,000$ Medián = 88,700$ Průměr = 93,600$ Příjem modus < median < průměr

17 Šikmá rozložení Záporně sešikmené rozložení
medián průměr modus modus > medián > průměr Hodnota

18 Míry střední hodnoty + - Modus Medián Průměr
rychlá & jednoduše vypočtená užitečná pro nominální data Špatná výběrová stabilita Medián není ovlivněná extrémními hodnotami, jasná interpretace Poměrně slabá výběrová stabilita Průměr výběrová stabilita vztah k rozptylu Nevhodná pro diskrétní data Ovlivněná sešikmeným rozložením

19 Rozložení Centrální hodnota: modus, medián, průměr
Tvar: symetrické, sešikmené Rozptýlenost Hodnota

20 Míry rozptýlenosti rozptýlenost skórů od středu
rozložení skórů je velmi variabilní, jestliže hodnoty se navzájem velmi liší Tři statistiky měří variabilitu rozpětí interkvartilové rozpětí rozptyl

21 Rozpětí Nejvyšší minus nejnižší hodnota (R) Obě
mají stejné rozpětí (80), ale vypadají jinak Moc neříká o tom, jak jsou rozptýlené kolem středu. Velmi ovlivněná vychýlenými hodnotami. Hodnota

22 Interkvartilové rozpětí
Vzdálenost mezi 25% percentilem a 75% percentilem Q3-Q1 = = 40 Q3-Q1 = = 5 Ignoruje extrémy Nebere v úvahu 50% rozložení Hodnota

23 Míry rozptýlenosti a rozdílu
Skór Rozdíl Amálka 10 -40 Václav 20 -30 Jan 30 -20 Jiří 40 -10 Hana 50 Karla 60 Petr 70 Markéta 80 Josef 90 Průměr Posuzujeme vzdáleností od průměru Skóry dále od průměru mají větší rozdílový skór

24 Míry rozptýlenosti a rozdílu
Hodnota Rozdíl Amálka 10 -40 Václav 20 -30 Jan 30 -20 Jiří 40 -10 Hana 50 Karla 60 Petr 70 Markéta 80 Josef 90 SUMA Abychom posoudili rozdílnosti, můžeme vypočítat průměr rozdílů, ale vždy dostaneme nulu.

25 Míry rozptýlenosti a rozdílu
Hodnota Rozdíl Čtverec rozdílů Amálka 10 -40 1600 Václav 20 -30 900 Jan 30 -20 400 Jiří 40 -10 100 Hana 50 Karla 60 Petr 70 Markéta 80 Josef 90 Suma 6000 Raději umocníme vypočtené rozdíly od průměru Spočteme součet čtverců (SS) __ SS= ∑(X-X)2

26 Rozptyl Spočteme průměr SS a dostaneme rozptyl Pro populaci:
Pro výběr: (korekce na dopočtenou hodnotu průměru)

27 Rozptyl Spočtene průměr. Odečteme průměr od hodnot. Spočteme čtverce.
Hodnota Rozdíl Čtverec rozdílů Amálka 10 -40 1600 Václav 20 -30 900 Jan 30 -20 400 Jiří 40 -10 100 Hana 50 Karla 60 Petr 70 Markéta 80 Josef 90 Suma 6000 6000/8=750 Spočtene průměr. Odečteme průměr od hodnot. Spočteme čtverce. SS. Podělíme SS hodnotou N nebo N-1.

28 Směrodatná odchylka Standardní odchylka (směrodatná odchylka) je odmocnina z rozptylu Směrodatná odchylka měří rozptýlenost v původních jednotkách, kdežto rozptyl to činí ve mocninách jednotek. Rozptyl se používá v inferenční statistice. Směrodatná odchylka je vhodná popisná statistika.

29 Příklad N = 28 X = 50 s2 = 140.74 s = 11.86 N = 28 X = 50 s2 = 555.55
Hodnota

30 Popisná statistika: přehled
Míry polohy Modus Medián Průměr * Míry rozptýlenosti Rozpětí Inter-kvartilové rozpětí Rozptyl Směrodatná odchylka * Míry symetrie Šikmost

31 Popisná statistika: přehled
Pro populaci: Pro výběr: Průměr Rozptyl Směrodatná odchylka

32 Cvičení Jde o výběr, vypočteme: Modus, medián, průměr
Rozpětí, rozptyl, směrodatnou odchylku

33 Míra šikmosti Pro populaci Pro výběr

34 Popisná statistika: přehled
Centrální hodnoty Modus Medián Průměr * Míry rozptýlenost Rozpětí Inter-kvartil Rozpětí Rozptyl Směrodatná odchylka * Míry symetrie Šikmost Míry polohy Percentil Diferenční skór Z-skór *

35 Míry polohy Jak popsat hodnotu vzhledem k rozložení?

36 Míry polohy Kvantil Diferenční skór Z-skór

37 Kvantily Kvartil Rozděluje seřazené hodnoty na čtyři stejné díly 25%
(minimum) (maximum) (medián)

38 Kvantily Decil 10% Rozděluje seřazené hodnoty na deset stejných dílů

39 Kvantily Percentilové pořadí
Rozděluje seřazené hodnoty na sto stejných dílů Počet skórů menších než x Percentilová hodnota x = • 100 Celkový počet hodnot

40 Rozdílové skóry Pro populaci: Pro výběr: Hodnota Rozdíl Amálka 10 -40
Václav 20 -30 Jan 30 -20 Jiří 40 -10 Hana 50 Karla 60 Petr 70 Markéta 80 Josef 90 Průměr Pro populaci: Pro výběr:

41 Jak postupovat při srovnání, jestliže máme různé průměry a směrodatné odchylka?
Příklad 9 studentů má naměřené hodnoty dvěmi různými testy Hodnoty jsou na různých škálách

42 9 studentů a dva testy Test 1 Test 2 Amálka 10 1 Václav 20 2 Jan 30 3
Jiří 40 4 Hana 50 5 Karla 60 6 Petr 70 7 Markéta 80 8 Lulu 90 9 Průměr

43 9 studentů a dva testy Test 1 Test 2 Diferenční hodnota 1
Amálka 10 1 -40 -4 Václav 20 2 -30 -3 Jan 30 3 -20 -2 Jiří 40 4 -10 -1 Hana 50 5 Karla 60 6 Petr 70 7 Markéta 80 8 Josef 90 9 Průměr

44 z-skóry Z-skóry modifikují rozložení dat tak, že se pohybují kolem nuly a směrodatnou odchylku mají 1. Odečteme průměr od hodnoty a pak dělíme směrodatnou odchylkou Pro populaci: Pro průměr:

45 z-skóry Test 1 Test 2 z- hodnota 1 z-hodnota 2 Amálka 10 1 -1.5 Václav
20 2 -1.2 Jan 30 3 -.77 Jiří 40 4 -.34 Hana 50 5 Karla 60 6 .34 Petr 70 7 .77 Markéta 80 8 1.2 Josef 90 9 1.5 Průměr Sm.odch. 25.8 2.58

46 z-skóry Rozložení z-skórů… Vždy má průměr nulu
Vždy má směrodatnou odchylku 1 Konverze nemění tvar rozložení: z-skóry nemohou non-normální rozložení převádět na normální rozložení Z-skór se intepretuje jako počet směrodatných odchylek nad nebo pod průměrem

47 Cvičení Při třetím testu průměr třídy byl 45 a směrodatná odchylka 6. Doplňte zbytek. Test 3 Z-skór Amálka 52 Václav 39 Jan -1.5 Jiří 1.3

48 Popisná statistika: rychlý přehled
Pro populaci: Pro průměr: Průměr Rozptyl Směr. odchylka Z-skór


Stáhnout ppt "Popisná statistika: přehled"

Podobné prezentace


Reklamy Google