Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Proč statistika ? Dva důvody Popis Inference
Hledání způsobu redukce dat k zachycení důležitých charakteristik dat Inference Jak (a kdy) zobecnit z výběru na větší populaci
2
Stupně zvládnutí analýzy dat
Základní: zvládnutí základů statistiky a statistických testů Střední: Zvládnutí lineárních modelů (ANOVA a regrese) Pokročilý: Rozšíření lineárních modelů Expertní znalost: vážný zájem o modelování a statistiku V každém stupni je nutné: Znalosti, Dovednosti, Zkušenosti
3
Popisná statistika
4
První dojem Druhý dojem
5
První dojem Druhý dojem
6
Popis rozložení dat frequency
7
Porovnání rozložení dat
frequency Muži frequency Ženy Jak lze zobrazit diference?
8
Složitější lineární vztahy
Uspokojení ze současného stavu
9
Popisná statistika Usiluje o grafickou a numerickou organizaci dat, jejich redukci a charakterizaci.
10
Typy studií Experimentální: Observační:
Některé faktory a proměnné (nezávisle proměnné) jsou manipulovány výzkumníkem. Observační: Nezávisle proměnné a prediktory jsou výzkumníkem pouze pozorovány a zaznamenávány (bez manipulace).
11
Typy proměnných Prediktory a nezávisle proměnné: Závisle proměnná:
Příčina nebo antecedentní podmínka, která se využívá k predikci výstupní (závislé, outcome) proměnné. Závisle proměnná: Proměnná, kterou považujeme za závisle proměnnou (často důsledek, outcome).
12
Typy proměnných Spojitá proměnná: Diskrétni (kategoriální) proměnná:
Nekonečně moho hodnot (celý interval v R). Diskrétni (kategoriální) proměnná: Hodnoty označují kategorie (také četnosti) Ordinální Nominální Množina kategorií bez řazení Množina kategorií, které lze seřadit
13
Sumarizace diskrétních dat
Jméno Barva očí Jana Hnědá Tomáš Modrá Dana Zelená Jan Josef Emil Anna Karla Kateřina Štěpán Eva Romeo
14
Frekvenční tabulka (tabulka četností)
Barva očí Četnost Hnědá Modrá Zelená 33 14 3
15
Četnostní tabulka Relativní četnost Barva očí Četnost 33 66% Hnědá 14
28% 6% Hnědá Modrá Zelená
16
Sloupkový graf četností
17
Sloupkový graf relativních četností
18
Sumarizace spojitých dat
Jméno Hodiny spánek / noc Jana 6 Tomáš 7.5 Dana 10.5 Jan 9 Josef 7 Emil Anna 8 Karla 5 Kateřina 8.5 Štěpán 6.5 Eva Romeo 4
19
Frekvenční tabulka Hodiny spánku Četnost 3 - 4 hod. 1 4 - 5 hod. 3
6 14 16 5 2
20
Histogram (četnosti)
21
Tabulka četností Hodiny spánku Relativní Četnosti 2% 6% 12% 28% 32%
10% 4% Četnosti 3 - 4 hod. 4 - 5 hod. 5 - 6 hod. 6 - 7 hod. 7 - 8 hod. 8 - 9 hod. hod. hod. 1 3 6 14 16 5 2
22
Histogram (relativní četnosti)
23
Tabulka četností Hodiny spánku Relativní četnosti Kumulativní četnosti
2% 8% 20% 48% 80% 90% 96% 100% Četnosti 3 - 4 hod. 4 - 5 hod. 5 - 6 hod. 6 - 7 hod. 7 - 8 hod. 8 - 9 hod. hod. hod. 1 3 6 14 16 5 2 2% 6% 12% 28% 32% 10% 4%
24
Graf lodyhy a listů Lodyha Listy 2 3 4 5 6 1 1 5 6 7 2 5 4 5 4 9 Jméno
Jana 54 Tomáš 59 Dana 35 Jan 41 Josef 46 Emil 25 Anna 47 Karla 60 Kateřina Štěpán 34 Eva 22 Romeo 45 Lodyha Listy 2 3 4 5 6 2 5 4 5 4 9
25
Graf lodyhy a listů Lodyha Listy 2 3 4 5 6 2 5 4 5 1 1 5 6 7 4 9 Jméno
Jana 54 Tomáš 59 Dana 35 Jan 41 Josef 46 Emil 25 Anna 47 Karla 60 Kateřina Štěpán 34 Eva 22 Romeo 45 Lodyha Listy 2 3 4 5 6 2 5 4 5 4 9
26
Dvojitý graf lodyhy a listů
Jméno Jana 54 Tomáš 59 Dana 35 Jan 41 Josef 46 Emil 25 Anna 47 Karla 60 Kateřina Štěpán 34 Eva 22 Romeo 45 2 3 4 5 6 2 5 7 ženy 9 muži
27
Vizuální prezentace rozložení dat - shrnutí
Diskrétní data Četnostní tabulky Sloupkové grafy Spojitá data Četnostní tabulky Histogramy Graf lodyhy a listů
28
Inferenční statistika
29
Inferenční statistika
Populace: Množina jedinců, která nás zajímá Výběr: Podmnožina jedinců vybraná z populace Inferenční statistika
30
Jsou rozdílnosti způsobené pouhou náhodou?
31
Důležité pojmy Parametr: Statistika: Výběrová chyba:
Charakteristika populace. Označuje se řeckými písmeny jako nebo . Statistika: Charakteristika výběru. Označuje se speciálními znaky jako třeba m ( ) nebo s. Výběrová chyba: Popisuje množství chyby, které může existovat u výběrové charakteristiky ve vztahu k populační charakteristice.
32
Chceme vědět, zda Petr je nad průměrem bodování v trestných hodech
Chceme vědět, zda Petr je nad průměrem bodování v trestných hodech. Sbíráme data.
33
Sadíte 10,00 €, že další hod bude v koši?
M K K M K M % košů = 0.75 % košů = 0.63 % košů = 0.58
34
Rozdíly ve výběrech nemusí být spolehlivé
(zvláště, jestliže rozdíly jsou malé nebo jsou malé výběry) Inferenční statistika nám říká, zda výsledek způsobila pouze náhoda nebo ne.
35
Důležité vyjasnění Statistika se ptá: byl efekt způsoben jenom náhodnou? Náhodné vlivy: Náhodná fluktuace Nenáhodné příčiny: Skutečný rozdíl v populacích Systematická chyba v designu studie Inferenční statistika odděluje Statisticky významný výsledek, neznamená, že výsledek je potvrzením hypotézy. Pouze, že není náhodný.
36
Inferenční statistika
Popisná statistika Teorie pravděpodobnosti
37
Typy analýzy NV -- kategoriální (skupiny); ZV --spojitá
Jednovýběrový test t-test. Úsudek o průměru v jedné skupině. Dvouvýběrový t-test. Diference mezi průměry dvou skupin. ANOVA. Diference v průměrech více skupin.
38
Typy analýzy NP --spojitá; ZP --spojitá
Korelace. Síla lineárního vztahu mezi dvěma spojitými proměnnými Regrese. Prokládání přímky nebo jiné křivky.
39
Typy analýzy NP -- kategoriální (skupiny); ZP -- kategoriální
Z-test pro relativní četnosti. Diference mezi dvěma výběrovými četnostmi. Chi-kvadrát test. Rozložení relativních četností a porovnání skupin.
40
Chybovost každodenního usuzování
Proč statistika? Chybovost každodenního usuzování
41
Každodenní statistické uvažování
Něco z ničeho: chybné vnímání náhodných dat. 2. Mnoho z mála: chybné posouzení z malého množství dat. 3. Vidíme to, co očekáváme: systematické zkreslení z nejednoznačných dat.
42
Chybná interpretace náhodných dat
“Lidský rozum předpokládá větší stupeň pořádku a shody ve věcech, než jaká je skutečnost; ačkoliv většina věci nemá řád, člověk nachází paralely, kontingence a podobnosti tak, kde žádné nejsou.” -Francis Bacon
43
Otázky ?
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.