Proč statistika ? Dva důvody Popis Inference Hledání způsobu redukce dat k zachycení důležitých charakteristik dat Inference Jak (a kdy) zobecnit z výběru na větší populaci
Stupně zvládnutí analýzy dat Základní: zvládnutí základů statistiky a statistických testů Střední: Zvládnutí lineárních modelů (ANOVA a regrese) Pokročilý: Rozšíření lineárních modelů Expertní znalost: vážný zájem o modelování a statistiku V každém stupni je nutné: Znalosti, Dovednosti, Zkušenosti
Popisná statistika
První dojem Druhý dojem 3.88 3.38 1.88 .63 2.00 3.13 3.88 4.25 2.50 .50 3.25 3.75 3.13 1.50 1.50 1.88 3.75 .88 2.00 2.25 2.38 1.13 3.25 3.38 2.88 1.00 .88 -.25 3.50 1.63 4.13 1.50 .38 2.00 4.63 2.13
První dojem Druhý dojem 3.88 3.38 1.88 .63 2.00 3.13 3.88 4.25 2.50 .50 3.25 3.75 3.13 1.50 1.50 1.88 3.75 .88 2.00 2.25 2.38 1.13 3.25 3.38 2.88 1.00 .88 -.25 3.50 1.63 4.13 1.50 .38 2.00 4.63 2.13
Popis rozložení dat frequency
Porovnání rozložení dat frequency Muži frequency Ženy Jak lze zobrazit diference?
Složitější lineární vztahy Uspokojení ze současného stavu
Popisná statistika Usiluje o grafickou a numerickou organizaci dat, jejich redukci a charakterizaci.
Typy studií Experimentální: Observační: Některé faktory a proměnné (nezávisle proměnné) jsou manipulovány výzkumníkem. Observační: Nezávisle proměnné a prediktory jsou výzkumníkem pouze pozorovány a zaznamenávány (bez manipulace).
Typy proměnných Prediktory a nezávisle proměnné: Závisle proměnná: Příčina nebo antecedentní podmínka, která se využívá k predikci výstupní (závislé, outcome) proměnné. Závisle proměnná: Proměnná, kterou považujeme za závisle proměnnou (často důsledek, outcome).
Typy proměnných Spojitá proměnná: Diskrétni (kategoriální) proměnná: Nekonečně moho hodnot (celý interval v R). Diskrétni (kategoriální) proměnná: Hodnoty označují kategorie (také četnosti) Ordinální Nominální Množina kategorií bez řazení Množina kategorií, které lze seřadit
Sumarizace diskrétních dat Jméno Barva očí Jana Hnědá Tomáš Modrá Dana Zelená Jan Josef Emil Anna Karla Kateřina Štěpán Eva Romeo
Frekvenční tabulka (tabulka četností) Barva očí Četnost Hnědá Modrá Zelená 33 14 3
Četnostní tabulka Relativní četnost Barva očí Četnost 33 66% Hnědá 14 28% 6% Hnědá Modrá Zelená
Sloupkový graf četností
Sloupkový graf relativních četností
Sumarizace spojitých dat Jméno Hodiny spánek / noc Jana 6 Tomáš 7.5 Dana 10.5 Jan 9 Josef 7 Emil Anna 8 Karla 5 Kateřina 8.5 Štěpán 6.5 Eva Romeo 4
Frekvenční tabulka Hodiny spánku Četnost 3 - 4 hod. 1 4 - 5 hod. 3 6 14 16 5 2
Histogram (četnosti)
Tabulka četností Hodiny spánku Relativní Četnosti 2% 6% 12% 28% 32% 10% 4% Četnosti 3 - 4 hod. 4 - 5 hod. 5 - 6 hod. 6 - 7 hod. 7 - 8 hod. 8 - 9 hod. 9 - 10 hod. 10 - 11 hod. 1 3 6 14 16 5 2
Histogram (relativní četnosti)
Tabulka četností Hodiny spánku Relativní četnosti Kumulativní četnosti 2% 8% 20% 48% 80% 90% 96% 100% Četnosti 3 - 4 hod. 4 - 5 hod. 5 - 6 hod. 6 - 7 hod. 7 - 8 hod. 8 - 9 hod. 9 - 10 hod. 10 - 11 hod. 1 3 6 14 16 5 2 2% 6% 12% 28% 32% 10% 4%
Graf lodyhy a listů Lodyha Listy 2 3 4 5 6 1 1 5 6 7 2 5 4 5 4 9 Jméno Jana 54 Tomáš 59 Dana 35 Jan 41 Josef 46 Emil 25 Anna 47 Karla 60 Kateřina Štěpán 34 Eva 22 Romeo 45 Lodyha Listy 2 3 4 5 6 1 1 5 6 7 2 5 4 5 4 9
Graf lodyhy a listů Lodyha Listy 2 3 4 5 6 2 5 4 5 1 1 5 6 7 4 9 Jméno Jana 54 Tomáš 59 Dana 35 Jan 41 Josef 46 Emil 25 Anna 47 Karla 60 Kateřina Štěpán 34 Eva 22 Romeo 45 Lodyha Listy 2 3 4 5 6 2 5 4 5 1 1 5 6 7 4 9
Dvojitý graf lodyhy a listů Jméno Jana 54 Tomáš 59 Dana 35 Jan 41 Josef 46 Emil 25 Anna 47 Karla 60 Kateřina Štěpán 34 Eva 22 Romeo 45 2 3 4 5 6 2 5 7 ženy 1 1 5 6 9 muži
Vizuální prezentace rozložení dat - shrnutí Diskrétní data Četnostní tabulky Sloupkové grafy Spojitá data Četnostní tabulky Histogramy Graf lodyhy a listů
Inferenční statistika
Inferenční statistika Populace: Množina jedinců, která nás zajímá Výběr: Podmnožina jedinců vybraná z populace Inferenční statistika
Jsou rozdílnosti způsobené pouhou náhodou?
Důležité pojmy Parametr: Statistika: Výběrová chyba: Charakteristika populace. Označuje se řeckými písmeny jako nebo . Statistika: Charakteristika výběru. Označuje se speciálními znaky jako třeba m ( ) nebo s. Výběrová chyba: Popisuje množství chyby, které může existovat u výběrové charakteristiky ve vztahu k populační charakteristice.
Chceme vědět, zda Petr je nad průměrem bodování v trestných hodech Chceme vědět, zda Petr je nad průměrem bodování v trestných hodech. Sbíráme data.
Sadíte 10,00 €, že další hod bude v koši? M K K M K M % košů = 0.75 % košů = 0.63 % košů = 0.58
Rozdíly ve výběrech nemusí být spolehlivé (zvláště, jestliže rozdíly jsou malé nebo jsou malé výběry) Inferenční statistika nám říká, zda výsledek způsobila pouze náhoda nebo ne.
Důležité vyjasnění Statistika se ptá: byl efekt způsoben jenom náhodnou? Náhodné vlivy: Náhodná fluktuace Nenáhodné příčiny: Skutečný rozdíl v populacích Systematická chyba v designu studie Inferenční statistika odděluje Statisticky významný výsledek, neznamená, že výsledek je potvrzením hypotézy. Pouze, že není náhodný.
Inferenční statistika Popisná statistika Teorie pravděpodobnosti
Typy analýzy NV -- kategoriální (skupiny); ZV --spojitá Jednovýběrový test t-test. Úsudek o průměru v jedné skupině. Dvouvýběrový t-test. Diference mezi průměry dvou skupin. ANOVA. Diference v průměrech více skupin.
Typy analýzy NP --spojitá; ZP --spojitá Korelace. Síla lineárního vztahu mezi dvěma spojitými proměnnými Regrese. Prokládání přímky nebo jiné křivky.
Typy analýzy NP -- kategoriální (skupiny); ZP -- kategoriální Z-test pro relativní četnosti. Diference mezi dvěma výběrovými četnostmi. Chi-kvadrát test. Rozložení relativních četností a porovnání skupin.
Chybovost každodenního usuzování Proč statistika? Chybovost každodenního usuzování
Každodenní statistické uvažování Něco z ničeho: chybné vnímání náhodných dat. 2. Mnoho z mála: chybné posouzení z malého množství dat. 3. Vidíme to, co očekáváme: systematické zkreslení z nejednoznačných dat.
Chybná interpretace náhodných dat “Lidský rozum předpokládá větší stupeň pořádku a shody ve věcech, než jaká je skutečnost; ačkoliv většina věci nemá řád, člověk nachází paralely, kontingence a podobnosti tak, kde žádné nejsou.” -Francis Bacon
Otázky ?