PSY117/454 Statistická analýza dat v psychologii Přednáška 13

Slides:



Advertisements
Podobné prezentace
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Advertisements

Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)
Testování statistických hypotéz
Power analysis aneb Co to vlastně znamená P0.05 (Podle Scheiner & Gurevitch 2001: Desing and analysis of ecological experiments.
Odhady parametrů základního souboru
Cvičení 6 – 25. října 2010 Heteroskedasticita
Lineární regresní analýza Úvod od problému
Porovnání hodnotících škál bolesti v závislosti na kognitivní funkci
Analýza variance (Analysis of variance)
Výzkum (pedagogického zhodnocení) volného času
ZPRACOVÁVÁME KVANTITATIVNÍ DATA II.
1 Hodnocení geologických dat pomocí matematické statistiky Petr Čoupek 740/742/ IT spec.
Testování hypotéz přednáška.
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Řízení a supervize v sociálních a zdravotnických organizacích
Inference jako statistický proces 1
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Poskytuje daný generátor opravdu posloupnost náhodných čísel?
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Korelace a elaborace aneb úvod do vztahů proměnných
Biostatistika 7. přednáška
- Pojmy - SPSS Statistické zpracování kvantitativních šetření.
Kontingenční tabulky.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
PSY117/454 Statistická analýza dat v psychologii Přednáška 8
Práce s výsledky statistických studií
PSY717 Statistická analýza dat 2010 První konzultace.
Pohled z ptačí perspektivy
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Statistická významnost a její problémy
Biostatistika 8. přednáška
KORPUSY A KVANTITATIVNÍ DATA Úvod do korpusové lingvistiky 11.
Biostatistika 1. přednáška Aneta Hybšová
PSY717 – statistická analýza dat
1. cvičení
STATISTICKÝ ROZCESTNÍK aneb CO S DATY Martin Sebera.
Mann-Whitney U-test Wilcoxonův test Znaménkový test
1 Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Vladimír Mikulík. Slezské gymnázium, Opava, příspěvková organizace. Vzdělávací materiál.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
Odhady odhady bodové a intervalové odhady
INDUKTIVNÍ STATISTIKA
Statistické testování – základní pojmy
Přehled kurzu seznámení se spss
Induktivní statistika
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
t-test Počítání t-testu t statistika Měření velikosti efektu
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Přehled kurzu seznámení se spss
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
PSY117 Statistická analýza dat v psychologii Přednáška
Úvod do induktivní statistiky
příklad: hody hrací kostkou
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Statistika a výpočetní technika
Plánování přesnosti měření v IG Úvod – základní nástroje TCHAVP
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Základy statistiky.
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

PSY117/454 Statistická analýza dat v psychologii Přednáška 13 Smysluplné užití statistiky VIII. Thou shalt not worship the 0.05 significance level. Michael Driscoll,, The American Mathematical Monthly, The Ten Commandments of Statistical Inference, Volume 84, Number 8, 1977 (p. 628) Abelson, R. (1995). Statistics as Principled Argument. LEA. Isbn 0-8058-0527-3

Dichotomizace výsledků výzkumu Výsledek výzkumu je testováním zredukován na ano-ne Čím nižší je a, tím vyšší je b. Přesná podoba vztahu závisí na použitém testu. a i b mohou být nízké pouze při vysokých n. Síla testu viz Hendl 401-411. AJ: type-I error, type-II error, (statistical) power H0 přijata H0 zamítnuta H0 pravdivá (žádný efekt) OK chyba 1. typu a (její pravděpodobnost) H0 nepravdivá (efekt) chyba 2. typu b Síla (1-b) a: efekt nalezen, kde žádný není b: existující efekt za takový neodhalen síla: pravděpodobnost odhalení existujícího efektu

Síla testu … pravděpodobnost, že výsledek našeho statistického testu bude znít „na hladině a je rozdíl(korelace) statisticky významný“, pokud určitý rozdíl skutečně existuje … pravděpodobnost nezamítnutí H0, je-li H0 nepravdivá P (p<a|H1) = 1− b Závisí na Velikosti účinku – skutečném stavu věcí – čím větší je účinek, tím vyšší je síla testu. Velikost účinku obvykle souvisí s variabilitou Zvolené a – čím nižší a, tím nižší síla testu Velikosti vzorku – čím větší vzorek, tím vyšší síla testu Použitém testu – obecně neparametrické mají nižší sílu testu Žádoucí hodnoty pro sílu testu jsou > 0,8

K čemu jsou úvahy o síle testu? K tomu abychom nedělali zbytečné výzkumy. Cohen 1960 – J of Abnormal & Social Pschlg – průměrná síla 0,48 Cohen 1992 – nic moc se za 30 let nezměnilo Existuje-li rozdíl/vztah a my ho hledáme v tak malém vzorku, že síla je < 50%, pak to nemá smysl Abychom nedělali manipulativní závěry Chceme-li potvrdit hypotézu o neexistenci rozdílu/vztahu, nelze to udělat prostým nevyvrácením nulové hypotézy. K tomu, abychom si dokázali spočítat, jak velký vzorek potřebujeme pro svůj výzkum – náklady.

Jak spočítáme potřebnou velikost vzorku? …těžko… pro každý statistický test se počítá jinak Totéž platí i pro sílu testu Obecně: Jak velký vzorek potřebuji na to aby mi pro mě zajímavý účinek vyšel s 80% pravděpodobností statisticky významný na hladině a? receptář Oseckých G*Power http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/ Online např. http://www.stat.uiowa.edu/~rlenth/Power/index.html http://www.dssresearch.com/toolkit/spcalc/power.asp

Základní postup zpracování dat Pečlivá tvorba datové matice Tvorba a transformace proměnných Seznámení se s daty a explorace Běžné popisné statistiky, zejm. četnosti Všemožná zobrazení, grafy a kontingenční tabulky, zejm. neredukující Outlieři, chyby, chybějící data, nečekané souvislosti – cokoli, co nám pomůže lépe pochopit získaná data (a důvěřovat jim) Upřesnění a testování hypotéz Nezapomenout na ověření předpokladů testů Umíme-li několika způsoby, je dobré je vyzkoušet, zvlášť když si nejsme jistí splněním předpokladů

Základní principy komunikování výsledků Ve výsledcích uvádíme Způsob výpočtu/kódování proměnných Popisné statistiky odpovídající úrovni měření a následujícím testům Často včetně intervalů spolehlivosti na M nebo r Ověření předpokladů testů, je-li nutné (dle konvence) Testy hypotéz Testová statistika (t, z, F, r apod.) + df p= …, nebo p<(>) a Velikost účinku (d, r2 , OR) Morgan, Reichert, Harrison (2002). From Numbers to Words - Reporting Statistical Results for the Social Sciences. Allyn & Bacon Morgan, Reichert, Harrison (2002). From Numbers to Words - Reporting Statistical Results for the Social Sciences. Allyn & Bacon

Statistická gramotnost Korelace neimplikuje kauzalitu Je rozdíl mezi statistickou a praktickou významností (zvlášť u velkých vzorků) Je rozdíl mezi zjištěním nulového účinku/rozdílu a konstatováním, že rozdíly nejsou statisticky významné (zvlášť u malých vzorků) Data jsou „omylným“ zachycením jevů a vždy je třeba zohledňovat jejich vznik – otázky a postupy … metodologie Zdánlivě velmi nepravděpodobné jevy a koincidence se vyskytují často, protože mají nesmírně mnoho možností se vyskytnout Nezaměňovat podmíněné pravděpodobnosti P(A|B) a P(B|A). Nezaměňovat podmíněné pravděpodobnosti s nepodmíněnými. Variabilita je přirozená a „normální“ není totéž co „průměrný“ Utts (2003) Automobile Association Foundation for Traftic Safety (Stutts et aj. 2) 1) was widely puhlicizcd hecause it found that only I .5% of drivers in accidents reported Ihatthey were using acell phone, whereas, for eXamp]e, 10.9% reported that they were distracted by another occupant in the cat. Many media reports concluded thai this mcant that taÍking on a cell phone was much Jcss likely to cause an accident than other disractions, like talking with sorneone In the car ot attending to the radio. But notice that this is confusiiig two conditional prohahilities. ‘I‘he rcported proportion ot accidents of .015 (I .5%) for which the driver was using a cell phone is an estirnate of the probab ility that a driver was using a cell phone, given that he or she had an accident. The probability of interest is the inverse—the probability that a driver will have an accident, given that he or she is using a cell phone. That probability cannot be fnund from the reported data because it depends on the prevalence of cell phone use. Bui. it Is alrnostcertainly truc that many more drivers are talking with other occupants ol the car than alking on a cell phone aI any given time.

Bezpečné řízení Automobile Association Foundation for Traffic Safety zjistila, že pouze 1,5% řidičů telefonovala, když měli havárii, zatímco 10,9% řidičů bylo v okamžiku havárie vyrušováno další osobou v autě nebo rádiem. Řada médií z toho činila závěr, že telefonování při řízení ohrožuje řidiče méně než další pasažéři nebo poslech rádia. P(Telefonování|Havárie) ≠ P(Havárie|Telefonování) But notice that this is confusiiig two conditional prohahilities. ‘I‘he rcported proportion ot accidents of .015 (I .5%) for which the driver was using a cell phone is an estirnate of the probab ility that a driver was using a cell phone, given that he or she had an accident. The probability of interest is the inverse—the probability that a driver will have an accident, given that he or she is using a cell phone. That probability cannot be fnund from the reported data because it depends on the prevalence of cell phone use. Bui. it Is alrnostcertainly truc that many more drivers are talking with other occupants ol the car than alking on a cell phone aI any given time.

M.A.G.I.C. MAGNITUDE – velikost účinku V čem se obecně liší dobrý statistický argument od špatného? MAGNITUDE – velikost účinku ARTICULATION – konkrétnost, jistota: t-test vs. ANOVA, c2 GENERALITY – aplikovatelnost na co nejširší třídu jevů INTERESTINGNESS – pro odborníka překvapivý výsledek? CREDIBILITY – věrohodnost: čím je výsledek překvapivější, tím lépe musí být doložen To jsou aspekty, které se ve výzkumné zprávě snažíme zdůraznit (a při provádějí výzkumu v rámci možností zajistit) Abelson, R. P. (1995). Statistics As Principled Argument. Lawrence Erlbaum.

Výzkumně-kriticky orientovaná Áčka PSY117 – statistika a PSY252 – statistika II (pouze na jednooborová) PSYXXX – psychometrika (pouze na jednooborové psychologii) PSY112 – metodologie – úvod, klasika a PSY118 – metodologie – kvalitativa Kritické myšlení při příjmu poznatků Konzumace výzkumu Realizace vlastních výzkumů Psychodiagnostika Chybí: filozofie, logika ….. sociologie vědy pořadí

2 knihy na závěr Mlodinow, L. (2009). Život je jen náhoda. Jak náhoda ovlivňuje naše životy. Praha: Slovart. Porter, T. M. (1995). Trust in numbers. The pursuit of objectivity in science and public life. Princeton: Princeton University Press.