Úvod do induktivní statistiky

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Testování parametrických hypotéz
Testování hypotéz Jana Zvárová
Testování neparametrických hypotéz
Testování hypotéz.
Testování statistických hypotéz
Statistické metody v ochraně kulturního dědictví
Cvičení 6 – 25. října 2010 Heteroskedasticita
Testování hypotéz přednáška.
Tloušťková struktura porostu
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
MUDr. Michal Jurajda, PhD. ÚPF LF MU
Testování statistických hypotéz
Inference jako statistický proces 1
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Biostatistika 6. přednáška
Analýza variance (ANOVA).
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Pohled z ptačí perspektivy
Samostatný úkol: Jednovýběrový t-test Dvouvýběrový nepárový t-test
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
8. Kontingenční tabulky a χ2 test
Normální rozdělení a ověření normality dat
Statistická významnost a její problémy
PSY717 – statistická analýza dat
Jak statistika dokazuje závislost
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
Aplikovaná statistika 2. Veronika Svobodová
Základy testování hypotéz
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Inferenční statistika - úvod
Mann-Whitney U-test Wilcoxonův test Znaménkový test
HYPOTÉZY „Hypotéza není ničím jiným než podmíněným výrokem o vztazích mezi dvěma nebo více proměnnými. Na rozdíl od problému, který je formulován v.
Zpracování dat z kvantitativního výzkumu. Na základní škole se uskutečnil výzkum, kde se měřila hmotnost žáků 8.tříd. Výzkumu se účastnilo 33 žáků. Byly.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
INDUKTIVNÍ STATISTIKA
Biostatistika Opakování – základy testování hypotéz
Statistické testování – základní pojmy
Induktivní statistika
Induktivní statistika
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
t-test Počítání t-testu t statistika Měření velikosti efektu
Induktivní statistika
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Induktivní statistika
Normální rozdělení a ověření normality dat Modelová rozdělení
Proč statistika ? Dva důvody Popis Inference
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Pravděpodobnost a výběry – 1. část
Neparametrické testy pro porovnání polohy
příklad: hody hrací kostkou
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Analýza kardinálních proměnných
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Základy statistiky.
Testování hypotéz - pojmy
Transkript prezentace:

Úvod do induktivní statistiky Metodologie pro ISK II Úvod do induktivní statistiky

Induktivní statistika Deskriptivní statistika: popisuje rozložení četností naměřených proměnných Statistická indukce: umožňuje zkoumat vztahy mezi proměnnými a zobecňovat výsledky na základní populaci

Statistická indukce (inference) Zdroj: http://new.euromise.org/czech/tajne/ucebnice/html/html/node3.html

Zobecňování na základní soubor (univariační analýza) Pomocí intervalů spolehlivosti Explore – Confidence Interval for Mean Interval, ve kterém se hodnota nachází se spolehlivostí 95 %

Statistické hypotézy Statistické hypotézy jsou domněnkami o populaci, jejichž pravdivost ověřujeme (testujeme) pomocí výběrových souborů z této populace. Jejich testování směřuje k zobecnění dat výběrového souboru na základní soubor. Mareš a Rabušic, 2003 Hypotézy jsou výroky o vztahu proměnných.

Nulová a alternativní hypotéza Nulová hypotéza předpokládá stav neexistence rozdílu (tj. předpokládá stav shody) mezi proměnnými/skupinami v populaci. (Arbuthnott, 1710) Alternativní hypotéza předpokládá existenci rozdílu (na základě teorie definujeme předpoklady o rozdílech mezi jednotlivými skupinami v populaci)

Nulová hypotéza - příklady H0: Neexistuje rozdíl mezi rozložením proměnných ve vzorku a v populaci H0: Neexistuje vztah mezi časem věnovaným internetu a pohlavím. Ho: Neexistuje rozdíl mezi průměrným příjmem mužů a žen zaměstnaných v knihovnách.

Alternativní hypotéza - příklady …

Testování hypotézy Reálný stav (populace) H0 H1 Akceptujeme H0 OK Data neodpovídají – zamítáme H0 Rozdíl mezi dvěma populačními průměry neexistuje – příjímáme H0 Reálný stav (populace) H0 H1 Akceptujeme H0 OK Chyba 2. druhu Zamítáme H0 Chyba 1. druhu Rozhodnutí (vzorek)

Hladina významnosti Velikost rizika chyby, již připouštíme Většinou: 0,05 (5 %) Statistická významnost je pravděpodobnost, s jakou bychom – za předpokladu platnosti nulové hypotézy – mohli obdržet data odporující nulové hypotéze. (Soukup 2010) Je-li statistická významnost nízká, nulová hypotéza nejspíš neplatí

Hladina významnosti V případě, že vypočtená pravděpodobnost chyby prvního druhu je menší než námi předem stanovená hranice, zamítáme nulovou hypotézu.

Testování Zvolíme testovací kritérium Každé testovací kritérium má své kritické hodnoty Vypočítáme z dat hodnotu testovacího kritéria Porovnáme ji s kritickou hodnotou Hodnota je menší, než kritická  H0 zamítáme Hodnota je větší  H0 nezamítáme – rozdíl je statisticky významný

Testování nulové hypotézy o normálním rozložení Analyze – Explore – Plots – Normality Plots with tests

Testování nulové hypotézy o normálním rozložení Grafický test

Testování nulové hypotézy o normálním rozložení Statistický test: Kolmogorovův-Smirnovův test Pokud je vypočtená významnost (ve sloupci Sig.) nízká, to je menší než 0,05 (pro spolehlivost 95 %), nulovou hypotézu o normálním rozložení v populaci zamítáme.

Limity statistické indukce

Kdy to můžeme použít? Požadavek velkého reprezentativního náhodného souboru Statistická významnost ještě neznamená významnost věcnou

Úkol Rozdělte se do skupin (3-4 lidi) Seznamte se s reprezentativním výzkumem hodnot a distinkcí – děti a rodiče (IS) – zaměřte se na děti (třicátníky) Zhodnoťte proměnnou Q10 a zobecněte průměr na populaci při 95% a 99% jistotě Definujte si 4 nulové a alternativní hypotézy a zjistěte rozložení v souboru (pouze deskriptivní statistika) Odevzdejte do odevzdávárny Odevzdejte výpisky z četby (Hendl, Ryšavý)

Tipy pro úkol Uvádějte tabulky četností i grafy V tabulkách zvýrazněte potenciálně zajímavá data Užívejte správně grafy (ne koláčový pro spojité proměnné!) Okomentujte nejzajímavější zjištění (ne pouze „v přehledné tabulce vidíme výsledky…“ )