Kontingenční tabulky.

Slides:



Advertisements
Podobné prezentace
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Advertisements

Neparametrické metody
Neparametrické metody a analýza rozptylu (lekce 3-7)
Testování neparametrických hypotéz
Testování hypotéz Distribuce náhodných proměnných
Testování hypotéz.
Minimální poměr: Exaktní metrika pro kolokace, klíčová slova atd.
Test dobré shody 2 test.
Chováme králíčky Liší se tato tři králičí plemena hmotností?
P‑value ano, či ne? Roman Biskup
Regresní analýza a korelační analýza
Testování hypotéz (ordinální data)
Náhodná proměnná Rozdělení.
také Gaussovo rozdělení (normal or Gaussian distribution)
Poskytuje daný generátor opravdu posloupnost náhodných čísel?
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
9. Analýza kategorických dat
Ringier ČR - Výzkumné oddělení
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Korelace a elaborace aneb úvod do vztahů proměnných
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Test dobré shody Fisherův přesný test McNemar test
Pohled z ptačí perspektivy
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Korelace.
Analýza kvantitativních dat II.
PSY717 – statistická analýza dat
Jak statistika dokazuje závislost
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
1. cvičení
Inferenční statistika - úvod
TEST DOBRÉ SHODY A TEST NEZÁVISLOSTI Vysoká škola technická a ekonomická v Českých Budějovicích Institute of Technology And Business In České Budějovice.
Měření v sociálních vědách „Měřit všechno, co je měřitelné, a snažit se učitnit měřitelným vše, co dosud měřitelné není“. (Galileo Galilei)
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
INDUKTIVNÍ STATISTIKA
Opakování – přehled metod
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Test dobré shody Fisherův přesný test McNemar test
Neparametrické testy parametrické a neparametrické testy
Induktivní statistika
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Neparametrické testy parametrické a neparametrické testy
Statistika a evaluace.
Induktivní statistika
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Pravděpodobnost a matematická statistika I.
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
PSY117 Statistická analýza dat v psychologii Přednáška
Neparametrické testy pro porovnání polohy
Metodologie pro ISK 2 Úvod do práce s daty
Úvod do induktivní statistiky
příklad: hody hrací kostkou
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Statistika a výpočetní technika
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

Kontingenční tabulky

Úvod základní technika pro zkoumání vztahů mezi dvěma kategorickými (=nominální/ordinální) proměnnými více proměnných –> mnohorozměrné KT převod škálových na kategorické – bining (bin = přihrádka) a) hypotéza o existenci vztahu b) určení síly vztahu vše založeno na centrální limitní větě binomické rozdělení se blíží normálnímu

každý jednotlivec může být klasifikován dle proměnné A a B výchozí předpoklad stochastické nezávislosti pokud např. A kontrolujeme (=cíleně vybíráme osoby s danou hodnotou A), nazývá se A faktor pak místo nezávislosti předpoklad homogenity – početně ale stejné jako obvykle – požadavek náhodného výběru/randomizace

chí-kvadrát test Fisherův exaktní test McNemar dostatečné N malé N „Lady tasting tea“ - The lady in question claimed to be able to tell whether the tea or the milk was added first to a cup. Fisher proposed to give her eight cups, four of each variety, in random order. One could then ask what the probability was for her getting the number she got correct, but just by chance. McNemar párová data

Kontingenční tabulka 2x2 výpočet chí-kvadrát statistiky:

Distribuce u různých df

Obecná r x c KT výpočet EC výpočet chí-kvadrát (E = Expected Count, očekávaná četnost, n = Observed Count, zjištěná četnost)

chí-kvadrát test dobré shody nejen v kontingenčních tabulkách ověřuje shodu empirické distribuce s teoretickou (předpokládanou) – v KT jen specifickým způsobem určíme EC

Analýza závislosti rozdělení výsledku atestace (1 – výborně, P – prospěl, N – neprospěl) na oboru studia (O_S) (A, B, C)

Otázky Hypotézu nezávislosti můžeme zamítnout na 1% hladině významnosti Jednička se u studentů oboru A vyskytuje s vyšší pravděpodobností než u zbývajících oborů  Extrémně nízký počtu osob (3) v kategorii (A * N) nedovoluje použít chí-kvadrát test nezávislosti  Očekávané četnosti jsou dostatečně veliké pro možnost užití chí-kvadrát testu  Pravděpodobnost klasifikace „NEPROSPĚL“ je u studentů oboru B vyšší než u studentů oboru A  Hypotézu stejné distribuce výsledku atestace u oborů A a B nelze zamítnout  U této atestace (bez ohledu na obor) se výsledek „N“ vyskytuje s nižší pravděpodobností než výsledek „1“

Fisherův přesný (exact) test u malých N – ale pouze 2x2 alternativně chí-kvadrát s Yatesovou korekcí přehnaně konzervativní

Cramerovo V hodnoty (0;1), 1 -> silný vztah, 0 -> žáden

McNemar H0: pc = pb McNemar-Bowker – pro víc kategorií SPSS počítá automaticky