Test dobré shody 2 test.

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Testování statistických hypotéz
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Testování hypotéz Jana Zvárová
Testování neparametrických hypotéz
A5M33IZS – Informační a znalostní systémy Testování modelů.
Další modely ANOVY.
Kvantitativní metody výzkumu v praxi
Testování hypotéz Distribuce náhodných proměnných
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Jiří Šafr jiri.safr(zavináč)seznam.cz
F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Analýza variance (Analysis of variance)
ZPRACOVÁVÁME KVANTITATIVNÍ DATA II.
Testování závislosti kvalitativních znaků
Diskrétní rozdělení a jejich použití
Testování hypotéz přednáška.
Tloušťková struktura porostu
Princip testování hypotéz, c2 testy.
Náhodná proměnná Rozdělení.
Statistika 8. ročník Autorem materiálu je Mgr. Jana Čulíková
Testování hypotéz vymezení důležitých pojmů
také Gaussovo rozdělení (normal or Gaussian distribution)
Řízení a supervize v sociálních a zdravotnických organizacích
Poskytuje daný generátor opravdu posloupnost náhodných čísel?
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Odhady odhady bodové a intervalové odhady
Data s diskrétním rozdělením
Ringier ČR - Výzkumné oddělení
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
základní principy a použití
Biostatistika 6. přednáška
Test dobré shody Fisherův přesný test McNemar test
Kontingenční tabulky.
Analýza variance (ANOVA).
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Princip testování hypotéz, c2 testy.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
Jak statistika dokazuje závislost
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
Aplikovaná statistika 2. Veronika Svobodová
1. cvičení
Inferenční statistika - úvod
Mann-Whitney U-test Wilcoxonův test Znaménkový test
Zpracování dat z kvantitativního výzkumu. Na základní škole se uskutečnil výzkum, kde se měřila hmotnost žáků 8.tříd. Výzkumu se účastnilo 33 žáků. Byly.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Princip testování hypotéz,  2 testy. Příklad. V dané populaci nejsme schopni v daném okamžiku zjistit počet samců a samic. Předpokládá se (= je teoreticky.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Neparametrické testy  neparametrické pořadové testy  Chí-kvadrát kontingenční tabulky test dobré shody.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
… jsou bohatší lidé šťastnější?
Test dobré shody Fisherův přesný test McNemar test
Testování hypotéz párový test
Neparametrické testy parametrické a neparametrické testy
Neparametrické testy parametrické a neparametrické testy
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
PSY117 Statistická analýza dat v psychologii Přednáška
Neparametrické testy pro porovnání polohy
příklad: hody hrací kostkou
7. Kontingenční tabulky a χ2 test
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

Test dobré shody 2 test

2 test testuje shodu očekávaných a pozorovaných četností H0: pozorované četnosti = očekávané četnosti Pokud zamítnu H0, mohu říct, že pozorované četnosti se od očekávaných liší (a je na mně, abych vysvětlil proč)

Příklad chci zjistit, jestli sexuální index (poměr samců a samic) odpovídá očekávanému (1:1) chci zjistit, jestli pasti s různým světlem polapily stejný počet jedinců (očekávám 1:1:1…..) poměr genotypů (očekávám aa : Aa : AA = 1:2:1) odpovídá poměr maturantů z daného předmětu (chlapci:dívky) poměru pohlaví na škole?

Výpočet Pearson 2 Kde pi = pozorovaná četnost i-té kategorie, oi = očekávaná četnost i-té kategorie Musím umět spočítat, protože Excel standardně vyhodí rovnou p

Statistics to use http://www.physics.csbsju.edu/stats/ na této adrese lze 2 spočítat

často spočítá 2 , ale napíše že p = 0.000 p se z principu nemůže rovnat 0! potom lze v Excelu využít funkci CHIDIST – po zadání hodnoty 2 a d.f. spočítá odpovídající p

Příklad Chytal jsem juvenilní jedince: 127 samců a 133 samic. Později v sezóně jsem chytil 73 samců a 121 samic. Liší se sexuální indexy v různých datech od očekávaného poměru (1:1)?

Příklad Chytil jsem tedy 127 samců a 133 samic, celkem 260. Očekávané četnosti jsou tedy 130:130 (poměr 1:1)

Příklad Měl jsem 2 kategorie, stupně volnosti jsou tedy 2-1 = 1. Při s.v. = 1 je kritická hodnota na hladině 5% 2 = 3,84. Můj výsledek 0,1385 < 3,84, nemohu tedy zamítnout hypotézu H0 (poměr juvenilních samic a samců se významně neliší od očekávaného poměru 1:1) Excel (fce CHITEST) vyhodí rovnou p, pokud je menší než 0,05  zamítám H0, jinak zamítnout nemůžu (zde p = 0,7098)

Statistické tabulky (kritické hodnoty různých rozdělení) např Statistické tabulky (kritické hodnoty různých rozdělení) např. na http://new.euromise.org/czech/tajne/ucebnice/html/html/node15.html, nebo na http://home.zcu.cz/~friesl/Archiv/PsaTab.pdf

Příklad Později jsem tedy chytil 73 samců a 121 samic, celkem 194. Očekávané četnosti jsou tedy 97:97 (poměr 1:1)

Příklad Můj výsledek 11,876 > 3,84, mohu tedy zamítnout hypotézu H0 (poměr starších samic a samců se tedy významně liší od očekávaného poměru 1:1) Excel (fce CHITEST) vyhodí rovnou p, pokud je menší než 0,05  zamítám H0, jinak zamítnout nemůžu (zde p = 0,00057)

Příklad Výsledek: Zatímco poměr pohlaví juvenilních jedinců (127:133) se významně neliší od očekávaného poměru 1:1 (2 = 0.1385, s.v. = 1, p = 0.7098), poměr starších jedinců (73:121) se od očekávaného poměru 1:1 liší signifikantně (2 = 11.876, s.v. = 1, p = 0.00057). Diskuse: Samci mají vyšší mortalitu… (anebo jsou chytřejší a nedají se tak snadno chytit)….

Pro rozumné použití je nutné, aby četnost většiny kategorií (alespoň 80%) byla nejméně 5, a aby všechny četnosti byly větší než 1 Když mám malé četnosti, mohu použít Yatesovu korekci (slabší test)

Pokud je shoda s očekávanými četnostmi příliš velká – too good to be true (při náhodnosti dat je nízká pravděpodobnost nejen malé, ale i velké shody!!!) – např. Mendelovy pokusy

Příklad: Ve třídě (28 žáků) je dlouhodobý poměr přítomných a nepřítomných žáků 13:1. Při písemce chybí 6 žáků. Liší se tato absence statisticky významně od očekávané „průměrné“ absence?

Příklad do rybníku jsem dal past se světlem bílým, žlutým, modrým, zeleným, červeným pokud barva světla nemá vliv na počet chycených jedinců, bude poměr cca 1:1:1:1:1 chytil jsem 56:72:41:53:38 Má barva světla vliv na odchyt?

Příklad Pokuste se vymyslet příklad na test dobré shody, který by se dal použít ve vaší DP

Kontingenční tabulky

Kontingenční tabulky Obecně – dvě (nebo více) kategoriálních proměnných

Výpočet 2 r je počet řádků, s je počet sloupců Očekávané četnosti vypočítám podle celkových součtů a H0 H0: faktory jsou na sobě nezávislé s.v. = (r-1)x(s-1)

Očekávané četnosti:

Příklad Žáci si mohli vybrat ze 4 předmětů svůj nejoblíbenější Je oblíbený předmět závislý na pohlaví? Data viz soubor chi_data.xls

Příklad Při dlouhém dni se vyvinulo 46 dlouhokřídlých a 12 krátkokřídlých bruslařek, při krátkém dni 32 dlouhokřídlých a 28 krátkokřídlých. Je frekvence křídelních morf závislá na délce dne?