Biostatistika 5. přednáška Aneta Hybšová

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

kvantitativních znaků
Testování parametrických hypotéz
Testování hypotéz Jana Zvárová
Testování neparametrických hypotéz
Testování hypotéz.
Testování statistických hypotéz
Statistické metody v ochraně kulturního dědictví
Cvičení 6 – 25. října 2010 Heteroskedasticita
ZPRACOVÁVÁME KVANTITATIVNÍ DATA II.
Testování hypotéz (ordinální data)
Obecný postup při testování souborů
Testování hypotéz přednáška.
Princip testování hypotéz, c2 testy.
Testování hypotéz vymezení důležitých pojmů
MUDr. Michal Jurajda, PhD. ÚPF LF MU
Testování statistických hypotéz
Biostatistika 9. přednáška Aneta Hybšová
Biostatistika 10. přednáška
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Ringier ČR - Výzkumné oddělení
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
základní principy a použití
Biostatistika 6. přednáška
Biostatistika 7. přednáška
Test dobré shody Fisherův přesný test McNemar test
Biostatistika 4. přednáška
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Pohled z ptačí perspektivy
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Princip testování hypotéz, c2 testy.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Biostatistika 1. přednáška Aneta Hybšová
PSY717 – statistická analýza dat
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
Aplikovaná statistika 2. Veronika Svobodová
1. cvičení
Mann-Whitney U-test Wilcoxonův test Znaménkový test
HYPOTÉZY „Hypotéza není ničím jiným než podmíněným výrokem o vztazích mezi dvěma nebo více proměnnými. Na rozdíl od problému, který je formulován v.
Zpracování dat z kvantitativního výzkumu. Na základní škole se uskutečnil výzkum, kde se měřila hmotnost žáků 8.tříd. Výzkumu se účastnilo 33 žáků. Byly.
Měření v sociálních vědách „Měřit všechno, co je měřitelné, a snažit se učitnit měřitelným vše, co dosud měřitelné není“. (Galileo Galilei)
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Princip testování hypotéz,  2 testy. Příklad. V dané populaci nejsme schopni v daném okamžiku zjistit počet samců a samic. Předpokládá se (= je teoreticky.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
… jsou bohatší lidé šťastnější?
INDUKTIVNÍ STATISTIKA
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Test dobré shody Fisherův přesný test McNemar test
Neparametrické testy parametrické a neparametrické testy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Neparametrické testy parametrické a neparametrické testy
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

Biostatistika 5. přednáška Aneta Hybšová

Náplň kurzu 1. Úvod do biostatistiky. Význam biostatistiky v biologii a v učitelství. Biostatistický znak, náhodná veličina. 2. Analýza jednorozměrných biostatistických dat, četnosti, střední hodnota, charakteristiky variability, grafické zobrazení. Grafy, tabulky. 3. Vícerozměrná biostatistická data. Základní a výběrový soubor v biostatistice. 4. Testování hypotéz v biostatistice, vybrané parametrické a neparametrické testy, testovací kritérium, kritická hodnota. T-testy, F-test, Mann-Whitneyův pořadový test, Wilcoxonův test, znaménkový test. 5. Měření závislosti mezi kvantitativními a kvalitativními proměnnými (jednoduchá a vícenásobná regresní a korelační analýza, jednorozměrná analýza rozptylu, analýzy v kontingenčních tabulkách). Pearsonův koeficient, Spearmanův koeficient pořadové korelace. 6. Obecný postup analýzy biostatistických dat. Prezentace biostatických výstupů. 7. Úvod do vícerozměrných metod. Analýza rozptylu, Analýza kovariance, Analýza hlavních komponent, Faktorová analýza, Shluková analýza, Diskriminační analýza. 2

Tvrzení vs. Hypotéza  Tvrzení  Agresivita u dětí předškolního věku se vyskytuje častěji u dětí z neúplných rodin.  Chlapci dosahují lepších výsledků ve fyzice než dívky.  Hypotéza  Četnost projevů agresivity je vyšší u dětí, které vyrůstají v neúplné rodině.  Průměrný počet bodů v testu z fyziky je u chlapců vyšší než u dívek. 3

Komparativní experiment  porovnání dvou a více skupin  muži vs. ženy – kalorický příjem  žáci s BOV vs. žáci s frontální výukou  pacienti léčení standardně vs. pacienti léčeni novým lékem  stanovení hypotézy H0 = nulová hypotéza  jednoznačné tvrzení  vyjadřuje vztah mezi proměnnými (pohlaví, kalorický příjem)  lze empiricky ověřit  obvykle tvrdí, že neexistuje rozdíl mezi skupinami  např. Muži mají stejný kalorický příjem než ženy.  stanovení alternativní hypotézy H1  popírá H0  rozdíl mezi skupinami existuje 4

Testování hypotéz  hladina významnosti α  pravděpodobnost, že nesprávně odmítneme nulovou hypotézu  standardně 0,05 (0,01 ; 0,001)  kritická hodnota  hodnota, která rozděluje kritický obor a obor přijetí (kvantil)  zpravidla hledáme v tabulkách  testové kritérium  hodnota, podle níž určujeme výsledek testu  pokud spadá do oboru přijetí pak H0 nezamítáme  spočítáme jej 5

Výsledek testování 1) srovnáním vypočteného testového kritéria s kritickou hodnotou, která se určuje v závislosti na zvolené hladině významnosti α. Jestliže hodnota vypočtené testovací statistiky překročí kritickou hodnotu, znamená to, že existuje evidence pro zamítnutí nulové hypotézy (tzn. „že jsme potvrdili rozdíl“). 2) pomocí p hodnoty – vypočtená pomocí software a) Jestliže p-hodnota je menší než hladina významnosti α, zamítáme H0 b) Jestliže je p-hodnota větší než hladina významnosti α (chyba α), nulovou hypotézu H 0 nemůžeme zamítnout a tedy předpokládáme, že platí. 6

Statistické metody pro analýzu nominálních dat 1. Chí kvadrát test dobré shody 2. Test nezávislosti chí kvadrát pro kontingenční tabulku 3. Fischerův test (kombinatorický) 7

1. Chí kvadrát test dobré shody  zkoumá, zda existuje souvislost mezi dvěma jevy, resp. nominálními proměnnými  H0: mezi skupinami není rozdíl  ověřujeme, zda četnosti, které byly získány měřením se liší od očekávaných četností  vychází z absolutních četností  Očekáváná četnost – četnost při platnosti H0  hrací kostka 8

1. Chí kvadrát test dobré shody - předpoklad  očekávané četnosti jsou větší než 5  80% očekávaných četností je větších než 5 9

1. Chí kvadrát test dobré shody - příklad  Skupina 90 žáků ZŠ odpovídala na otázku: Který z vyučovacích předmětů máš nejraději? A) matematika B) fyzika C) chemie  Rozhodněte zda mezi oblibou předmětů existuje statisticky významný rozdíl. 10

Postup: 1)Stanovení očekávaných četností O 2)Počet stupňů volnosti 3)Stanovení kritické hodnoty 4)Výpočet chí-kvadrát testového kritéria 5)Porovnání kritické hodnoty a testového kritéria 11

1. Chí kvadrát test dobré shody - příklad Předmět Pozorovaná četnost P Očekávaná četnost O P-O(P-O) O Matematika ,833 Fyzika ,133 Chemie ,3 Součet ,266  testové kritérium je 1,266  stupně volnosti 2 (počet řádků – 1)  hladina významnosti 0,05  kritická hodnota (tabelovaná) 5,99 – přijímáme H0  Výsledky lze připsat působení náhody. Obliba předmětů je stejná. 12

Příklad 2 - Zmrzlina  Řetězec cukráren, který nabízí 4 druhy zmrzliny otevřel provozovnu v nové lokalitě. Ve stávajících provozovnách řetězce byla dosud struktura prodeje podle druhů zmrzliny následující: vanilková 62%, čokoládová 18%, jahodová 12%, pistáciová 8%. Po otevření provozovny v nové lokalitě máme záznam o následujícím prodeji: vanilková 120, čokoládová 40 jahodová 18, pistáciová 22.  Vyjádřete se pomocí statistického testu ke shodě či odlišnosti struktury prodeje v nové lokalitě oproti dosavadním prodejům řetězce. 13

Příklad 2 - Zmrzlina zmrzlinastruktura prodejenová provozovnaoč.při stejné struktuřechi-kvadrát vanilková62% ,13 čokoládová18%40360,44 jahodová12%18241,5 pistáciová8%22162,25  100%200 4,32 - počet stupňů volnosti hladina významnosti – 0,05 Spočtená hodnota testového kritéria (4,32) nepřekračuje mez vymezující kritický obor (7,81), nachází se v oboru přijetí a na zvolené 5%ní hladině významnosti hypotézu o shodě struktury prodeje nezamítáme. 14

2. Test nezávislosti chí kvadrát pro kontingenční tabulku  existuje souvislost mezi dvěma jevy, resp. nominálními proměnnými?  H0: skupiny jsou shodné  PŘEDPOKLAD  80% očekávaných četností nad 5 15

Příklad 4  400 náhodně vybraných studentů odpovědělo na dvě otázky:  Byl jste v loňském roce ubytován na kolejích? ANO - NE  Jaký je Váš průměrný studijní průměr?  A) lepší než 1,6  B) 1,6-2,1  C) horší než 2,1 Rozhodněte zda existuje vztah mezi průměrnou známkou a bydlením na kolejích. 16

 H0: Mezi četnostmi na obě uvedené otázky není závislost.  H1: Mezi četnostmi na obě uvedené otázky je závislost. 17

 počet stupňů volnosti (r-1)*(s-1) = 2  kritická hodnota (2) = 5,991 alfa 0,05  prokázána rozdílnost mezi empirickými a očekávanými četnostmi = souvislost mezi znaky 18

Příklad 5 - Platy  Příjmy obyvatelstva závisí na dosaženém vzdělání. Počítejte na 1% hladině významnosti. 19

Příklad 5 - Výsledek  kritická hodnota (8) je 15,507 pro alfa 0,01  testové kritérium 73,29  prokázán statisticky významný rozdíl 20

Příklad na doma  Celkem bylo sledováno 54 semenáčků o stejné výchozí velikosti na sekané louce a 68 semenáčků na pasené louce. Za měsíc zbylo 12 semenáčků na sekané louce a 8 semenáčků na pasené louce.  Liší se přežívání semenáčků zkoumané trávy na louce sekané a pasené? 21