Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Statistické testy •z náhodného výběru vyvozuji závěry ohledně základního souboru •často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.

Podobné prezentace


Prezentace na téma: "Statistické testy •z náhodného výběru vyvozuji závěry ohledně základního souboru •často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného."— Transkript prezentace:

1 statistické testy •z náhodného výběru vyvozuji závěry ohledně základního souboru •často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného výběru a teoretickou střední hodnotu, počty pozorované a očekávané atd.

2 liší se hmotnost samic a samců? •mám hypotézu H: m f ≠ m m –předpokládám, že se liší •hypotézu nemůžu potvrdit (verifikovat) → zkusím zamítnout (falzifikovat) nulovou hypotézu H 0 : m f = m m –mají stejnou hmotnost pokud ji zamítnu, přijmu opačnou alternativní hypotézu H A (tu moji původní) •průměr m f, m m se téměř určitě bude lišit. Bude se lišit tak, abych mohl zamítnout H 0 ?

3 statistické testy •z dat spočítám testovou statistiku, která má známé teoretické rozdělení (t, F,  2, U….) •lze určit, jakou hodnotu bude testová statistika mít, pokud platí H 0 •na základě stupňů volnosti (d.f., s.v. – z počtu nezávislých pozorování) stanovím, jestli odchylky jsou jen dílem náhody - p

4 statistické testy •definuji si hladinu významnosti α – pravděpodobnost, že zamítnu H 0 ačkoli platí – chyba prvního druhu •většinou 5 % (= 0.05) •pokud spočítané p je menší než α – zamítám H 0 a tím „přijímám“ H A

5 statistické testy •jako výsledek statistického testu uvádím –hodnotu testové statistiky (t, F,  2, U…..) –stupně volnosti (degrees of freedom – d.f., s.v.) –dosažená hladina významnosti (p) •t = 3.414, d.f. = 28, p = •t (28) = 3.414, p = •t 28 = 3.414, p =

6 Studentův t-test

7 •testuji, zda můj výběr má střední hodnotu shodnou s danou hodnotou – jednovýběrový t- test (H 0 : μ = k) –dlouhodobá průměrná denní teplota v červnu je rovna 17.5 °C. Byla letos stejná? •testuji, zda dva náhodné výběry (nezávislé) pochází ze stejného základního souboru (mají stejnou střední hodnotu) – dvouvýběrový t-test (H 0 : μ A = μ B ) –hmotnost samic a samců,…. •testuji, zda rozdíl párových hodnot (závislých) je roven dané hodnotě (větš. 0) - párový t-test (H 0 : μ 1 - μ 2 = 0) –hmotnost před a po zásahu, délka pravé a levé nohy,….

8 Studentův t-test •předpoklad použití: –normalita dat •pracuji s průměry, pokud mám dostatek dat, tak se rozdělení blíží normálnímu (centrální limitní věta) •pokud mám dat málo, většinou nemůžu zamítnout že data nepochází z normálního rozdělení •ne kategoriální či ordinální stupnice! –shodnost variancí – ale různé modifikace

9 Příklad: •měřím zadní stehno bruslařky a chci porovnat, jestli se liší samci a samice •chci zjistit, jestli se liší znalosti (= počet bodů v testu) žáků 2 gymnázií •měřím střevle ve dvou řekách a chci zjistit, jestli jsou stejně velké  dvouvýběrový t-test

10 Příklad: •měřím zadní stehno bruslařky a chci porovnat, jestli se liší levé a pravé •chci zjistit, jestli se liší znalosti (= počet bodů v testu) žáků před a po prázdninách / přednášce •vážím lidi (myši) před a po snězení 0.1 kg cukru – je změna 0.1 kg?  párový t-test

11 formální provedení •chci ukázat: střevle z povodí Stropnice jsou jinak velké než střevle z povodí Černé (musím zdůvodnit proč!) •formuluji hypotézu: H 0 : Výběry naměřených délek střevlí pochází z jednoho základního souboru (průměry se neliší) •alternativní hypotéza: H A : Výběry naměřených délek střevlí z povodí Stropnice i Černé nepochází z jednoho základního souboru (= střevle obou povodí jsou různě velké) •provedu testování, jak moc je pravděpodobné že oba výběry pochází ze stejného souboru •pokud je pravděpodobnost malá (p < 0.05), zamítnu H 0 a akceptuji H A •pokud je p > 0.05, nemůžu zamítnout H 0 (ale ani H A !)

12

13 dvouvýběrový t-test •rovnají se rozptyly? •shodnost rozptylů testuji F-testem (H 0 : s 2 1 = s 2 2 ) •pokud p větší než 0.05 – nemůžu zamítnout H 0  rozptyly se rovnají (asi) •pokud p menší než 0.05 – můžu zamítnout H 0  rozptyly se nerovnají (asi)

14 Excel vyžaduje, aby data s větším rozptylem byla zadána jako první!!!

15 stupně volnosti hodnota t odpovídající p: -jednostranného testu -dvoustranného testu

16 test jednostranný a dvoustranný •testuji zda A se liší od B (H 0 : A=B) – dvoustranný •testuji zda A je menší / větší než B (H 0 : A≤B) - jednostranný

17 výsledek •Průměrná velikost střevlí z povodí Stropnice a Černé se signifikantně liší (t (33) = -2.61, p = 0.013) •dobré je i uvést výsledek F-testu: Po nezamítnutí homogenity variancí (F(15,18) = 1.429, p = 0.466)….. •formálně – zamítám H 0 o shodnosti velikostí střevlí z obou povodí….

18 chyby statistických testů testu zamítnu H 0 nezamítnu H 0 H 0 platí (např. A=B) chyba 1. druhusprávně H 0 neplatí (např. A≠B) správněchyba 2. druhu realita rozhodnutí pravděpodobnost chyby je α = hladina významnosti pravděpodobnost chyby je β = neznáme

19 Grafické vyjádření •pro znázornění t-testu je vhodný krabicový graf

20 krabicový graf •v Excelu problém

21 krabicový graf •v Excelu problém •doplněk do Excelu: er_Setup.zip er_Setup.zip

22 Statistica •data se zadávají odlišně •každý sloupec je jedna proměnná •u t-testu je jedna kategoriální proměnná (zde povodí) a jedna kvantitativní (zde délka)

23

24 dvouvýběrový t-test, data ve sloupci pod sebou dvouvýběrový t-test, data ve sloupcích vedle sebe (jako v Excelu) párový t-test, data ve sloupcích vedle sebe (jako v Excelu) jednovýběrový t-test na střední hodnotu

25

26 výsledek testů se ukládá v samostatném souboru

27 další výsledky, grafy apod.


Stáhnout ppt "Statistické testy •z náhodného výběru vyvozuji závěry ohledně základního souboru •často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného."

Podobné prezentace


Reklamy Google