Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
ZveřejnilVojta Pospíšil
1
statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného výběru a teoretickou střední hodnotu, počty pozorované a očekávané atd.
2
liší se hmotnost samic a samců?
mám hypotézu H: mf ≠ mm předpokládám, že se liší hypotézu nemůžu potvrdit (verifikovat) → zkusím zamítnout (falzifikovat) nulovou hypotézu H0: mf = mm mají stejnou hmotnost pokud ji zamítnu, přijmu opačnou alternativní hypotézu HA (tu moji původní) průměr mf, mm se téměř určitě bude lišit. Bude se lišit tak, abych mohl zamítnout H0?
3
statistické testy z dat spočítám testovou statistiku, která má známé teoretické rozdělení (t, F, 2, U….) lze určit, jakou hodnotu bude testová statistika mít, pokud platí H0 na základě stupňů volnosti (d.f., s.v. – z počtu nezávislých pozorování) stanovím, jestli odchylky jsou jen dílem náhody - p
4
statistické testy definuji si hladinu významnosti α – pravděpodobnost, že zamítnu H0 ačkoli platí – chyba prvního druhu většinou 5 % (= 0.05) pokud spočítané p je menší než α – zamítám H0 a tím „přijímám“ HA
5
statistické testy jako výsledek statistického testu uvádím
hodnotu testové statistiky (t, F, 2, U…..) stupně volnosti (degrees of freedom – d.f., s.v.) dosažená hladina významnosti (p) t = 3.414, d.f. = 28, p = t (28) = 3.414, p = t28 = 3.414, p =
6
Studentův t-test
7
testuji, zda můj výběr má střední hodnotu shodnou s danou hodnotou – jednovýběrový t-test (H0: μ = k) dlouhodobá průměrná denní teplota v červnu je rovna 17.5 °C. Byla letos stejná? testuji, zda dva náhodné výběry (nezávislé) pochází ze stejného základního souboru (mají stejnou střední hodnotu) – dvouvýběrový t-test (H0: μA = μB) hmotnost samic a samců,…. testuji, zda rozdíl párových hodnot (závislých) je roven dané hodnotě (větš. 0) - párový t-test (H0: μ1- μ2 = 0) hmotnost před a po zásahu, délka pravé a levé nohy,….
8
Studentův t-test předpoklad použití: normalita dat
pracuji s průměry, pokud mám dostatek dat, tak se rozdělení blíží normálnímu (centrální limitní věta) pokud mám dat málo, většinou nemůžu zamítnout že data nepochází z normálního rozdělení ne kategoriální či ordinální stupnice! shodnost variancí – ale různé modifikace
9
Příklad: měřím zadní stehno bruslařky a chci porovnat, jestli se liší samci a samice chci zjistit, jestli se liší znalosti (= počet bodů v testu) žáků 2 gymnázií měřím střevle ve dvou řekách a chci zjistit, jestli jsou stejně velké dvouvýběrový t-test
10
Příklad: měřím zadní stehno bruslařky a chci porovnat, jestli se liší levé a pravé chci zjistit, jestli se liší znalosti (= počet bodů v testu) žáků před a po prázdninách / přednášce vážím lidi (myši) před a po snězení 0.1 kg cukru – je změna 0.1 kg? párový t-test
11
formální provedení chci ukázat: střevle z povodí Stropnice jsou jinak velké než střevle z povodí Černé (musím zdůvodnit proč!) formuluji hypotézu: H0: Výběry naměřených délek střevlí pochází z jednoho základního souboru (průměry se neliší) alternativní hypotéza: HA: Výběry naměřených délek střevlí z povodí Stropnice i Černé nepochází z jednoho základního souboru (= střevle obou povodí jsou různě velké) provedu testování, jak moc je pravděpodobné že oba výběry pochází ze stejného souboru pokud je pravděpodobnost malá (p < 0.05), zamítnu H0 a akceptuji HA pokud je p > 0.05, nemůžu zamítnout H0 (ale ani HA!)
13
dvouvýběrový t-test rovnají se rozptyly?
shodnost rozptylů testuji F-testem (H0: s21 = s22) pokud p větší než 0.05 – nemůžu zamítnout H0 rozptyly se rovnají (asi) pokud p menší než 0.05 – můžu zamítnout H0 rozptyly se nerovnají (asi)
14
Excel vyžaduje, aby data s větším rozptylem byla zadána jako první!!!
15
hodnota t odpovídající p: jednostranného testu dvoustranného testu stupně volnosti
16
test jednostranný a dvoustranný
testuji zda A se liší od B (H0: A=B) – dvoustranný testuji zda A je menší / větší než B (H0: A≤B) - jednostranný
17
výsledek Průměrná velikost střevlí z povodí Stropnice a Černé se signifikantně liší (t (33) = -2.61, p = 0.013) dobré je i uvést výsledek F-testu: Po nezamítnutí homogenity variancí (F(15,18) = 1.429, p = 0.466)….. formálně – zamítám H0 o shodnosti velikostí střevlí z obou povodí….
18
chyby statistických testů testu
pravděpodobnost chyby je α = hladina významnosti rozhodnutí zamítnu H0 nezamítnu H0 H0 platí (např. A=B) chyba 1. druhu správně H0 neplatí (např. A≠B) chyba 2. druhu realita pravděpodobnost chyby je β = neznáme
19
Grafické vyjádření pro znázornění t-testu je vhodný krabicový graf
20
krabicový graf v Excelu problém
21
krabicový graf v Excelu problém
doplněk do Excelu:
22
Statistica data se zadávají odlišně každý sloupec je jedna proměnná
u t-testu je jedna kategoriální proměnná (zde povodí) a jedna kvantitativní (zde délka)
24
dvouvýběrový t-test, data ve sloupci pod sebou
dvouvýběrový t-test, data ve sloupcích vedle sebe (jako v Excelu) párový t-test, data ve sloupcích vedle sebe (jako v Excelu) jednovýběrový t-test na střední hodnotu
26
výsledek testů se ukládá v samostatném souboru
27
další výsledky, grafy apod.
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.