Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Testování statistických hypotéz
Neparametrické metody
Testování parametrických hypotéz
Statistika Ing. Jan Popelka, Ph.D. odborný asistent
Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)
A5M33IZS – Informační a znalostní systémy Testování modelů.
Testování hypotéz Distribuce náhodných proměnných
Testování statistických hypotéz
Statistické metody v ochraně kulturního dědictví
Odhady parametrů základního souboru
Test dobré shody 2 test.
F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Analýza variance (Analysis of variance)
t-rozdělení, jeho použití
Testování hypotéz přednáška.
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
také Gaussovo rozdělení (normal or Gaussian distribution)
Testování statistických hypotéz
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám.
Odhady parametrů základního souboru
Inference jako statistický proces 1
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Odhady odhady bodové a intervalové odhady
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
základní principy a použití
Další spojitá rozdělení pravděpodobnosti
Analýza variance (ANOVA).
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Pohled z ptačí perspektivy
Samostatný úkol: Jednovýběrový t-test Dvouvýběrový nepárový t-test
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
8. Kontingenční tabulky a χ2 test
Normální rozdělení a ověření normality dat
Biostatistika 8. přednáška
T - testy Párový t - test Má se zjistit, zda se sjíždějí přední pravé pneumatiky stejně jako přední levé pneumatiky. Bylo vybráno 6 vozů stejné značky:
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Mann-Whitney U-test Wilcoxonův test Znaménkový test
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
Odhady odhady bodové a intervalové odhady
Biostatistika Opakování – základy testování hypotéz
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Testování hypotéz párový test
Induktivní statistika
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
Induktivní statistika
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Odhady parametrů základního souboru
Induktivní statistika
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
Samostatný úkol: Jednovýběrový t-test Dvouvýběrový nepárový t-test
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Základy statistiky.
Testování hypotéz - pojmy
Transkript prezentace:

statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného výběru a teoretickou střední hodnotu, počty pozorované a očekávané atd.

liší se hmotnost samic a samců? mám hypotézu H: mf ≠ mm předpokládám, že se liší hypotézu nemůžu potvrdit (verifikovat) → zkusím zamítnout (falzifikovat) nulovou hypotézu H0: mf = mm mají stejnou hmotnost pokud ji zamítnu, přijmu opačnou alternativní hypotézu HA (tu moji původní) průměr mf, mm se téměř určitě bude lišit. Bude se lišit tak, abych mohl zamítnout H0?

statistické testy z dat spočítám testovou statistiku, která má známé teoretické rozdělení (t, F, 2, U….) lze určit, jakou hodnotu bude testová statistika mít, pokud platí H0 na základě stupňů volnosti (d.f., s.v. – z počtu nezávislých pozorování) stanovím, jestli odchylky jsou jen dílem náhody - p

statistické testy definuji si hladinu významnosti α – pravděpodobnost, že zamítnu H0 ačkoli platí – chyba prvního druhu většinou 5 % (= 0.05) pokud spočítané p je menší než α – zamítám H0 a tím „přijímám“ HA

statistické testy jako výsledek statistického testu uvádím hodnotu testové statistiky (t, F, 2, U…..) stupně volnosti (degrees of freedom – d.f., s.v.) dosažená hladina významnosti (p) t = 3.414, d.f. = 28, p = 0.0215 t (28) = 3.414, p = 0.0215 t28 = 3.414, p = 0.0215

Studentův t-test

testuji, zda můj výběr má střední hodnotu shodnou s danou hodnotou – jednovýběrový t-test (H0: μ = k) dlouhodobá průměrná denní teplota v červnu je rovna 17.5 °C. Byla letos stejná? testuji, zda dva náhodné výběry (nezávislé) pochází ze stejného základního souboru (mají stejnou střední hodnotu) – dvouvýběrový t-test (H0: μA = μB) hmotnost samic a samců,…. testuji, zda rozdíl párových hodnot (závislých) je roven dané hodnotě (větš. 0) - párový t-test (H0: μ1- μ2 = 0) hmotnost před a po zásahu, délka pravé a levé nohy,….

Studentův t-test předpoklad použití: normalita dat pracuji s průměry, pokud mám dostatek dat, tak se rozdělení blíží normálnímu (centrální limitní věta) pokud mám dat málo, většinou nemůžu zamítnout že data nepochází z normálního rozdělení ne kategoriální či ordinální stupnice! shodnost variancí – ale různé modifikace

Příklad: měřím zadní stehno bruslařky a chci porovnat, jestli se liší samci a samice chci zjistit, jestli se liší znalosti (= počet bodů v testu) žáků 2 gymnázií měřím střevle ve dvou řekách a chci zjistit, jestli jsou stejně velké  dvouvýběrový t-test

Příklad: měřím zadní stehno bruslařky a chci porovnat, jestli se liší levé a pravé chci zjistit, jestli se liší znalosti (= počet bodů v testu) žáků před a po prázdninách / přednášce vážím lidi (myši) před a po snězení 0.1 kg cukru – je změna 0.1 kg?  párový t-test

formální provedení chci ukázat: střevle z povodí Stropnice jsou jinak velké než střevle z povodí Černé (musím zdůvodnit proč!) formuluji hypotézu: H0: Výběry naměřených délek střevlí pochází z jednoho základního souboru (průměry se neliší) alternativní hypotéza: HA: Výběry naměřených délek střevlí z povodí Stropnice i Černé nepochází z jednoho základního souboru (= střevle obou povodí jsou různě velké) provedu testování, jak moc je pravděpodobné že oba výběry pochází ze stejného souboru pokud je pravděpodobnost malá (p < 0.05), zamítnu H0 a akceptuji HA pokud je p > 0.05, nemůžu zamítnout H0 (ale ani HA!)

dvouvýběrový t-test rovnají se rozptyly? shodnost rozptylů testuji F-testem (H0: s21 = s22) pokud p větší než 0.05 – nemůžu zamítnout H0  rozptyly se rovnají (asi) pokud p menší než 0.05 – můžu zamítnout H0  rozptyly se nerovnají (asi)

Excel vyžaduje, aby data s větším rozptylem byla zadána jako první!!!

hodnota t odpovídající p: jednostranného testu dvoustranného testu stupně volnosti

test jednostranný a dvoustranný testuji zda A se liší od B (H0: A=B) – dvoustranný testuji zda A je menší / větší než B (H0: A≤B) - jednostranný

výsledek Průměrná velikost střevlí z povodí Stropnice a Černé se signifikantně liší (t (33) = -2.61, p = 0.013) dobré je i uvést výsledek F-testu: Po nezamítnutí homogenity variancí (F(15,18) = 1.429, p = 0.466)….. formálně – zamítám H0 o shodnosti velikostí střevlí z obou povodí….

chyby statistických testů testu pravděpodobnost chyby je α = hladina významnosti rozhodnutí zamítnu H0 nezamítnu H0 H0 platí (např. A=B) chyba 1. druhu správně H0 neplatí (např. A≠B) chyba 2. druhu realita pravděpodobnost chyby je β = neznáme

Grafické vyjádření pro znázornění t-testu je vhodný krabicový graf

krabicový graf v Excelu problém

krabicový graf v Excelu problém doplněk do Excelu: http://peltiertech.com/Excel/Zips/PTS_Box_Charter_Setup.zip

Statistica data se zadávají odlišně každý sloupec je jedna proměnná u t-testu je jedna kategoriální proměnná (zde povodí) a jedna kvantitativní (zde délka)

dvouvýběrový t-test, data ve sloupci pod sebou dvouvýběrový t-test, data ve sloupcích vedle sebe (jako v Excelu) párový t-test, data ve sloupcích vedle sebe (jako v Excelu) jednovýběrový t-test na střední hodnotu

výsledek testů se ukládá v samostatném souboru

další výsledky, grafy apod.