Transformace v Anově. Předpoklady Anovy: normalita dat

Slides:



Advertisements
Podobné prezentace
Základní statistická analýza dat z pre- a klinických studií
Advertisements

Statistika.
Úvod do analýzy rozptylu
Neparametrické metody
Logaritmus a věty o logaritmech
Testování parametrických hypotéz
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Neparametrické metody a analýza rozptylu (lekce 3-7)
Jednovýběrové testy parametrickch hypotéz
Testování statistických hypotéz
Jednofaktorová ANOVA Jednofaktorová analýza rozptylu
F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Cvičení 6 – 25. října 2010 Heteroskedasticita
Lineární rovnice se dvěma neznámými
Analýza variance (Analysis of variance)
Statistika II Michal Jurajda.
Neparametrické testy Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek.
Testování hypotéz (ordinální data)
Popisná statistika - pokračování
také Gaussovo rozdělení (normal or Gaussian distribution)
T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám.
Odhady parametrů základního souboru
Inference jako statistický proces 1
Jaderná energie Jádra atomů.
Statistická analýza únavových zkoušek
Obecný lineární model Fitované hodnoty and regresní residuály
základní principy a použití
Lineární regresní analýza
Biostatistika 6. přednáška
Analýza variance (ANOVA).
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
Tabulky a grafy - jak je číst Seminář funkční gramotnosti 2012/2013 J. Poddaná.
V. Analýza rozptylu ANOVA.
Dvouvýběrový t-test 11 stejně starých selat bylo náhodně rozděleno do 2 skupin. První skupina byla krmena krmivem A, druhá krmivem B. Po 6 měsících byly.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
8. Kontingenční tabulky a χ2 test
T - testy Párový t - test Má se zjistit, zda se sjíždějí přední pravé pneumatiky stejně jako přední levé pneumatiky. Bylo vybráno 6 vozů stejné značky:
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
VY_32_INOVACE_21-16 STATISTIKA 2 Další prvky charakteristiky souboru.
1. cvičení
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Mann-Whitney U-test Wilcoxonův test Znaménkový test
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.
Analýza variance (ANOVA).
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Testování hypotéz párový test
Celá čísla Úvod. Porovnávání celých čísel..
Neparametrické testy parametrické a neparametrické testy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
Neparametrické testy parametrické a neparametrické testy
Odhady parametrů základního souboru
Normální rozdělení a ověření normality dat Modelová rozdělení
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
PERMUTACE BEZ OPAKOVÁNÍ
Parametrické testy Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek.
Neparametrické testy pro porovnání polohy
Střední škola obchodně technická s. r. o.
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Analýza kardinálních proměnných
Analýza variance (ANOVA).
7. Kontingenční tabulky a χ2 test
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Základy statistiky.
Transkript prezentace:

Transformace v Anově. Předpoklady Anovy: normalita dat homogenita variancí Porušení normality dat. Provedeme transformace do normálního rozdělení. Děláme pouze tehdy, když víme, že data nemají normální rozdělení. Na porušení normality není Anova příliš citlivá. Pokud ale lze data transformovat, je lépe použít transformaci. Procentuální data. Pokud jsou procenta v rozmezí 10% - 80%, není nutná transformace. Pokud se vyskytují data y do 10% nebo nad 80%, pak se provádí transformace: , kde 0 ≤ y ≤ 100.

Porušení homogenity variancí. Častý je lineární vztah mezi průměrem a směrodatnou odchylkou. Pokud označíme data y, pak používáme transformaci z = log (y). na typu logaritmu (přirozeném nebo dekadickém) nezáleží logaritmus je definován pouze pro kladné hodnoty. Pokud tedy y nejsou kladné, je nutno je transformovat do kladných hodnot. Příklad. min( y ) = - 50. Provedeme transformaci z = log( y + 51).

Neparametrické testy (neparametrické ekvivalenty Anovy). Kruskal Wallisův test (obdoba 1-faktorové Anovy) Friedmannův test (obdoba blokového uspořádání Anovy). Kruskal – Wallisův test. H0: všechny výběry pocházejí z téhož rozdělení Data se seřadí vzestupně, určí se pořadí. Příklad. 10 osob sledovalo reklamu firmy A a následně 10 osob reklamufirmy B. Svůj pocit označili známkou 0 – 10, 0 – ošklivé, 10 – úžasné. Liší se reakce na reklamu obou firem? Součet pořadí pro A je 80.5, pro B je 129.5  B více zaujme.

Friedmannův test. Je obdobou Anovy – znáhodnělých bloků. H0: všechny bloky pocházejí z téhož rozdělení. Předchozí příklad – osoba je blok. V každém bloku se data uspořádají zvlášť. Součet pořadí pro A je 11.5, pro B je 18.5  B více zaujme.