Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Testování neparametrických hypotéz. Neparemetrické hypotézy Hypotézy o vlastnostech populace (typ rozdělení, závislosti, …)

Podobné prezentace


Prezentace na téma: "Testování neparametrických hypotéz. Neparemetrické hypotézy Hypotézy o vlastnostech populace (typ rozdělení, závislosti, …)"— Transkript prezentace:

1 Testování neparametrických hypotéz

2 Neparemetrické hypotézy Hypotézy o vlastnostech populace (typ rozdělení, závislosti, …)

3 Testy dobré shody (testy o shodě mezi výb. a teoret. rozdělením) Χ 2 – test dobré shody Kolmogorovův – Smirnovův test pro jeden výběr

4 Χ 2 – test dobré shody Volba H 0 a)H 0 : Výběr pochází z populace, v níž jsou relativní četnosti jednotlivých variant rovny číslům, populace musí být roztříditelná podle nějakého znaku do k skupin. b)H 0 : Výběr pochází z rozdělení určitého typu, jehož parametry jsou dány (úplně specifikovaný model). c)H 0 : Výběr pochází z rozdělení určitého typu, přičemž neověřujeme informace o parametrech rozdělení, parametry modelu odhadujeme (neúplně specifikovaný model).

5 Χ 2 – test dobré shody Volba testové statistiky n … rozsah výběru k … počet variant h … počet odhadovaných parametrů modelu n i … empirické četnosti jednotlivých variant π 0,i … očekávané rel. četnosti jednotlivých variant

6 Χ 2 – test dobré shody Předpoklad testu Očekávané četnosti musí být větší než 5 (alespoň 80% očekávaných četností musí být větších než 5)

7 Χ 2 – test dobré shody Výpočet p – value

8 Příklady Litschmannová M., Statistika I. – cvičení, Testování neparam. hypotéz: Testování neparam. hypotéz:

9 Kolmogorovův-Smirnovův test pro jeden výběr Používá se pro ověření hypotézy, zda pořízený výběr pochází z rozdělení se spojitou distribuční funkcí F(x). F(x) musí být úplně specifikovaná.

10 Kolmogorovův-Smirnovův test pro jeden výběr Výhody oproti X 2 -testu dobré shody: větší síla testu nemá omezující podmínky (lze použít při výběrech malého rozsahu) vychází z jednotlivých pozorování a nikoliv z údajů setříděných do skupin

11 Kolmogorovův-Smirnovův test pro jeden výběr H 0 a H A : H 0 : H A : Testová statistika:

12 Kolmogorovův-Smirnovův test pro jeden výběr DnDn

13 Nulové rozdělení: Speciální rozdělení pro tento test, kvantily tabelovány – viz. Tab. 5Tab. 5 Výpočet p-value

14 Příklady Litschmannová M., Statistika I. – cvičení, Testování neparam. hypotéz: Testování neparam. hypotéz: 12.4

15 Testy v kontingenční tabulce

16 X 2 -test nezávislosti v kontingenční tabulce (Testování závislosti dvou kategoriálních proměnných)

17 Co je to kontingenční tabulka? Dvourozměrná tabulka četností, z jejichž hodnot můžeme usoudit na závislost či nezávislost mezi dvěma kategoriálními proměnnými

18 Grafický výstup pro analýzu závislosti dvou kategoriálních proměnných Shlukový sloupcový graf Kumulativní sloupcový graf Mozaikový graf 100% skládaný pruhový graf (Lze použít k explorační analýze závislosti)

19 Shlukový sloupcový graf (Statgraphics)

20 Shlukový sloupcový graf (Excel)

21 Kumulativní sloupcový graf (Excel)

22 Mozaikový graf (Statgraphics)

23 100% skládaný pruhový graf (Excel)

24 Pojmy: Pozorované (empirické) četnosti O ij (Observed frequency) – zjištěné sdružené četnosti Očekávané (teoretické) četnosti E ij (Expected frequency) – sdružené četnosti očekávané za předpokladu nezávislosti proměnných (aneb platí-li H 0 ) Odchylky, rezidua (Deviation) – rozdíly mezi očekávanými a pozorovanými četnostmi = E ij -O ij

25 Chí-kvadrát test nezávislosti v kontingenční tabulce Ideální případ nezávislosti O ij =E ij aneb O ij -E ij =0 i=1, …, m; j=1, …, n

26 H 0 a H A : H 0 : Proměnné v kontingenční tabulce jsou nezávislé. H A : Proměnné v kontingenční tabulce jsou závislé. Testová statistika (Pearsonova statistika chí-kvadrát): m … počet řádků kont. tabulky n … počet sloupců kont. tabulky Chí-kvadrát test nezávislosti v kontingenční tabulce

27 Předpoklady testu: Žádná očekávaná četnost nesmí klesnout pod 2 Alespoň 80% četností musí být větších než 5 Výpočet p-value

28 Rozšířená kontingenční tabulka IntenzivníStandardníCelkem Vysvětlivky Nezletilý % 63% 155,5 21,5 3, % 46% 120,5 -21,5 3,8 276 Empirické četnosti E ij Řádkové rel. četnosti Sloupcové rel. četnosti Očekávané četnosti O ij Odchylky (E ij -O ij ) (E ij -O ij ) 2 /O ij Zletilý % 37% 124,5 -21,5 3, % 54% 96,5 21,5 4,8 221 Empirické četnosti E ij Řádkové rel.četnosti Sloupcové rel. četnosti Očekávané četnosti O ij Odchylky (E ij -O ij ) (E ij -O ij ) 2 /O ij Celkem

29 Příklady Litschmannová M., Statistika I. – cvičení, Testování neparam. hypotéz: Testování neparam. hypotéz: 12.5

30 Yatesova korekce Lze provést v případě, kdy nejsou splněny předpoklady chí-kvadrát testu nezávislosti (extrémně nízké očekávané četnosti). Snižuje pravděpodobnost chyby I. druhu, tím však snižuje sílu testu. Testová statistika (Pearsonova statistika chí-kvadrát): m, n … počet řádků (sloupců) kont. tabulky Výpočet p-value:

31 Fisherův exaktní test Užívá se v případě extrémně nízkých očekávaných četností. Lze použít pouze pro čtyřpolní tabulky. Určují se pravděpodobnosti výskytu všech možných obměn četností v kontingenční tabulce, které dávají stejné marginální četnosti jako tabulka zjištěných četností…

32 McNemarův test Pouze pro čtyřpolní tabulky. Test shody rozdělení pro závislé alternativní proměnné se stejnými kódy. Nulová a alternativní hypotéza: H 0 : Procenta „úspěšností“ jsou u obou veličin stejná. H A : Procenta „úspěšností“ nejsou u obou veličin stejná. Testové kritérium: Předpoklad testu: Výpočet p-value:

33 Příklady Litschmannová M., Statistika I. – cvičení, Testování neparam. hypotéz: Testování neparam. hypotéz: 12.6


Stáhnout ppt "Testování neparametrických hypotéz. Neparemetrické hypotézy Hypotézy o vlastnostech populace (typ rozdělení, závislosti, …)"

Podobné prezentace


Reklamy Google