Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Znaménkový test a χ 2 test Shrnutí statistických testů Kontingenční.

Podobné prezentace


Prezentace na téma: "Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Znaménkový test a χ 2 test Shrnutí statistických testů Kontingenční."— Transkript prezentace:

1 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Znaménkový test a χ 2 test Shrnutí statistických testů Kontingenční tabulky 8. Kontingenční tabulky a χ 2 test

2 Shrnutí statistických testů Typ srovnáníNulová hypotézaParametrický testNeparametrický test 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu. jednovýběrový t-test Wilcoxonův test; znaménkový test 2 skupiny dat nepárově Obě skupiny hodnot pochází ze stejného rozdělení. nepárový t-testMann-Whitneyův test 2 skupiny dat párově Zkoumaný efekt mezi páry hodnot je nulový. Párový t-test Wilcoxonův test; znaménkový test shoda rozdělení rozdělení dat ve skupině odpovídá teoretickému (vybranému) rozdělení. Shapiro-Wilkův test; Kolmogorovův- Smirnovův test; Lilieforsův test χ2 test, test dobré shody homoskedasticita (shoda rozptylů) rozptyl obou (všech) skupin je shodný. Levenův test více skupin nepárově Zkoumaný efekt mezi skupinami hodnot je nulový. ANOVAKruskal- Wallisův test korelace Neexistuje (příčinná, důsledková) vazba mezi skupinami hodnot. Pearsonův koeficient Spearmanův koeficient; Kendallův koeficient

3 Shrnutí statistických testů Jsou data normálně rozdělená? Lze použít transformaci? Kolik je skupin? Jsou data párová? Co chci spočítat ? Mají sku- piny stejný rozptyl? Nelze spočítat NE ANO 1 korelaci test shody 2 více Co chci spočítat ? Jedno- výběro- vý t-test Párový t-test Nelze spočítat Dvouvý běrový t-test Mann- Whitney U-test Sada Pears. kor. koef. ANOVA Kruskal - Wallisů v test Nelze spočítat Wilco- xonův test Spear- manův/ Kendallů v k. k. Wilco- xonův test Nelze spočítat Kuskal- Wallisů v test Pearso- nův kor. koef. ANO korelaci test shody NE korelaci ANONE test shody Jsou data párová? ANO NE Mají sku- piny stejný rozptyl? ANONE test shody Co chci spočítat ? korelaci Co chci spočítat ? Kolik je skupin? NE 1 korelaci test shody Co chci spočítat ? korelaci test shody Jsou data párová? 2 ANONE Jsou data párová? více Nelze spočítat Mann- Whitney U-test Co chci spočítat ? korelaci test shody Co chci spočítat ? ANO NE korelaci test shody Parametrické testy Kolomogorovův- Smirnovův test Shapiro-Wilkův test F test Levenův test Co chci spočítat ? korelaci log arcsin

4 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Statistické testování – základní pojmy Nulová hypotéza H 0 Alternativní hypotéza H A Testová statistika Kritický obor testové statistiky 0 T Pozorovaná hodnota – Očekávaná hodnota Variabilita dat Testová statistika = H 0 : sledovaný efekt je nulový H A : sledovaný efekt je různý mezi skupinami * Velikost vzorku Statistické testování odpovídá na otázku zda je pozorovaný rozdíl náhodný či nikoliv. K odpovědi na otázku je využit statistický model – testová statistika.

5 P-hodnota Významnost hypotézy hodnotíme dle získané tzv. p-hodnoty, která vyjadřuje pravděpodobnost, s jakou číselné realizace výběru podporují H 0, je-li pravdivá. P-hodnotu porovnáme s α (hladina významnosti, stanovujeme ji na 0,05, tzn., že připouštíme 5 % chybu testu, tedy, že zamítneme H 0, ačkoliv ve skutečnosti platí). P-hodnotu získáme při testování hypotéz ve statistickém softwaru. Je-li p-hodnota ≤ α, pak H 0 zamítáme na hladině významnosti α a přijímáme H A Je-li p-hodnota > α, pak H 0 nezamítáme na hladině významnosti α P-hodnota vyjadřuje pravděpodobnost za platnosti H 0, s níž bychom získali stejnou nebo extrémnější hodnotu testové statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita M. Cvanová

6 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Test dobré shody - základní teorie Testuje shodu reálné distribuce hodnot do n skupin s teoretickou distribucí. Předpokladem je, že velikost rozdílu mezi očekávaným a skutečným počtem hodnot v každé skupině je náhodně rozdělená → multinomické rozdělení. Součet druhých mocnin relativních rozdílů očekávaného a skutečného počtu hodnot má přibližně χ 2 rozdělení. χ 2 rozdělení pro kladné hodnoty (suma čtverců) se liší podle počtu stupňů volnosti k (počtu skupin) - se zvyšujícím se k přechází v normální rozdělení. pozorovaná četnost očekávaná četnost očekávaná četnost = 2 - ∑

7 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Test dobré shody - základní teorie pozorovaná četnost očekávaná četnost očekávaná četnost =+ 2 pozorovaná četnost očekávaná četnost očekávaná četnost 1. jev 2. jev …

8 Očekávané četnosti Vytvořil Institut biostatistiky a analýz, Masarykova univerzita M. Cvanová V případě platnosti nulové hypotézy je poměr mezi buňkami jednoho sloupce v různých řádcích nezávislý na výběru tohoto sloupce. V případě platnosti nulové hypotézy je poměr mezi buňkami jednoho řádku v různých sloupcích nezávislý na výběru tohoto řádku. Pokud tyto poměry normalizujeme, získáváme tabulku očekávaných četností. Řádkové a sloupcové součty se touto operací nemění. AnoNe  Ano Ne  AnoNe  Ano18,483,6102 Ne11,652,464  Pozorované četnostiOčekávané četnosti 102 × 30 / 166

9 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Test dobré shody - základní teorie Binomické jevy (1/0) pozorovaná četnost očekávaná četnost očekávaná četnost =+ 2 pozorovaná četnost očekávaná četnost očekávaná četnost I. jev 1 II. jev Příklad lidí hází mincí rub: případů (R) líc: případů (L) Lze výsledek považovat za statisticky významně odlišný (nebo neodlišný) od očekávaného poměru R : L = 1 : 1 ? Rozdíl je vysoce statisticky významný (p << 0,001] Tabulková hodnota:

10 Znaménkový test Zjednodušení neparametrického párového Wilcoxonova testu. Namísto velikosti rozdílů se počítá pouze jejich orientace (signum). Případy, kde sgn(d) = 0 se z analýzy vylučují. Sečtou se kladné a záporné rozdíly a menší ze součtů je hledaná statistika m. Statistika m se porovná s tabulkovou hodnotou pro danou hladinu pravděpodobnosti:

11 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Kontingenční tabulky H0 :Nezávislost dvou jevů A a B Kontingenční tabulka 2 x 2 +-  + ab - cd  suma sum B A

12 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Kontingenční tabulky: příklad AnoNe  Ano Ne  gen  Kontingenční tabulka v obrázku Gen: ANOGen: NE

13 Příklad – závislost pohlaví na onemocnění ZdravíNemocníCelkem Muži Ženy Celkem Vytvořil Institut biostatistiky a analýz, Masarykova univerzita M. Cvanová ZdravíNemocníCelkem Muži Ženy Celkem ZdravíNemocníCelkem Muži Ženy Celkem ZdravíNemocníCelkem Muži Ženy Celkem

14 Příklad – závislost pohlaví na onemocnění ZdravíNemocníCelkem Muži Ženy Celkem Vytvořil Institut biostatistiky a analýz, Masarykova univerzita M. Cvanová ZdravíNemocníCelkem Muži Ženy Celkem ZdravíNemocníCelkem Muži Ženy Celkem ZdravíNemocníCelkem Muži Ženy Celkem ZdravíNemocníCelkem Muži Ženy Celkem Očekávané hodnoty pro všechny tabulky vlevo Pozorované hodnoty pozorovaná četnost očekávaná četnost očekávaná četnost = 2 -

15 Příklad – závislost pohlaví na onemocnění ZdravíNemocníCelkem Muži Ženy Celkem Vytvořil Institut biostatistiky a analýz, Masarykova univerzita M. Cvanová ZdravíNemocníCelkem Muži Ženy Celkem ZdravíNemocníCelkem Muži Ženy Celkem ZdravíNemocníCelkem Muži Ženy Celkem Χ 2 = 0,0 p = 1,000 Χ 2 =2,0 p = 0,157 Χ 2 = 18,0 p < 0,0001 Χ 2 = 162,0 p < 0,0001

16 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Parametrická analýza rozptylu Post hoc testy Kruskal-Wallisův test Korelace Lineární regrese 9. Analýza rozptylu a korelace

17 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Anotace t-test slouží pro porovnání průměrů spojité proměnné ve dvou (diskrétních) skupinách. Analýza rozptylu (ANOVA) umožňuje totéž porovnání provést pro větší počet (diskrétních) skupin. Korelační analýza je využívána pro vyhodnocení míry vztahu dvou spojitých proměnných. Regresní analýza vytváří model vztahu dvou nebo více proměnných, tedy jakým způsobem jedna proměnná (vysvětlovaná) závisí na jiných proměnných (prediktorech). Regresní analýza je obdobně jako ANOVA nástrojem pro vysvětlení variability hodnocené proměnné. Existují rovněž neparametrické varianty t-testu a ANOVy.

18 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Analýza rozptylu - ANOVA Zobecnění dvouvýběrového t-testu ANOVA je základním nástrojem pro analýzu rozdílů mezi průměry v několika skupinách H 0 : všechny střední hodnoty jsou stejné H A : alespoň jedna dvojice středních hodnot se liší Předpoklady: normální rozložení ve skupinách, nezávislost skupin, shoda rozptylů (Levenův či Bartlettův test) Pokud H 0 zamítáme na hl. význ. α → nás zajímá, která dvojice středních hodnot se od sebe liší  metody mnohonásobného testování (tzv. post hoc testy), např. Scheffého, Tukeyova metoda

19 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Anotace Základní myšlenka, na níž je ANOVA založena, je rozdělení celkové variability v datech (neznámé, dané pouze náhodným rozložením) na část systematickou (spjatou s kategoriemi pacientů, vysvětlená variabilita) a část náhodnou. Pokud systematická, tedy nenáhodná a vysvětlitelná část variability převažuje, považujeme daný kategoriální faktor za významný pro vysvětlení variability dat. Analýza rozptylu vyhodnocuje pouze celkový vliv faktoru na variabilitu, v případě analýzy jednotlivých kategorií je třeba využít tzv. post-hoc testy

20 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Analýza rozptylu - ANOVA Základní technika sloužící k posouzení rozdílů mezi více úrovněmi pokusného zásahu Kontrola Koncentrace X1 Koncentrace X Koncentrace Xp Rostoucí koncentrace testované látky / látek Celkově významné změny v reakci biologického systému Vzájemné rozdíly účinku jednotlivých dávek Rozdíly účinku dávek od kontroly Koncentrace X2

21 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Analýza rozptylu - ANOVA Významné kroky analýzy, vedoucí k efektivnímu srovnání variant Rostoucí koncentrace testované látky / látek Splnění předpokladů analýzy Transformace dat Relevantnost kontroly (vliv vlastní aplikace látek) Vhodnost modelu ANOVA pro účely testu Vlastní srovnání variant Minimalizace chyb při ověřování hypotéz Kontrola Koncentrace X1 Koncentrace X3 Koncentrace Xp Koncentrace X2

22 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Analýza rozptylu - ANOVA ANOVA = parametrická analýza dat Předpoklad nezávislosti opakování experimentu Normalita rozložení v rámci pokusných variant Homogenita rozptylu v rámci pokusných variant SPLNĚNÍ PŘEDPOKLADŮ ANOVA JE NEZBYTNOU PODMÍNKOU POUŽITÍ TÉTO TECHNIKY ALTERNATIVOU JSOU NEPARAMETRICKÉ METODY

23 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Analýza rozptylu - ANOVA Předpoklady analýzy rozptylu jsou nezbytné pro dosažení síly testu Symetrické rozložení hodnot a normalita odchylek od hodnoceného modelu ANOVA. Velkou část dat lze adekvátně normalizovat použitím logaritmické transformace. Předpoklad lognormální transformace může pochopitelně být teoreticky vyloučen u mnoha datových souborů obsahujících diskrétní parametry, kde je indikována vhodnost jiného typu transformace. U asymetricky rozložených a u diskrétních dat je nutné využít neparametrické alternativy analýzy rozptylu. Homogenita rozptylu je nutným předpokladem pro smysluplnost vzájemných srovnání pokusných variant. U testů toxicity by splnění tohoto předpokladu mělo být ověřováno (Bartlettův test), neboť vážné rozdíly (až řádové) v jednotkách testovaného parametru mohou nastat v důsledku inhibice dávkami látky. Nehomogenita rozptylu je často ve vztahu k nenormalitě (asymetrii) dat a lze ji odstranit vhodnou normalizující transformací. Statistická nezávislost reziduí vyhodnocovaného modelu ANOVA. Pokud odhad a posouzení korelačních vztahů mezi pokusnými variantami není přímo předmětem výzkumu, lze jejich vliv na vyhodnocení odstranit znáhodněním dat v rámci pokusných variant - tedy změnou pořadí v náhodné. Rozsah vlivu těchto autokorelačních vztahů musí být ovšem primárně omezen správností experimentálního uspořádání. Aditivita jako předpoklad týkající se složitějších experimentálních uspořádání. Exaktní otestování aditivity více pokusných faktorů je procedura poměrně náročná na experimentální design vyvážený co do počtu opakování. Je rovněž obtížné testovat interakci na nestandardních datech, neboť případná transformace může změnit charakter odchylek původních dat od hodnoceného modelu ANOVA.

24 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Analýza rozptylu - ANOVA Omezení aplikace ANOVA lze řešit Chybějící data. Vážným problémem jsou chybějící údaje o celé skupině kombinací testovaných látek, například u faktoriálních pokusů, kdy je znemožněno hodnocení experimentu jako celku. Různé počty opakování Jde o typický jev pro experimentální datové soubory. Při různých počtech opakování v experimentálních variantách jsou testy ANOVA citlivější na nenormalitu dat. Pokud jsou počty opakování zcela odlišné (až řádové rozdíly), je nutno použít neparametrické techniky nebo analýzu rozptylu nevyvážených pokusů. Nehomogenita rozptylu. Velmi častý nedostatek experimentálních dat, často související s nenormalitou rozložení nebo s odlehlými hodnotami. Odlehlé hodnoty. Ojedinělé odlehlé hodnoty musí být před parametrickou analýzou rozptylu vyloučeny. Nedostatek nezávislosti mezi rezidui modelu. Jde o závažný nedostatek, zkreslující výsledek F-testu. Velmi často je tato skutečnost důsledkem špatného provedení nebo naplánování experimentu. Nenormalita dat. I v tomto případě lz situaci upravit vyloučením odlehlých hodnot nebo normalizující transformací. Neaditivita kombinovaného vlivu více pokusných zásahů. Tuto situaci lze testovat jednak speciálními testy aditivity nebo přímo F testem kontrolujícím významnost vlivu interakce pokusných zásahů. Při významné interakci je nutné prozkoumat především její charakter ve vhodném experimentálním uspořádání.

25 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Modely analýzy rozptylu Model I. Pevný model Model II. Náhodný model X0X X2X X3X X4X ABC DE X1X1 X0 X1 X2X3X4 Y A BCDE Y

26 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek ANOVA – základní výpočet Základním principem ANOVY je porovnání rozptylu připadajícího na:  Rozdělení dat do skupin (tzv. effect, variance between groups)  Variabilitu objektů uvnitř skupin (tzv. error, variance within groups), předpokládá se, že jde o náhodnou variabilitu (=error) 1.Variabilita mezi skupinami Rozptyl je počítán pro celkový průměr (tzv. grand mean) a průměry v jednotlivých skupinách dat Stupně volnosti jsou odvozeny od počtu skupin (= počet skupin -1) 2.Variabilita uvnitř skupin Rozptyl je počítán pro průměry jednotlivých skupin a objekty uvnitř příslušných, celková variabilita je pak sečtena pro všechny skupiny Stupně volnosti jsou odvozeny od počtu hodnot (= počet hodnot - počet skupin) Výsledný poměr (F) porovnáme s tabulkami F rozložení pro v 1 a v 2 stupňů volnosti SS=sum of squares

27 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Jednoduchý ANOVA design Nejjednodušším případem ANOVA designu je rozdělení na skupiny podle jednoho parametru.

28 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Nested ANOVA Rozdělení skupin na náhodné podskupiny (např. opakování experimentu), podskupiny jsou vždy v jedné skupině (ne kartézský součin). Cílem je zjistit, zda data v jedné skupině nejsou pouhou náhodou Nejprve je testována shoda podskupin v hlavních skupinách, pokud jsou shodné, je vše v pořádku pokud nejsou, stále lze zjišťovat, zda se variabilita uvnitř hlavních skupin liší od celkové variability

29 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Two way ANOVA Pro rozdělení do kategorií je zde více parametrů (možné jsou všechny varianty kartézského součinu). Na rozdíl od nested ANOVY nejde o náhodná opakování experimentu, ale o řízené zásahy (např.vliv pH a koncentrace O 2 ) Kromě vlivu hlavních faktorů se uplatňuje i jejich interakce

30 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Modely analýzy rozptylu - základní výstup Základním výstupem analýzy rozptylu je Tabulka ANOVA - frakcionace komponent rozptylu Zdroj rozptylu Pok. zásah (mezi skupinami) Uvnitř skupin Celkem SS B /SS T MS B /MS T St. v. a -1 SS B SS B /(a -1) MS B /MS E N - a SS E SS E /(N - a) N -1 SS T SSMSF Kvantifikovaný podíl rozdílu mezi pokusnými zásahy na celkovém rozptylu Statistická významnost rozdílu

31 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Analýza rozptylu - obecný F test obecný F test H 0 : m 1 = m 2 = m 3 =.... = m p Kontrola Koncentrace X 1 Koncentrace X Koncentrace X p F test: H 0 Koncentrace X 2 Látka nepůsobí H 0 neplatí Látka působí Další analýzy H 0 platí

32 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Analýza rozptylu - Testy kontrastů ANOVA:H 0 zamítnuta Testy kontrastů Kontrola Koncentrace X 1 Koncentrace X 3 Koncentrace X p Koncentrace X 2 Rozdíly v smysluplných kombinacích ? Testování kontrastů "Multiple range testy" ParametrickéNeparametrické Plánované Neplánované Pro srovnání variant s kontrolou

33 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Příklad: Anova - One way Dávka rostlinného stimulátoru (0, 4, 8, 12 mg/l) A = 4 ; n = 8 I. ANOVA Bartlett's test: P = 0,9847 K-S test: P = 0, ,6525 pro jednotlivé kategorie Source D. f. SS MS F Between Groups 3 305,8 101,9 8,56 Within Groups ,2 11,9 Total (corr.) ,0 II. Multiple Range Test NKS -test Level Average Homogenous Groups 0 34,8 x 4 41,4 x 12 41,8 x 8 52,6 x

34 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Srovnání variant v testech Srovnáváni variant po celkovém testu ANOVA Mnoho existujících algoritmů není vhodných pro konkrétní případ Day and Quin Ecological Monographs,1989 TestVyužitíPoznámka Dunnett Williams Srovnání s kontrolou Ex. i modifikace pro různá n. ANOVA testy (F) Orthogonální kontrasty Plánovaná srovnání Ryan Q test Jednoduché kontrasty Vyhodnocen jako nejlepší test Testy pro jednoduché kontrasty ScheffeTukey LSD Bonferroni Dunn- Sidák Kramer Duncan Student - Newmann-Keuls Waller-Duncan k ratio Testy nevhodné

35 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Řada post-hoc testů v různých SW

36 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek ANCOVA Rozšíření ANOVA Současná analýza kategoriálních a spojitých prediktorů Testování hypotézy paralelismu regresních vztahů Spojitý prediktor Hodnocená proměnná kategorie Spojitý prediktor Hodnocená proměnná kategorie Kategorie pacientů (pokusný zásah) neovlivňuje vztah proměnných Kategorie pacientů (pokusný zásah) ovlivňuje vztah proměnných

37 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Korelace a regrese Korelační analýza je využívána pro vyhodnocení míry vztahu dvou spojitých proměnných. Obdobně jako jiné statistické metody, i korelace mohou být parametrické nebo neparametrické Regresní analýza vytváří model vztahu dvou nebo více proměnných, tedy jakým způsobem jedna proměnná (vysvětlovaná) závisí na jiných proměnných (prediktorech). Regresní analýza je obdobně jako ANOVA nástrojem pro vysvětlení variability hodnocené proměnné

38 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Korelace K měření těsnosti lineárního vztahu 2 spojitých proměnných r = 0 → nekorelované r > 0 → kladně korelované r < 0 → záporně korelované H 0 : proměnné X, Y jsou stochasticky nezávislé náhodné veličiny (r = 0) H A : proměnné X, Y nejsou stochasticky nezávislé náhodné veličiny (r ≠ 0) Parametrický korelační koeficient: Pearsonův kor. koef. (dvourozměrné normální rozložení) Neparametrické korelační koeficienty: Spearmanův (pořadový) kor. koef., Kendallovo tau.

39 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Jednoduchá lineární regrese V případě existence vzájemného vztahu (korelace) lze tento vztah podrobněji popsat. Cíl regresní analýzy: popsat závislost hodnot proměnné Y na hodnotách proměnné X. V případě lineární regrese je tento popis dán lineárním modelem tvaru y = ax + b. Existují i techniky nelineární regrese. Nemáme-li dostatek informací k teoretickému souboru, snažíme se odhadnout typ funkce pomocí dvourozměrného diagramu.

40 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy korelační analýzy - I. Korelace – vztah (závislost) dvou znaků (parametrů) Y2Y2 X1X1 Y 2 X 1 Y2Y2 X1X1 ANONE ANOab NEcd X1X1 X2X2

41 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy korelační analýzy - II. Parametrické míry korelace Kovariance Pearsonův koeficient korelace x-- y Y2Y2 X1X1 r = 1 r = -1

42 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy korelační analýzy - III. P I (zem) P I (rostl.) I. II.

43 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy korelační analýzy - IV. Srovnání dvou korelačních koeficientů (r) 1.2. Krevní tlak x koncentrace kysl. radikálů 7,461 >> 1,96 => P << 0,01

44 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy korelační analýzy - V. Neparametrická korelace (rs) P I v půdě P I v rostl dIdI i = 1, ….. n; n = 8 => v = 6 P = 0,358 Pacient č Lékař Lékař dIdI

45 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Korelace v grafech I. Y X Y X Vztahy velmi často implikují funkční vztah mezi Y a X. Y = a + b. X Y = a + b 1. X 1 + b 2. X 2 + b 3. X 3 Y = a + b 1. X 1 + b 2. X 2 Y = a + b 1. X 1 + b 2. X 2 + b 3. X 1. X 2

46 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Korelace v grafech II. Problém rozložení hodnotProblém typu modelu X Y X r = 0,981 (p < 0,001) r = 0,761 (p < 0,032) Y Problém velikosti vzorku Y X Y X r = 0,891 (p < 0,214) r = 0,212 (p < 0,008)


Stáhnout ppt "Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Znaménkový test a χ 2 test Shrnutí statistických testů Kontingenční."

Podobné prezentace


Reklamy Google