kvantitativních znaků

Slides:



Advertisements
Podobné prezentace
“Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky.”
Advertisements

Použité statistické metody
Odhady parametrů základního souboru
Hodnocení způsobilosti měřících systémů
Cvičení 6 – 25. října 2010 Heteroskedasticita
Lineární regresní analýza Úvod od problému
Analýza variance (Analysis of variance)
Testování závislosti kvalitativních znaků
Metody zkoumání ekonomických jevů
Úvod do regresní analýzy
Regresní analýza a korelační analýza
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Porovnání průměrů více než dvou normálních rozdělení
Testování hypotéz (ordinální data)
DATA  INFORMACE Statistická analýza je založena na zhušťování informace – tj. jak s co nejmenšího množství vhodně zvolených údajů vytěžit maximum relevantních.
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
kvantitativních znaků
Základy ekonometrie Cvičení září 2010.
Biostatistika 9. přednáška Aneta Hybšová
Řízení a supervize v sociálních a zdravotnických organizacích
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Regrese Aproximace metodou nejmenších čtverců
Biostatistika 5. přednáška Aneta Hybšová
Statistika Zkoumání závislostí
Charakteristiky variability
Závislost Vzájemný vztah dvou veličin
Lineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Biostatistika 6. přednáška
Lineární regrese kalibrační přímky
Biostatistika 7. přednáška
Teorie psychodiagnostiky a psychometrie
Základy ekonometrie 4EK211
Normální rozdělení a ověření normality dat
2.1.1 Kvadratická funkce. Kvadratická funkce se nazývá každá funkce, daná ve tvaru kde je reálné číslo různé od nuly, jsou libovolná reálná čísla. Definičním.
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Základy statistiky Autor: Jana Buršová.
Korelace.
Biostatistika 1. přednáška Aneta Hybšová
PSY717 – statistická analýza dat
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Molekulová fyzika 3. přednáška „Statistický přístup jako jediná funkční strategie kinetické teorie“
Aplikovaná statistika 2. Veronika Svobodová
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
IV..
Vzájemná poloha Paraboly a přímky
Aplikovaná statistika 2.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Základy zpracování geologických dat R. Čopjaková.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Dvojrozměrné (vícerozměrné) statistické soubory Karel Mach.
… jsou bohatší lidé šťastnější?
Metody zkoumání závislosti numerických proměnných
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
Popisná analýza v programu Statistica
INDUKTIVNÍ STATISTIKA
2.1.1 Kvadratická funkce.
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Marie Budíková, Štěpán Mikoláš Katedra aplikované matematiky
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
Statistika a výpočetní technika
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Transkript prezentace:

kvantitativních znaků Hodnocení závislosti kvantitativních znaků

Jednorozměrná statistika – hodnocení 1 znaku (proměnné) v různých souborech (ZS, VS); vzájemné porovnání souborů Vícerozměrná statistika – závislost mezi 2 a více znaky v jednom souboru; vyjádření a popis vzájemného vztahu mezi proměnnými

Vztahy mezi 2 proměnnými (obecně): Funkční závislost (matematika, fyzika) - každé číselné hodnotě jednoho znaku (proměnné xi) odpovídá 1 přesná hodnota znaku druhého (proměnná yi) Přesný popis rovnicí (vzorcem) – např. vztah mezi poloměrem kruhu a jeho obvodem, plochou. yi (2r) Pevný příčinný vztah, neovlivněný náhodou (závislá p.- následek) xi (r) (nezávislá p.- příčina)

Korelační (statistická) závislost (biologie, medicína) - jedné číselné hodnotě prvního znaku (proměnné xi) odpovídá celá řada náhodných hodnot znaku druhého (proměnná yi) Volná závislost – změna 1.znaku vyvolá změnu 2.znaku jen s určitou pravděpodobností (znaky spolu korelují). (spojení celého komplexu různých příčin a následků, včetně náhodných vlivů.) (bodový diagram) yi (hmotnost) xi (výška)

Popis a charakteristika korelační závislosti v biologii: Odhadování nejbližší funkční závislosti (ke které se korelační závislost blíží) - aproximace Funkční závislost vyjádříme rovnicí.

Typy funkčních závislostí: Lineární závislost: y = kx +q k – směrnice přímky (=tg  ; sklon přímky) q – posun přímky na ose y +k +q -q -k 

Kvadratická (parabolická) závislost: y = ax2+bx +c Hyperbolická závislost:

Odhadování nejvýstižnější funkční závislosti pro korelační vztah: Bodový diagram - podle charakteru rozložení bodů: a) lineární závislost b) nelineární závislost A) Lineární korelace Empirická křivka: pro opakované měření v bodě xi získáme několik hodnot yi (zjistíme jejich průměr)

(empirická křivka - VS) yi (empirická křivka - VS) xi Empirická křivka – popisuje závislost na úrovni VS (odhad skutečné závislosti)

korelační dvojice (xi ; yi) Aproximace – zjištění teoretické přímky: (výpočet koeficientů přímky y=kx + q: regresní analýza) VS: n- počet členů korelační dvojice (xi ; yi) (kvalitativní stránka závislosti: vlastnosti přímky – sklon, posun)

(teoretická přímka - ZS) Výpočet 2 bodů pro sestrojení přímky: - zvolíme x1  y1 = kx1 + q - zvolíme x2  y2 = kx2 + q yi y2 (teoretická přímka - ZS) y1 xi x1 x2

r = -1; +1 Korelační analýza – zjištění těsnosti vztahu: (výpočet korelačního koeficientu: r) („parametrická korelace“ ) r – kvantitativně vyjadřuje sílu závislosti (rozptýlení bodů v bodovém diagramu) r = -1; +1

r = 0 r <0 r >0 r =+1 r = -1 Přímá závislost nepřímá závislost závislost úplná (funkční) r = -1 závislost úplná (funkční)

Významnost korelačního koeficientu Testujeme hypotézu nezávislosti pomocí t-testu: Test.kritérium: Střední chyba korelačního koeficientu:  = n-2 Porovnáme s tab.krit. hodnotou Studentova rozdělení t1-/2() :

Významnost korel.koeficientu souvisí s rozsahem VS: Pokud t  t1-/2()  zamítáme hypotézu nezávislosti X a Y (r je statisticky významný) Pokud t  t1-/2()  platí hypotéza nezávislosti X a Y (r je statisticky nevýznamný) Významnost korel.koeficientu souvisí s rozsahem VS: - čím větší je n souboru, tím větší je významnost r (při stejné velikosti).

B) Nelineární korelace Bodový diagram: Namáhavost výpočtů nelineárních regresních rovnic  řešení pomocí počítače Stat. SW – polynomiální regrese (křivky různého tvaru) Např. polynom 4.řádu: y=ax4 +bx3 +cx2 +dx +e – Spearmanův koeficient pořadové korelace (neparametrický – nevyžaduje normalitu dat)

Kvalitativní znaky barva, tvar, výskyt anomálie, onemocnění, úhyn apod. (charakterizované četnostmi výskytu v souboru) ne – empirická (pozorovaná) četnost znaku ve VS no – očekávaná (teoretická) četnost znaku v ZS Výpočty: testování rozdílu četností mezi soubory zjišťování závislosti kvalitativních znaků

2 – test (test shody četností) m – počet kvalitativních tříd ve VS (varianty znaku) Je-li  2 > 2krit.  významný rozdíl mezi ne a no (při zvolené ) Je-li 2   2krit.  nevýznamný rozdíl mezi ne a no Použití: porovnání četnosti onemocnění ve VS se statistickou nemocností porovnání výskytu onemocnění ve 2 a více VS zjišťování závislosti kvalitativních znaků

Test rozdílu empirické a teoretické četnosti (VS x ZS) VS: n=146 ZS: p=4,5% (0,045) enteritis: 13 ne: 13 (N) 133 (Z) no : p. n= 0,045.146= 6,57 (N) (1- p). n= 0,955.146= 139,43 (Z) 2 krit.0,05 = 3,841  2 krit.0,01 = 6,635 Významnost: p<0,05

Test rozdílu 2(a více) empirických četností (VSxVS) Porovnání několika skupin empirických četností mezi sebou Každá skupina: několik kvalitativních tříd Př.: při vyšetření masa srnčí zvěře na parazitární napadení byl sledován počet pozitivních a negativních vzorků ze 3 lokalit (A,B,C) v republice. Liší se lokality?

3 skupiny– k (i) 2 třídy– m (j) Negativní Pozitivní A 96 25 B 121 22 C 89 16 Skup  (si) 121 143 105 (100,34) (20,66) (118,59) (24,41) (87,07) (17,93) Tř.  (tj) 306 63 369(n) ne – empirické četn. noij no – teoretické četn.

Vypočteme testovací kritérium: Počet stupňů volnosti:  = (k-1).(m-1)=2 Tabulková kritická hodnota:  20,05(2)=5,99 2   2krit.  rozdíl mezi pozorovanými četnostmi je stat. nevýznamný (p>0,05) Závěr.: výskyt parazitárního napadení srnčí zvěře se v lokalitách A, B a C významně neliší.