Dvojrozměrné (vícerozměrné) statistické soubory Karel Mach.

Slides:



Advertisements
Podobné prezentace
Statistika.
Advertisements

Lineární funkce - příklady
kvantitativních znaků
Lineární funkce a její vlastnosti
Rovnice roviny Normálový tvar rovnice roviny
Odhady parametrů základního souboru
Hodnocení způsobilosti měřících systémů
Cvičení 6 – 25. října 2010 Heteroskedasticita
Lineární regresní analýza Úvod od problému
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
Testování závislosti kvalitativních znaků
Funkce.
Regresní analýza a korelační analýza
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Testování hypotéz (ordinální data)
Statistika Vypracoval: Mgr. Lukáš Bičík
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
kvantitativních znaků
Základy ekonometrie Cvičení září 2010.
Řízení a supervize v sociálních a zdravotnických organizacích
Lineární regrese.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Statistika Zkoumání závislostí
Závislost Vzájemný vztah dvou veličin
Lineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Biostatistika 6. přednáška
Lineární regrese kalibrační přímky
Biostatistika 7. přednáška
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Experimentální fyzika I. 2
Teorie psychodiagnostiky a psychometrie
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
Korelace.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Hustota pravděpodobnosti – případ dvou proměnných
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
Aplikovaná statistika 2. Veronika Svobodová
Aplikovaná statistika 2.
REGRESNÍ ANALÝZA Vysoká škola technická a ekonomická v Českých Budějovicích Institute of Technology And Business In České Budějovice.
Funkce, funkční závislosti Lineární funkce. Obsah: Definice funkce Grafické znázornění funkce Konstantní funkce Lineární funkce Vlastnosti lineárních.
Základy zpracování geologických dat R. Čopjaková.
Funkce Lineární funkce a její vlastnosti 2. Funkce − definice Funkce je předpis, který každému číslu z definičního oboru, který je podmnožinou množiny.
Elektronické učební materiály - II. stupeň Matematika Autor: Mgr. Radek Martinák FUNKCE – lineární Co znamená lineární? Jak souvisí lineární funkce s přímou.
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
Jednovýběrový a párový t - test
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Funkce Pojem funkce Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem.
Homogenita meteorologických pozorování
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
Opakovatelnost (koeficient opakovatelnosti) Korelace genetická, prostřeďová a fenotypová Karel Mach.
Homogenita meteorologických pozorování
Základy zpracování geologických dat Rozdělení pravděpodobnosti
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Funkce Pojem funkce Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem.
Homogenita meteorologických pozorování
Parciální korelace Regresní analýza
Lineární funkce a její vlastnosti
DEFINICE FUNKCE Název školy: Základní škola Karla Klíče Hostinné
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
Lineární regrese.
Grafy kvadratických funkcí
Soustava dvou lineárních rovnic se dvěma neznámými
Grafy kvadratických funkcí
Transkript prezentace:

Dvojrozměrné (vícerozměrné) statistické soubory Karel Mach

U jedné statistické jednotky – prvku zjišťujeme hodnoty dvou nebo více znaků; příklad: Dosud: sledován pouze na vlastnost – jednorozměrný(é) statistické soubory; příklad:

1.) závislosti – funkční (pevné) 1.) závislosti – funkční (pevné) Určité hodnotě nezávisle proměnné odpovídá vždy jedna konkrétní vlastnost závisle proměnné 2.) závislosti – volné (statistické, stochastické) 2.) závislosti – volné (statistické, stochastické) ; vazba mezi příčinou a následkem má pravděpodobnostní charakter U obou typů závislosti se může jednat o  a) závislost jednostrannou  a) závislost jednostrannou – jednoznačně lze určit příčinu a účinek (následek), tzn. nezávisle a závisle proměnné  b) závislost oboustrannou  b) závislost oboustrannou – nelze jednostranně určit příčinu a následek, postavení závisle a nezávisle proměnné, možno prohodit

Příklady závislostí 1) funkční s  např. volný pád0,6  s=1/2 g*t 2 =5t 2 0,4  s…délka dráhy0,2  t…čas t

2) Stochastické (statistické): a)nelineární regresní křivky

b) Lineární regresní přímky kladnázáporná

Statistická nezávislost

Základní údaje o obvodu hrudníku (x, v cm) a živé hmotnosti (y, v kg) pro stanovení korelačního a obou regresních koeficientů Býci ČESTR, 9 měsíců - věk Poř.č. xyx-xy-y(x-x) 2 (y-y) 2 (x-x)*(y-y) Σ (B)55600(C)6672(A)

n = 102; Σx = cm; Σy = kg; x = 153 cm(obvod hrudníku);y = 306 kg (živ.hmotn.) A = Σ / (x-x) * (y-y) / = 6672 (kovariance) B = Σ (x-x) 2 = 1668 (variance x) C = Σ (y-y) 2 = (variance y)

Rozmezí koeficientu korelace (r) Význam! Na co je třeba brát zřetel! -1 -0,5 0+0,5 +1

r – mezi obvodem hrudníku a živou hmotností byla zjištěna kladná závislost vyjádřená korelačním koeficientem 0,69; b y/x – při zvýšení obvodu hrudníku u plemenných býčků (v 9. měsíci věku) v průměru o 1 cm, zvýší se jejich živá hmotnost v průměru o 4 kg b x/y – při zvýšení obvodu hrudníku u plemenných býčků (v 9. měsíci věku) v průměru o 1 cm, zvýší se jejich obvod hrudníku v průměru o 0,12 cm Výpočet korelačního, regresních koeficientů není úplně přesný, k určité chybě ve výpočtu dochází v souvislosti s početností a representativností zpracovaného výběru. Měřítkem chyby je střední chyba korelačního koeficientu (s r ) a střední chyby koeficientů regresních s by/x; s bx/y

Tyto střední chyby (vzorce a dosažené údaje našeho příkladu) počítáme následujícím způsobem: Střední chyba je jedním z měřítek průkaznosti vypočteného koeficientu. Jestliže dvojnásobek (lépe, když ani trojnásobek) střední chyby nedosahuje příslušného koeficientu, lze tento korelační, případně regresní koeficient považovat za průkazný. Tab. Minimální hodnoty koeficientu korelace (testace průkaznosti)

Koeficient pořadové korelace R (Spermanův koeficient korelace) V praktickém příkladě budeme zjišťovat hodnotu R pro % obsah tuku v mléce krav mezi prvou a druhou laktací. Potřebné údaje pro výpočet udává následující tabulka. Dosazením hodnoty Σ d 2 = 156,5 a počtu pozorování (n = 13) do uvedeného vzorce dostáváme:

Tab. Údaje o tučnosti mléka (v %) za prvou a druhou laktaci sloužící pro výpočet koeficientu pořadové korelace Číslo krav n=13 TučnostPořadíd=x-yd 2 (Σd 2 =156,5) 1.laktace x 2.laktace y 1.Laktace x 2.Laktace y 13,804, ,154, ,184, ,913, ,883,9286,5+1,52,25 63,733, ,793, ,284, ,423, ,344, ,763,9256,5-1,52,25 123,704, ,653,

Regresní přímky – jejich rovnice Vraťme se k příkladu, ve kterém jsme sledovali u plemenných býčků vztah mezi obvodem hrudníku (x) a jejich živou hmotností (y); x = 153 cm b y/x = 4 kg y = 306 kg b x/y = 0,12 cm a sestavme rovnice obou regresních přímek: závisle proměnná y (živá hmotnost) závisle proměnná x (obvod hrudníku) b = b y/x = 4 b = b x/y = 0,12 a = y – bxa = x – by = 306 – 4*153 = = 153 – 0,12*306 = 116,28 ŷ = a + bx = *xx = a + by = 116,28 + 0,12*y x = 155 cmy = 314 kg ŷ = *155 = 314 kgx = 116,28 + 0,12*314 = 153,96 cm

Pomocí těchto vypočtených hodnot vyneseme v bodovém poli 0 xy obě statistické regresní přímky. Tyto přímky se protínají v průměrných hodnotách znaku x a y, úhel, který spolu svírají vyjadřuje výši korelačního koeficientu ( v našem případě r = 0,69). Hodnotě r = 1 odpovídá splývání regresních přímek s úhlem 0° (funkční závislost, která je extrémním případem závislosti statistické), nulová korelace je charakterizována úhlem 90°.

Vynesení regresních přímek do osy souřadnic 0xy x = a + by = 116,28 + 0,12 ŷ = a + bx = x y kg 314 y = ,12 x = ,96 155x cm

Poznámka ke grafickému znázornění stochastické závislosti pomocí sdružených regresních přímek a ……úsek osy regresní přímky b (regresní koeficient) směrnice regresní přímky Součet rozdílu teoretických a skutečných (empirických) hodnot, tzn. vzdáleností jednotlivých průsečíků xy a regresní přímky je vždy = 0; platí pro jakoukoli přímku v ose souřadnic 0xy. Pouze pro dvě přímky však platí tzv. kriterium nejmenších čtverců: součet čtverců odchylek (vzdáleností) mezi jednotlivými průsečíky xy a regresní přímkou je nejmenší. Pro x = a + by se jedná o součet čtverců délky úseček mezi průsečíky xy jednotlivých náhodných proměnných x a y a regresní přímkou, přičemž uvažované úsečky jsou rovnoběžné s osou x. Pro: ŷ = a + bx úsečky jsou rovnoběžné s osou y.

x = a + bya = x – byb = b x/y y i = a + bxa = y – bxb = b y/x yy0xxyy0xx

Malý úhel...vysoká korelace Velký úhel...nízká korelace Míru korelace lze vyčíst z úhlu, který tvoří obě regresní přímky: čím ostřejší úhel, tím vyšší korelace.

Děkuji za pozornost!!!