Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Dvojrozměrné (vícerozměrné) statistické soubory Karel Mach.

Podobné prezentace


Prezentace na téma: "Dvojrozměrné (vícerozměrné) statistické soubory Karel Mach."— Transkript prezentace:

1 Dvojrozměrné (vícerozměrné) statistické soubory Karel Mach

2 U jedné statistické jednotky – prvku zjišťujeme hodnoty dvou nebo více znaků; příklad: Dosud: sledován pouze na vlastnost – jednorozměrný(é) statistické soubory; příklad:

3 1.) závislosti – funkční (pevné) 1.) závislosti – funkční (pevné) Určité hodnotě nezávisle proměnné odpovídá vždy jedna konkrétní vlastnost závisle proměnné 2.) závislosti – volné (statistické, stochastické) 2.) závislosti – volné (statistické, stochastické) ; vazba mezi příčinou a následkem má pravděpodobnostní charakter U obou typů závislosti se může jednat o  a) závislost jednostrannou  a) závislost jednostrannou – jednoznačně lze určit příčinu a účinek (následek), tzn. nezávisle a závisle proměnné  b) závislost oboustrannou  b) závislost oboustrannou – nelze jednostranně určit příčinu a následek, postavení závisle a nezávisle proměnné, možno prohodit

4 Příklady závislostí 1) funkční s  např. volný pád0,6  s=1/2 g*t 2 =5t 2 0,4  s…délka dráhy0,2  t…čas 1 2 3 4 5 t

5 2) Stochastické (statistické): a)nelineární regresní křivky

6 b) Lineární regresní přímky kladnázáporná

7 Statistická nezávislost

8

9 Základní údaje o obvodu hrudníku (x, v cm) a živé hmotnosti (y, v kg) pro stanovení korelačního a obou regresních koeficientů Býci ČESTR, 9 měsíců - věk Poř.č. xyx-xy-y(x-x) 2 (y-y) 2 (x-x)*(y-y) 1150284-3-229484+66 2154297+1-9181-9 3152330+241576-24 4152305 11+1 5162333+9+2781729+243 102150283-3-23952969 Σ1560631212--1668(B)55600(C)6672(A)

10 n = 102; Σx = 15606 cm; Σy = 31212 kg; x = 153 cm(obvod hrudníku);y = 306 kg (živ.hmotn.) A = Σ / (x-x) * (y-y) / = 6672 (kovariance) B = Σ (x-x) 2 = 1668 (variance x) C = Σ (y-y) 2 = 55600 (variance y)

11 Rozmezí koeficientu korelace (r) Význam! Na co je třeba brát zřetel! -1 -0,5 0+0,5 +1

12 r – mezi obvodem hrudníku a živou hmotností byla zjištěna kladná závislost vyjádřená korelačním koeficientem 0,69; b y/x – při zvýšení obvodu hrudníku u plemenných býčků (v 9. měsíci věku) v průměru o 1 cm, zvýší se jejich živá hmotnost v průměru o 4 kg b x/y – při zvýšení obvodu hrudníku u plemenných býčků (v 9. měsíci věku) v průměru o 1 cm, zvýší se jejich obvod hrudníku v průměru o 0,12 cm Výpočet korelačního, regresních koeficientů není úplně přesný, k určité chybě ve výpočtu dochází v souvislosti s početností a representativností zpracovaného výběru. Měřítkem chyby je střední chyba korelačního koeficientu (s r ) a střední chyby koeficientů regresních s by/x; s bx/y

13

14 Tyto střední chyby (vzorce a dosažené údaje našeho příkladu) počítáme následujícím způsobem: Střední chyba je jedním z měřítek průkaznosti vypočteného koeficientu. Jestliže dvojnásobek (lépe, když ani trojnásobek) střední chyby nedosahuje příslušného koeficientu, lze tento korelační, případně regresní koeficient považovat za průkazný. Tab. Minimální hodnoty koeficientu korelace (testace průkaznosti)

15 Koeficient pořadové korelace R (Spermanův koeficient korelace) V praktickém příkladě budeme zjišťovat hodnotu R pro % obsah tuku v mléce krav mezi prvou a druhou laktací. Potřebné údaje pro výpočet udává následující tabulka. Dosazením hodnoty Σ d 2 = 156,5 a počtu pozorování (n = 13) do uvedeného vzorce dostáváme:

16 Tab. Údaje o tučnosti mléka (v %) za prvou a druhou laktaci sloužící pro výpočet koeficientu pořadové korelace Číslo krav n=13 TučnostPořadíd=x-yd 2 (Σd 2 =156,5) 1.laktace x 2.laktace y 1.Laktace x 2.Laktace y 13,804,00781 24,154,01109+11 34,184,1911121 43,913,6992+749 53,883,9286,5+1,52,25 63,733,6341+39 73,793,8964+24 84,284,8212131 93,423,7813-24 104,344,091310+39 113,763,9256,5-1,52,25 123,704,15311-864 133,653,9025-39

17 Regresní přímky – jejich rovnice Vraťme se k příkladu, ve kterém jsme sledovali u plemenných býčků vztah mezi obvodem hrudníku (x) a jejich živou hmotností (y); x = 153 cm b y/x = 4 kg y = 306 kg b x/y = 0,12 cm a sestavme rovnice obou regresních přímek: závisle proměnná y (živá hmotnost) závisle proměnná x (obvod hrudníku) b = b y/x = 4 b = b x/y = 0,12 a = y – bxa = x – by = 306 – 4*153 = - 306 = 153 – 0,12*306 = 116,28 ŷ = a + bx = -306 + 4*xx = a + by = 116,28 + 0,12*y x = 155 cmy = 314 kg ŷ = -306 + 4*155 = 314 kgx = 116,28 + 0,12*314 = 153,96 cm

18 Pomocí těchto vypočtených hodnot vyneseme v bodovém poli 0 xy obě statistické regresní přímky. Tyto přímky se protínají v průměrných hodnotách znaku x a y, úhel, který spolu svírají vyjadřuje výši korelačního koeficientu ( v našem případě r = 0,69). Hodnotě r = 1 odpovídá splývání regresních přímek s úhlem 0° (funkční závislost, která je extrémním případem závislosti statistické), nulová korelace je charakterizována úhlem 90°.

19 Vynesení regresních přímek do osy souřadnic 0xy x = a + by = 116,28 + 0,12 ŷ = a + bx = -306 + 4x y kg 314 y = 306 282 0147 150,12 x = 153 153,96 155x cm

20 Poznámka ke grafickému znázornění stochastické závislosti pomocí sdružených regresních přímek a................................... ……úsek osy regresní přímky b (regresní koeficient)...........směrnice regresní přímky Součet rozdílu teoretických a skutečných (empirických) hodnot, tzn. vzdáleností jednotlivých průsečíků xy a regresní přímky je vždy = 0; platí pro jakoukoli přímku v ose souřadnic 0xy. Pouze pro dvě přímky však platí tzv. kriterium nejmenších čtverců: součet čtverců odchylek (vzdáleností) mezi jednotlivými průsečíky xy a regresní přímkou je nejmenší. Pro x = a + by se jedná o součet čtverců délky úseček mezi průsečíky xy jednotlivých náhodných proměnných x a y a regresní přímkou, přičemž uvažované úsečky jsou rovnoběžné s osou x. Pro: ŷ = a + bx.......................úsečky jsou rovnoběžné s osou y.

21

22 x = a + bya = x – byb = b x/y y i = a + bxa = y – bxb = b y/x yy0xxyy0xx

23 Malý úhel...vysoká korelace Velký úhel...nízká korelace Míru korelace lze vyčíst z úhlu, který tvoří obě regresní přímky: čím ostřejší úhel, tím vyšší korelace.

24 Děkuji za pozornost!!!


Stáhnout ppt "Dvojrozměrné (vícerozměrné) statistické soubory Karel Mach."

Podobné prezentace


Reklamy Google