Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0

Slides:



Advertisements
Podobné prezentace
ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Advertisements

Korelace a regrese Karel Zvára 1.
kvantitativních znaků
Funkce.
Testování statistických hypotéz
Rovnice roviny Normálový tvar rovnice roviny
Cvičení 6 – 25. října 2010 Heteroskedasticita
4EK211 Základy ekonometrie Autokorelace Cvičení /
Lineární regresní analýza Úvod od problému
Analýza variance (Analysis of variance)
Úvod do regresní analýzy
Regresní analýza a korelační analýza
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
kvantitativních znaků
Základy ekonometrie Cvičení září 2010.
Základy ekonometrie Cvičení října 2010.
Řízení a supervize v sociálních a zdravotnických organizacích
Základy ekonometrie Cvičení 3 4. října 2010.
Exponenciální funkce Körtvelyová Adéla G8..
VLASTNOSTI MOTORICKÝCH TESTŮ Oddělení antropomotoriky, rekreologie a metodologie Katedra kinantropologie, humanitních věd a managementu sportu © 2009 FTVS.
Kvadratická funkce. Co je to funkce Každému prvku x z definičního oboru je přiřazeno právě jedno číslo y z oboru hodnot x je nezávisle proměnná y je závisle.
Lineární regrese.
Lineární lomená funkce
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Statistika Zkoumání závislostí
Korelace a elaborace aneb úvod do vztahů proměnných
Lineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Závislost dvou kvantitativních proměnných
Lineární regrese kalibrační přímky
Analýza variance (ANOVA).
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Experimentální fyzika I. 2
V. Analýza rozptylu ANOVA.
Přesnost a spolehlivost v účelových sítích Bc. Jindřich Poledňák.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie psychodiagnostiky a psychometrie
2. Vybrané základní pojmy matematické statistiky
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Korelace.
Repetitorium z matematiky Podzim 2012 Ivana Medková
Úvod do praktické fyziky Seminář pro I.ročník F J. Englich, ZS 2003/04.
Aplikovaná statistika 2. Veronika Svobodová
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
IV..
Základy zpracování geologických dat R. Čopjaková.
Dvojrozměrné (vícerozměrné) statistické soubory Karel Mach.
Funkce Lineární funkce a její vlastnosti 2. Funkce − definice Funkce je předpis, který každému číslu z definičního oboru, který je podmnožinou množiny.
Elektronické učební materiály - II. stupeň Matematika Autor: Mgr. Radek Martinák FUNKCE – lineární Co znamená lineární? Jak souvisí lineární funkce s přímou.
A. Soustavy lineárních rovnic. y = 2x + 5 2x – y = -5 a 1 x 1 + a 2 x 2 = b a 1 = 2 a 2 = -1 b = - 5 x + y = 5 3x + 3y = 18 x + y = 5 3x + 3y = 15 x +
Metody zkoumání závislosti numerických proměnných
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Cvičení V této kapitole můžete procvičit probrané téma. Jednotlivá cvičení obsahují správné řešení s postupem. Po zobrazení zadání se dalším(dalšími) kliknutím(kliknutími)
Homogenita meteorologických pozorování
t-test Počítání t-testu t statistika Měření velikosti efektu
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Parciální korelace Regresní analýza
Lineární funkce a její vlastnosti
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
Plánování přesnosti měření v IG Úvod – základní nástroje TCHAVP
Lineární regrese.
Medián, modus Medián Pro medián náhodné veličiny x platí: Modus
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
Transkript prezentace:

Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0 přímka je klesající

r > 0 přímka je rostoucí Vztah mezi x a y není lineární ALE Korelaci měřit lze  přímku lze proložit vždy

Korelační koeficient r 0 ≤ r ≤ 1  lineární vazba je rostoucí -1 ≤ r ≤ 0  lineární vazba je klesající r ~ ± 1  lineární vztah je velmi těsný  lineární vztah mezi proměnnými r ~ 0  není lieární vztah mezi proměnnými. Může být jiná funkční závislost. Pro výpočet korelačního koeficientu nemusíme vědět, která proměnná je závislá a která je nezávislá. Testuje se těsnost lineární vazby: H0: r = 0 H1: r ≠ 0

Lineární regrese. Minimalizuje se součet čtverců odchylek přímky a měření y = a + bx y je závislá na x Předpoklady: x je měřena přesně bez chyb y může být zatížena chybou, má normální rozdělení

→ minimum (vzhledem k a, b) Neboli hledám koeficienty a, b přímky tak, aby součet čtverců odchylek přímky a měření byl minimální  hledám regresní přímku. Vlastnosti: a, b jsou náhodné veličiny, mají normální rozdělení regresní přímka prochází průměrnou hodnotou x a y b je sklon (směrnice, slope) přímky, b > 0  přímka je rostoucí, b < 0  přímka je klesající. testuje se H0: b = 0, H1: b ≠ 0  H0: r = 0  H0: není lineární vztah mezi x a y a označuje průsečík s osou y v bodě x = 0 ( a = intercept).

H0: vztah mezi proměnnými NENÍ lineární Odchylka nevysvětlená regresí Odchylka vysvětlená regresí ANOVA: H0: vztah mezi proměnnými NENÍ lineární  odchylka vysvětlená / odchylka nevysvětlená je „malé číslo“ (blízké 0) Měří se F – rozdělením s (n-2, n-1) stupni volnosti.

Mezi x a y je lineární vztah  H0: data nemají lineární vztah v Anově zamítáme H0: b = 0 v regresní přímce zamítáme H0: r = 0 (korelační koeficient) zamítáme Všechna 3 tvrzení jsou ekvivalentní 95% predikční interval: Pro každou hodnotu x určíme interval, v němž budou s jistotou 95% měření.

95% konfindenční interval (95% interval spolehlivosti): Pro každé x se regresní y vyskytuje v tomto intervalu. Regresní přímka prochází Průměrem, tam je interval nejužší.

Postup. Nevíme, která proměnná je závislá a která nezávislá  korelační koeficient Víme, která proměnná je závislá a která nezávislá  korelační koeficient, regresní přímka Následující nulové hypotézy jsou ekvivalentní: H0: korelační koeficient je roven 0, H0: mezi proměnnými není LINEÁRNÍ vztah, H0: koeficient b v regresní přímce y = a + bx je roven 0.

Mnohonásobná lineární regrese. Příklad: Byla zjišťována velikost (délka) vejce v závislosti na velikosti (délce) matky a přídavku jódu v potravě: Zobrazení závislosti: Budeme předpokládat lineární závislost Vejce = b0 + b1*matka + b2*jód + chyba

2. Korelace  lineární vztah mezi vejcem a dvojicí (matka, jód). Mezi matkou a jódem není průkazná korelace, není LINEÁRNÍ vztah. Mezi jódem a vejcem je průkazná korelace, je lineární vztah. Mezi matkou a vejcem není průkazná korelace, není LINEÁRNÍ vztah. První indicie pro vyloučení matky z modelu.

3. Regrese. Vejce = 0.504 + 0.27*matka + 1.213*jód 10 ≤ matka ≤ 20, 1 ≤ jód ≤ 3, při tom ale 2.7 ≤ 0.27*matka ≤ 5.4, 1.213 ≤ 1.213*matka ≤ 3.639 Regresní koeficienty vyrovnávají jednotky u nezávisle proměnných, nevypovídají o důležitosti proměnných. O důležitosti proměnných vypovídají koeficienty vztažené k standardizovaným nezávisle proměnným, tj. k proměnným transformovaným do (0, 1). Pro matku je tento koeficient 0.5 a pro jód je 0.638  o velikosti vejce více vypovídá množství jódu v potravě.

Postupná lineární regrese. Umožňuje testovat, které z měřených nezávisle proměnných mají průkazný vliv na závisle proměnnou. Tedy které nezávisle proměnné mají vysvětlující vliv a které jsou nadbytečné. Lineární regrese procházející počátkem. Jestliže je velikost matky 0 a přidaný jód tedy také 0, je velikost vejce také 0. V tom případě neodhadujeme absolutní člen regrese. Vejce = 0.297*matka + 1.246*jód Polynomiální regrese. Polynom stupně n má tvar Definujeme: x1 = x, x2 = x2, x3 = x3, …, xn = xn. Pak a jedná se o úlohu lineární regrese.