Korelace.

Slides:



Advertisements
Podobné prezentace
Korelace a regrese Karel Zvára 1.
Advertisements

kvantitativních znaků
Použité statistické metody
Testování statistických hypotéz
Cvičení 6 – 25. října 2010 Heteroskedasticita
Lineární regresní analýza Úvod od problému
ZÁKLADY EKONOMETRIE 7. cvičení Heteroskedasticita
Úvod do regresní analýzy
Regresní analýza a korelační analýza
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Testování hypotéz (ordinální data)
DATA  INFORMACE Statistická analýza je založena na zhušťování informace – tj. jak s co nejmenšího množství vhodně zvolených údajů vytěžit maximum relevantních.
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
kvantitativních znaků
také Gaussovo rozdělení (normal or Gaussian distribution)
Obecný lineární model Analýza kovariance Nelineární modely
Základy ekonometrie Cvičení října 2010.
Základy ekonometrie Cvičení 3 4. října 2010.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Korelace a elaborace aneb úvod do vztahů proměnných
Lineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Závislost dvou kvantitativních proměnných
Biostatistika 6. přednáška
Lineární regrese kalibrační přímky
Biostatistika 7. přednáška
Experimentální fyzika I. 2
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie psychodiagnostiky a psychometrie
Korelace a elaborace aneb úvod do vztahů proměnných
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
8. Kontingenční tabulky a χ2 test
Teorie psychodiagnostiky a psychometrie
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Biostatistika 1. přednáška Aneta Hybšová
Modeling claim size in time via copulas (Gaida Pettere & Tonu Kollo) Mgr. Jan Šváb
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Hustota pravděpodobnosti – případ dvou proměnných
Vzájemná závislost - KORELACE
1. cvičení
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová.
Mann-Whitney U-test Wilcoxonův test Znaménkový test
IV..
Aplikovaná statistika 2.
REGRESNÍ ANALÝZA Vysoká škola technická a ekonomická v Českých Budějovicích Institute of Technology And Business In České Budějovice.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Základy zpracování geologických dat R. Čopjaková.
Dvojrozměrné (vícerozměrné) statistické soubory Karel Mach.
… jsou bohatší lidé šťastnější?
Metody zkoumání závislosti numerických proměnných
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Opakování – přehled metod
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
Veličiny v turbulenci.
Induktivní statistika
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Parciální korelace Regresní analýza
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Vzájemná závislost - KORELACE
Transkript prezentace:

Korelace

Korelace versus regrese Korelace mezi dvěma kvantitativními proměnnými (Y1 a Y2) nahlíží na obě proměnné stejným způsobem. Předpokládá, že obě jsou náhodné proměnné se stochastickou distribuci, ale že střední hodnota distribuce hodnot proměnné Y1 se mění se střední hodnotou proměnné Y2. Těsnost této závislosti měříme vypočteným korelačním koeficientem

Lineární vztah proměnných Pearsonův korelační koeficient Součin v čitateli je kladný, pokud jsou kladné odchylky od průměru u X spojeny s kladnými odchylkami u Y, a podobně záporné se zápornými Bezrozměrná veličina, v rozsahu -1.0 až +1.0

Korelace a podoba vztahu Zde byl narušen předpoklad linearity

Test korelačního koeficientu Testujeme hypotézu H0: r = 0 přičemž r je odhadem parametru základního souboru – r Testovou statistikou je t statistika: Můžeme použít jednostranný či oboustranný test, podle badatelské otázky

Kritické hodnoty r Opět je vhodné připomenout, že průkaznost není to samé jako těsnost závislosti a tyto dva aspekty jsou pro různé otázky různě důležité

Výpočet a testování r v programu Statistica Matici korelací mezi více proměnnými lze spočítat v Basic statistics / Tables V záložce Options lze zadat test jednotlivých vypočtených r.

Srovnání korelace s regresí Koeficient determinace (R2) v přímkové regresi je druhou mocninou r Signifikance testu hypotézy b = 0 odpovídá výsledku testu hypotézy r = 0 Obdobně i síla testu je ovlivněna stejnými faktory jako u regrese

Nelineární závislost Spearman-ův či Kendallův koeficient V obou případech musí být závislost monotónní (neklesající či nerostoucí) Spearman-ův koeficient: pro každou proměnnou zvlášť nahradím její hodnoty odpovídajícím pořadím (nejmenší 1, pak 2, ...) a z pořadí pak spočtu Pearsonův korelační koeficient. Pro větší n platí i kritické hodnoty Pearsonova r Tedy ne taková!

Děkuji za pozornost ...