FSS MUNI, katedra SPSP Kvantitativní výzkum x118 Téma 11: Korelace

Slides:



Advertisements
Podobné prezentace
Sedm základních nástrojů řízení jakosti. Kontrolní tabulky Vývojové diagramy Histogramy Diagramy příčin a následků Paretovy diagramy Bodové diagramy Regulační.
Advertisements

Směsi Chemie 8. ročník. SMĚSI Jsou to látky, ze kterých můžeme oddělit fyzikálními metodami jednodušší látky- složky směsi. Třídění směsí a) RŮZNORODÉ.
Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Kapitola 1: Popisná statistika jednoho souboru2  Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání.  Je možno.
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ.
Testy hypotéz - shrnutí Testy parametrické Testy neparametrické.
Genetické parametry Heritabilita, korelace. primární GP genetický rozptyl prostřeďový rozptyl kovariance sekundární GP heritabilita opakovatelnost genetické.
Základy zpracování geologických dat Rozdělení pravděpodobnosti R. Čopjaková.
NÁZEV ŠKOLY: S0Š Net Office, spol. s r.o, Orlová Lutyně AUTOR: Ing. Oldřich Vavříček NÁZEV: Podpora výuky v technických oborech TEMA: Základy elektrotechniky.
STATISTICKÉ METODY V GEOGRAFII. Odhady parametrů intervaly spolehlivosti.
Funkce Lineární funkce a její vlastnosti 2. Funkce − definice Funkce je předpis, který každému číslu z definičního oboru, který je podmnožinou množiny.
Grafy Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Metodologie ISK Základy statistického zpracování dat Ladislava Suchá, 28. dubna 2011.
Induktivní statistika
Korelace 20. prosince 2013 VY_42_INOVACE_190227
Testování hypotéz Testování hypotéz o rozdílu průměrů
Mocniny, odmocniny, úpravy algebraických výrazů
STATISTIKA Starší bratr snědl svůj oběd i oběd mladšího bratra. Oba snědli v průměru jeden oběd.
OCEŇOVÁNÍ CENNÝCH PAPÍRŮ Přednáška č. 2
Interpolace funkčních závislostí
7. Statistické testování
„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“
Matematika 3 – Statistika Kapitola 4: Diskrétní náhodná veličina
NÁZEV ŠKOLY: ČÍSLO PROJEKTU: NÁZEV MATERIÁLU: TÉMA SADY: ROČNÍK:
Lineární funkce - příklady
ČÍSLO PROJEKTU CZ.1.07/1.5.00/ ČÍSLO MATERIÁLU 1 – Množiny – teorie
STATISTICKÉ METODY V GEOGRAFII
Statistické pojmy. Statistické pojmy Statistika - vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter Pojem statistika slouží k.
„Svět se skládá z atomů“
2. cvičení
MANAŽERSKÉ ÚČETNICTVÍ
Popisná /deskriptivní/ statistika
Název školy Základní škola Jičín, Husova 170 Číslo projektu
Párový neparametrický test
Základy statistické indukce
Základy zpracování geologických dat testování statistických hypotéz
Parametry polohy Modus Medián
SÁRA ŠPAČKOVÁ MARKÉTA KOČÍBOVÁ MARCELA CHROMČÁKOVÁ LUKÁŠ BARTOŠ B3E1
Míry asociace obecná definice – síla a směr vztahu
Kvadratické nerovnice
Želvy H0 = není rozdíl mezi délkou želv na Marshallových ostrovech a délkou celé populace karet obrovských H1 = je rozdíl mezi délkou karet obrovských.
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Stavební fakulta ČVUT, B407
Test z Metodologie – náměty k přípravě
Spojité VELIČINY Vyšetřování normality dat
Rovnice základní pojmy.
Střední hodnoty Udávají střed celé skupiny údajů, kolem kterého všechny hodnoty kolísají (analogie těžiště). Aritmetický průměr - vznikne součtem hodnot.
Korelace a elaborace aneb úvod do vztahů proměnných
XII. Binomické rozložení
Metody sociálního výzkumu 6. blok
STATISTIKA PRO EKONOMY (kombinovaná forma)
Úvod do praktické fyziky
Téma 11 Odstraňování chudoby (Poverty Relief).
Teorie chyb a vyrovnávací počet 1
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Lineární regrese.
Metody sociálních výzkumů
Lomené výrazy (2) Podmínky řešitelnost
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Teorie chyb a vyrovnávací počet 1
Náhodný jev, náhodná proměnná
Lineární funkce a její vlastnosti
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Teorie chyb a vyrovnávací počet 1
Více náhodných veličin
Hra (AZ kvíz) ke zopakování či procvičení učiva:
Funkce Pojem funkce Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem.
Grafy kvadratických funkcí
Teorie chyb a vyrovnávací počet 2
Transkript prezentace:

FSS MUNI, katedra SPSP Kvantitativní výzkum x118 Téma 11: Korelace Miroslav Suchanec

Korelace - souvislost vyjádření vzájemné souvislosti dvou nebo více jevů (nejméně ordinálního charakteru) kondice a klidová tepová frekvence tělesná výška a tělesná hmotnost úroveň silových schopností a výsledky běhu na 100m výška a rozpětí paží hledání skrytých souvislostí, vazeb, příčin, ...

Příčiny souvislosti dvou jevů přirozená sdružená proměnlivost barva očí a vlasů teoretické zdůvodnění tělesná hmotnost a výška: konstantní tělesná skladba ρ, objem je svázán s výškou, hmotnost = ρ * V jev X vyvolává jev Y kouření a rakovina plic

Příčiny souvislosti dvou jevů jevy spolu souvisejí, protože mají společnou příčinu X Y Z jevy spolu souvisejí, protože měří něco společného Y X Z

Typy souvislostí pozitivní negativní

Korelace vs. kauzalita Korelace není kauzalita, pouze jedním z jejich předpokladů (dále časová následnost, neexistence alternativní příčiny)

Nepravá korelace (spuriousness) Znamená vysoká korelace mezi počtem čápů a počtem dětí, že čápi nosí děti? X Y Z Počet čápů Počet domácností Počet dětí

Velikost souvislosti koeficient korelace mezní hodnoty -1 a 1 značí absolutní souvislost hodnota 0 značí absolutní nezávislost

Vyjádření souvislosti různé druhy korelačních koeficientů použití se liší podle druhu dat, typu závislosti a typu rozložení nejčastěji používané: Pearsonův koeficient součinové korelace Spearmanův koeficient pořadové korelace

Pearsonův korelační koeficient (R) = nástroj pro měření míry lineární souvislosti (vztahu) mezi dvěma intervalovými nebo poměrovými proměnnými (které tudíž mají svůj průměr, rozptyl a odchylku) (Pro ostatní typy proměnných se užívá jiný nástroj pro měření vztahu) např. souvisí četnost sledování televizních reklam (v min. týdně) s průměrnou týdenní útratou? pohybuje se v rozmezí od -1 do 1 ( -1 =< R xy =< 1 ), kdy R xy=1 je absolutní pozitivní souvislost (např. čím více počtu let vzdělání, tím vyšší mzda); R xy=0 je absolutní nezávislost, (např. víme-li člověkovu výšku postavy, nepomůže nám to určit jeho hodnotu IQ); a R xy=-1 je absolutní negativní souvislost (např. čím více mailů sekretářka dostává, tím kratší dobu jí trvá než na ně odpoví).

Předpoklady použití Pearsonova korelačního koeficientu 1) nejméně intervalová data 2) normální rozložení v populaci 3) neexistence extrémních případů 4) linearita vztahu 2, 3 a 4 třeba ověřit / otestovat Není-li jeden z předpokladů naplněn a máme-li alespoň ordinální data, používáme Spearmanův koeficient

Předpoklad linearity vztahu lineární nelineární

Ověřování předpokladu linearity vztahu Nejlépe pomocí bodového rozptýlení (scatterplot)

Ověřování předpokladu neexistence extrémních hodnot Např. pomocí krabicového diagramu (boxplot) nebo jiného zobrazení extrémních hodnot…

Jak nenaplnění předpokladu neexistence extrémních hodnot ovlivní Pearsonův r?

Ověřování předpokladu normality Graficky – pozorované hodnoty ve vzorku vs. očekávané hodnoty pokud je populace normálně rozložená Kolmogorov-Smirnov test normality rozložení

Korelační koeficient a bodové rozptýlení proměnných x a y

…další příklady (zdroj: wikipedia)

(Databáze korelace a regrese.sav) x y 2 3 1 4 5 6 korelace mezi x a y, neboli R xy = cov(x,y) / s(x) * s(y), Cov (x,y) = Σ dx * dy / n -1 = Σ (xi – x)*(yi – y) / n - 1 X = Σ xi / n = 40 / 10 = 4 Y = Σ yi / n = 30 / 10 = 3 Cov (x,y) = Σ dx * dy / n -1 = Σ (xi – x)*(yi – y) / n - 1 = (-2*-3) + (-2*-1) + (-1*-2) + 0 + 0 + 0 + 0 +(1*2) + (2*1) + (2*3) = 20 / 9 = 2,22 s(x) * s(y) = √ var (x) * √ var (y) var (x) = Σ (xi – x )2 / n -1 = 20 / 9 = 2,22 var (y) = Σ (yi – y )2 / n -1 = 30 / 9 = 3,33 R xy= cov(x,y) / s(x) s(y) = 2,22 / √ 2,22 * √ 3,33 = 2,22 / 2,72 = 0,81 Korelace výpočet s příkladem (Databáze korelace a regrese.sav) Legenda Xi = hodnota X pro jednotlivá individua X = průměr pro x d = absolutní odchylka var(x)=rozptyl x s(x)=směrodatná odchylka Cov (x,y)=kovariance mezi x a y R (x,y)= korelace mezi x a y

Rozdíl mezi Pearsonovým a Spearmanovým koeficientem