Zpracování dat z kvantitativního výzkumu. Na základní škole se uskutečnil výzkum, kde se měřila hmotnost žáků 8.tříd. Výzkumu se účastnilo 33 žáků. Byly.

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Statistika.
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Testování neparametrických hypotéz
Cvičení 6 – 25. října 2010 Heteroskedasticita
ZPRACOVÁVÁME KVANTITATIVNÍ DATA I.
ZPRACOVÁVÁME KVANTITATIVNÍ DATA II.
Testování hypotéz (ordinální data)
Statistika Vypracoval: Mgr. Lukáš Bičík
Charakteristiky polohy hodnoty znaku - čísla popisující polohu znaku na číselné ose -můžeme zvolit: -Aritmetický průměr -Modus, medián -Harmonický průměr.
Testování hypotéz přednáška.
Tloušťková struktura porostu
Statistika 8. ročník Autorem materiálu je Mgr. Jana Čulíková
Testování hypotéz vymezení důležitých pojmů
Analýza dat.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Principy konstrukce norem a základní statistické pojmy
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Charakteristiky variability
Statistika 2 Aritmetický průměr, Modus, Medián
Biostatistika 6. přednáška
Biostatistika 7. přednáška
Biostatistika 4. přednáška
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Pohled z ptačí perspektivy
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Základy statistiky Autor: Jana Buršová.
VY_32_INOVACE_21-16 STATISTIKA 2 Další prvky charakteristiky souboru.
1. cvičení
Inferenční statistika - úvod
Mann-Whitney U-test Wilcoxonův test Znaménkový test
HYPOTÉZY Hypotéza je tvrzení (výrok) vyjařující vztah mezi proměnnými
Základy statistiky Základní pojmy. Základy statistiky Statistiku můžeme chápat jako činnost - získávání stat. údajů, jejich zpracování a vyhodnocení jako.
Charakteristiky úrovně Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Měření v sociálních vědách „Měřit všechno, co je měřitelné, a snažit se učitnit měřitelným vše, co dosud měřitelné není“. (Galileo Galilei)
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Neparametrické testy  neparametrické pořadové testy  Chí-kvadrát kontingenční tabulky test dobré shody.
… jsou bohatší lidé šťastnější?
INDUKTIVNÍ STATISTIKA
Opakování – přehled metod
Test dobré shody Fisherův přesný test McNemar test
Neparametrické testy parametrické a neparametrické testy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
Neparametrické testy parametrické a neparametrické testy
STATISTICKÉ CHARAKTERISTIKY
Statistika - opakovací test k procvičení
METODICKÝ LIST PRO ZŠ Pro zpracování vzdělávacích materiálů (VM)v rámci projektu EU peníze školám Operační program Vzdělávání pro konkurenceschopnost   
Induktivní statistika
METODOLOGIE MAGISTERSKÉ PRÁCE
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Neparametrické testy pro porovnání polohy
Metodologie pro ISK 2 Úvod do práce s daty
Výukový materiál zpracován v rámci projektu EU peníze školám
Úvod do induktivní statistiky
Střední škola obchodně technická s. r. o.
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
Analýza kardinálních proměnných
Autor: Honnerová Helena
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Základy statistiky.
Základy popisné statistiky
Transkript prezentace:

Zpracování dat z kvantitativního výzkumu

Na základní škole se uskutečnil výzkum, kde se měřila hmotnost žáků 8.tříd. Výzkumu se účastnilo 33 žáků. Byly získány tyto výsledky: 51, 48, 46, 52, 56, 39, 53, 64, 49, 54, 55, 47, 47, 46, 48, 49, 46, 51, 52, 53, 52, 50, 48, 49, 51, 53, 46, 43, 57, 58, 50, 49, 44. R - variační šíře intervalu R = 64 – 39 = 25 h - hloubka intervalu h = 0,08. R = 2 

Hmotnost žákůČetnost n i Střed intervalu x í Kumulativní četnost , , , , , , , , , , , , ,533

Grafické znázornění naměřených dat Histogram četností

Polygon četností

Graf kumulativních četností (Galtonova ogiva)

Výsečový diagram

S-L grafy (grafy „stonek a list“) Příklad: Skupina studentů Sociální pedagogiky získala v didaktickém testu tyto bodové výsledky: 6, 7, 11, 22, 23, 31, 15, 15, 20, 32, 21, 23, 36, 10, 9, 18, 29, 13, 48, 32. Uspořádejte tato data a vyjádřete je graficky.

Postup sestavení S-L grafu Každý údaj si představme jako dvojciferné číslo (06, 07, 20, 32…). V našem příkladě budou stonek reprezentovat desítky,tj. čísla od 0 do 4. K stonku připojíme listy – z každého čísla jeho pravou část, tj. jednotky.

Podoba S-L grafu stoneklisty

Porovnání 2 skupin S-L grafem

Charakteristiky polohy (týká se středních hodnot) Aritmetický průměr (data metrická) Medián (data ordinální) Modus (data nominální)

Aritmetický průměr Vypočítáme ho vzorcem : kde je celková četnost všech hodnot, je určitá hodnota a je četnost té konkrétní hodnoty Medián Mediánem označujeme prostřední hodnotu z řady hodnot seřazených podle velikosti. Modus Modus je hodnota, která se v daném souboru vyskytuje s největší četností, tedy nejčastěji.

Při měření IQ žáků jedné deváté třídy byly získány tyto hodnoty: 125, 129, 130, 130, 135, 133, 132, 131, 132, 126, 130, 134, 131, 129, 127, 132, 132, 134, 132, 128, 129, 131, 131, 130, 127, 132. IQ Četnosti Aritmetický průměr: Medián: Modus: 

Grafické znázornění

Závislost mezi jevy při nominálním měření Test dobré shody (chí-kvadrát). Test nezávislosti pro kontingenční tabulku Stupeň závislosti mezi jevy v kontingenční tabulce

Test dobré shody (chí-kvadrát). Principem tohoto testu je určit, zda četnosti, které byly získány měřením v PG realitě, se významně odlišují od teoretických četností, které odpovídají dané nulové hypotéze.

Skupina 90 mužů různého věku ve výzkumu odpovídala na otázku: Jakou barvu vlasů preferujete u své přítelkyně (manželky)? A blond B černé C hnědé H O : Četnosti mužů jsou přibližně stejně velké. H A : Četnosti mužů jsou rozdílné. Hodnotu, kterou vypočítáme z daného vzorce srovnáme s tzv. kritickou hodnotou (tabulky). Příslušnou kritickou hodnotu hledáme pro určitou hladinu významnosti (0,05 a 0,01) a určitý počet stupňů volnosti (k-1, kde k počet řádků v tabulce). 

Barva vlasůPozorovaná četnost P Očekávaná četnost O Blond ,633 Černé ,700 Hnědé ,533 Proto zavrhujeme nulovou hypotézu! A přijímáme alternativní hypotézu, která nám říká, že ve výběru mužů jsou statisticky významné rozdíly! V případě opačné nerovnosti přijímáme nulovou hypotézu.

Test dobré shody pro kontingenční tabulku Toho testu užijeme v případě, že uvažujeme, zda existuje souvislost mezi dvěma pedagogickými jevy, jež byly změřeny na úrovni nominálního měření. Vyskytuje se často při zpracování dotazníkových šetření. Kontingenční tabulka (čtyřpolní tabulka) počet stupňů volnosti kde r je počet řádků a s počet sloupců kontingenční tabulky

Skupině 190 občanů ČR byla položena otázka, zda vždy a za všech okolností souhlasí s názorem šéfa. Z celkového počtu dotázaných jich 41 odpovědělo, že vždy plně souhlasí, 48 odpovědělo, že souhlasí, 48 odpovědělo, že v zásadě nesouhlasí a 53 s šéfem zásadně nesouhlasí. 10(16)13(12,1)18(12,9) 12(18,7)13(14,1)23(15,2) 23(18,7)14(14,1)11(15,2) 29(20,6)16(15,7)8(16,7) Plně souhlasí Souhlasí Nesouhlasí Zásadně nesouhlasí Věk respondentů do 25 let25-40 nad 4O

Dosadíme-li do vzorečku pro každou hodnotu v kontingenční tabulce, tak součtem těchto hodnot dostaneme. Počet stupňů volnosti vychází f=6. Kritická hodnota v tabulkách odpovídá. Proto zamítáme nulovou hypotézu! Která nám říká, že existuje závislost mezi věkem respondentů a jejich poklonkováním :o).

Spearmanův koeficient pořadové korelace Používá se v případech, kdy máme rozhodnout, jak těsně spolu souvisí dva jevy, které jsme získali ordinálním měřením. Dané jevy seřadíme dle pořadí. SKPK umožňuje kvantitativně stanovit, jak dalece jsou si dvě daná pořadí podobná.

(M. Chráska- Úvod do výzkumu v pedagogice str. 108) Výpočet SKPK objasníme na příkladě výzkumného šetření, ve kterém se zjišťovalo, jak těsný je vztah mezi hmotností dětí a jejich rychlostí běhu. U vybrané skupiny 10 dětí bylo zaznamenáno v jakém pořadí doběhli do cíle v závodě na 60 m, dále u nich byla zaznamenána také jejich hmotnost. (viz.tabulka) DítěHmotnost (kg) Pořadí podle hmotnosti Pořadí podle pořadí v běhu A16, B18, C16, D19,56424 E16, F23, G23, H19,84,58-3,512,25 I19,84,59-4,520,25 j22,

Vypočítaný koeficient nám říká, že vztah mezi hmotností dětí a rychlostí jejich běhu je negativní (nepřímo úměrný). Tedy čím větší je hmotnost dítěte, tím je menší je jeho rychlost běhu. Koeficient korelaceInterpretace r=1naprostá závislost 1,00 r 0,90velmi vysoká závislost 0,90 r 0,70vysoká závislost 0,70 r 0,40střední závislost 0,40 r 0,20nízká závislost 0,20 r 0,00velmi slabá závislost r=0naprostá nezávislost

Ve dvou skupinách žáků byly získány tyto výsledky didaktických testů: skupina A: skupina B: H 0 : Mezi výsledky žáků v obou skupinách nejsou podstatné rozdíly. H A : Mezi výsledky žáků v obou skupinách jsou podstatné rozdíly. 7(B)8(A)9(A)10(B)11(A)12(B)13(B) 14(A)15(B)16(B)17(A) Testovým kriteriem je menší z hodnot. Kritickou hodnotou (tabulky ) je Nesmíme tedy odmítnout nulovou hypotézu!

Pearsonův koeficient korelace Pro jednorozměrný statistický soubor rozptyl(variance): Pro dvojrozměrný statistický soubor:

Studentův t-test Jeden z nejznámějších statistických testů. Pomocí tohoto testu můžeme rozhodnout, zda dva soubory dat, získané měřením na dvou různých souborech objektů, má stejný aritmetický průměr.

Ve výběrovém souboru 5 letých dětí bylo 15 chlapců a 20 dívek. Při měření jejich výšky byly získány výsledky, které jsou v tabulkách. Z uvedených dat jsou vypočítány průměrné hodnoty u děvčat cm a cm u chlapců. H O : Průměrná výška chlapců a dívek je stejná. H A : Průměrná výška dívek a chlapců se liší.

Následně můžeme vypočítat hodnotu t Určíme počet stupňů volnosti

Jelikož vypočítaná hodnota je menší než hodnota v tabulkách, musíme přijmout nulovou hypotézu! Tedy, průměrná výška dívek a chlapců je stejná.

xPárový t –test Tento statistický test používáme v případě, že dvakrát měříme u téže skupiny určitou vlastnost a chceme rozhodnout, zda jsou mezi výsledky statisticky významné rozdíly. V tomto případě nemůžeme rozhodnout Studentovým T-testem, protože ten předpokládá, že oba výběry jsou nezávislé.