Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

ZPRACOVÁVÁME KVANTITATIVNÍ DATA I. Mgr. Karla Hrbáčková Metodologie pedagogického výzkumu 18. 4. 2007.

Podobné prezentace


Prezentace na téma: "ZPRACOVÁVÁME KVANTITATIVNÍ DATA I. Mgr. Karla Hrbáčková Metodologie pedagogického výzkumu 18. 4. 2007."— Transkript prezentace:

1 ZPRACOVÁVÁME KVANTITATIVNÍ DATA I. Mgr. Karla Hrbáčková Metodologie pedagogického výzkumu

2 „SOUVISLOST“ Kvantitativní výzkum – testování hypotéz Kvantitativní výzkum – testování hypotéz Jeho silnou stránkou je schopnost nám říct, jak moc se mýlíme. Jeho silnou stránkou je schopnost nám říct, jak moc se mýlíme. Testování hypotéz – produkce výroků o tom, jak silně proměnné souvisí (jaká je mezi nimi míra korelace – hodně, malinko). Testování hypotéz – produkce výroků o tom, jak silně proměnné souvisí (jaká je mezi nimi míra korelace – hodně, malinko).

3 OMYL Představte si, že máte v rukou obálku s vyplněným dotazníkem z výzkumu na celostátním vzorku dospělého obyvatelstva. Váš úkol je odhadnout, jaké je pohlaví respondenta, jehož dotazník je v obálce (jaká je pravděpodobnost správného odhadu?). Představte si, že máte v rukou obálku s vyplněným dotazníkem z výzkumu na celostátním vzorku dospělého obyvatelstva. Váš úkol je odhadnout, jaké je pohlaví respondenta, jehož dotazník je v obálce (jaká je pravděpodobnost správného odhadu?). Představte si, že z obálky vyčtete odpověď na následující otázku. Představte si, že z obálky vyčtete odpověď na následující otázku. Užíváte někdy rtěnku? ANO x NE Pravděpodobnost správného odhadu je mnohem vyšší. Pravděpodobnost správného odhadu je mnohem vyšší. Můžeme tedy říci, že mezi proměnnými „pohlaví“ Můžeme tedy říci, že mezi proměnnými „pohlaví“ a „používání rtěnky“ existuje souvislost. a „používání rtěnky“ existuje souvislost. Souvislost může být definována jako přírůstek Souvislost může být definována jako přírůstek v pravděpodobnosti správného odhadu jedné proměnné, za který vděčíme naší znalosti o jiné proměnné. v pravděpodobnosti správného odhadu jedné proměnné, za který vděčíme naší znalosti o jiné proměnné.

4 Příklad souvislosti Geometrie Matematika ABCD A50%35%10%0% B45%55%25%10% C5%8%55%10% D0%2%10%80% N100%150100%360100%400100%50 Říká nám tato tabulka něco o souvislosti mezi známkou z G a M? Co by to znamenalo, kdyby vedla diagonála obráceně?

5 Příklad ABCD J K L M Je nějaká souvislost mezi proměnným v tabulce? X reprezentuje volební obvody, Y politické strany. Když známe hodnotu X, odhadneme hodnotu Y! Statistika – srovnání nalezené distribuce pozorování do polí tabulky s takovou distribucí, jakou bychom obdrželi, kdyby byla pozorování zařazena do polí tabulky náhodně. Proměnná X Proměnná Y

6 Redukce informací Průměrný počet půllitrů vypitý během jednoho týdne: Průměrný počet půllitrů vypitý během jednoho týdne: muži: 8 muži: 8 ženy: 2 ženy: 2 Více věříme průměru, který byl vypočítán na vzorku 500 pozorování, než průměru vypočítaném pro vzorek 5 jedinců. Více věříme průměru, který byl vypočítán na vzorku 500 pozorování, než průměru vypočítaném pro vzorek 5 jedinců. Často je pro nás výhodné vyjádřit informaci o vzorku v co nejjednodušší formě (ale stačí nám průměr?) Často je pro nás výhodné vyjádřit informaci o vzorku v co nejjednodušší formě (ale stačí nám průměr?) Jaká mají data rozložení? Míry centrální tendence, míry variability, míry koncentrace. Jaká mají data rozložení? Míry centrální tendence, míry variability, míry koncentrace. Průměr a jiné reprezentace středních hodnot redukují informaci do jednoho údaje podle druhu dat! Průměr a jiné reprezentace středních hodnot redukují informaci do jednoho údaje podle druhu dat!

7 Statistické operace z různých druhů měření NOMINÁLNÍ MĚŘENÍ – četnosti, %, modus, koeficient kontingence, chí-kvadrát, atd. NOMINÁLNÍ MĚŘENÍ – četnosti, %, modus, koeficient kontingence, chí-kvadrát, atd. ORDINÁLNÍ MĚŘENÍ – medián, některé míry variability, pořadové koeficienty korelace, atd. ORDINÁLNÍ MĚŘENÍ – medián, některé míry variability, pořadové koeficienty korelace, atd. INTERVALOVÁ MĚŘENÍ – aritmetický průměr, testy významnosti – t-test, F-test, směrodatná odchylka, analýza rozptylu, koeficienty korelace,atd. INTERVALOVÁ MĚŘENÍ – aritmetický průměr, testy významnosti – t-test, F-test, směrodatná odchylka, analýza rozptylu, koeficienty korelace,atd.

8 TABULKA ČETNOSTÍ Utřídění dat pomocí tzv. „čárkovací metody.“ Utřídění dat pomocí tzv. „čárkovací metody.“ Při měření školní úspěšnosti získali žáci tyto známky z matematického testu: 1, 1, 2, 4, 3, 3, 3, 2, 4, 1, 3, 2, 1, 5, 1, 1, 2, 4, 3, 2, 3, 3. Při měření školní úspěšnosti získali žáci tyto známky z matematického testu: 1, 1, 2, 4, 3, 3, 3, 2, 4, 1, 3, 2, 1, 5, 1, 1, 2, 4, 3, 2, 3, 3. Sestavte tabulku četností podle vzorce Sestavte tabulku četností podle vzorce Známka Četnost n i Relativní četnost f i Kumulativní četnost 160, , , , ,04622 ∑22 ∑1,000 f i = n i : n

9 Aritmetický průměr, modus, medián Intervalový popis střední hodnoty Intervalový popis střední hodnoty průměr r – 2,455 průměr r – 2,455 Počet dětí, příjem Počet dětí, příjem věk, barva očí věk, barva očí Modus – ta hodnota, která se v daném souboru dat vyskytuje nejčastěji (má největší četnost). Modus – ta hodnota, která se v daném souboru dat vyskytuje nejčastěji (má největší četnost). Medián – prostřední hodnota z řady hodnot seřazených podle velikosti (rozděluje soubor na dvě stejné části). Medián – prostřední hodnota z řady hodnot seřazených podle velikosti (rozděluje soubor na dvě stejné části). 1,1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4,5 (stojí přesně uprostřed, odlehlá hodnota není reflektována). 1,1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4,5 (stojí přesně uprostřed, odlehlá hodnota není reflektována). Známka Četnost n i n. x i ∑22 ∑54

10 Míra variability (rozptyl) Jak dalece jsou data rozptýlena? Jak dalece jsou data rozptýlena? Třída A 1,1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4,5 Třída A 1,1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4,5 Třída B 1,1,1,1,1,1,1,1,1,1,2,4,4,4,4,4,4,4,4,5,5. Třída B 1,1,1,1,1,1,1,1,1,1,2,4,4,4,4,4,4,4,4,5,5. Rozptyl – zda mezi průměry jsou či nejsou významné rozdíly! Příklad – terč. Rozptyl – zda mezi průměry jsou či nejsou významné rozdíly! Příklad – terč. Směrodatná odchylka – jak jsou hodnoty vzdáleny od průměru! Směrodatná odchylka – jak jsou hodnoty vzdáleny od průměru! Ptáme se, co činí kolísání rozptylu. Ptáme se, co činí kolísání rozptylu. Kvantitativní výzkum – kontroluji rozptyl hodnot (dat), izoluji proměnné. Kvantitativní výzkum – kontroluji rozptyl hodnot (dat), izoluji proměnné. Chceme, aby to byla nezávisle proměnná, neměla by to být náhoda. Jestliže je naše působení větší než náhoda, přijímáme alternativní hypotézu. Příklad experimentu – vliv metody. Chceme, aby to byla nezávisle proměnná, neměla by to být náhoda. Jestliže je naše působení větší než náhoda, přijímáme alternativní hypotézu. Příklad experimentu – vliv metody.

11 Výpočet rozptylu A = {1,1,1,5,5,5} B = {3,3,3,3,3,3} A = {1,1,1,5,5,5} B = {3,3,3,3,3,3} Vypočítejte průměr (r) a rozptyl (s 2 ) Vypočítejte průměr (r) a rozptyl (s 2 ) 1. Od pozorované hodnoty pro každého jedince odečteme průměr. 1. Od pozorované hodnoty pro každého jedince odečteme průměr. 2. Odchylku vypočítanou pro každého jedince umocníme. 2. Odchylku vypočítanou pro každého jedince umocníme. 3. Umocněné odchylky sečteme. 3. Umocněné odchylky sečteme. 4. Součet vydělíme počtem jedinců ve vzorku = rozptyl. 4. Součet vydělíme počtem jedinců ve vzorku = rozptyl. 5. Výsledek dělení odmocníme = směrodatná odchylka. 5. Výsledek dělení odmocníme = směrodatná odchylka. x x2x2x2x r=3 s 2 =4 x x2x2x2x r=3 s 2 =0

12 Směrodatná odchylka, normální rozložení r = průměr 68% všech respondentů +1 rozptyl Hodnoty, kterých může studovaná proměnná nabývat Množství případů, kteří mají danou hodnotu proměnné

13 Nominální data – chí-kvadrát Nejčastějším statistickým postupem na úrovni nominálního měření bývá test chí-kvadrát. Nejčastějším statistickým postupem na úrovni nominálního měření bývá test chí-kvadrát. Ověřuje se zde, zda četnosti, které byly získány pozorováním se významně odlišují od teoretických četností, které odpovídají dané nulové hypotéze. Ověřuje se zde, zda četnosti, které byly získány pozorováním se významně odlišují od teoretických četností, které odpovídají dané nulové hypotéze. Příklad pro pochopení principu testu dobré shody. Příklad pro pochopení principu testu dobré shody. Skupina 90 žáků základní školy ve výzkumu odpovídala na otázku: Který z vyučovacích předmětů máš nejraději? A matematika B fyzika C chemie Na základě testu dobré shody chí-kvadrát máme rozhodnout, zda mezi oblibou předmětů jsou statisticky významné rozdíly.

14 Princip testu dobré shody chí-kvadrát Jestliže je výsledek statisticky významný, je velmi nepravděpodobné, že by byl způsoben náhodou. Jestliže je výsledek statisticky významný, je velmi nepravděpodobné, že by byl způsoben náhodou. Začínáme formulací nulové (mezi sledovanými jevy není vztah) a alternativní (existuje vztah) hypotézy. Začínáme formulací nulové (mezi sledovanými jevy není vztah) a alternativní (existuje vztah) hypotézy. H 0 : Četnost žáků, kteří vybírají jednotlivé předměty, jsou zhruba stejné. H 1 : Četnost žáků, kteří vybírají jednotlivé předměty, jsou rozdílné. Vypočítanou hodnotu srovnáváme s tzv. kritickou hodnotou (statistická tabulka). x 2 = ∑ x 2 = ∑ Vyučovací předmět Pozorovaná četnost P Očekávaná četnost O P - O P - O (P – O) 2 O fyzika ,833 chemie ,133 matematika ,300 ∑ 90 1,266 (P – O) 2 O

15 Princip testu dobré shody chí-kvadrát Příslušnou kritickou hodnotu hledáme vždy pro určitou (zvolenou) hladinu významnosti a určitý počet stupňů volnosti. Příslušnou kritickou hodnotu hledáme vždy pro určitou (zvolenou) hladinu významnosti a určitý počet stupňů volnosti. Ve statistických tabulkách nalézáme, že kritická hodnota chí- kvadrát pro hladinu významnosti 0,05 a 2 stupně volnosti je x 2 0,05 (2) = 5,991 Ve statistických tabulkách nalézáme, že kritická hodnota chí- kvadrát pro hladinu významnosti 0,05 a 2 stupně volnosti je x 2 0,05 (2) = 5,991 Zjišťujeme, že vypočítaná hodnota je menší, než hodnota kritická, a proto přijímáme nulovou hypotézu. Zjišťujeme, že vypočítaná hodnota je menší, než hodnota kritická, a proto přijímáme nulovou hypotézu. K odmítnutí nulové hypotézy je třeba, aby vypočítaná hodnota testového kritéria byla větší (nebo alespoň stejně velká) jako hodnota kritická. K odmítnutí nulové hypotézy je třeba, aby vypočítaná hodnota testového kritéria byla větší (nebo alespoň stejně velká) jako hodnota kritická. Pokud jsme nuceni přijmout nulovou hypotézu, znamená to, že výsledky je možno docela dobře připsat na vrub náhody, že tedy mezi studovanými jevy není významný vztah. Pokud jsme nuceni přijmout nulovou hypotézu, znamená to, že výsledky je možno docela dobře připsat na vrub náhody, že tedy mezi studovanými jevy není významný vztah. Nebylo prokázáno, že mezi oblibou vyučovacích předmětů je rozdíl. Nebylo prokázáno, že mezi oblibou vyučovacích předmětů je rozdíl.

16 Závislost mezi jevy - nominální Existuje závislost mezi danými dvěma pedagogickými jevy, které byly změřeny na úrovni nominálního (a vyššího) měření. Existuje závislost mezi danými dvěma pedagogickými jevy, které byly změřeny na úrovni nominálního (a vyššího) měření. Příklad: Vzorku 400 náhodně vybraných studentů PdF byl předložen dotazník. Jedna z otázek (uzavřené otázky) zjišťovala, zda studenti byly v uplynulém studijním roce ubytováni na kolejích. Další z otázek zjišťovala, jakého průměrného prospěchu studenti v uplynulém studijním roce dosáhli. Máme rozhodnout, zda je vztah mezi tím, zda studenti bydlí na kolejích a tím, jakých studijních výsledků dosahují. Příklad: Vzorku 400 náhodně vybraných studentů PdF byl předložen dotazník. Jedna z otázek (uzavřené otázky) zjišťovala, zda studenti byly v uplynulém studijním roce ubytováni na kolejích. Další z otázek zjišťovala, jakého průměrného prospěchu studenti v uplynulém studijním roce dosáhli. Máme rozhodnout, zda je vztah mezi tím, zda studenti bydlí na kolejích a tím, jakých studijních výsledků dosahují. Použijeme tzv. kontingenční tabulku (četnosti studentů, kteří odpověděli určitým způsobem na první otázku a současně určitým způsobem na druhou otázku). Použijeme tzv. kontingenční tabulku (četnosti studentů, kteří odpověděli určitým způsobem na první otázku a současně určitým způsobem na druhou otázku).

17 Příklad lepší než 1,6 1,6 – 2,1 horší než 2,1 ∑ + 40 (48) 107 (108) 93 (84) (32) 73 (72) 47 (86) 160 ∑ bydlení na kolejích Např. číslo 93 v tabulce znamená, že 93 studentů odpovědělo, že bydleli na kolejích a současně, že měli průměrný prospěch horší než 2,1. Čísla uváděná vpravo od tabulky a pod tabulkou jsou tzv. okrajové („marginální“) četnosti, tj. součty četností v řádcích a sloupcích tabulky. Formulujeme nulovou a alternativní hypotézu. Vypočítáme očekávané četnosti pro každé pole kontingenční tabulky tak, že násobíme odpovídající marginální četnosti v tabulce a potom dělíme celkovou četností. Např. očekávanou četnost (48) vypočítáme O = = 48 Pro každé pole kontingenční tabulky vypočítáme hodnotu (P - O) 2 : O. Testové kritérium x 2 vypočítáme jako součet všech těchto hodnot, tj. 1, , , , , ,446 = 5,767. Určíme hladinu významnosti a počet stupňů volnosti podle vzorce f = (r – 1). (s – 1) = 2 Srovnáme-li vypočítanou hodnotu testového kritéria (5,767) s kritickou hodnotou testového kritéria x 2 0,05 (2) = 5,991, zjistíme, že je menší, proto přijímáme nulovou hypotézu. 400

18 Závislost mezi jevy - ordinální Koeficienty korelace např. Spearmanův (ordinální dat), Pearsonův (metrická data). Koeficienty korelace např. Spearmanův (ordinální dat), Pearsonův (metrická data). Př. závislost mezi výškou a věkem žáků. Lze říci, že výška žáků se s přibývajícím věkem zvětšuje, ale nelze tvrdit, že určitému věku odpovídá jen určitá výška žáka. Př. závislost mezi výškou a věkem žáků. Lze říci, že výška žáků se s přibývajícím věkem zvětšuje, ale nelze tvrdit, že určitému věku odpovídá jen určitá výška žáka. Zjišťujeme, zda existuje souvislost, nikoli která proměnná ji způsobuje. Zjišťujeme, zda existuje souvislost, nikoli která proměnná ji způsobuje. Hodnoty koeficientu (-1 do +1). Hodnoty koeficientu (-1 do +1).

19 Příklad x - MA y – PŘ xixixixi yiyiyiyi xi yixi yixi yixi yi xi2xi2xi2xi2 yi2yi2yi2yi n ∑ x i y i - ∑ x i ∑y i √ { n ∑ x i 2 – (∑ x i ) 2 } { n ∑ y i 2 – (∑ y i ) 2 } – √ ( – 50 2 ) ( – 52 2 ) r = 0,91

20 Regresní linie

21 Perfektní pozitivní korelace, s rostoucí hodnotou X hodnota Y vzrůstá. Hodnotu Y odhadneme na základě znalosti hodnoty X bez jakéhokoli omylu, r = 1. Perfektní negativní korelace, s přirůstající hodnotou X, hodnota Y klesá, r = -1. Silná korelace. Perfektní nezávislost, znalost hodnoty X nezlepší naši schopnost odhadnout správně hodnotu Y, r = 0.


Stáhnout ppt "ZPRACOVÁVÁME KVANTITATIVNÍ DATA I. Mgr. Karla Hrbáčková Metodologie pedagogického výzkumu 18. 4. 2007."

Podobné prezentace


Reklamy Google