Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

1 Ringier ČR - Výzkumné oddělení Χ 2 test dobré shody.

Podobné prezentace


Prezentace na téma: "1 Ringier ČR - Výzkumné oddělení Χ 2 test dobré shody."— Transkript prezentace:

1 1 Ringier ČR - Výzkumné oddělení Χ 2 test dobré shody

2 2 Ringier ČR - Výzkumné oddělení Použití Χ 2 testu dobré shody A)Kontrola reprezentativity výběrového šetření – porovnáváme rozložení kategorizovaných proměnných s dostupnými statistickými daty, např. věk, příjem – Jsou výzkumná data reprezentativní? B)Hledáme vztah mezi proměnnými – nejedná se o intervalové (kardinální), ale o proměnné nominální, ordinální s malým počtem variant. Do jaké míry ovlivňuje jedna proměnná druhou? Rozložení (distribuce) hodnot jedné proměnné (závisle) je závislé (asociováno s) na rozložení hodnot druhé (nezávislé). K tomu abychom mohli hypotézu potvrdit či vyvrátit použijeme Chí-kvadrát test Předpoklady použití: kategorizované proměnné (nominální, ordinální, dichotomické, kardinální) minimálně 30 pozorování počty očekávaných četností menších než 5 (1) – kontroluje, zda lze Χ 2 test použít (žádná očekávaná četnost nesmí být menší než 5 (1); 20 % očekávaných četností smí být menších než 5, ale žádná nesmí být menší než 1), není-li splněno, lze vyřešit sloučením kategorií. Jeho výsledek závisí na počtu řádků a sloupců (stupně volnosti) Není vhodný: Nedokáže změřit sílu vztahu, víme s určitou jistotou = pravděpodobností, že mezi proměnnými existuje vztah, který nebyl způsoben výběrovou chybou Není vhodný pro: 2 ordinální nebo 2 kardinální proměnné Neměl by se používat pro tabulky 2x2 Typy řešených úloh:

3 3 Ringier ČR - Výzkumné oddělení Statistické hypotézy: H 0 : p k = π k H A : p k ≠ π k p k jsou četnosti, které reprezentují výběr π k jsou četnosti, které předpokládá hypotéza Testová statistika: (Pearson Chí square) Testová statistika Χ 2 = ∑ k (n k - nπ k ) 2 nπknπk df = k – 1 nπ k očekávané četnosti nπ k očekávané četnosti, jaká četnost by byla v políčku tabulky, kdyby platila H 0 ; (n i. *n.j )/n DF – počet stupňů volnosti, určuje velikost tabulky, kolik buněk tabulky musíme znát, abychom z nich a z celkového počtu respondentů dokázali ostatní buňky dopočítat = (počet řádků – 1) x (počet sloupců – 1). Sig. – dosažená hladina významnosti, udává pravděpodobnost toho, že mezi řádkovou a sloupcovou proměnnou neexistuje závislost. Je-li menší než 0,05; 0,01; 0,001 (eventuálně 0,1), pak pokládáme závislost za statisticky významnou s 95%; 99%; 99,9% spolehlivostí (respektive 90%). Řádky: i = 1…..r Sloupce: j = 1…..s

4 4 Ringier ČR - Výzkumné oddělení Pro získání očekávaných četností u prodeje zmrzliny aplikujeme dosavadní strukturu prodeje na celkové prodané množství v nové lokalitě (celkem 200): Např. u vanilkové zmrzliny: očekávaná četnost při celkem 200 prodaných jednotek = 62 % z 200 = 124 Spočítanou hodnotu testového kritéria porovnáme s příslušnou tabulkovou hodnotou pro k – 1, tedy 3 stupně volnosti, která je 7,82 při 95 % spolehlivosti. Vypočítaná hodnota testového kritéria (4,32) nepřekračuje mez vymezující kritický obor (7,82), nachází se v oboru přijetí a na zvolené 5%ní hladině významnosti hypotézu o shodě struktury prodeje nezamítáme. H 0 : struktury jsou shodné H A : struktury nejsou shodné Příklad 1: Řetězec cukráren nabízející 4 druhy zmrzliny otevřel provozovnu v nové lokalitě. Ve stávajících provozovnách byla dosud struktura prodeje jednotlivých druhů následující: vanilková 62 %, čokoládová 18 %, jahodová 12 %, pistáciová 8%. Po otevření provozovny v nové lokalitě byl prodej následující: vanilková 120, čokoládová 40, jahodová 18, pistáciová 22. Je struktura prodeje v nové lokalitě shodná či odlišná oproti dosavadním prodejům řetězce?

5 5 Ringier ČR - Výzkumné oddělení

6 6 Chí kvadrát – CROSSTAB v SPSS Pearson Chi-Square – viz výpočet na straně 3 LIkelihood Ration Chi Square – jedná se o alternativu k Pearsnovu χ 2 používá se v loglineárních modelech. Pro velké soubory jsou obě statistická kritéria přibližně stejná. LInear-by linear association chi-square: jedná se o funkci Pearsnova korealčního koeficientu, pouze pro kvantitativní proměnné (proměnné, kde má význam sledovat lineární vztahy).

7 7 Ringier ČR - Výzkumné oddělení Pro každé políčko tabulky určíme reziduum: reziduum: empirická četnost – očekávaná četnost standardizovaná rezidua: součet jejich druhých mocnin = Χ 2 Statistické hypotézy: H 0k : p k = π k H Ak : p k ≠ π k postupně pro k = 1, …. K Každá z těchto hypotéz se testuje pomocí z-testu: √ nπ k (1 - π k ) z k = n k - nπ k Znaménkové schéma: Pokud jsme již pomocí hodnoty testového kriteria chí-kvadrát dospěli k zamítnutí H 0, nabízí se otázka ve kterých kategoriích konkrétně je tento rozdíl významný? Je některá skupina typická v zájmu o daný výrobek/inklinuje k nějakému názoru či postoji? atd. Pro znázornění významnosti odchylek výběrové a očekávané četnosti můžeme použít znaménkové schéma, a to tak, že:  provedeme postupně z-testy pro jednotlivá pole tabulky/ zjistíme rezidua (pracujeme s adjustovanými reziduii „Δ“ )  určíme, zda hodnoty statistik překračují kritické hodnoty a každému poli přiřadíme znaménko plus nebo mínus podle toho, jak silně je odchylka signifikantní a zda je rozdíl skutečné a očekávané četnosti kladný nebo záporný, to provedeme podle tří zvolených hladin významnosti (5%; 1%; 0,1%, tomu odpovídá počet znamének): Podle „Statistika pro výzkum trhu a marketing“ - Řehák Hodnota kvantilu normovaného normálního rozdělení Hladina významnosti Přiřazená znaménka |z k | < 1,96α > 5%Žádné znaménko |zk| >= 1,96α = 5%+ nebo - |zk| >= 2,58α = 1%α = 1%++ nebo -- |zk| >= 3,21α = 0,1%+++ nebo --- adjustované reziduum (používaná pro znaménkové schéma): rozdíl empirické četnosti od očekávané, dělený „odhadem standardizované chyby rezidua“

8 8 Ringier ČR - Výzkumné oddělení CHÍ – KVADRÁT TEST - PŘÍKLADY Příklad 1 Ve výběrovém šetření byly domácnosti rozděleny do dvou typů AB a CDE. Zjistěte, zda se tyto dva typy domácností liší podle struktury nákupu výrobku X a Y. Příklad 2 Pro výzkum bylo vybráno 1000 respondentů – mužů v následujícím věkovém složení: 0-14 let 200 mužů, 15 – 64 let 650 mužů, 65 a více let 150 mužů. Je tento výběr reprezentativní víme-li, že věkové složení mužů v ČR je v jednotlivých věkových skupinách 0-14 let 16 %, let 73 % a %. Příklad 3 Na základě výběrových šetření o oboru vzdělání a zastávané profesi po absolvování školy rozhodněte, zda je závislost mezi oborem studia a oborem uplatnění.


Stáhnout ppt "1 Ringier ČR - Výzkumné oddělení Χ 2 test dobré shody."

Podobné prezentace


Reklamy Google