Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Marketingový výzkum v praxi část 3A: od Od datové matice k závěrečné zprávě Martin Zaplatílek FOCUS, Centrum pro sociální a marketingovou analýzu

Podobné prezentace


Prezentace na téma: "Marketingový výzkum v praxi část 3A: od Od datové matice k závěrečné zprávě Martin Zaplatílek FOCUS, Centrum pro sociální a marketingovou analýzu"— Transkript prezentace:

1 Marketingový výzkum v praxi část 3A: od Od datové matice k závěrečné zprávě Martin Zaplatílek FOCUS, Centrum pro sociální a marketingovou analýzu

2 PŘÍPRAVA DAT, ANALÝZY A ZÁVĚREČNÁ ZPRÁVA Máme:  Zadání a definované cíle výzkumu  Data zapsaná v datové matici Co nás čeká:  Kontrola dat – kvóty, kódování variant a záznam otevřených otázek atd.  Konstrukce kategorizovaných, „dummy“ a agregovaných proměnných, definování nezávislých proměnných, které budete používat v celé zprávě  Volba analytických přístupů – frekvence, volba nezávislých proměnných, další analýzy (cluster analysis, rozhodovací stromy, factor analysis atp.)  Vypracování osnovy zprávy  Analýza a grafické zpracování výstupů  Kompletace a editace výzkumné zprávy 2

3 PROCES PRÁCE S DATY V AGENTUŘE 3 Měření / pozorování / dotazování Záznam dat / kódování Čištění dat Transformace / spojování Chybějící hodnoty / „missing value Analýza dat Závěrečná zpráva a prezentace výsledků

4 KONTROLA DATOVÉ MATICE Kontrola datové matice je základem pro další práci – princip „waste in, waste out“…  „Pokud vaše nová data obsahují více než 30 čísel, tak je v nich skoro jistě nějaká chyba.“ (Spoustův teorém…)  Čištění a příprava dat zabírá obvykle okolo 80 % analytikova času, věnuje se mu jako hlavnímu tématu méně než 1 % článků ve statistických a podobných časopisech.  Čištění dat je často komplikované, nezřídka nudné a naprosto vždy zásadně důležité… Základní zásadou je přípravu dat nepodcenit a pod tlakem (termínu, zvědavosti, šéfa, klienta…) se nepustit do zpracování výstupů, dokud nemáte data připravená. 4

5 KONTROLA DATOVÉ MATICE  zkontrolovat úplnost datové matice (vytřídit neúplně vyplněné dotazníky / cases – zejména případy, kde chybí kvótní znaky nebo většina proměnných)  „olabelovat“ proměnné a varianty proměnných zkontrolovat, zda odpovídají variantám v dotazníku  ověřit ID (čísla dotazníků, záznamy o respondentech atp. – první eliminace duplicit)  ověřit duplicitní data (lze procedurou v SPSS, případně náhodná kontrola)  zkontrolovat, zda jsou u všech kvótních proměnných data kompletní pokud ne, zvážit, zda je lze možno data doplnit na základě jiných vyplněných proměnných (příjem možno doplnit na základě lineární regrese - pracnost a časová náročnost; přitom např. variantu čistý měsíční příjem do jisté míry supluje např. agregovaná proměnná socioekonoický status…) zkontrolovat, zda jsou uvedeny jen platné varianty proměnné (př. zda u věku v matici 18let + nejsou 16-letí, u pohlaví 3 varianty odpovědí atd.) ověřit, zda varianty kvótních proměnných odpovídají kvótě (zda jsou stejné věkové kategorie, velikosti obce, kategorie u vzdělání) – viz dále vážení 5

6 KONTROLA DATOVÉ MATICE  u volných / otevřených otázek zda odpovídají jen ti, kteří odpovídat mají (např. „varianta jiné – uveďte:“) doplnit chybějící odpovědi variantou „neodpověděl/a“ kódování a kategorizace – definovat obecnější kategorie a do nich varianty odpovědí rekódovat (např. ot 13 jiné - kategorie klid, ticho do níž sdružit varianty klidné prostředí, únik před hlukem města, oáza ticha, místo, kde mám klid na rozhovor… ) o respondenti při odpovědích i tazatelé při zápisu jsou často nesnesitelně kreativní….  zkontrolovat orientaci škál v dotazníku a v datové matici pozor na dlouhodobé / longitudinální výzkumy a zásahy do dotazníků v jejich průběhu – „vylepšení“ (mírné přeformulování otázky, redukce či otočení škály…) často znásobí požadavky na práci analytika… 6

7 KONTROLA DATOVÉ MATICE  první pohled na data – třídění prvního stupně pomocí frequencies si udělat základní přehled o proměnných a distribuci dat zda nejsou v některých případech uváděny extrémní hodnoty (zejm. kardinální proměnné, např. cena/ks) zda nejsou uváděny hodnoty mimo definovaný rámec („out of range“) kontrola použitých jednotek - kódování času (roky, měsíce, hodiny, minuty)  kontrola vazeb mezi proměnnými – třídění druhého stupně crosstabs – vazby mezi dvěma proměnnými; odhalení nelogických odpovědí (samostatná osoba v domácnosti x počet dětí v domácnosti 3; Zlín, kraj Karlovarský; Praha, velikost obce do 4999 ….) – odhalí často chyby v kódování i „nepoctivé tazatele“ první analytický pohled – můžeme při té příležitosti najít či ověřit korelace mezi proměnnými 7

8 VÁŽENÍ DAT – postratifikační váhy Při nesouladu kvóty a dat je vhodné zvážit možnost data upravit vážením  váhy vyrovnají charakteristiky vzorku s distribucí znaků v populaci  vážením tedy eliminuje odchylky od kvóty v rámci datového souboru a „napravujeme“ jeho reprezentativitu  vážení kompenzuje zejména non-response apod. – je to „z nouze ctnost“, nelze na něj a priori spoléhat při sběru dat a dodržování kvót…  je možné/vhodné jen v případě dostatečně velkého vzorku  musíme mít co vážit = v dané kategorii musí být data – u velkých odchylek od kvóty hrozí i w=3 a více, tzn. že daný případ je ve zpracování zahrnut 3x …  má i další omezení – řada analýz s vahami nepracuje (rozhodovací stromy, clusterová analýza atp.) 8

9 VÁŽENÍ DAT poststratifikační váhy Vždy vážíme dle kvótních znaků a na úrovni, z níž budeme zpracovávat výstupy  tzn. při výzkumu reprezentativní na populaci ČR 18 let a více a kvótách pro jednotlivé kraje = konstrukce vah pro jednotlivé kraje zvlášť Při práci se souborem musíme mít na paměti, že vážící proměnná musí být zapnuta („weight on“ v dolním stavovém řádku)  váha = očekávaný podíl / zjištěný podíl př. máme-li 25 % žen a v populaci jich má být 50 %, bude váha 50/25 = 2,0 (strata jsou dána pohlavím)  agregovaná váha – pro daný případ na základě dílčích vah pro jednotlivé kvótní znaky (w1 – pohlaví, w2 – věk, w3 – vzdělání, w4 – velikost obce) w = w1*w2*w3*w4 9

10 VÁŽENÍ DAT 10 w = w1*w2*w3*w4 Rel. četnosti obyvatelstva 18+ podle krajů. Praha Doporučený počet tazatelů: N= 160 Taz.=11 Vzdělání%n základní11,39%18 vyučen30,08%48 maturita34,81%56 VŠ22,19%35 celkem98,46% ,54 23 Sex%n muži47,41%76 ženy52,59%84 celkem100,00%160 Věk%n ,07% ,99% ,75% ,17% ,51% ,51%31 celkem100,00%160 kraj = Praha Count pohlavímuž 63 žena 68 věk vzdělánízákladní 15 sš bez maturity 41 sš s maturitou 46 vysokoškol ské 29 velikost obce do krajPraha 131 ČESKÁ REPUBLIKA - uprava pro jednotlivé krajePraha VZOREK160 očekávanédosažené počet%STARÉváha W1POHLAVÍ160100,0 131 muži7647, ,20 ženy8452, ,24 W2VĚK160100, let1912, , let2917, , let2515, , let3220, , let2314, ,22 65 a více let3119, ,30 W3VZDĚLÁNÍ160100,0 131 základné1811, ,22 bez maturity5031, ,21 s maturitou5735, ,23 vysokoškolské3522, ,22 W4 VELIKOST OBCE160100,0 134 do #DIV/0! #DIV/0! ,0 #DIV/0! ,19 KVÓTA KVÓTNÍ ZNAKY V DATECH KONSTRUKCE VAH

11 VÁŽENÍ DAT 11 w = w1*w2*w3*w4 compute w1=1. compute w2=1. compute w3=1. compute w4=1. execute. if (pohlavi=1) w1=1.02. if (pohlavi=2) w1=1.09. if (vek=1) w2=1.01. if (vek=2) w2=1.06. if (vek=3) w2=1.02. if (vek=4) w2=1.01. if (vek=5) w2=0.92. if (vek=6) w2=1.18. if (vzdelani=1) w3=1.08. if (vzdelani=2) w3=1.03. if (vzdelani=3) w3=1.07. if (vzdelani=4) w3=0.99. if (velobce=1) w4=1.08. if (velobce=2) w4=1.55. if (velobce=3) w4=0.84. if (velobce=4) w4=0.99. execute. compute w=w1*w2*w3*w4. weigh by w. FREQUENCIES VARIABLES=kraj pohlavi vek vzdelani velobce /ORDER= ANALYSIS SYNTAX WEIGHT CASES BY …

12 POMOCNÉ A AGREGOVANÉ PROMĚNNÉ Při zpracování zprávy si zřídkakdy vystačíme s proměnnými, které máme ve výchozí datové matici  při zpracování často využijeme kategorizované proměnné s menším počtem variant zejména u třídících / nezávislých proměnných používaných při analýze jako univerzální třídící znaky v celé zprávě při kategorizaci zvažujme praktičnost vs hrozící ztrátu informací a detailů př. věk – z kardinální proměnné věk v letech vytvoříme ordinální s kategoriemi věk 18-25let, 26-35let atd.; obdobně u např. frekvence návštěv restaurací, délky pobytu v Olomouci týdně apod. (viz dotazník vašeho projektu)  proměnné typu dummy využijeme pro rychlé rozdělení souboru - případy, kdy daný znak je / není přítomen; například nová proměnná „obed“ s variantami „obědvá pravidelně“, „neobědvá pravidelně“ 12

13 POMOCNÉ A AGREGOVANÉ PROMĚNNÉ  agregované proměnné – nově vytvořená proměnná za základě specifických kritérií a hodnot několika jiných proměnných příklady: socioekonomický status – stratifikuje respondenty podle délky vzdělání, pozice v zaměstnání a vybavení domácnosti segmenty – typologie respondentů na základě distinktivních znaků, které je spojují, resp. rozdělují o nejčastěji na základě behaviorálních znaků (spotřebitelské chování a zvyklosti), mediálního chování (vnímání jednotlivých typů médií) a psychografie (sebepercepce, souhlas s výroky atp.) 13

14 ZPRÁVA Z VÝZKUMU  Prvním krokem je zpracování osnovy pořadí otázek v dotazníku není zavazující pro zpracování zprávy o pořadí otázek je dáno dramaturgií dotazníku, která má jiné priority než závěrečná zpráva na základě zadání / projektu stanovíme obsah a pořadí kapitol, následně vytvoříme podkapitoly s přiřazením otázek z dotazníku, které se ke kapitole váží o hlavní zásadou je nevynechat v analýze některou z proměnných… přesto se vám to určitě dříve či později stane  počítejte vždy s čtenářem jako naprostým laikem, v lepším případě poučeným laikem… na úvod zprávy jej seznamte s cíli výzkumu, metodou sběru a zpracování dat, případně i používanou terminologií u pokročilejších analýz alespoň stručně objasněte, jak pracují a čeho jejich použitím chcete dosáhnout 14

15 ZPRÁVA Z VÝZKUMU 15  TITULNÍ STRANA měla by odpovídat corporate identity (tzn. vizuálně být navázána na firemní grafiku) – logo, logotyp, použité fonty jednoznačně referovat o obsahu zprávy – název, specifikace typu výzkumu, datum zpracování název a logo klienta přehledná, jednoduchá, srozumitelná, distinktivní o téma i zpracovatel zprávy by měli být jasní na první pohled…

16 ZPRÁVA Z VÝZKUMU 16  OBSAH  METODA VÝZKUMU přehledný a detailní popis použitých metod na jakou skupinu výsledky vztahujeme (cílová populace) specifikace výběrového souboru a způsob výběru metodika sběru dat popis kontroly sběru dat o „záruka věrohodnosti výsledků“ je vhodné doplnit údaj o intervalu spolehlivosti o známe-li velikost cílové populace o

17 ZPRÁVA Z VÝZKUMU 17  CÍLE VÝZKUMU stručné shrnutí hlavních cílů na základě projektu výzkumu  HLAVNÍ ZÁVĚRY shrnutí nejdůležitějších výsledků z analýzy provázání poznatků z dílčích kapitol doporučení pro klienta pro účely další publikace je možné je psát stylem tiskové zprávy; tzn. vyhnout se čast. použ. zkr. apod., podíly psát slovně spíše než % o text je celistvý, lépe se čte, detailní informace nalezne čtenář na úvodu jednotlivých kapitol

18 ZPRÁVA Z VÝZKUMU 18  PROFIL VÝBĚROVÉHO SOUBORU prezentuje rozložení dat v rámci kvótních proměnných v grafu pro ilustraci dodržení kvóty můžeme zobrazit rozložení znaku v cílové populaci je vhodné jej doplnit i o další nezávislé proměnné, které budou ve zprávě používány POZN. POPISKY U GRAFŮ jednoznačně specifikovat zda jde o %, průměry či absolutní četnosti specifikovat cílovou populaci, k níž se graf vztahuje včetně počtu respondentů, kteří na otázku odpovídali v případě bar chart grafů možno vedle každého sloupce vypsat počet respondentů v dané kategorii, kteří byli do grafu zahrnuti graf musí být srozumitelný a jasný bez dalších poznámek, doplnění a vysvětlení (oceníte při zpracování prezentace) $

19 ZPRÁVA Z VÝZKUMU 19 ZÁKLADNÍ OBECNÁ DOPORUČENÍ PRO TVORBU ZPRÁVY  od obecného k detailnímu vždy začít s tématy (otázkami), ke kterým se vyjadřovali všichni respondenti detailní výstupy zobrazit v rámci zvolených nezávislých proměnných (zejména tedy sociodemografické charakteristiky respondentů + další vybrané nezávislé proměnné) zaměřit se na rozdíly ve výsledcích pro jednotlivé varianty nezávislých proměnných a interpretovat je; ověřit statistickou významnost zaznamenaných rozdílů o nástroj AnswerTree v SPSS – třídění závislé proměnné na základě statistické významnosti vztahů s nezávislými proměnnými (procedura CHAID) o v případě nedostatku času vždy posuzovat alespoň rozdíly na základě velikosti vzorku v podkategorii a ve výstupech upozornit / být opatrní při interpretaci (př. v rámci celku (N = 1000) preferuje výrobek 36 % dotázaných, mezi trojgeneračními domácnostmi 65 % - počet respondentů je však jen 22 …)

20 ZPRÁVA Z VÝZKUMU 20 ZÁKLADNÍ OBECNÁ DOPORUČENÍ PRO TVORBU ZPRÁVY  od podstatného k méně podstatnému pohlížejte na zprávu očima zadavatele výzkumu o co je pro něj podstatné, o co bude mít při čtení zprávy největší zájem - podpořená a spontánní znalost značky XY, zaznamenání reklamy, zkušenost s výrobkem, hodnocení značky a konkurence… nebo spíše profil zákazníků, potencionálně oslovitelných spotřebitelů… nebo velikost populace s vyšší afinitou k některým výrobkům  text sdružujte do větších logických celků pro orientaci ve výsledcích a celkový přehled o zjištěních z výzkumu je lepší interpretovat grafy a tabulky na úvod kapitoly než přímo u jednotlivých grafů  preferujte zobrazení grafy před tabulkami grafy umožní rychlejší orientaci ve výsledcích; tabulky jsou vhodnější dát do přílohy v excelových listech o k metodám zobrazení více viz Hendl „Přehled statistických metod…“, kap. 3.1

21 ZPRÁVA Z VÝZKUMU 21 VOLBA NEZÁVISLÝCH PROMĚNNÝCH (TŘÍDÍCÍCH ZNAKŮ)  v případě vašeho výzkumu omezení malým vzorkem (N = 100) demografické charakteristiky (pohlaví, věk) délka pobytu v Olomouc týdně o kategorizovat např. na tři kategorie „1 den/týdně“; „2-4 dny/týdně“; „více dnů v týdnu“ další? kuřák /nekuřák? o lze očekávat, že (ne)kuřáci budou preferovat odlišné typy restaurací a kaváren, rovněž jejich spokojenost s nabídkou (ne)kuřáckých restaurací se bude lišit kategorizace q20 – konzumace v restauraci ? o např. „častý/á konzument/ka alkoholu“, „častý/á konzument/ka nealko nápojů“, „ častý/á konzument/ka kávy / čaje“ o lze očekávat, že tyto skupiny spotřebitelů budou mít odlišné preference, jinou frekvenci návštěv restaurací –

22 ZPRÁVA Z VÝZKUMU 22 VOLBA NEZÁVISLÝCH PROMĚNNÝCH (TŘÍDÍCÍCH ZNAKŮ) studijní charakteristiky (fakulta, ročník)? o zvážit na základě dat, zda se stravovací návyky a preference liší mezi studenty různých fakult o bude v jednotlivých kategoriích proměnných dostatečný počet respondentů? o totéž u ročníku – opravdu se liší? a pokud ano, je to v rámci jednotlivých ročníků a nebo se liší „prváci“ (neznají město, mají jiný životní styl ovlivněný místem, kde dosud bydleli apod.) od zbytku? a nebo je to úplně jinak…?

23 ZPRÁVA Z VÝZKUMU 23  NÁVRH OSNOVY (nezávazný, hrubý náčrt pro inspiraci…) NÁZEV VÝZKUMU: ………………….. 1.CÍLE VÝZKUMU 2.METODA VÝZKUMU 3.HLAVNÍ ZÁVĚRY 4.PROFIL VÝBĚROVÉHO SOUBORU 5.STRAVOVACÍ ZVYKLOSTI STUDENTŮ OLOMOUCKÝCH VŠ 1.Preferovaný typ stravy 2.Snídaně 3.Obědy 4.Večeře 6.PREFERENCE PŘI NÁVŠTĚVE RESTAURACÍ A KAVÁREN 1.Konzumace jednotlivých typů nápojů 1.frekvence konzumace, oblíbená značka piva 2.Cenová citlivost (promyslet, zahrnout i výstup „obvykle vydaná cena - večeře…)“ vs „ochota vydat za večeři v restauraci“) 1.menu 2.nápoje 7.OBLÍBENÝ PODNIK A HODNOCENÍ AKTUÁLNÍ NABÍDKY STRAVOVACÍCH ZAŘÍZENÍ 8.HODNOCENÍ ZÁMĚRU NOVÉ RESTAURACE A JEJÍCH CHARAKTERISTIK

24 ZPRÁVA Z VÝZKUMU 24 STRUKTURACE VÝSTUPŮ  shrnutí na úvod kapitoly zahrnuje interpretaci všech následujících grafů a vybraných výstupů pro třídění druhého stupně (tedy výstupy v rámci třídění podle nezávislých proměnných pohlaví, věk, ?,?,?)  graf z výstupu pro celou zkoumanou populaci koláčový graf v případě proměnné s jednou možností odpovědi

25 ZPRÁVA Z VÝZKUMU 25 STRUKTURACE VÝSTUPŮ sloupcový u „multiple response“ (např. q13) nebo proměnných s velkým počte variant, případně chceme-li zdůraznit pořadí a odstup jednotlivých variant slopucový graf v případě baterie výroků s hodnocením na škále

26 ZPRÁVA Z VÝZKUMU 26 STRUKTURACE VÝSTUPŮ spojnicový graf u kardinálních a ordinálních znaků – vhodný pro zobrazení cenové citlivosti atp.

27 ZPRÁVA Z VÝZKUMU 27 STRUKTURACE VÝSTUPŮ  graf s výstupy na základě třídění dle nezávislých proměnných řádková % pro každou nezávislou proměnnou v případě baterie výroků s hodnocením na škále je vhodné zobrazení průměrů v každé kategorii nezávislé proměnné o tedy rozdíly dle věku, pohlaví atd. o pozor na var. „neví“ – označována kódy 9 či 99; nezahrnout do výpočtu průměrů! (klasická chyba…)

28 ZPRÁVA Z VÝZKUMU 28 STRUKTURACE VÝSTUPŮ  graf s výstupy na základě třídění dle nezávislých proměnných možnost použít AnswerTree – procedura CHAID; rozděluje soubor podle odpovědí na otázku dle statisticky významných rozdílů v rámci nezávislých proměnných zobrazí jen statisticky významné rozdíly SPSS nabídka: Analyze/Classify/Tree logo

29 LITERATURA HENDL, J., 2006: Přehled statistických metod zpracování dat, Portál; kap. 2, 3, 15 BÁRTOVÁ, H., BÁRTA, V., KOUDELKA, J : Chování spotřebitele a výzkum trhu. 2. přepr. vyd. Praha : VŠ DISMAN, M, 1993: Jak se vyrábí sociologická znalost, Karolinum, Praha PŘIBOVÁ, M., 1998: Analýza konkurence a trhu, Grada KOUDELKA, J., 2005: Segmentujeme spotřební trhy, Professional Publishing KALKA, J., ALLGAYER, F., 2008: Marketing podle cílových skupin, Computer Press AJAN S GAUR, SANJAYA S GAUR, 2005: Statistical Methods for Practice and Research, SAGE HAUGE, P., 2003: Průzkum trhu, Computer Press (kap. 12 a 13) SILVERMAN, D., 2005: Ako robiť kvalitatívny výskum, 2005 (kap. 10 – 21) DENZIN, N.K., LINCOLN, Y., 2005: Handbook of Qualitative Research, SAGE MEDIA GURU, Mediální slovník, (leden ´10) ŘEZANKOVÁ, H, MAREK, L, VRABEC, M., 2000: IASTAT - Internetová učebnice statistiky (leden ´10) STATSOFT: Elektronická učebnice statistiky statistiky/ (leden ´10) SAMPLE SIZE CALCULATOR, (leden ´10) 29

30 TÝMOVÁ PRÁCE V NÁSLEDUJÍCÍCH DNECH 30

31 Práce v týmech Zkontrolujte si datovou matici Zkontrolujte, zda data odpovídají kvótě Připravte si proměnné k analýze Vytvořte si osnovu zprávy a promyslete postup zpracování Rozdělte si práci na zprávě Vytvořte závěrečnou zprávu z připravených dat v PowerPointu DO PÁTKU a odešlete ji na adresu 31

32 Co nás čeká příště? Další setkání: S dotazy a připomínkami se obracejte na adresu: Na dalším setkání se budeme věnovat hodnocení vašich zpráv a zaměříme se na zpracování prezentace. 32

33 POMŮCKA PRO PRVNÍ KONTAKT S SPSS více viz uživatelská příručka SPSS (odkaz v sekci „užitečné odkazy – SPSS“) 33

34 OTEVŘENÍ DATOVÉHO SOUBORU

35 VYTVOŘENÍ NOVÉ KATEGORIZOVANÉ PROMĚNNÉ

36 VYTVOŘENÍ PROMĚNNÉ PRO MULTIPLE RESPONSE

37 UŽITEČNÉ ODKAZY - SPSS %2013-_E.htm – uživatelská příručka SPSS 13 %2013-_E.htm

38 Na viděnou! Martin ZAPLATÍLEK FOCUS, Centrum pro sociální a marketingovou analýzu


Stáhnout ppt "Marketingový výzkum v praxi část 3A: od Od datové matice k závěrečné zprávě Martin Zaplatílek FOCUS, Centrum pro sociální a marketingovou analýzu"

Podobné prezentace


Reklamy Google