Modelování odezvy zákazníků v systému SAS Enterprise Miner™ Ukázková úloha pro předmět Získávání znalostí z databází doc. Ing. Jaroslav Zendulka, CSc.

Slides:



Advertisements
Podobné prezentace
PKML.
Advertisements

Stodůlky 1977 a 2007 foto Václav Vančura, 1977 foto Jan Vančura, 2007.
Města ČR – orientace na mapě
Zpracování informací a znalostí Další přístupy k vyhledávání textových dokumentů Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství.
TEORIE ROZHODOVÁNÍ A TEORIE HER
Napoleon Bonaparte.
*Zdroj: Průzkum spotřebitelů Komise EU, ukazatel GfK. Ekonomická očekávání v Evropě Březen.
Český Internet po (uši v?) krizi Marek Antoš. snímek |datum |dokument | 1. Internetové prostředí 2.
Příprava R&R studie Obsluha by měla měřit alespoň 10 dílů - nebo více Vyberte díly, které reprezentují výrobní proces z dlouhodobého hlediska Vyberte alespoň.
Aktuální informace o vyšetřování c-erb-2 genu v referenční laboratoři a návrh změny v indikačních kritériích Hajdúch M., Petráková K., Kolář Z., Trojanec.
19.1 Odčítání v oboru do 100 s přechodem přes desítku
Student: Ing. Olga Minaříková školitel: doc.akad.soch. Miroslav Zvonek, PhD. srpen 2009.
Téma 3 ODM, analýza prutové soustavy, řešení nosníků
Urči název a zařaď do příslušné skupiny
Tomáš NETERDA 1961 Sportovní kariéra : plavecké třídy ZŠ Komenského gymnázium Dašická plavecká škola
Dynamické rozvozní úlohy
Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .
Výzkumy volebních preferencí za ČR a kraje od
NÁSOBENÍ ČÍSLEM 10 ZÁVĚREČNÉ SHRNUTÍ
Téma: SČÍTÁNÍ A ODČÍTÁNÍ CELÝCH ČÍSEL 2
Jak měřit transparentnost NNO?
Vzdělávací materiál / DUMVY_32_INOVACE_02B14 Příkazový řádek: obsah souborů PŘÍKLADY AutorIng. Petr Haman Období vytvořeníLeden 2013 Ročník / věková kategorie3.
Nejmenší společný násobek
VY_32_INOVACE_INF_RO_12 Digitální učební materiál
Animace Demo Animace - Úvodní animace 1. celé najednou.
Průvodní list Jméno autora: Ing. Miroslava Jeřichová
Elektronická učebnice - I
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)
Střední škola Oselce Škola: SŠ Oselce, Oselce 1, Nepomuk, Projekt: Registrační číslo: CZ.1.07/1.5.00/ Název: Modernizace.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Martina Burgetová Tento materiál byl vytvořen v rámci projektu Operačního programu.
Zábavná matematika.
Dělení se zbytkem 6 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Letokruhy Projekt žáků Střední lesnické školy a střední odborné školy sociální ve Šluknově.
Stav studie „Seroprevalence VHC u injekčních uživatelů drog“ k Národní monitorovací středisko pro drogy a drogové závislosti Úřad vlády ČR tel.
Čtení myšlenek Je to až neuvěřitelné, ale skutečně je to tak. Dokážu číst myšlenky.Pokud mne chceš vyzkoušet – prosím.
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
Únorové počítání.
Inovace a zkvalitnění výuky prostřednictvím ICT VY_32_INOVACE_412_3TR_M Autor: Mgr. Jana Siederová 1 Základní škola Karviná – Nové Město tř. Družby 1383.
52_INOVACE_ZBO2_1364HO Výukový materiál v rámci projektu OPVK 1.5 Peníze středním školám Číslo projektu:CZ.1.07/1.5.00/ Název projektu:Rozvoj vzdělanosti.
Dělení se zbytkem 8 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Násobení a dělení čísel (10,100, 1000)
Náhoda, generátory náhodných čísel
Sexuální život u pacientů s mentálním postižením v ÚSP
Zásady pozorování a vyjednávání Soustředění – zaznamenat (podívat se) – udržet (zobrazit) v povědomí – představit si – (opakovat, pokud se nezdaří /doma/)
SČÍTÁNÍ A ODČÍTÁNÍ V OBORU DO 100
Hrubá - prostá incidence nádorů kolorekta u mužů 1. Maďarsko 88,29 2. Česká Republika 86,73 3. Japonsko 77,74 4. Německo 75,39 5. Nový Zéland71,77 6. Austrálie.
TRUHLÁŘ II.ročník Výrobní zařízení Střední škola stavební Teplice
Lounky PRO Vratimov, o.s. ( 1 Charitativní sbírka Lounky 06/2013.
Cvičná hodnotící prezentace Hodnocení vybraného projektu 1.
Celá čísla Dělení.
DĚLENÍ ČÍSLEM 7 HLAVOLAM DOPLŇOVAČKA PROCVIČOVÁNÍ
Fyzika 2 – ZS_4 OPTIKA.
Analýza knihovnických standardů za rok 2006 knihovny Jmk Provozní doba Nákup knihovního fondu Kč na 1 obyvatele Roční přírůstek Počet studijních míst Veřejně.
Číslo projektu CZ.1.07/1.500/ Číslo materiálu VY_42_INOVACE_matematika_22 Název školy Táborské soukromé gymnázium, s. r. o. Autor Bc. Ivana Kotková.
MS PowerPoint Příloha - šablony.
1 Celostátní konference ředitelů gymnázií ČR AŘG ČR P ř e r o v Mezikrajová komparace ekonomiky gymnázií.
Technické kreslení.
Úkoly nejen pro holky.
END 1.Přítelem 2.Druhem 3.Milencem 4.Bratrem 5.Otcem 6.Učitelem 7.Vychovatelem 8.Kuchařem 9.Elektrikářem 10.Instalatérem 11.Mechanikem 12.Návrhářem 13.Stylistou.
Přednost početních operací
DĚLENÍ ČÍSLEM 5 HLAVOLAM DOPLŇOVAČKA PROCVIČOVÁNÍ Zpracovala: Mgr. Jana Francová, výukový materiál EU-OP VK-III/2 ICT DUM 50.
Slovní úlohy řešené soustavou rovnic
ELEKTRICKÉ VLASTNOSTI LÁTEK
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
KONTROLNÍ PRÁCE.
Gymnázium, Broumov, Hradební 218
Porovnání výroby a prodejů vozidel ve světě
SHLUKOVÁNÍ David Zeman FIT VUT UIFS Získávání znalostí z databází Modelování shlukové analýzy v systému SAS Enterprise Miner TM.
Transkript prezentace:

Modelování odezvy zákazníků v systému SAS Enterprise Miner™ Ukázková úloha pro předmět Získávání znalostí z databází doc. Ing. Jaroslav Zendulka, CSc. FIT VUT v Brně

Modelování odezvy zákazníků 2 Obsah Definice problému Postup –Definice zdroje dat a prozkoumání dat –Příprava dat –Vytvoření regresního modelu –Vytvoření rozhodovacího stromu –Dokumentace –Aplikace modelu

Modelování odezvy zákazníků 3 Definice problému (1) Předpokládejme, že pracujeme pro zásilkovou firmu, která měsíčně rozesílá katalog zařízení pro domácnost a domácích potřeb. Jako součást nadcházející prodejní kampaně chce distribuovat speciální katalog věnovaný kvalitnímu stolování, který zahrnuje vybavení kuchyní, nádobí a příbory. Je ale příliš drahé rozeslat katalog všem zákazníkům. Proto je ho potřeba směrovat těm, kteří některé z nabízeného zboží s velkou pravděpodobností zakoupí. Dosáhneme toho tak, že nejprve vytvoříme model tendence (k nákupu) a na jeho základě sestavíme seznam takových zákazníků. (převzato z Getting Started with SAS Enterprise Miner™)

Modelování odezvy zákazníků 4 Definice problému (2) Naštěstí máme rozsáhlý soubor záznamů nákupů zákazníků. Data zahrnují proměnné, které indikují, zda zákazníci zakoupili během posledních dvou let vybavení kuchyní, nádobí nebo příbory. Tato historie nákupů byla použita k vytvoření datového souboru (tabulky) CUSTDET1 s následujícími 49 proměnnými (sloupci):

Modelování odezvy zákazníků 5 Definice problému (3) Purchase, Dollars Spent, Yearly Income. Home Value, Order Frequency, Recency, Married, Name Prefix, Age, Sex, Telemarket Ind., Rents Apartment, Occupied <1 Year, Domestic Product, Apparel, Purchase, Leisure Product, Luxury Items, Kitchen Product, Dishes Purchase, Flatware Purchase, Total Dining (kitch+dish+flat), Promo: 1-7 Months, Promo: 8-13 Months, $ Value per Mailing, Country Code, Total Returns, Mens Apparel, Home Furniture, Lamps Purchase, Linens Purchase, Blankets Purchase, Towels Purchase, Outdoor Product, Coats Purchase, Ladies Coats, Ladies Apparel, His/Her Apparel, Jewelry Purchase, Date 1st Order, Telemarket Order, Account Number, State Code, Race, Heating Type, Number of Cars, Number of Kids, Travel Time, Education Level, Job Category

Modelování odezvy zákazníků 6 Definice problému (4) Předpokládejme, že byla vytvořena proměnná označená Total Dining (kitch+dish+flat), která obsahuje součet hodnot proměnných Kitchen Product, Dishes Purchase a Flatware Purchase a udává tedy, za kolik zákazník nakoupil dané druhy zboží. Tato proměnná bude základem modelu, který vytvoříme, protože indikuje zájem o produkty pro stolování.

Modelování odezvy zákazníků 7 Definice zdroje dat (1) 1.Vytvoření projektu 2.Vložení uzlu Input Data Source

Modelování odezvy zákazníků 8 Definice zdroje dat (2)

Modelování odezvy zákazníků 9 Pochopení charakteru dat (1) 1.Vložení uzlu Insight

Modelování odezvy zákazníků 10 Pochopení charakteru dat (2) 2.Spuštění analýzy a studium charakteristik

Modelování odezvy zákazníků 11 Pochopení charakteru dat (3)

Modelování odezvy zákazníků 12 Transformace (1) 1.Vložení uzlu Transform Variables

Modelování odezvy zákazníků 13 Transformace (2) 1.Vytvoření nové proměnné (DINEBIN)

Modelování odezvy zákazníků 14 Modifikace atributů (1) 1.Vložení uzlu Data Set Attributes

Modelování odezvy zákazníků 15 Modifikace atributů (2) 2.Definování DINEBIN jako cíle 3.Vyřazení zbytečných vstupů (Kitchen Product, Dishes Purchase, Flatware Purchase) 4.Nastavení rozměru DINEBIN na ‘binary’ 5.Nastavení pořadí hodnot pro cíl Pozn: Attributy lze modifikovat i přímo v uzlu Input Data Source

Modelování odezvy zákazníků 16 Modifikace atributů (3)

Modelování odezvy zákazníků 17 Modifikace atributů (4)

Modelování odezvy zákazníků 18 Definice profilu cíle (1) 1.Model nákladů Důležitý pro cenové ohodnocení –přínos správné vs. ztráta nesprávné predikce Předpokládejme, že náklady na rozeslání katalogu jsou $10 a průměrná tržba $90/katalog => zisk při správné predikci: 90-10=$80 ztráta pří nesprávné predikci: $10

Modelování odezvy zákazníků 19 Definice profilu cíle(2) Nastavení strategie a konstantních nákladů

Modelování odezvy zákazníků 20 Definice profilu cíle (3) Nastavení očekávaného zisku

Modelování odezvy zákazníků 21 Definice profilu cíle (4) 2.Řešení problému převzorkování (oversampling) V důsledku malého počtu pozitivních případů (12%) v původním zdroji by bylo při náhodném vzorkování pro dolování málo pozitivních příkladů => převzorkování – zvýšení podílu pozitivních na 54%.

Modelování odezvy zákazníků 22 Definice profilu cíle (5) Nastavení původní četnosti

Modelování odezvy zákazníků 23 Rozčlenění dat (1) 1.Vložení uzlu Partition

Modelování odezvy zákazníků 24 Rozčlenění dat (2) 2.Nastavení metody a poměru množin

Modelování odezvy zákazníků 25 Náhrada dat (1) 1.Vložení uzlu Replacement

Modelování odezvy zákazníků 26 Náhrada dat (2) 2.Zavedení ‘indikačních’ proměnných

Modelování odezvy zákazníků 27 Vytvoření regresního modelu (1) 1.Vložení uzlu Regression

Modelování odezvy zákazníků 28 Vytvoření regresního modelu (2) 2.Volba metody výběru proměnných

Modelování odezvy zákazníků 29 Vytvoření regresního modelu (3) 3.Specifikace názvu modelu

Modelování odezvy zákazníků 30 Hodnocení regresního modelu (1) 1.Vložení uzlu Assessment

Modelování odezvy zákazníků 31 Hodnocení regresního modelu (2) 2.Vytvoření a validace modelu

Modelování odezvy zákazníků 32 Hodnocení regresního modelu (3) 3.Prohlížení výsledků - kumulativní lift

Modelování odezvy zákazníků 33 Vytvoření regresního modelu (4) 4.Prohlížení výsledků - nekumulativní lift

Modelování odezvy zákazníků 34 Vytvoření rozhodovacího stromu (1) 1.Vložení uzlu Tree

Modelování odezvy zákazníků 35 Vytvoření rozhodovacího stromu (2) 2.Vytvoření stromu a prohlížení - tabulka

Modelování odezvy zákazníků 36 Vytvoření rozhodovacího stromu (3) 3.Vytvoření stromu a prohlížení - graf

Modelování odezvy zákazníků 37 Hodnocení stromového modelu (1) 1.Připojení Tree k uzlu Assessment

Modelování odezvy zákazníků 38 Hodnocení stromového modelu (2) 2.Výběr modelu

Modelování odezvy zákazníků 39 Hodnocení stromového modelu (3) 3.Výběr modelu, resp. obou pro porovnání

Modelování odezvy zákazníků 40 Hodnocení stromového modelu (4) 4.Porovnání modelů - kumulativní lift

Modelování odezvy zákazníků 41 Hodnocení stromového modelu (5) 5.Porovnání modelů - nekumulativní lift

Modelování odezvy zákazníků 42 Hodnocení stromového modelu (6) 6.Porovnání modelů - návratnost (ROI)

Modelování odezvy zákazníků 43 Vygenerování dokumentace (1) 1.Vložení uzlu Reporter

Modelování odezvy zákazníků 44 Vygenerování dokumentace (6) 2.Vygenerování sady HTML dokumentů

Modelování odezvy zákazníků 45 Aplikace modelu (1) 1.Vložení uzlu Score

Modelování odezvy zákazníků 46 Aplikace modelu (2) 2.Nastavení režimu

Modelování odezvy zákazníků 47 Aplikace modelu (3) 3.Uložení kódu aplikace, export

Modelování odezvy zákazníků 48 Aplikace modelu (4) 4.Editace kódu aplikace (1)

Modelování odezvy zákazníků 49 Aplikace modelu (5) 4.Editace kódu aplikace (2)

Modelování odezvy zákazníků 50 Aplikace modelu (6) 4.Spuštění, zobrazení výsledků

Modelování odezvy zákazníků 51 Aplikace modelu v prostředí EM (1) 1.Přidání uzlu Input Data Source

Modelování odezvy zákazníků 52 Aplikace modelu v prostředí EM (2) 2.Nastavení parametrů uzlu

Modelování odezvy zákazníků 53 Aplikace modelu v prostředí EM (3) 3.Nastavení zdrojových dat pro model

Modelování odezvy zákazníků 54 Aplikace modelu v prostředí EM (4) 4.Přidání uzlu Insight pro prohlížení

Modelování odezvy zákazníků 55 Aplikace modelu v prostředí EM (5) 5.Nastavení parametrů uzlu, spuštění