Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
ZveřejnilMonika Vítková
1
Analýza nákupního košíku Vlastimil Menčík
2
Data účtenky ze supermarketu celkem cca 60 použito asi 50 z různých zdrojů
3
Předzpracování dat ruční převod do XML časově náročné vytvoření dobré představy o struktuře dat
4
Číselník rozdělení zboží do hierarchických kategorií např. 4.3.1 = nealko.minerálka.perlivá vytváření během převodu dat do XML
5
Použitý software vlastní aplikace v Javě maximální přizpůsobení potřebám úlohy všechny potřebné nástroje v jednom prostředí (parsování XML, kolekce, …)
6
Reprezentace dat odpovídá struktuře XML přidány agregované informace (počty položek v transakci podle daných kategorií, atd.) třídy Category, Item, Receipt
7
Vlastní MBA vstup: seznam sledovaných kategorií výstup: pravidla (třída Rule) nad danými kategoriemi se spočítanou podporou, spolehlivostí a zlepšením
8
Výsledky (1) ovlivněné povahou získaných dat pestrý sortiment zboží => nízká podpora pravidel 2 typy transakcí: – malý „náhodný“ nákup – pravidelný velký nákup
9
Výsledky (2) mléčné výrobky=>pečivoS=0.6000R=0.8437I=1.1167 pečivo => mléčné výrobky S=0.6000R=0.7941I=1.1167 jogurt => houskyS=0.2000R=0.7500I=1.6071 zelenina=>pečivoS=0.4666R=0.9545I=1.2633 pečivo => zelenina S=0.4666R=0.6176I=1.2633 olej =>čerstvá zeleninaS=0.1555R=1.0000I=2.2500 olej => okurkyS=0.1111R=0.7142I=3.5714 olej => rajčataS=0.1111R=0.7142I=4.0178 olej => bramboryS=0.1111R=0.7142I=4.5918 džus => chlebaS=0.1777R=0.8000I=2.0000 maso => rohlíkyS=0.2222R=0.7692I=1.5050 chleba =>pivoS=0.2888R=0.7222I=1.7105
10
Závěr bylo by potřeba (řádově) vetší množství dat důležitá volba kategorií, resp. úrovně granularity když už má pravidlo vysokou podporu, tak má malé zlepšení (problém častých položek)
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.