Zpracování informací a znalostí Zadání úkolu č. 4 – DZD Jan Rauch Katedra informačního a znalostního inženýrství
Obsah Úkol číslo 4: DZD Asociační pravidla a 4ft-Miner – vybrané pojmy Mimořádné konzultace
Úkol číslo 4: DZD – zadání (1) Seznamte se se systémem LISp-Miner. K tomu jsou k dispozici tutoriály na adrese http://lispminer.vse.cz/tutorial/, použijte příklad Barbora, viz Barbora - analyza dat.ppsx a http://lispminer.vse.cz/tutorial/t8.html. Vyřešte dílčí analytickou otázku přiřazenou vašemu týmu na následujícím slide. Podrobnosti jsou v souboru Adamek_4IZ210_11_12_leto_ZADANI.pdf, bude k dispozici i online verse. Výsledkem budou analytické zprávy prezentované pomocí CMS systému JOOMLA, viz http://www.joomla.org/. Podrobnosti budou sděleny na příštím cvičení. Data jsou v souboru Adamek11_CASLAV.zip. Podrobný popis dat je v souboru Adamek_pro_KIZI_0412.pdf , bude k dispozici i online verse.
Úkol číslo 4: DZD – zadání (2) Dakal O2 Druhý tým O3 Elektron O4 Tým jedna O5 Wizards
Úkol číslo 4: DZD – skupiny atributů
Úkol číslo 4: DZD – data
Úkol číslo 4: CRISP-DM Porozumění problematice - nevyžaduje se specializovaná medicínská znalost, případné další podrobnosti lze nalézt na webu. Porozumění datům – viz Adamek_pro_KIZI_0412.pdf Transformace dat – viz Adamek_pro_KIZI_0412.pdf + LMDataSource Analytické procedury – asociační pravidla, aplikace procedury 4ft-Miner Interpretace výsledků a Využití výsledků – analytická zpráva v CMS JOOMLA
Úkol číslo 4: DZD – poznámky (1) Pro přípravu a transformace dat použijte proceduru LMDataSource, viz http://lispminer.vse.cz/tutorial/VideoTutorial/vt2/vt2.html a http://lispminer.vse.cz/tutorial/VideoTutorial/vt3/LMDataSource.html . Pro řešení analytické otázky použijte proceduru 4ft-Miner, viz http://lispminer.vse.cz/tutorial/t4.html , http://lispminer.vse.cz/tutorial/t5.html a http://lispminer.vse.cz/tutorial/VideoTutorial/vt4/4ftTask.html a případně též LMDataSource_0409.pdf a 4ft-Miner_Cedenty_1111.pdf, Podrobnosti o tvorbě analytické zprávy budou sděleny na dalším cvičení. Další informace budou poskytnuty dle potřeby.
Úkol číslo 4: DZD – poznámky (2) Systém LISp-Miner je vyvíjen na FIS VŠE pro potřeby výzkumu a vývoje, byl vícekrát použit i pro analýzu reálných dat. Procedura 4ft-Miner je jednou z analytických procedur implementovaných v systému LISP-Miner. Ve výuce předmětu 4IZ210 jsou využity pouze některé možnosti procedury 4ft-Miner . V systému LISp-Miner jsou mimo jiné další dvě procedury které pracují s asociačními pravidly, přesněji se zajímavými dvojicemi asociačních pravidel. Procedura SD4ft-Miner hledá dvojice asociačních pravidel které ukazují na dvě podmnožiny objektů, výrazně se lišící co se týče charakteristik nějakého asociačního pravidla. Procedura Ac4ft-Miner hledá dvojice asociačních pravidel které naznačují nějakou potenciálně užitečnou akci. Podrobnosti budou sděleny na přednášce.
Asociační pravidla a 4ft-Miner – vybrané pojmy Matice dat a booleovské atributy Asociační pravidlo a cedenty v proceduře 4ft-Miner Příklady 4ft-kvantifikátorů Příklady zadání parametrů procedury 4ft-Miner
Matice dat a booleovské atributy Matice dat M Základní boolevské atributy Atributy objekt o1 o2 … on A1 A2 … Am 3 54 16 7 5 A1(3) A2(5,7) 1 … … Odvozené booleovské atributy: A1(3) A2(5,7), A1(4), A1(3) A2(5,7)
Asociační pravidlo v proceduře 4ft-Miner 4ft-kvantifikátor Antecedent Sukcedent 1 … p 1 … q Dílčí sukcedent Dílčí antecedent Dílčí sukcedent Dílčí antecedent
Cedent a dílčí cedenty (1) Cedent = antecedent, sukcedent nebo podmínka Dílčí cedent = dílčí antecedent, dílčí sukcedent nebo dílčí podmínka Dílčí cedent i = i,1 … i,ki konjunkce literálů literál literál
Cedent a dílčí cedenty (2) Cedent = antecedent nebo sukcedent Dílčí cedent = dílčí antecedent nebo dílčí sukcedent Dílčí cedent i = i,1 … i,ki disjunkce literálů literál literál
Literál a koeficient A() A() A() – základní booleovský atribut positivní literál literál A() A() negativní literál A() – základní booleovský atribut – coefficient
Příklady 4ft kvantifikátorů M a b c d p,Base Nejméně 100p procent objektů splňujících splňuje také a nejméně Base objektů matice M splňuje i . +p,Base Relativní četnost objektů splňujících mezi objekty splňujícími je alespoň o 100p procent vyšší než relativní četnost objektů splňujících v celé matici M a zároveň nejméně Base objektů matice splňuje i
Příklad: 4ft-Miner – Vstup Množina relevantních antecedentů 4ft-kvantifikátor Množina relevantních sukcedentů Minimální a maximální délka antecedentů Množina relevantních podmínek
Koeficient interval – příklad `` 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,...., 59, 60, 61, 62, 63, 64, 65, 66 ,....,
Koeficient Left cut – příklad zadání 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,...., 59, 60, 61, 62, 63, 64, 65, 66
Koeficient Right cut – příklad zadání 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,...., 59, 60, 61, 62, 63, 64, 65, 66
Mimořádné konzultace Vzhledem ke státním svátkům 1. a 8. května vyhlašuji mimořádné konzultační hodiny: středa 2. 5. 2012 v době 13.15 až 14.15 středa 9. 5. 2012 v době 13.15 až 14.15. Další mimořádné konzultace lze dohodnou pomocí e-mailu