KDD II David Pejčoch. KDD vs. data mining KDD = Knowledge discovery in databases, česky Získávání znalostí z databází nebo DZD = celý proces (viz např.

Slides:



Advertisements
Podobné prezentace
Systémová integrace Business Intelligence
Advertisements

Východiska EU pro zaměření priorit Olomouckého kraje v kohezní politice EU Budoucnost Olomouckého kraje v rámci kohezní politiky EU 2014+,
4IZ210 – Zpracování informací a znalostí Ing. D. Pejčoch
Nástroje pro migraci databázových schémat
Multirelační GUHA, Ferda a genetická data
Prezentace nového SQL modulu Mzdy a personalistika Pavel Pitaš Miloš Jirčík.
Magistrát města Mostu Radniční 1/ Most IČ: DIČ: CZ Národní konference kvality 2014 Hradec Králové Kompetence.
Projektové řízení Modul č.1.
Ing. Jan Mittner MySQL Workbench 2. Základy práce s databází 3. Subversion 2.
Data mining Autor: Martin Schlosser Skalský Dvůr
Přednáška č. 1 Úvod, Historie zpracování dat, Základní pojmy
Metodika projektového investování - Případová studie Petra Wendelová Jim Wheeler Libor Cupal David Koudela 2. a Tato zakázka je financována Evropskou.
Zpracování informací a znalostí Zadání úkolu č. 4 – DZD Jan Rauch Katedra informačního a znalostního inženýrství.
David Pejčoch. Práce se SEWEBARem Použijte tutoriál: Krok 1: Stažení.
SAS Jan Blaťák Laboratoř vyhledávání znalostí Fakulta informatiky Masarykova Univerzita, Brno
Závěrečná zpráva projektu Stanislav Filipčík Asistent projektového manažera © 2010 IBA CZ, s.r.o.
Grafický editor studijních plánů Jan Krňoul, Západočeská univerzita v Plzni,
Cesta ke kvalitě v praxi
Koreferát: LISp-Miner a (lékařské) ontologie Vojtěch Svátek.
Vedlejší specializace MARKETING (3MK)
Akreditační standardy pro primární péči Bohumil Seifert Setkání auditorů
Zpracování informací a znalostí Zadání úkolu č. 4 – DZD
Získávání informací Získání informací o reálném systému
Využití technologií pro zpracování dat ve veřejné správě Petr Zeman, Key Account Manager – Public Sector Tomáš Kočka, Consultant Adastra Corporation.
Mgr. Alena Lukáčová, Ph.D., Dr. Ján Šugár, CSc.
Jak se učí inovační podnikání
Dotyková zařízení ve výuce​ KA4 Evaluace
Databázové systémy M. Kučerová.
Konference projektu Cesta ke kvalitě
Systémy pro podporu managementu 2
KONFERENCE projektu APSYS „ Propojení vědy, výzkumu, vzdělávání a podnikové praxe “ Propojení vědy, výzkumu, vzdělávání a podnikové praxe Jsou potřebné,
Podnikové informační systémy C7 – Data Mining a získávání znalostí České vysoké učení technické v Praze Fakulta strojní ústav Řízení a ekonomiky podniku.
Databázové systémy Přednáška č. 6 Proces návrhu databáze.
Procesní řízení realizace projektů (praxe)
Systémy pro podporu managementu 2
 BA_EM Electronic Marketing Pavel Agenda  Efektivní data mining jako zdroj relevantních dat o potřebách zákazníků.
Školní informační systémy
Analýza rizik Miroslav Čermák.
Artificial Intelligence (AI).  „Úloha patří do oblasti umělé inteligence, jestliže řešení, které najde člověk považujeme za projev jeho inteligence.
1 Kognitivní inspirace třídění na základě závislostí atributů Jan Burian Eurfomise centrum – Kardio, Ústav informatiky AV ČR Článek je dostupný na WWW:
Databázové systémy 2 Zkouška – 8:00. Příklad I - Procedura Vytvořte proceduru PROCEDURE ZK_ZAM_HISTOGRAM(P_ROK_OD IN NUMBER, P_ROK_DO IN NUMBER)
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Doménový expert místo vzorce , MFF UK, Tomáš Kliegr.
SHLUKOVÁNÍ David Zeman FIT VUT UIFS Získávání znalostí z databází Modelování shlukové analýzy v systému SAS Enterprise Miner TM.
Jídlo z blízka – vzdělávání kuchařů a zemědělců pro vytvoření regionální gastronomie jako součást udržitelného cestovního ruchu Olomouckého kraje.
Dolce: Databáze lokálních konformací DNA
Využití ontologií při dobývání znalostí z databází Hana Češpivová.
Infrastruktura pro dotazování nad sémantickými daty Jiří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarového inženýrství, MFF UK Praha
Změna datového modelu databáze Odry 2000 Autor: Kateřina Šimečková Vedoucí bakalářské práce: ing. David Vojtek.
knowledge management, řízení znalostí, management znalostí
1 Řízení znalostí z pohledu práva Seminář č. 4. Opakování Software pro tvorbu projektu jako platforma pro přenos znalostí – pro tým připravující projekt.
Projekt LISp-Miner Milan Šimůnek. Milan Šimůnek – Projekt LISp-Miner2 Obsah Význam databází a uchovávaných informací Proces dobývání znalostí z databází.
Postup při empirickém kvantitativním výzkumu
Vůdcovství – leadership CVIČENÍ č.2
Seminář MD ČR, Alena Heinišová Ekonomické hodnocení investičních akcí na SŽDC, s.o.
Pilotní tréninky hotel Zlatý Orel K1- K14 Výsledky hodnocení tréninku kompetencí: Bilanční workshop hotel Troyer
Konference projektu Adaptace sídel na změnu klimatu – praktická řešení a sdílení zkušeností Praha, 3. prosince 2015 Adaptace on-line Miroslav Lupač David.
StringData s.r.o. | Antala Staška 510/38 | Praha 4 | TEL: BENEFLEX VĚRNOSTNÍ PROGRAM Prezentace řešeni.
I N V E S T I C E D O R O Z V O J E V Z D Ě L Á V Á N Í Prioritní osa 2 Výzva 2.3 Lidské zdroje ve Výzkumu a vývoji Mgr. Filip Týc Odbor programů výzkumu.
Urban Planner Analytický nástroj pro hodnocení potenciálu území Jaroslav Burian.
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
ESPON – Identifikace územních aspektů informační společnosti
Financováno z ESF a státního rozpočtu ČR.
Autorské právo !.
Škodlivý software, počítačové viry
StatSoft CR Tel: Fax: Podbabská 16
Business Intelligence
Dobývání znalostí z databází dolování dat
Dobývání znalostí z databází znalosti
GaP a správa úvazků.
Transkript prezentace:

KDD II David Pejčoch

KDD vs. data mining KDD = Knowledge discovery in databases, česky Získávání znalostí z databází nebo DZD = celý proces (viz např. CRISP-DM) data mining = část procesu spočívající ve vlastním vytěžení... ale... v praxi se rozdíl mezi pojmy stírá

Klíčové výzvy KDD Začlenění dodatečných znalostí do modelů Srozumitelná reprezentace získaných znalostí Větší interaktivita s uživatelem Vypořádání se s nekvalitními daty Zohlednění subjektivních metrik Media mining Relační data mining (bez nutnosti specifické přípravy) Vytěžování sociálních sítí (Facebook v ČR 2,7 mio)

Jaké použít nástroje? Nekomerční Weka, Yale, R, Rapid Miner, Knime Komerční SAS Enterprise Miner (kvadrant leaderů) SAS STAT modul IBM SPSS Modeller (dříve Clementine) (kvadrant leaderů Angoss Software... v některých případech jsou součástí DB řešení

... jaké je zadání? Přiřazení analytické otázky jednotlivým týmům Určení antecedentu a sukcedentu Použití procedury ASSOC Fundovaná implikace AA kvantifikátor Nalezení rozumného počtu pravidel Interpretace s využitím dodatečných znalostí Automatické vytvoření zprávy na SEWEBAR Syntetizující zpráva na SEWEBAR

Analytické úlohy pro naše týmy ČísloOznačeníPočet atributůNázevTýmTypy 1OSB3Osobní údajeR, N 2SCA5Sociální anamnézaN, O 3AKT2 AktivityN, O 4MRY7MíryKromě T40R, N 5RFK4 Rizikové faktoryT40N 6OBT5ObtížeO, N 7KTL2Krevní tlakT36R 8EKG3 T37, T40R 9CHL4 Laboratoř CholesterolT38R 10GKM2 Laboratoř GKMT39R 11LAB6 LaboratořR

Doporučené nastavení cedentů SkupinaDoporučené výchozí parametry Číslo Název AtributůMin. délkaMax. délkakonjunkce/disjunkce 1 Osobní 313konjunkce 2Sociální anamnéza513konjunkce 3Aktivity212konjunkce 4 Míry 212konjunkce 5Rizikové faktory413konjunkce 6Obtíže515disjunkce 7 Krevní tlak 212konjunkce 8 EKG 313konjunkce 9 Laboratoř Cholesterol 413konjunkce 10Laboratoř GKM212konjunkce

Doporučené nastavení: Literal type = Basic Gace type = Positive Mění se podle zadání: Coefficient type Coefficient length

Použití procedury ASSOC AplikaceParametry číslonázevzadání literálů pro atributy typu R kvantifikátor 1FUI: – int: ANT => SUC intervalyFundovaná implikace  0.95,30 2AA: – cut: ANT =>+ SUC cutAA –kvantifikátor  +0.2,30

... tak, jdeme na to