Podnikové informační systémy C7 – Data Mining a získávání znalostí České vysoké učení technické v Praze Fakulta strojní ústav Řízení a ekonomiky podniku.

Slides:



Advertisements
Podobné prezentace
Systémová integrace Business Intelligence
Advertisements

Sedm základních nástrojů managementu jakosti
Matematické modelování a operační výzkum
Dynamické systémy.
Přednáška č. 3 Normalizace dat, Datová a funkční analýza
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
Hodnocení způsobilosti měřících systémů
Plošná interpolace (aproximace)
MODELY DISKRÉTNÍ VOLBY 3. cvičení
Diagnostika vnitřních podmínek výuky
Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad.
Neuronové sítě Jakub Krátký.
Adéla Masopustová Alena Seifrtová Lukáš Hůla
JAK POZNAT HODNOTNÉ ZÁKAZNÍKY …cílíme přesně 1. Obsah  Teorie zákaznické hodnoty  Vyrábění zákaznické hodnoty 
Didaktické prostředky
Taktická příprava Michal Lehnert.
Informační strategie. řešíte otázku kde získat konkurenční výhodu hledáte jistotu při realizaci projektů ICT Nejste si jisti ekonomickou efektivností.
Systémy pro podporu managementu 2
Relační databáze.
Luděk Novák dubna 2006 Proč a jak řídit informační rizika ve veřejné správě.
Modelování a simulace MAS_02
Optimalizace versus simulace 9.přednáška. Obecně o optimalizaci  Maximalizovat nebo minimalizovat omezujících podmínkách.  Maximalizovat nebo minimalizovat.
Možnosti modelování požadavků na informační systém
Systémy pro podporu managementu 2
Lineární regrese.
Aplikace VT v hospodářské praxi Byznys inteligence
1 Kognitivní inspirace třídění na základě závislostí atributů Jan Burian Eurfomise centrum – Kardio, Ústav informatiky AV ČR Článek je dostupný na WWW:
Dokumentace informačního systému
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Lineární regrese.
Lineární regresní analýza
2008/2009 REPORTING Tereza Mulačová Česká zemědělská univerzita v Praze Tereza Řezníčková Provozně ekonomická fakulta Marek Tláskal obor Veřejná správa.
Makrozoobentos a klasifikace toků Jarkovský J. 2,3, Kubošová K. 2,3, Zahrádková S. 1, Brabec K. 1, Kokeš J. 4, Klapka R. 2,3 1) Ústav botaniky a zoologie,
Ekonomické modelování Analýza podnikových procesů Statistická simulace je vhodný nástroj pro analýzu stochastických podnikových procesů (výrobní, obchodní,
Databázové modelování
Tvorba simulačních modelů. Než vznikne model 1.Existence problému 2.Podrobnosti o problému a o systému 3.Jiné možnosti řešení ? 4.Existence podobného.
Využití ontologií při dobývání znalostí z databází Hana Češpivová.
Rozhodovací proces, podpory rozhodovacích procesů
AKD VII.
Analýza konkurence Harry Löwit 2009/2010
Strategický marketingový proces: plánovací etapa
Rozhodování ve veřejné správě Přednáška M. Horáková.
ROZHODOVÁNÍ Osnova: 1. Východiska
ROZHODOVÁNÍ Osnova: Východiska Procesní stránka rozhodování
Návrh a implementace algoritmů pro údržbu,
METODY STŘEDNĚDOBÉHO PROGNÓZOVÁNÍ SURO jaro 2010.
STATISTICKÝ ROZCESTNÍK aneb CO S DATY Martin Sebera.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Poradenský proces Plánování akce. Vypracování jednoho nebo více řešení diagnostikovaného problému Vypracování jednoho nebo více řešení diagnostikovaného.
Dolování znalostí z vícejazyčných textových dat Luděk Svozil , Brno Vedoucí práce: doc. Ing. František Dařena, Ph.D.
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
Vysoká škola technická a ekonomická Ústav technicko-technologický
Vzdělávací oblast: Ekonomické vzdělávání Tematická oblast:
StatSoft CR Tel: Fax: Podbabská 16
Didaktické prostředky
Geografické informační systémy
Dobývání znalostí z databází dolování dat
Informační systémy Business Inteligence
Geografické informační systémy
Databázové systémy přednáška 13 – Analýza a reporting
Segmentace trhu. Segmentace trhu Trh je tvořen velkým počtem zákazníků, kteří se liší svými potřebami, možnostmi…. Segmentace je rozdělení trhu na.
Osobní prodej Osobní forma komunikace s 1 nebo více zákazníky
Metody strojového učení
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Geografické informační systémy
Datové sklady (Data Warehouse)
OnLine Analytical Processing ESF MU 2005 J.Skorkovský
Lineární regrese.
Datové sklady (Data Warehouse)
Transkript prezentace:

Podnikové informační systémy C7 – Data Mining a získávání znalostí České vysoké učení technické v Praze Fakulta strojní ústav Řízení a ekonomiky podniku Zbyněk Hyský – IV/15

Data mining z angličtiny: „data“ – informace „mining“ – dolování, těžení Důvody vzniku Data Miningu: rozsáhlé informační databáze a databázové sklady nemožnost snadné analýzy – chybějící hodnoty nelze použít standardní statistické metody potřeba „vytěžení“ efektivních informací

Tipické úlohy Data Miningu Detekce podvodů:Detekce podvodů: v bankovnictví při přidělování úvěrů Profily zákazníků:Profily zákazníků: cílené oslovení zákazníka (úspora peněz) Udržení zákazníka:Udržení zákazníka: vytipování zákazníka se sklonem přechodu ke konkurenci Stanovení diagnózy:Stanovení diagnózy: podání správného léčiva na základě známých příznaků

Analýza časových řad:Analýza časových řad: provádění předpovědí na základě historických dat, např. ekonomika, meteorologie... Analýza prohlížení stránek na Internetu:Analýza prohlížení stránek na Internetu: (web mining) segmentace zákazníků podle jejich chování na Internetu Tipické úlohy Data Miningu

Data Miningové metody Lineární regrese: Klasický statistický model, který předpokládá, že spojité závislé proměnné jsou lineární kombinací prediktorů. Logistická regrese: Model pro kategorizované výstupy, který předpokládá, že šance kategorií závislé proměnné lineárně závisí na hodnotách prediktorů. Diskriminační analýza: Statistiský predikční model, pro separaci kategorií výstupní proměnné ve vícerozměrném prostoru pomocí oddělovacích ploch. Seskupovací (klastrová) analýza: Model, který vytváří skupiny případů tak, aby případy spadající do jedné skupiny si byly co nejvíce podobné, zatímco případy z různých skupin se co nejvíce odlišují.

Faktorová analýza: Postup pro redukci dimenzionality dat. Metoda se snaží nahradit velký počet proměnných menším počtem tzv. faktorů takovým způsobem, aby ztracená informace byla minimální. Asociační pravidla: Nacházení typických vzorů v datech, tj. určení které kombinace atributů se spolu vyskytují nejčastěji. Vhodné především pro analýzy nákupních košíků nebo web mining. Indukce logických podmínek: Nalezení nezávislých implikačních podmínek typu "když je splněno... pak..." pro předpověď hodnot výstupní proměnné. Data Miningové metody

Rozhodovací stromy: Hierarchický systém pravidel pro klasifikaci a vysvětlení variability cílové vlastnosti. o hodnotě výstupní proměnné se rozhoduje podobným způsobem jako při určování rostlin podle botanického klíče. Neuronové sítě: Zjednodušný model nervové soustavy. Skládá se z vrstev neuronů, které si pomocí synapsí vyměňují informace. Model se učí tak, že vhodně nastavuje cilivost na podměty přicházející po synapsích. Metoda nejbližších sousedů: Model komparuje zpracovávaný případ se známými případy, které se novému nejvíce podobají ve vstupních proměnných. Data Miningové metody

Data Miningový projekt proces, který je značně finančně nákladný jedna z možností ušetření je postupovat standardizovaným způsobem vypracovány různé metodologie asi nejznámější je CRISP-DM

CRISP-DM CRoss-Industry Standard Process for Data Mining nabízí návod krok za krokem (úkoly a cíle) rychlejší a efektivnější řešení Data Miningových úloh pomáhá vyhnout se běžným chybám

Rozdělení DM projektu podle CRISP-DM 1. Definování cílů 2. Porozumění datům 3. Příprava dat 4. Modelování 5. Hodnocení výsledků 6. Implementace vytvořeného modelu

Popis jednotlivých částí projektu Definování cílů: ve vstupní fázi je nutné určit cíl projektu z obchodního hlediska Porozumění datům: tzn. získání dat nebo přístupu k nim a jejich pochopení Příprava dat: jedna z nejnáročnějších fází, převod různých formátů, tabulek, doplnění chybějících hodnot

Modelování: výběr konkrétního algoritmu, který bude použit pro analýzu Hodnocení výsledků: hodnocení úrovně dosažení obchodních cílů Implementace: vlastní nasazení Data Miningového modelu do obchodní činnosti Popis jednotlivých částí projektu