Business Intelligence

Slides:



Advertisements
Podobné prezentace
Systémová integrace Business Intelligence
Advertisements

Stránka 1, © Vema, a. s.. Stránka 2, © Vema, a. s. Podnikové aplikace  Integrovaný podnikový systém (Integrated Business System):  komplex aplikací.
ARBES FEIS [BI] ARBES Technologies, s.r.o.
Základy databázových systémů
Přednáška č. 1 Úvod, Historie zpracování dat, Základní pojmy
Přednáška č. 3 Normalizace dat, Datová a funkční analýza
Databáze.
Business intelligence
Business Intelligence
Business Intelligence
Podnikové informační systémy úvod
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
Přednáška č. 5 Proces návrhu databáze
Procesy Informační proces
Podnikové informační systémy
BI, e-commerce Ing. Jiří Šilhán. Úroveň informatiky.
IS V EKONOMICKÝCH SUBJEKTECH Ing. Jiří Šilhán. IS IS – data+lidi+HW, prvky + relace mezi uživateli, které splňují nějaké cílové chování – tak aby byly.
Tvorba mezinárodních podnikových sítí a strategických aliancí
SAP Ing. Jiří Šilhán.
Adéla Masopustová Alena Seifrtová Lukáš Hůla
Transakční systémy Transakční systémy
Ing. Jiří Šilhán.  představuje komplex aplikačního a základního software, technických prostředků, podnikových procesů a personálních zdrojů určených.
Inovace výuky ve vazbě na požadavky Mezinárodních výukových standardů doc. Ing. Marie Pospíšilová,CSc. SVŠES.
Zpětnovazební obvody v ekonomice Skorkovský KPH ESF MU Brno.
Jaromír Skorkovský ESF MU KAMI
Analytické aplikácie Adaptované z knihy (kap.9) : Pour,J., Gála,L, Šedivá, Z..: Podniková informatika, 2. Vydanie,. Grada, Praha, ISBN:
Systémy pro podporu managementu 2
Relační databáze.
Databázové systémy. Práce s daty Ukládání dat Aktualizace dat Vyhledávání dat Třídění dat Výpočty a agregace.
Globální architektura IS/ICT
Databázové systémy Architektury DBS.
Základní pojmy Systém je abstrakce, kterou si lidé vytvářejí v procesu poznávání jako nástroj zkoumání reálných objektů.
Informatika pro ekonomy II přednáška 10
Systémové pojetí hospodářské organizace
Informační systémy TPS,MIS, SIS.
Aplikace VT v hospodářské praxi Byznys inteligence
Systémové pojetí hospodářské organizace 1 ECM – Řízení podnikového obsahu (Zdroj: Gála, Pour, Toman: Podniková informatika. Praha: Grada 2006) řízení podnikového.
Geoinformační technologie Geografické informační systémy (GIS) Výukový materiál pro gymnázia a ostatní střední školy © Gymnázium, Praha 6, Nad Alejí 1952.
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
DATABÁZOVÉ SYSTÉMY. 2 DATABÁZOVÝ SYSTÉM SYSTÉM ŘÍZENÍ BÁZE DAT (SŘBD) PROGRAM KTERÝ ORGANIZUJE A UDRŽUJE NASHROMÁŽDĚNÉ INFORMACE DATABÁZOVÁ APLIKACE PROGRAM.
Datový sklad Jak analyzovat data za období delší než kalendářní rok? Ing. Robert Naar Skalský Dvůr
Databázové modelování
Databázové systémy Informatika pro ekonomy, př. 18.
Základní rozdělení činností v podnikové informatice
Data Warehousing Růst obratu: $10 miliard v 1999
CRM a jeho možné využití
Business Inteligence 2. přednáška pro DS
1. Charakteristika IS Informační systém je soubor lidí, technických prostředků a metod, zabezpečujících sběr, přenos, uchování a zpracování dat za účelem.
Metodika řízení projektů
Systémové pojetí hospodářské organizace 1 Architektura podnikové informatiky (Zdroj: Gála, Pour, Toman, Podniková informatika. Praha: Grada 2006)
13.přednáška – Elektronické zásobování Ing. Jiří Zmatlík, Ph.D. ČVUT, Fakulta elektrotechnická Katedra ekonomiky, manažerství a humanitních věd.
24 Používání relačních databází (základní pojmy a principy z oblasti relačních databází, struktura databáze,oblasti použití relačních databází, vkládání.
Úvod do databází zkrácená verze.
Datové sklady (DWH) VOJTĚCH VYCHODIL, MICHAL VACHLER, PAVEL FIALA BRNO 2015.
Systémy pro podporu managementu 2
Business Intelligence
Dobývání znalostí z databází dolování dat
Datové sklady Analýza dat
Informační systémy Business Inteligence
Ing. Athanasios Podaras, Ph.D 2016
Databázové systémy přednáška 13 – Analýza a reporting
Informatika pro ekonomy přednáška 8
Business Intelligence
Business Intelligence
Informační systémy podnikové systémy CRM
Základy business intelligence Jaroslav Šmarda
Datové sklady (Data Warehouse)
OnLine Analytical Processing ESF MU 2005 J.Skorkovský
Datové sklady (Data Warehouse)
Business Intelligence
Transkript prezentace:

Business Intelligence Skorkovský KAMI, ESF MU

Principy BI zpracování velkých objemů dat tak, aby výsledek této akce manažerům pomohl k rozhodování při řízení procesů výsledkem zpracování musí být relevantní informace, kterou dostanou manažeři ve správném čase základní zdroj dat, která se často ukládají do datových skladů jsou ERP systémy (relační DB) získání informací jako výsledek strukturovaných dotazů musí probíhat rychle (krátká odezva) používá se pro řízení na strategické, taktické u operační úrovni

Principy BI Definice 1 : BI je sběr a analýza dat, jejímž cílem je lepší porozumění a reakce na změny, kterým organizace neustále čelí Definice 2 : BI je znalost podniku získaná za použití HW a SW technologií, která umožní přeměnit data organizace v informaci Definice 3 : sada procesů, aplikací a technologií, jejíchž cílem je účinně a účelně podporovat rozhodovací procesy ve firmě. Tyto procesy podporují analytické a plánovací činnosti podniků a organizací a jsou postaveny na principech multidimenzionálních pohledů na podniková data

Nástroje BI ERP systémy Dočasná úložiště (DSA: Data Staging Area) Operativní úložiště (ODS : Operational Data Store) Transformační nástroje (ETL : Extraction Transformation Loading) Integrační nástroje (EAI : Enterprise Application Integration) Datové sklady Datová tržiště OLAP Reportingové nástroje EIS (Executive Information Systém) Data Mining

Omezení ERP jako poskytovatele dat Neumožňují rychle a pružně měnit kriteria výběru Okamžitý přístup uživatelů k velkým objemům agregovaných dat ERP jsou primárně určeny k pořizovaní dat a jejich aktualizaci V každém podniku se objem dat za každých pět let zdvojnásobí, což ovšem také znamená, že systém je zahlcen redundantními daty Vícedimenzionální pohled na data v ERP je problematický. DB ERP není pro tento pohled stavěná. Databáze, které vzniknou přeměnou primárních dat z ERP a jsou využívány např. OLAP technologií jsou pro drilling a slice operace optimalizovány

Zjednodušené schéma využívání ERP DB ERP Transakce - položky Partneři ERP Informace (trendy) Informace Podnik Zprávy Náhledy Rozhodnutí Znalost metod řízení procesů a metrik Klíčová rozhodnutí Klíčová znalost

Schematické a zjednodušené schéma BI Extraction Transformation Loading

Jiný pohled na BI

Konstatování V poslední dekádě minulého tisíciletí firmy hýčkaly mantru ERP. Důvodem byla utkvělá představa, že miliony utracené za licence a implementační služby se projeví tak, že pro uživatele už nebude chytrost žádné čáry. A to navždy…..

Organizačně-technologické schéma podniku Dodavatelé Vedení podniku Zákazníci BI,ERP,EIS,datové sklady, reporting CRM EDI EDI CRM Intranet, workflow,OIS BI BI Řízení výroby Řízení financí Řízení zdrojů, majetku a PAM Řízení nákupu, prodeje a logistiky BI

OLAP kostka řez Částky(prodej, náklady,doprava,…) http://www.databaseanswers.org/designing_olap_cubes.htm řez Částky(prodej, náklady,doprava,…) Nákladová- výnosová střediska Čas (Rok,Měsíc, den)

Relační dimenzionální model: STAR Vařečka Jižní Čechy 12 ks 240 Kč Jan Hromada ČAS Rok Měsíc Den PRODUKT Kategorie Skupina Název cena OBLAST Název Popis Prodejce =dimenze xxx

Relační dimenzionální model: SNOWFLAKE DIM: ČÁST Čas_ID Čas_rok Čas_měsíc Čas_den Výsledek Produkt_ID Oblast_ID Čas_ID Prodej_ks Prodej_Kč DIM:KATEGORIE Kategorie_ID Kategorie_název DIM: SKUPINA Skupina_ID Kategorie_ID Skupina_název DIM: PRODUKT Produkt_ID Skupina_ID Produkt_název DIM: OBLAST Oblast_ID Oblast_název

Datový sklad Podniková DB Transakce Datový Dolování dat sklad Zákazníci Zakázky Transakce Dodavatelé Atd.… Atd.… Datoví horníci : “Profíci” – vědí co chtějí “Výzkumníci” – nepředvídané výsledky Kopie, , organizace dat Sumarizace dat Datový sklad Dolování dat

Definice Datový sklad: základní komponenta BI Datové tržiště : subjektově orientované analytické DB- součást datového skladu Operativní datová úložiště : podpůrné analytické DB Dočasná úložiště dat : úložiště dat před jejich zpracování do databázových komponent řešení BI

Vrstvy pro analýzu dat Reporting : ad hoc dotazovací proces do DB komponent BI (ad hoc = k tomuto, za tímto účelem, pro tento jednotlivý případ OLAP : pokročilé a dynamické analytické úlohy Data Mining (dolování dat) : sofistikovaná analýza většího množství dat Algoritmy pro dolování dat : rozhodovací stromy Neuronové sítě Clustering a klasifikace

Datový sklad->datové tržiště (anglická verze) Decision Support Information Data Mart Data Warehouse Decision Support Information Data Mart Decision Support Information Data Mart

Vysvětlení pojmu METADATA Metadata jsou data o datech, kde pomocí předem definovaných dat s jasně danou a popsanou strukturou uchováváme informace o jiných datech. Typickým příkladem metadat jsou katalogizační záznamy v knihovnách, což byla jejich původní funkce.

Architektura OLAP (anglická verze) METADATA viz definice na předchozím snímku

Hlavní komponenty BI a jejich vazby ERP,CRM,… Operativní úložiště EAI Reporting Dočasné úložiště Datový sklad ETL Dolování dat Datové úložiště Transformační nástroje (ETL : Extraction Transformation Loading) Integrační nástroje (EAI : Enterprise Application Integration)

Dolování dat Rozhodovací stromy Neuronové sítě Genetické algoritmy Clustering a klasifikace

Dolování dat Rozhodovací stromy (RS) - prediktivní model, který se zobrazuje v podobě stromu, kde každý uzel určuje kritérium pro následní rozvětvení. Strom rozděluje veškerá zdrojová data do segmentů, kde každý list odpovídá určitému segmentu definovanému předešlými uzly.Data v jednom segmentu mají shodné vlastnosti.

B + tree-jeden z příkladů RS Dividers (no data) Data Searching „Sandy“ = Search path

Příklad vytvoření RS Typy stromů : CART=Classificaion and Regression Trees (kriterium redukce směrodatné odchylky) CHAID =Chi-squared Automatic Interaction Detector http://lisp.vse.cz/~berka/docs/izi456/SL-IDT.PDF

Rozdělení postaviček podle atributů Hlava Úsměv Ozdoba Tvar těla Předmět Přátelský Kruh Ne Kravata Čtverec Šavle NE Ano Motýlek NIC ANO Trojúhelník Balon Květina

Rozhodovací strom jako logický výraz

Neuronové sítě Neuronové sítě (NS) - užívané pro tvorbu prediktivních modelů, Jsou založeny na obdobných principech, které napodobují organizaci nebo způsob chování lidského mozku, založeném na systému neuronů. Synapse je vazba a má dva typy : Excitační (vybuzující) a Inhibiční (tlumící)

Učení neuronových sítí

Vícevrstvé neuronové sítě

OLAP databáze OLAP DB představují jednu nebo více souvisejících OLAP kostek OLAP kostka na rozdíl od datových skladů zahrnuje předzpracované agregace dat podle definovaných hierarchických struktur dimenzí a jejich kombinací Technologie OLAP má několik variant (uvádím zde pouze dvě z nich): MOLAP - Multidimensional OLAP (speciální uložené v multidimenzionálních-binárních kostkách) ROLAP – Relational OLAP (uloží data do relační DB)

Datová pumpa Datová pumpa Datový sklad Primární transakční systém (ERP,CRM,..) Datová pumpa Datový sklad

Datová pumpa (kritické místo celé aplikace) Datová pumpa, nebo-li ETL nástroj umožňuje efektivní zpracování velkých objemů z různých zdrojů a jejich uložení do datového skladu. Každý ETL nástroj musí umět: a) zpracovávat různorodá data obvykle fyzicky umístěná na různých místech, navrhovat transformace pro přenos dat mezi různými datovými formáty Datový sklad Pumpa, provádějící Transformaci dat Primární transakční systém (ERP,CRM,..) Zpracování = odstranění redundancí, agregace podle dimenzí, zapomínání dat Zapomínání dat = úmyslné odstranění nepotřebných dat z datového skladu

Datová pumpa (kritické místo celé aplikace) Datová pumpa = Extraction Transformation and Loading = ETL Datový sklad Pumpa Primární transakční systém (ERP,CRM,..) Položky zboží Pumpa Částečná změna struktury dat a případně další aplikace dimenzí (oblast, typ zákazníka,.. ) Položky ocenění Test správnosti dat (konzistence) Věcné položky 2006 (1)->2006 (3) časový filtr-dimenze čas Zákaznické položky IF NOT OK THEN Opravná zpětná vazba=TRUE 2002 (4)->2007 (2)