Business Intelligence

Slides:



Advertisements
Podobné prezentace
Systémová integrace Business Intelligence
Advertisements

ARBES FEIS [BI] ARBES Technologies, s.r.o.
Přednáška č. 1 Úvod, Historie zpracování dat, Základní pojmy
Přednáška č. 3 Normalizace dat, Datová a funkční analýza
Business intelligence
Business Intelligence
Business Intelligence
Podnikové informační systémy úvod
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
Procesy Informační proces
IS V EKONOMICKÝCH SUBJEKTECH Ing. Jiří Šilhán. IS IS – data+lidi+HW, prvky + relace mezi uživateli, které splňují nějaké cílové chování – tak aby byly.
Technologie pro CI. Od technologií pro CI vyžadujeme především funkce vyhledávání v rozsáhlých databázích na základě libovolných dotazů, propojování a.
Případová studie Business Intelligence ve společnosti Mountfield, a.s.
Databáze Jiří Kalousek.
Podnikový systém SEWSS Jakub Charvát STATISTICA Enterprise-wide SPC System.
Informační systémy podnikové systémy CRM
Analýza dat Jiří Slabý Nástroje pro analýzu dat SQL SERVER - součást Small Business serveruSQL SERVER - součást Small Business serveru Kontingenční tabulkyKontingenční.
Adéla Masopustová Alena Seifrtová Lukáš Hůla
M O R A V S K O S L E Z S K Ý K R A J 1 Vedení správních řízení ve spisové službě a statistika vyřizování dokumentů.
Transakční systémy Transakční systémy
D ATOVÉ MODELY Ing. Jiří Šilhán. D ATABÁZOVÉ SYSTÉMY Patří vedle textových editorů a tabulkových kalkulátorů k nejrozšířenějším představitelům programového.
Ing. Jiří Šilhán.  představuje komplex aplikačního a základního software, technických prostředků, podnikových procesů a personálních zdrojů určených.
Informační strategie. řešíte otázku kde získat konkurenční výhodu hledáte jistotu při realizaci projektů ICT Nejste si jisti ekonomickou efektivností.
Systémy pro podporu managementu 2
Relační databáze.
Základní pojmy Systém je abstrakce, kterou si lidé vytvářejí v procesu poznávání jako nástroj zkoumání reálných objektů.
Podnikové informační systémy C7 – Data Mining a získávání znalostí České vysoké učení technické v Praze Fakulta strojní ústav Řízení a ekonomiky podniku.
Informatika pro ekonomy II přednáška 10
Systémové pojetí hospodářské organizace
Reporting Ing. Jan Přichystal, Ph.D.. Úvod Uživatelé obvykle přistupují k DW pomocí BI aplikace Většina využívá předdefinované reporty Poskytují standardizovaný.
Informační systémy TPS,MIS, SIS.
Systémy pro podporu managementu 2
Aplikace VT v hospodářské praxi Byznys inteligence
Business Inteligence a její nástroje ve veřejné správě Petr Zeman, Key Account Manager – Public Sector Adastra Corporation.
Pojmové vymezení. Proč pojmové vymezení? Spousta firem deklaruje svou projektovou orientaci Ve skutečnosti pouze používají několik metodik pro podporu.
Systémové pojetí hospodářské organizace 1 ECM – Řízení podnikového obsahu (Zdroj: Gála, Pour, Toman: Podniková informatika. Praha: Grada 2006) řízení podnikového.
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
uložené procedury (stored procedures) triggery, sekvence, pohledy, funkce, parametrické dotazy (prepared statements) komplexní agregace a SQL dotazy jiné.
Databázové modelování
Databázové systémy Informatika pro ekonomy, př. 18.
Rozhodovací proces, podpory rozhodovacích procesů
1 NÁKLADOVÉ ÚČETNICTVÍ (MU_305). 2 Ing. Jaroslav Wagner, PhD. Katedra manažerského účetnictví Místnost: 285 NB KH: Pondělí 15,00 – 17,00 hod.
Přehled SAS Institute software For 22 Years: “If It Moves, We Can Analyze It”
Data Warehousing Růst obratu: $10 miliard v 1999
Nasazení nástrojů BI pro analýzu dat z IS STAG Řešitel: Vladimíra Zádová Datum:
Business Inteligence 2. přednáška pro DS
Business Intelligence
Databázové systémy Úvod, Základní pojmy. Úvod S rozvojem lidského poznání roste prudce množství informací. Jsou kladeny vysoké požadavky na ukládání,
Systémové pojetí hospodářské organizace 1 Architektura podnikové informatiky (Zdroj: Gála, Pour, Toman, Podniková informatika. Praha: Grada 2006)
ICT – TEORIE A PRAXE – ŠKOLY A FIRMY Miloš Maryška, Katedra informačních technologií, VŠE Praha
Datové sklady (DWH) VOJTĚCH VYCHODIL, MICHAL VACHLER, PAVEL FIALA BRNO 2015.
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
Databázové systémy Roman Danel Institut ekonomiky a systémů řízení 2016.
Dobývání znalostí z databází OLAP a datové kostky
Systémy pro podporu managementu 2
Dobývání znalostí z databází dolování dat
Datové sklady Analýza dat
Informační systémy Business Inteligence
Ing. Athanasios Podaras, Ph.D 2016
Databázové systémy přednáška 13 – Analýza a reporting
Projekt BOZP Výsledky první části České vysoké učení technické
Informatika pro ekonomy přednáška 8
Business Intelligence
Roman Péchal, Jan Čongva, Martin Durák
Informační systémy podnikové systémy CRM
Základy business intelligence Jaroslav Šmarda
Datové sklady (Data Warehouse)
OnLine Analytical Processing ESF MU 2005 J.Skorkovský
Datové sklady (Data Warehouse)
Datové sklady (Data Warehouse)
Transkript prezentace:

Business Intelligence Ing. Roman Danel, Ph.D. roman.danel@vsb.cz Institut ekonomiky a systémů řízení Hornicko–geologická fakulta

Obsah Co je to BI? Z čeho se BI skládá Co je to OLTP a OLAP systém? Co je to datový sklad a datová pumpa? Prezentační vrstva - reporting Jaký je rozdíl mezi OLAP a Data Mining? Metody Data Miningu Co je to Knowledge Management?

Data a informace Data - vhodně formalizovaný aspekt reality Informace - vzniká interpretací dat Informace je údaj (množné číslo data), ke kterým si člověk přiřadí význam. Znalost - zobecnění poznání určité části reality. Znalost = informace + předpoklady + zkušenost

Business Intelligence 1989 – Howard Dresner, Gartner Koncepty a metodiky, které zlepšují rozhodovací proces Integrace podnikových informací a jejich následná analýza

Co je Business Intelligence? Business Intelligence souvisí s manažerskými systémy pro podporu rozhodování. BI - dovednosti, znalosti, technologie, aplikace, kvalita, rizika, bezpečnostní otázky a postupy používané v podnikání pro získání lepšího pochopení chování na trhu a obchodních souvislostech. BI aplikace zpracovávají data prodeje, výroby, financí a dalších zdrojů dat pro obchodní účely, především řízení výkonnosti podniku.

Business Intelligence „Prodalo se 600 tisíc aut.“ BI – je to moc nebo málo?

Nástroje Business intelligence Datový sklad (Data Warehouse) OLAP analýza Data Mining (dolování dat) Knowledge discovery in Databases (KDD)

Data Warehouse (datový sklad) Operativní data z provozních systémů se transformují do datového skladu, kde se ukládají způsobem, který vyhovuje dalšímu analytickému zpracování. Datový sklad je fyzicky i logicky oddělen od provozních databází. Integruje data z různých zdrojů do jednoho systému Obsahuje historická data; speciální formát Různá úroveň sumarizace dat Načítají se periodicky z provozních systémů Uživatelé pouze čtou

OLTP databáze Podnikový informační systém ukládá data do provozních databázových systémů (označovaných jako OLTP). Cílem u OLTP databází je optimální uložení dat - minimální redundance, konzistence a integrita dat…

Data warehouse Provozní databáze ETL nástroj – datová pumpa Datový sklad Provozní databáze

ETL – datová pumpa Extraction – Transformation – Loading MS SQL Server – Analytical Services – DTS Package, automatizovaně, periodicky

Srovnání datového skladu s databází Orientace na subjekt – u OLTP databází snaha o minimální redundanci dat, u DW snaha o strukturu čitelnější pro uživatele (určeno pro vedení, obchod, ekonomické oddělení…) Integrovanost – u OLTP databází aplikace nad relacemi řeší specifický problém, u datového skladu snaha informace seskupit podle logického významu

Uložení dimenzí datového skladu Data jsou v datovém skladu členěna do schémat (=struktura DS). Základem schématu je faktová tabulka - obsahuje vlastní analyzovaná data. Na faktovou tabulku jsou navázány dimenze - tabulky, obsahující seznamy hodnot sloužící ke kategorizaci a třídění.

Schémata datového skladu Hvězda (Star) Vločka (Snowflake) Galaxie (Fact Constellation)

Schéma „hvězda“ Hvězda (star) – každá dimenzní tabulka je vázána na faktovou; data v dimenzní tabulce jsou uložena redundantně

Schéma „hvězda“

Schéma „vločka“ Vločka (Snowflake) – na faktovou tabulku jsou vázány dimenzní tabulky na nejnižší hierarchické úrovni; ostatní dimenzní tabulky jsou vázány na tabulky nižší dimenze Data v tabulkách dimenzí jsou oproti schématu hvězdy normalizována

Schéma „vločka“

Schéma „galaxie“ (souhvězdí) Galaxie (Fact Constellation) - některé aplikace mohou vyžadovat více tabulek faktů, aby mohly sdílet tabulky dimenzí. Toto schéma může být zobrazeno jako soubor hvězd a proto se nazývá „Constellation“

Datový sklad Údaje v datovém skladu jsou: Nemusí být normalizované. Atomické Sumární (agregované) Nemusí být normalizované. Časový snímek dat.

OLAP analýza OLAP = On-line Analytical Processing Nástroj pro vícerozměrnou analýzu dat nad tzv. multidimenzionální datovou kostkou. Sledování vybraných ukazatelů ve více rozměrech.

KOSTKA (CUBE) prostor, ve kterém analyzujeme data

Příklad datové kostky

ÚČEL KOSTKY Předpřipravit všechny možné kombinace údajů podle různých dimenzí Uživatel může provádět agregace, pohledy, řezy kostkou… http://reportportal.com/

OLAP - postup Definování zdrojů dat (Data Source Wizard) Definování pohledů na data (Data View Wizard) Návrh dimenzí (Dimension Wizard) Návrh kostky (Cube Wizard, Cube Builder)

Uložení dat v OLAP systémech ROLAP – relační OLAP, pracuje nad relační db a agregace ukládá do pomocných tabulek MOLAP – multidimenzionální databázová analýza, pracuje nad datovým skladem HOLAP – hybridní (slučuje obě předchozí – pracuje nad relační databází, ale agregace ukládá do datového skladu)

ROLAP Relační OLAP systémy Data zůstávají v původních relačních databázích Relační tabulky pro uložení agregací Vhodný pro rozsáhlé databáze nebo analýzy, které se provádějí s nízkou četností

MOLAP Multidimenzionální způsob analýzy dat s vysokým výkonem Data ukládána na OLAP server (datový sklad) Vysoký výkon analýzy Vhodný pro malé a střední objemy dat (u rozsáhlých dat trvá dlouho příprava – nutné „přelití“ z relační db pomocí ETL) Výhodné tam, kde se analýzy často periodicky opakují

Struktura prostředků BI

Analýza a Reporting

Prezentační vrstva Reporting Dashboard – viewing data in interactive GUI Scorecards – measuring progress Excel – např. kontigenční tabulka SharePoint (Microsoft), Alfresco, Google Cloud

Dashboard

Výstup: kontigenční tabulka a graf

Dashboard - ukázka http://reportportal.com/ Dashobard – agregovaná a sumarizovaná data v interaktivním GUI Scorecard – srovnání skutečnosti oproti plánu

Scoreacard Source: http://www.newworldresources.eu/cs/udrzitelnost/prehled/cile-udrzitelneho-rozvoje-scorecard

Nástroje pro sdílení informací v podniku Microsoft Sharepoint Alfresco – open source Google cloud

Sharepoint - Microsoft

Sharepoint usnadnění spolupráce mezi lidmi a pracovními týmy zajištění sdílení znalostí poskytnutí nástroje pro správu dokumentů a webového obsahu umožňuje uživatelům přístup k informacím, které potřebují pro svou práci vývoj aplikací

Zásady prezentační vrstvy Jednoduchost prezentace Estetický vzhled Interaktivita Parametrizace Nástroje

Data Mining Proces výběru, prohledávání, analýzy a modelování velkého objemu dat. Cílem je postižení neznámých vztahů v datech nebo predikce.

Data Mining Deskriptivní model – popisuje nalezené vzory a vztahy v datech, které mohou ovlivnit rozhodování (Př. Analýza prodeje zboží v supermarketu na jejímž základě je pak umístěno zboží v regálech). Prediktivní model – umožňuje předvídat budoucí hodnoty atributů na základě nalezených vzorů v datech (Př. Analýza zákazníků, u kterých je vysoká pravděpodobnost, že budou reagovat na písemnou reklamní nabídku…)

Fáze při dolování dat Data Understanding – porozumění úloze Data Preparation - příprava Modelling - dolování Evaluation - vyhodnocení Deployment - nasazení

Kategorie úloh Data Mining Klasifikace – bude produkt úspěšný? Regrese – závislost mezi dvěma proměnnýma Shlukování – rozdělení do množin dle společných znaků Sumarizace Predikce podle časových řad (autoregresní modely, např. ARIMA) Modelování závislostí Asociace – např. analýza nákupního koše Analýza sekvencí – např. procházení webu návštěvníkem Analýza odchylek – bankovní podvody

Metody DM regresní metody (lineární regresní analýza, nelineární regresní analýza, neuronové sítě) klasifikace (diskriminační analýza, logistická regresní analýza, rozhodovací stromy, neuronové sítě), segmentace – shlukování - shluková analýza, genetické algoritmy, neuronové shlukování (Kohonenovy mapy) analýza vztahů (asociační algoritmus pro odvozování pravidel typu „ if X then Y“) predikce v časových řadách (Boxova-Jenkinsonova metoda, neuronové sítě, autoregresní modely, ARIMA) detekce odchylek

Příklady úloh DM Predikce úvěrového rizika Kontrola kvality výrobků Marketingové kampaně Vytipování cílové skupiny Odhalování bankovních podvodů

Nástroje SAS Statistica Data Miner Tanagra WEKA Bayesia LISp Miner

Knowledge Management (KM) Jak využít data v IS Jak uchovat firemní know-how Jak efektivně sdílet informace Převaha ve znalostech oproti konkurenci Jak chránit znalosti firmy před konkurencí

Knowledge Discovery in Databases Proces objevování znalostí v databázích Využívá se statistika, induktivní učení, umělá inteligence, dolování dat, genetické algoritmy… Někdy synonymum pro dolování dat Sofistikované prediktivní analýzy

Postup při KDD Výběr vhodného algoritmu (modelu) Fáze učení na testovacích datech Testování a verifikace použitého modelu a algoritmu Vlastní analýza

Shrnutí BI – integrace, analýza a reporting informací pro podporu rozhodování a řízení na manažerské úrovni OLTP x OLAP systémy SW BI – datový sklad, OLAP, DM ETL – datová pumpa Pojem Knowledge Management a Knowledge Discovery