Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Business intelligence
Helena Palovská
2
business intelligence
Manažerské informace složitost Kteří zákazníci nakupovali produkt „A-Mutt“? Kolik bylo objednáno zboží v květnu? Na jaké výrobky jsou jednotliví zákazníci zaměřeni? Jaké výrobky se v Brazílii vůbec neprodávají? Závisí to na kategorii? Na čem to závisí? Kteří zákazníci jsou perspektivní? business intelligence
3
Architektura BI IT zpracování transakcí reporty OLAP ? datový sklad ?
datamining
4
ETL – datové pumpy Extraction Transformation Loading
Jsou stanovena pravidla pro extrakci Transformation intergrace, čištění Loading podle rozvrhu
5
Další pomocná úložiště
Data Stagging Area když nelze produkční systémy zatěžovat nárazovým pumpováním pouze extrakce transformace a loading se dělá dávkově podle rozvrhu Operational Data Store Integrované centrální úložiště dostupné pro produkční systémy Konsolidované dimenzionální tabulky Aktuální data dostupná pro BI aplikace
6
Data Marty Subjektově orientované replikované části centrálního DWH
nebo primární úložiště a DWH se z nich integruje
7
Reporty Vznikají na základě analýzy nebo uživatelských požadavků
Mohou vznikat problémy s disseminací reporty jsou, ale uživatelé o nich nevědí
8
OLAP Manažerská aplikace
9
OLAP
10
Nutno zakoupit nástroj i školení.
Datamining Clusterová analýza automatické hledání shluků Rozhodovací stromy může používat vyškolený uživatel Neuronové sítě … Nutno zakoupit nástroj i školení.
11
Decision Supporting Systems
Modelovací nástroje pro podporu rozhodování data mohu „tahat“ z datového skladu
12
Expertní systémy Napodobují rozhodování experta – podávají rady
mohou se učit na datech z datového skladu
13
Charakteristika produkčních databází
Zpracovávají business transakce krátké transakce odezvy v reálném čase Normalizovaná schémata databází většinou v 3. NF (co je normalizovaná databáze) Nezávislé systémy mohou být navzájem neintegrované Optimalizovány pro podporu business operací pokračuj na charakteristiku dat. skladu
14
Co je normalizovaná databáze
1 změna ve světě ~ 1 změna v databázi 1.,2.,3. … normální formy Takto vznikne normalizovaná databáze: pečlivá analýza → ER(A) model (co ER(A)) CASE nástroj či „mapovací algoritmus“ relační databázové schéma Kontrola kvality – utilita db serveru (náročné) hledání závislostí mezi poli tabulky na reprezentativním vzorku dat zpět
15
Co je E-R(A) Jaké jsou entity (objekty), vztahy mezi nimi
Jaké mají atributy Jaká jsou integritní omezení: kardinality vztahů (1:N, M:N, 1:1) členství ve vztazích (povinné, nepovinné) co jsou klíčové atributy nalezení event. identifikačních vztahů Nalezení generalizace/specializace zpět
16
Charakteristika datového skladu - DWH
Dlouhé a složité dotazy Konsolidovaná data Denormalizovaný Předpočítané výpočty, agregace Změny pouze přírůstkové obsahuje archívní, historická data nové záznamy vkládány v dávkách podle rozvrhu Optimalizován pro business intelligence
17
Možnosti organizace DWH
Relační db – tabulka faktů a tabulky pro dimenze: Hvězda Každá dimenze v jediné tabulce (denormalizované) Snowflake Hierarchie každé dimenze rozložena do více tabulek (normalizovaná dimenze) Multidimenzionální db – kostky popisné atributy dimenzí mohou být v Operational Data Store
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.