Datové sklady (DWH) VOJTĚCH VYCHODIL, MICHAL VACHLER, PAVEL FIALA BRNO 2015
Proč bychom měli budovat DWH? Centralizace Srozumitelnost Šetří čas Homogenní data Uchovává historická data
Co je to datový DWH? Definice: DWH je strukturované úložiště dat Podpůrná platforma pro práci s historickými daty a zpracování informací „Data warehouse is integrated, subject oriented, nonvolative and time variant collection of data in support of management's decisions.“ - William Inmon
Vysvětlení definice Předmětově orientovaný – data jsou rozdělena na základě jejich typu a nikoliv na základě aplikace a místa kde byla vytvořena Integrovaný – data jsou uchovávána a přístupná v rámci celé společnosti a nikoliv pouze v rozsahu jednotlivých oddělení podniku
Vysvětlení definice Neměnný – technologie datového skladu umožňuje pouze čtení – jedná se tzv. „read only“ technologii. To má za následek, že data nemohou být následně modifikována nebo vkládána ručně uživateli. Celý systém pracuje na ryze automatickém principu Časově závislý – data jsou ukládána s časovým údajem, který udává kdy byla vložena do systému datového skladu. Tento fakt je důležitý zejména proto, že umožňuje zpětně analyzovat časovou dimenzi zkoumaných problémů a historický vývoj uložených událostí
Terminologie ETL (Extraction Transformation Loading) jedná se komplexní sekvenci algoritmů, které jsou použity k modifikaci a transformaci dat ze zdrojových systémů do datového skladu. Dobře navržené a realizované ETL představuje skutečnou programátorskou výzvu a často vyžaduje velmi specifická řešení, která jsou mnohdy odvislá od obchodního zaměření dané společnosti
Terminologie Data Mart – neboli datové tržiště je jednou z částí datového skladu, která je typicky orientována na konkrétní odvětví podnikové aktivity. Každé datové tržiště obsahuje pouze data, která souvisí s úkony vykonávanými daným subjektem, nebo oddělením společnosti, které je využívá
Architektura datových skladů Bottom – up navrhl Ralphe Kimballem Top – down navrhl William Inmon Hybrid design, který je kombinací dvou výše uvedených
Datový tok
Ukázka praktického využití DWH
Děkujeme za pozornost.