Prostředí pro provoz IS Vývoj informačních systémů
Příprava provozu IS Příprava provozu IS závisí na tom, jak byl implementován. Obvyklý IS lze rozdělit na dvě základní části: –První z nich je OLAP (viz dále), což je aplikační a výpočetní část. –Na druhé straně stojí klasické databázové systémy, které se označují jako OLTP, což je zkratka „on-line transaction processing“ neboli „okamžité zpracování transakcí“.
Znázornění IS
Informační systém IS Pod pojmem „informační systém“ můžeme chápat „Komplexní data uložená ve struktuře, která umožňuje efektivní analýzu a dotazování“. Data do IS jsou čerpána z primárních informačních systémů a dalších zdrojů.
Datový sklad Různí autoři se liší v tom, co zahrnují do pojmu „OLAP“. Ve třívrstvé architektuře IS rozlišujeme tři vrstvy: a) Spodní b) Prostřední c) Vrchní
a) Spodní vrstva IS Do spodní vrstvy patří datový sklad, na kterém jsou uloženy relační databáze Nebo ji tvoří klasické databázové systémy, které se označují jako OLTP, což je zkratka „on-line transaction processing“ neboli „okamžité zpracování transakcí“. Této vrstvě odpovídá položka „Datový sklad“ na obrázku
b) Prostřední vrstva IS prostřední vrstva zahrnuje OLAP server, který obvykle implementuje –buď relační OLAP model (ROLAP), což je rozšířený relační DBMS, který převádí operace nad multidimenzionálními daty na standardní relační operace –nebo multidimensionální OLAP (MOLAP), který už přímo umí pracovat s multidimenzionálními daty a operacemi. Tato vrstva koresponduje s „Aplikační vrstvou“ ve schématu.
c) Vrchní vrstva IS Vrchní vrstvu označujeme jako klienta. Obsahuje nástroje pro provádění dotazů a vytváření zpráv, analýzy a/nebo data miningové nástroje (analýzy trendu, predikce, apod.). Shoduje se s prezentační vrstvou na schématu.
Poznámka V literatuře bývá někdy zkratka OLAP, která pochází ze slov „on-line analytical processing“ a znamená okamžité zpracování dat, synonymem pro datové sklady. Označení OLAP pro datové sklady však není správné. Pod OLAP bychom spíše měli rozumět pružné (rychlé) zpracování dotazů a analýz, tedy procesní a aplikační část.
Datový sklad x OLTP Datový sklad je na rozdíl od OLTP databáze určen výhradně ke čtení dat pro potřeby nejrůznějších analýz. Jedinou výjimkou jsou (obvykle periodické) aktualizace datového skladu, tj. přidávání nových datových agregátů či odstraňování již neaktuálních datových agregátů, které probíhají obvykle periodicky každý týden, měsíc, atp.
(pokrač.) Tyto akce je ovšem možno chápat za součást údržby datového skladu, která probíhá ve speciálním režimu při momentálním vyloučení zpracování OLAP požadavků uživatelů datového skladu. V běžném režimu práce (tzn. při provádění dotazů a analýz) není obsah datového skladu modifikován!
(pokrač. 2) Tento zásadní rozdíl mezi OLTP systémy a datovými sklady má rozsáhlé důsledky pro způsob jeho implementace, návrhu a tvorby konceptuálního modelu, který je orientován na dosažení co nejrychlejšího zpracování dotazů kladených datovému skladu vrstvou OLAP.
Rozdíly Datový sklad x OLTP
(pokrač.)
Plnění dat Proces plnění datového skladu je někdy označován jako proces ETL (extraction- transformation- load). Tato zkratka vystihuje složitost plnění datového skladu: (viz dále)
(pokrač.) Data je třeba nejprve extrahovat z primárních datových zdrojů. Ale: Jednotlivé primární datové zdroje nepracují s týmž datovým modelem, Mnohdy nepoužívají tytéž datové typy, Některé údaje jsou v datových zdrojích obsaženy pouze implicitně a je třeba je odvozovat z jiných údajů.
(pokrač. 2) Následuje krok „transformace“, který převede data získaná z jednotlivých datových zdrojů do unifikovaného datového modelu, Nad nímž už je možné vytvářet agregace, Získaná agregovaná data pak lze uložit do datového skladu (fáze load).
Testování Po naplnění (aspoň nejzákladnějších) dat musí nutně následovat testování! Cílem testování je objevit chyby v softwaru a ne ukázat, že v něm chyby nejsou! (Paralela ze všedního života: většinou nelze dokázat, že se něco nestalo)
Nebezpečné nesmysly Ten, kdo je skutečně dobrý programátor nedělá chyby, když se soustředí na práci, když používá strukturované programování, návrh shora dolů atd. Chyby děláme, protože nejsme dost dobří, pozorní, vzdělaní. Proto se máme cítit provinile, že jsme chybu dopustili. Testování je přiznáním viny.
Děkuji za pozornost.