Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Prof. Molnár 1 Manažerské informační systémy Business Intelligence a OLAP Prof. Ing. Zdeněk Molnár, CSc zdenek.

Podobné prezentace


Prezentace na téma: "Prof. Molnár 1 Manažerské informační systémy Business Intelligence a OLAP Prof. Ing. Zdeněk Molnár, CSc zdenek."— Transkript prezentace:

1 Prof. Molnár 1 Manažerské informační systémy Business Intelligence a OLAP Prof. Ing. Zdeněk Molnár, CSc zdenek.

2 Prof. Molnár2 Motto Objem všech dat na světě se zdvojnásobí zhruba každé 2 roky, přičemž výraznou měrou se na tomto exponenciálním růstu podílejí podniky. Problém dnes není data shromažďovat a uchovávat, ale organizovat takovým způsobem, aby byla rychle a snadno k dispozici.

3 Prof. Molnár 3 Transakční systémy - operační data MIS/EIS Požadují se : - trendy - souvislosti - struktury - what-if - flexibilita Požaduje se: - rychlost odezvy - kapacita - integrita dat - konsistence dat Model chování systému Model stavu systému Úloha MIS

4 Prof. Molnár 4 ZnakOLTPOLAP CharakteristikaProvozní zpracováníInformační zpracování OrientaceTransakčníAnalytická Uživatel Úředník, databázový administrátor Znalostní pracovník (manažer, analytik) FunkceKaždodenní operace Dlouhodobé informační požadavky, podpora rozhodování Návrh databáze Entitně-relační základ, aplikačně orientovaný Hvězda/sněžná vločka, věcná orientace Data Současná, zaručeně aktuální Historická Sumarizace dat Základní, vysoce detailníShrnutá, kompaktní Základní rozlišení OLTP a OLAP

5 Prof. Molnár 5 NáhledDetailníShrnutý, multidimensionální Jednotky práce Krátké, jednoduché transakce Komplexní dotazy PřístupČíst a zapisovatVětšinou pouze číst ZaměřeníVkládání datZískávání informací Počet dostupných záznamů DesítkyMiliony Počet uživatelůTisíceStovky Velikost databáze 100 MB až GB100 GB až TB Přednosti Vysoký výkon, vysoká přístupnost Vysoká flexibilita, nezávislost koncového uživatele Míry hodnoceníPropustnost transakcí Propustnost dotazů a doba odezvy OLTP OLAP

6 Prof. Molnár 6 „Nedostatky zdrojových (transakčních) systémů Neustálá změna – neustálý (on-line) režim aktualizace – vysoká zátěž systému Nedostupnost historie – zachycují jen aktuální stav – případně mají „krátkou“ paměť Čistota dat (konsistence a integrita) – nedostatečná identifikace entit (duplicity), roztroušenost a nekonsistence hodnot atributů, odlišná fyzická struktura a formáty

7 Prof. Molnár 7 Co je to OLAP? On-line Analytical Processing Rychlá analýza sdílených multidimenzionálních informací Multidimenzionální databáze (OLAP krychle) Klientská aplikace pro přístup k databázi OLAP

8 Prof. Molnár 8 Datový sklad (Data Warehouse – DW) Datový sklad definujeme jako databázi, která je organizována tak, aby sloužila jako univerzální úložiště všech potenciálně užitečných dat. Data jsou organizována předmětně (náklady, prodeje a pod) a s každým záznamem je držena informace o čase, kdy byl do datového skladu přidán tj. je sledována jeho historie (Dohnal, Pour) Veškeré změny v databázi (aktualizace) probíhají dávkově (Batch Processing - nejčastěji v noci), zatímco uživatel spouští nad datovým skladem různé analytické (často velmi složit) dotazy v reálném čase (OLAP – On Line Analytical Processing)

9 Prof. Molnár 9 DW se často používají jako systémy spojení dat pocházejících z různých transakčních (operačních) systémů (tzv. základní systémy) DataWarehouse Datová pumpa (Staging Area) výrobaekonomika odbyt Externí data Externí data zásobování

10 Prof. Molnár 10 DataMarkt Finance Účelem DW je vytvoření konsistentních informací potřebných pro taktické a strategické rozhodování v různých oblastech podniku. Za tím účelem se budují DataMarkt(s) „datová tržiště“, která obsahují vybrané dimenze a fakta, která bývají „předzpracována“ tak, aby podporovala určitou tématickou oblast DataMarkt Marketing DataMarkt Personalistika DataWarehouse

11 Prof. Molnár 11 Relační databáze (operační data) Multidimensionální databáze Datová pumpa Relační databáze (operační data)

12 Prof. Molnár 12 OLAP v podnikové informační soustavě Provozní Informační systém Relační databáze OLAP databáze OLAP aplikace

13 Prof. Molnár 13

14 Prof. Molnár 14 pracuje na principu n-rozměrné Rubikovy kostky Transakční databáze nabíjení vytváření uživatelských řezů (výběrů) Multidimensionální databáze MIS

15 Prof. Molnár 15 Požadavky na funkčnost DW (1) Dostupnost, tj.DW musí být k dispozici uživatelům „neustále“. (Tento požadavek do jisté míry omezuje dobu, po kterou může být DW aktualizován) Aktuálnost, tj. DW by měl obsahovat co možná „nejčerstvější“ data z produkčních systémů. (Obyčejně je aktualizace DW aktualizován v noci, protože jde o proces, kdy HW je zatížen na maximum.) Odezva, tj. interaktivní zodpovídání rozmanitých analytických dotazů (OLAP) v „rozumné“ době (maximálně 3 minuty) i při značně rozsáhlých DW (až desítky GB)

16 Prof. Molnár 16 Požadavky na funkčnost DW (2) Čistota (kvalita) dat, tj. jeden z fundamentálních požadavků (GIGO). Jde zejména o konsistenci „stejných“ dat vyskytujících se v různých produkčních systémů, jejich referenční a doménovou integritu. Právě zde vystupuje do popředí požadavek  jasně definovaného datového modelu  vybudování metainformačního systému (metadata – slovník a adresář) To je úkol zejména pro základní komponentu DW tj. program označovaný jako ETL (extraction, transformation, loading). Tato aplikace „sbírá“ data ze všech dostupných systémů, provádí jejich konsolidaci (čištění) a jejich následné nahrání do databáze DW.

17 Prof. Molnár 17 ETL proces V datech přenášených do datového skladu se téměř vždy objevují duplicity a datové chyby, které není jednoduché odhalit. Tyto nepřesnosti způsobuje proměnlivé názvosloví („str. 56“/„stránka 56“), používání, či nepoužívání diakritiky („František Novák“/„Frantisek Novak“), pravopisné a jiné chyby, které způsobují nekonzistenci a je nutné je rozpoznat. Většinou neexistuje korekce chyb ve zdrojovém systému, proto je třeba nekonzistence dohledat, opravit a záznamy logicky spojit do jednoho při plnění datového skladu Tento proces čištění dat při plnění datového skladu může pak zpětně sloužit jako opravná zpětná vazba pro zdrojový provozní informační systém. Udává se, že až 15 % všech zdrojových dat je nekonzistentních nebo nesprávných.

18 Prof. Molnár 18 Identifikace, kvantifikace, klasifikace a analýza chyb a problémů v datech Cílem tohoto okruhu činností je poznat stav kvality dat a na jeho základě stanovit postupy, pravidla a standardy pro zvýšení a udržení kvality dat. Současně podle nastavených pravidel a mezí identifikuje záznamy a skupiny záznamů, které:  systém automaticky opraví a upraví pro dosažení vyšší kvality,  systém opraví a upraví na základě explicitního rozhodnutí (případně ověření),  bude třeba ručně opravit z důvodu velmi nízké kvality, neúplnosti nebo zjevné nesprávnosti, již nelze automaticky opravit.

19 Prof. Molnár 19 Zpracování dat pomocí čistících a unifikačních algoritmů rozpoznání (parsing) obsahu datových položek, opravy datových položek (odstranění překlepů, nesprávných zápisů, formátů apod.), standardizace – převod datových položek na jednotný formát, který je pak možno použít pro porovnání s rejstříky a číselníky a pro porovnání hodnot datových položek spravovaných různými systémy, obohacení – doplnění chybějících položek, pokud je to možné (např. chybějících částí adresy), unifikace – určení všech záznamů, které představují jeden konkrétní subjekt – např. nalezení a jednoznačné označení všech evidovaných záznamů o konkrétní osobě, adrese, vozidle atd., deduplikaci – výběr nejlepšího záznamu, který bude nadále reprezentovat konkrétní subjekt, identifikaci – pro nové datové záznamy – určení konkrétního subjektu (například osoby), ke kterému záznam patří.

20 Prof. Molnár 20 Vstupní data: RowFirstNameLastNameSSNAddressUnitZip 1JaneDoeNULL123 MainStreetNULL JaneDoe NULL J.DoeNULL123 MainStreetApt NULLSmith MainStreetApt JaneSmith-Doe NULL 22222

21 Prof. Molnár 21 Výstupní data (vyčištěná o duplicity a standardizována): RowFirstNameLastNameSSNAddressUnitZip 1JaneDoe MainStreetApt

22 Prof. Molnár 22 Pro ETL proces lze nastavit strategii pro čištění dat, jako například remove (data, která nesplňují pravidla se nepřenesou dále, jsou odstraněna), match (očištění dat na základě nejbližší shody hodnoty atributů – odstranění překlepů, velká/malá písmena apod.) nebo custom (libovolná vlastní logika čištění dat).

23 Prof. Molnár 23 Vytvoření OLAP krychle Tabulka faktů Tabulky dimenzí

24 Prof. Molnár 24 Analýza segmentů trhu SKUPINA ZÁKAZNÍKŮ OBOR REGION Obchodní domy Velkoobchod Maloobchod Sklo Keramika Plasty sever jih východ

25 Prof. Molnár 25 Analýza nákladů NAKLADOVY DRUH VÝROBEK STŘEDISKO Materiál Mzdy Energie SU15 VOC25 NCU10 S01 S02 S03 ČAS

26 Prof. Molnár 26 OLAP krychle Řez krychlí OLAP aplikace (Excel) Čas Org. jednotka Druh účtu Kč (data)

27 Prof. Molnár 27 OLAP dimenze Rok Závod Přímé náklady Měsíc Náklady na materiál Stavba

28 Prof. Molnár 28 Fakta a jejich aditivnost Aditivní fakta – mohou být agregována pomocí jednoduchých funkcí jako je průměr, součet apod. přes všechny dimenze (např. výše tržeb může být sečtena jak za libovolné časové období a za všechny prodejny) Semiaditivní fakta – mohou být agregována podle jednotlivých dimenzí jen částečně (např. hotovost v bance může být sečtena jen za všechny účty, nikoliv za nějaké časové období) Neaditivní fakta – nemohou být agregována jednoduchými funkcemi (např. průměrná produktivita v jednotlivých měsících nemůže být sečtena za za rok, ani za všechny organizační jednotky)

29 Prof. Molnár 29 Vlastnosti dimenzí Hierarchie Granularita Sdílení Proměnlivost

30 Prof. Molnár 30 Vlastnosti dimenzí (1) Hierarchie dimenze – umožňuje procházet daty od úrovně s nejvyšší mírou agregace k nižší úrovni (drill-down) a naopak (roll-up). Např. ústav, fakulta, univerzita, vysoké školy, nebo stavba, závod, divize, celá společnost. Granularita dimenze– základní úroveň detailu dat uložených v DW odpovídá nejnižší úrovni detailu u všech dimenzí. Tak vzniká problém balancování mezi objemem dat a mírou detailu zachycených dat. Daná metrika se může lišit podle dalších dimenzí Např. chceme-li sledovat denní výjezdy pohotovostních vozidel plynárenské služby v Praze, tak se může stát, že u řady dalších měst toto nemá smysl, protože stačí sledovat jen za týden.

31 Prof. Molnár 31 Vlastnosti dimenzí (2) Sdílené dimenze (common shared dimension) – jsou společné pro všechna fakta a tím poskytují uživateli jednotný pohled na fakta a usnadňují implementaci. Typickými sdílenými dimenzemi jsou čas, organizační jednotka, produkt, zákazník apod. Proměnlivost dimenze (slowly changing dimension) – znamená, že atributy dimenze se mohou v čase měnit, což může komplikovat historické přehledy (sledování trendů). To je většinou řešeno ukládáním dvojích hodnot staré a nové. Pokud se dimenze mění často, vede to k nežádoucímu nárůstu atributů (dat). Např. zákazník se přejmenuje, sloučí s jiným či přestěhuje do jiného regionu.

32 Prof. Molnár 32 Příklady dimenzí u aplikace prodeje Čas (rok, měsíc, případně den v roce či den v měsíci) Stav (prognóza, plán skutečnost) Útvar (dle konkrétního organizačního uspořádání) Zákazník (obchodní zástupce, významný zákazník, přímý odběratel apod.) Segment trhu (státní sektor, soukromý sektor, bytová výstavba apod.) Produkt/zakázka (typ, provedení apod.) Teritorium (Evropa, ČR, kraj apod.) Nákladový druh (materiál, mzdy, cestovné,provize a pod.) a další dle konkrétních požadavků obchodníků

33 Prof. Molnár 33 Příklady fakt u aplikace prodeje Objem tržeb Náklady Zisk Počet zákazníků a další dle konkrétních požadavků obchodníků Z hodnot fakt a jejich dimenzí pak systém tvoří ukazatele Např. % nákladů na provize z celkových tržeb či z celkového zisku a jejich vývoj v čase a to dle jednotlivých útvarů

34 Prof. Molnár 34 Hierarchie dimensí

35 Prof. Molnár 35 Tabulka vazeb faktů a dimensí

36 Prof. Molnár 36 Datový model - prodeje FAKTA: tržba zisk pohledávky Dimenze: čas produkt zákazník způsob prodeje region čas produkt zákazník způsob prodeje kraj denkomediefanoušcie-shopPraha týdenpsychoteaneagersřetězceStřední čechy měsícthrillersingelsmaloobchodKarlovarský roklove storyothersdealeratd. granularita

37 Prof. Molnár 37 Vazba pohledávky - dimense pohledávky čas zákazník způsob

38 Prof. Molnár 38 Vazba tržba - dimense tržba čas produkt zákazník způsob kraj

39 Prof. Molnár 39 Vazba zisk - dimense zisk čas způsob produkt

40 Prof. Molnár 40 Model fakta-dimenze tržba časprodukt zákazník způsob kraj zisk pohledávky

41 Prof. Molnár 41 - Uživatelské vlastnosti MIS grafická a tabulková prezentace intuitivní ovládání panelů možnost detailních pohledů (drill-down) agregace a integrace dat multidimensionální řezy(slice and dice) víceuživatelský přístup diagnostika extrémních hodnot (alert) spouštění externích aplikací simulace (what-if) tiskové výstupy

42 Prof. Molnár 42

43 Prof. Molnár 43

44 Prof. Molnár 44 Základní operace v OLAP systémech Drill-down – umožňuje uživateli ve zvolené(-ých) instanci(-ích) jisté agregační úrovně nastavit nižší(jemnější) agregační úroveň Roll-up – jde o opak předešlé operace. Ve zvolených instancích jisté agregační úrovně nastavuje vyšší (hrubší) agregační úroveň. Pivoting – umožňuje „otáčet“ datovou krychlí, tj. měnit úhel pohledu na data na úrovni presentace obsahu datového skladu. Slicing – dovoluje provádět řezy datovou kostkou, tj. nalézt pohled, v němž je jedna dimenze fixována v jisté(-ých) instanci(-ích) jisté agregační úrovně. Jinými slovy tato dimenze aplikuje filtr na instance příslušné agregační úrovně dané dimenze. Dicing – je obdobou „slicingu“, jenž umožňuje nastavit takový filtr pro více dimenzí

45 Prof. Molnár 45 Postup budování MIS/DW Identifikace problému (nejsložitější etapa) – projekt musí být podložen nějakým problémem, v důsledku jehož vyřešení se očekává přínos pro podnik. Vytvoření prototypu – identifikace určitého podproblému (například jenom problém sledování a vyhodnocování nákladů), jehož vyřešení nevyžaduje příliš mnoho úsilí, ale výsledek bude jasně naznačovat, jak bude vypadat cílový systém. Prototyp má dva efekty  Koncovému uživateli jasně ukazuje jak bude vypadat výsledek a co lze od budovaného řešení očekávat  Dává možnost řešiteli vyzkoušet si i ověřit své předpoklady a získat konkrétná zkušenosti z analýzy, návrhu a technické realizace prototypu včetně seznámení se s prostředím uživatele a navázání komunikace s budoucími uživateli Rozvinutí (roll-out) systému - postupné (step-by-step) rozšiřování řešení do dalších oblastí podnikového řízení.

46 Prof. Molnár 46 Pořízení MIS Vlastním vývojem (většinou na bázi EXCEL) Nákupem modulu MIS, který je součástí komplexního podnikového IS jako nadstavba ERP (SAP, ORACLE, NAVISION, MFG/Pro a pod.) tzv. systém all-in-one nákupem specializovaného MIS, který je přes standardizovaný interface napojen na libovolný základní ERP systém (COGNOS, SAS Institute, ADASTRA, MIS Alea apod.) tzv. systém best-of breed

47 Prof. Molnár 47 Hlavní nedostatky současných MIS/EIS 1) mají tendenci spoléhat se ve značné míře na finanční ukazatele 2) zabývají se většinou historickými daty 3) vycházejí v drtivé míře z interních zdrojů podniku a ignorují vnější prostředí a konkurenci 4) pokud se zabývají budoucností, tak jenom na základě jednoduchých extrapolací minulosti 5) slouží účelově jednotlivým organizačním útvarům podniku a ignorují průřezové integrující pohledy

48 Prof. Molnár 48 IS pro strategické řízení musí zabezpečit selektivní sběr, zpracování a komunikování informací, které 1) jsou většinou nefinanční povahy 2) jsou orientované na budoucnost 3) pocházejí zejména z externích zdrojů 4) jsou založené na prognózách budoucnosti a ne na jednoduché extrapolaci minulosti

49 Prof. Molnár 49 Úroveň turbulence (Ansoff a Sullivan)

50 Prof. Molnár 50 Pro zvládnutí turbulence musí IS zabezpečit 1. Zpracování signálů o možné změně turbulence 2. Analýzu konkurence k identifikaci změn v jejích tržních strategiích a technologiích 3. Generování scénářů alternativních strategií 4. Analýzu proveditelnosti projektů alternativních strategií včetně analýzy kompetencí k provedení změny 5. Sledování plnění strategie a hodnocení dosahovaných efektů

51 Prof. Molnár 51 Funkce ISRealizuje Monitorovací - analýzu konkurence - zachycení a zpracování signálů o změně turbulence Rozhodovací a plánovací - analýzu scénářů - kapacitní analýzu - analýzu proveditelnosti změn Řízení a kontroly - sledování odchylek - vyhodnocovat efektivnost projektu - sledování postupu projektu

52 Prof. Molnár 52 S rostoucí turbulencí roste náročnost na IS

53 Prof. Molnár 53 Business/Competitive Intelligence je termín pro celou množinu konceptů a metodologií zlepšujících rozhodovací procesy v podnikání, které jsou založeny na - analýze faktů - odhalování souvislostí mezi nimi Na informace získané z různých zdrojů aplikujeme zkušenosti (znalosti) k získání předpovědi vývoje podnikání a ke zlepšení rozhodovacích procesů

54 Prof. Molnár 54 Produkty podporující BI Executive/Enterprise Information Systems (EIS) Management Support Systems (MSS) Decision Support Systems (DSS) Expert Systems (ES) On-Line Analytical Processing (OLAP) Data Mining Data Visualisation Knowledge management (KM)

55 Prof. Molnár 55 Obecná definice data miningu proces výběru, prohledávání a modelování ve velkých objemech dat, sloužící k odhalení dříve neznámých vztahů mezi daty, za účelem získání konkurenční výhody. DM bývá v širším slova smyslu definován jako získávání dosud neznámých, ověřených a použitelných znalostí z rozsáhlých databází pro provádění klíčových manažerských rozhodnutí.

56 Prof. Molnár 56 Příklady obchodního zadání, které mohou vést k zavádění technik DM Deskripce (např. „Které atributy nejvíce charakterizují chování určité skupiny zákazníků?“). : Klasifikace (např. „Představuje toto hlášení o škodní události pojišťovací podvod?“); Odhad (např. „Jaká je obchodní hodnota zákazníka?“); Předpovídání (např. „Kteří zákazníci od nás pravděpodobně odejdou v průběhu nejbližších šesti měsíců?“); Analýza nákupního košíku (např. „Které produkty se obvykle kupují společně?“); Seskupování podle podobností (např. „Které skupiny zákazníků mají nějaké společné charakteristiky?“);


Stáhnout ppt "Prof. Molnár 1 Manažerské informační systémy Business Intelligence a OLAP Prof. Ing. Zdeněk Molnár, CSc zdenek."

Podobné prezentace


Reklamy Google