Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Datové sklady a BI aplikace

Podobné prezentace


Prezentace na téma: "Datové sklady a BI aplikace"— Transkript prezentace:

1 Datové sklady a BI aplikace
MFF Část 1 Říjen 2004 Ing. David Pirkl

2 1. Přednáška

3 Cíle školení Seznámit s architekturou aplikací BI
Datové sklady Data Mining CRM Podrobně popsat metodologii tvorby datových skladů Ukázat na možnosti dimensionálního modelování Pokročilé analytické techniky využití data Obchodní příležitosti a typické úlohy

4 Co byste si měli odnést Představu o architektuře řešení BI a významu jednotlivých komponent Detailní znalost metodiky tvorby DW Principy dimensionálního modelování Znalost hlavních technik pokročilé analýzy dat a jejich možnosti využití Praktické zkušenosti s práce s řešením od firmy Microsoft a SPSS MS SQL Server 2000, MS Analysis Services Clementine, …

5 Předpoklady Žádné speciální znalosti nejsou požadovány
Uživatelská znalost Práce na PC Databází (např. MS Access) Základy statistiky a středoškolské matematiky

6 Literatura Kimball Raplh: The Data Warehouse Toolkit, John Wiley & Sons, 2002 Kimball Raplh: The Data Warehouse Lifecycle Toolkit, John Wiley & Sons, 1998 Inmon W. H.: Building the Data Warehouse, John Wiley & Sons, 2002 Lacko Luboslav: Databáze: datové sklady, OLAP a dolování dat s příklady v MS SQL Serveru a Oracle, Computer Press, 2003 Humphries M., Hawkins M. W. : Data warehousing : návrh a implementace, Computer Press, 2002 Berry M. J., Linoff G.: Data Mining Techniques for marketing, sales and customer support, John Wiley & Sons, 1997 Rud Olivia Parr: Data mining, Computer Press, 2001 Berka Petr: Dobývání znalostí z databází, Academia, 2003

7 Literatura Rozsáhle zdroje na Internetu: www.rkimball.com

8 Vyučuje Ing. David Pirkl

9 Agenda dne Základní pojmy Metodologie BDLC

10 Základní pojmy Mezi hlavní pojmy, s kterými se seznámíme, patří:
BI – Business Intelligence Datový sklad Datové tržiště Proces ETL OLAP Reporting

11 Business intelligence (BI)
Označuje proces transformace dat (údajů) na informace a převod těchto informací na znalosti, sloužící k podpoře podnikání (rozhodování) Identifikovat trhlinu mezi obchodními potřebami a dostupnými informacemi

12 Business intelligence (BI)
Data mining Neuronové sítě, … Vysoké OLAP Reporting Data warehouse Znalosti Zpracování dat Informace OLTP Operační databáze Nízké Data

13 Historie BI Navazuje na rozvoj databázových systémů:
Transakční systémy (OLTP) 60. léta – Dávkové zpracování výkazů Složité nalézt a analyzovat informace Nákladné a neflexibilní, přeprogramování dle nových požadavků 70. léta – první manažerské aplikace (Lockheed) Terminálově orientované EIS a DSS aplikace 80. léta – Desktopové aplikace a analytické nástroje Dotazovací nástroje, tabulkové procesory, GUI Jednoduché na používání, přístup pouze k operačním databázím 90. léta – Rozvoj datových skladů, integrace OLAP databází a DM technik

14 Co vedlo k BI Orientace na zákazníka
Potřeba efektivních a flexibilních analýz – cena informace Potřeba oddělit analýzu od operačních potřeb Rozvoj technologie – relační databáze, OLAP databáze

15 Co vedlo k BI Nemohu nalézt informace, které potřebuji
Data jsou v různých místech po síti Různé verze dat, liší se Nemohu se dostat k datům, která potřebuji Potřeba kontaktovat IT experta Nerozumím datům, která jsem získal Data nejsou dokumentována (metadata) Nemohu využít data, která jsem získal Výsledky jsou nepravděpodobné (chyby) Potřebuji transformovat data do jiné formy

16 Současný a zítřejší stav
Mnoho nástrojů pro podporu řešení BI Propracovaná metodologie Vývoj směrem k co největší uživatelské přívětivosti Mnoho konzultačních firem nabízejících řešení BI

17 Komponenty a aplikace BI
Mezi komponenty BI řešení lze zařadit: Reportingová řešení Datové sklady Data Mining řešení CRM specializované aplikace (optimalizace zásob, obchodních cest, …)

18 Centrální datový sklad
Architektura BI Data mining modely Kontaktní CRM Analytický data mart 6 11 12 10 9 5 7 ODS 13 Centrální datový sklad 8 2. vrstva 1. vrstva 0. vrstva OLAP analýza Data marty Uživatelé/Analytici 2 Prodej 3 4 Marketing 1 ETL Reporting Ekonomika Provoz Obchod Účetnictví

19 Data Warehouse Datový sklad je podnikový strukturovaný depozitář předmětově orientovaných, vzájemně provázaných, časově neměnných, historických dat používaný na získávání informací a podporu rozhodování. V datovém skladu jsou uložena detailní a sumární data. Bill Inmon Datový sklad je centrální úložiště různorodých dat firmy Řešení integračních efektů Jednotné místo uložení dat Určeno pro analytickou podporu rozhodování (drill-down, drill-up) Zahrnuje nejen data v databází, ale i nástroje pro extrakci dat, nástroje pro reporting, analýzu dat, data mining… Prezentace dat uživatelsky příjemným způsobem zaměřeným na střední a vyšší management

20 Předmětná orientace Prodejní systém Zaměstnanec Výplatní systém
Zákazník Nákupní systém Prodejce Provozní systémy Aplikační orientace Datový sklad Předmětná orientace

21 Integrace Prodejní systém Výplatní systém Zákazník Nákupní systém
Provozní systémy Aplikační orientace Datový sklad Předmětná orientace

22 Časová neměnnost, historie
create zobrazení Výplatní systém Zákazník update delete insert načtení Provozní systémy Aplikační orientace Datový sklad Předmětná orientace

23 Přínosy řešení datového skladu
Integrace a čistota dat, integrační efekty Podpora úloh analytického charakteru a jejich ekonomické a mimoekonomické efekty Vyšší flexibilita řízení a realizace změn Zpětná vazba Nezávislost vedoucích pracovníků na oddělení IT Kvalifikační efekty – v IT i v ekonomice řízení (práce s informacemi, uvažování v kontextu) Automatizace rutinních procesů (tvorba výkazů, zpráv) Kontrola plnění plánů a finanční analýza Více

24 Přínosy řešení datového skladu
Podpora analýzy dat: Trendy, sledování a analýza časových řad Poměrové ukazatele Identifikace odchylek Drill-down, Drill-up, Drill-across, Slice-dice

25 OLTP Provozní databáze Vlastnost OLTP Typická operace Update
Podpora analýz Nízká Uživatelské rozhraní Stabilní Velikost dat při transakci Malá Úroveň dat Detailní Stáří dat Současné Orientace Záznam

26 OLTP vs. DW OLTP DW Podpora transakcí - každodenní operace
Analýza i historických dat Data uložena na úrovni transakcí Integrace dat Normalizovaný datový model Denormalizovaný model

27 Data Mart (Datové tržiště)
Logická podmnožina datového skladu Část řešení datového skladu určená pro podporu specifické analýzy (účetnictví) nebo oddělení firmy (marketing, prodej) Vlastnost Data Warehouse Data Mart Rozsah Enterprise Oddělení Obsah Více oblastí Jedna oblast Zdroje Hodně Málo Velikost (typicky) 100 GB to > 1 TB < 100 GB Implementace Měsíce až roky Měsíce

28 ETL Extraction-Transformation-Loading
Kompletní proces načtení dat do datového skladu Zahrnuje mnoho subprocesů: Extrakce – výběr dat Transformace – ověření, čištění, integrace dat Loading – načtení dat do DW Kontrola kvality Auditovaní Bezpečnost Zálohování & Obnova

29 OLAP On-Line Analytic Processing
Obecné označení pro dotazování a zobrazení dat z datového skladu založené na dimenzionálním modelu Prakticky zkratka označuje multidimenzionální uložení a analýzu dat (OLAP databáze)

30 ODS Operational Data Store
Architektura obsahující předmětově orientovaná, integrovaná, současná, rychle se měnící a detailní data pro operační potřeby ODS typicky obsahuje dat rychle se měnící v reálném čase Pro podporu analytických a CRM aplikací

31 Data Mining Data mining je netriviální proces zjišťování platných, neznámých, potencionálně užitečných a snadno pochopitelných znalostí z dat. Automatizované zpracování rozsáhlých datových souborů metodami na pokraji statistiky, strojového učení a umělé inteligence.

32 CRM Customer Relationship Management
Systémy pro řízení vztahů se zákazníky

33 Shrnutí pojmů Shrnutí relevantních pojmů (některé budou probrány dále)
OLTP – transakční systémy Datový sklad (DW) Datové tržiště ETL ODS OLAP CRM Data Mining (DM) Dimensionální modelování ROLAP, MOLAP, HOLAP Dotazovací nástroje DM techniky

34 DW - opakování Centrální úložiště relevantní firemních dat
Integrace firemních datových zdrojů Historie v datech Centrální místo pro podporu informačních potřeb uživatelů Velké objemy dat Navrženo pro podporu analýzy – speciální struktury uložení dat

35 Základní způsoby budování DW
Existují dva základní přístupy k budování DW: Metoda velkého třesku Přírůstková metoda

36 Přístupy k tvorbě DS „Velký třesk“ Inkrementální přírůstky Data marty
Uživatelé Data marty Provoz Obchod Účetnictví Marketing Prodej Ekonomika Centrální datový sklad „Velký třesk“ BUS Architektura Centrální datový sklad Data marty Uživatelé Inkrementální přírůstky Provoz Obchod Účetnictví Marketing Prodej Ekonomika

37 Nezávislé datové tržiště
OLTP ETL

38 Nezávislé datové tržiště
ETL – 3 krát !!!

39 Nezávislé datové tržiště
$ $ Duplikace práce na ETL Časově i finančně náročné Údržba nezávislých DM je náročná, těžkopádná

40 Závislé datové tržiště s odpovídajícími metadaty
DW architektura Uživatelské nástroje DW Dept’l md Detailní Dept’l md Metadata Dept’l md Závislé datové tržiště s odpovídajícími metadaty

41 DW architektura DW Rychlý vývoj, ale … Budou ETL konzistentní?
Detailní Dept’l md Rychlý vývoj, ale … Budou ETL konzistentní? Jak je řízena redundance? Komplexní architektura Konzistence dat Detailní i agregovaná data Metadata jsou konzistentní

42 Základní způsoby budování DW
Dnes je preferovaná přírůstková metoda Přírůstková metoda zaručuje: Projektovou zvládnutelnost řešení Reálné časové horizonty jednotlivých etap (2-4 měsíce) Řešení aktuálních uživatelských (obchodních) potřeb Zpětnou vazbu uživatelů

43 Cíle datového skladu Zajistit dostupnost firemních informací
Zajistit konzistenci firemních informací Vytvořit adaptivní a pružný zdroj informací Zabezpečit ochranu firemních informací Vytvořit základnu pro firemní podporu rozhodování (analytické centrum)

44 DW procesy Hlavní proces při tvorbě datového skladu Podprocesy:
Extrakce Transformace Čištění dat Výběr dat Integrace Umělé klíče Agregace Načtení (Loading) a tvorba indexů Data Quality Assurance

45 DW procesy Další procesy v DW Publikace dat (prezentační server)
Update dat Dotazování Zpětná vazba (čistá dat do OLTP, data z DM do DW) Audit dat Bezpečnost Zálohování a obnova

46 Architektura B U S Provozní databáze Datový sklad „Prezentační vrstva“
Uživatelské aplikace ETL Prezentace Uložení dat: - 0. vrstva DW - Není pro přímé dotazování Procesy: - Čištění dat - Integrace - Full vs. Inkrem. - Výběr - Duplicity - Standardizace - Conformní dimenze - Převod do prezentační vrstvy - a další B U S Ad Hoc dotazování Datové tržiště - Dimenzionální - Předmětně orientované - BUS architekt. - OLAP Extrakce Plnění Prezentace Reportovací nástroje Prezentace Datové tržiště Intranet Extrakce Plnění DM modelování - scoring - předpovědi - segmentace - cross-selling - časové řady Analýza Extrakce Datové tržiště Plnění Oprava chyb Výsledky modelů

47 Architektura CRM aplikace a Internetové aplikace Data mining aplikace
Internetové a intranetové aplikace pro řízení vztahu se zákazníkem, podporu pracovníků distribuční sítě (např. on-line scoring) Data mining modely Scoring, cross-selling, … MS SQL Server 2000 EE Provozní databáze MS SQL Server 2000 ETL Uživatelé Relační databáze datového skladu (0. a 1. vrstva, datová tržiště a ODS) Ekon. MS DTS Obchod WWW prohlížeč (IE) MS Analysis Services Externí data OLAP dbf Excel XP Excel MS Reporting Services ProClarity Metainformační a reportingový portál

48 Produkty pro BI Nástroje pro BI Klientské nástroje
Microsoft (MS SQL Server, Analysis Services, Reporting Services) Oracle Sybase IQ IBM DB2, DB2 OLAP Server Microstrategy SPSS SAS SAP – Business Warehouse Klientské nástroje ProClarity Oracle Discoverer MS Excel 2000 Business Objects Cognos: PowerPlay, Impromptu Brio: Brio Query Quadbase – EspressReport

49 2. Přednáška

50 Business Dimensional LifeCycle
Standardní metodologie vývoje datového skladu od Ralpha Kimballa Projektový management Projektový plán Definice uživatelských požadavků Technická architektura Výběr produktů instalace Dimensionální modelování Fyzická úroveň ETL procesy Nasazení Údržba a růst Uživatelské aplikace specifikace vývoj

51 Popis metodologie Standardní metodologie tvorby datového skladu
Modifikovaná metodika tvorby IS Vyžaduje speciální znalosti analytiků/implementátorů Jednotlivé fáze mají rozdílnou váhu v jednotlivých etapách 1. etapa – nastartování tvorby datového skladu (HW, SW infrastruktura) Další etapy – dopady řešení na stávající infrastrukturu

52 Agenda BDLC Plán projektu a projektový management Business požadavky
Dimenzionální modelování Architektura Fyzický design ETL Uživatelské aplikace Nasazení Správa a růst DW

53 Plán projektu a projektový managm.
Existuje poptávka po DW, od koho, proč? Poptávka jediného oddělení Informatika Mnoho oddělení Ohodnotit připravenost pro projekt DW Silný business sponzor Pocit potřeby podpory businessu Stupeň práce s informacemi dnes, ochota do budoucnosti („analytická kultura“) Stav IS/IT Proveditelnost (např. Existují zdroje dat?) Kritický faktor úspěchu podpora managementu

54 Plán projektu a projektový managm.
Jak odstranit nepřipravenost? Popsat hlavní potřeby business na konceptuální úrovni Potřeby managementu Prioritizace business potřeb Proof of concept Pozor potom na přehnaná očekávání

55 Plán projektu a projektový managm.
Vysoké Etapa B Etapa A Obchodní dopad Etapa D Etapa C Nízké Nízké Vysoké Náročnost

56 Plán projektu a projektový managm.
Definice rozsahu projektu – 1. etapy Řízeno obchodními potřebami ne harmonogramem Spolupráce IT a business Doporučeno jednoduchý obchodní problém řešitelný z jednoho zdroje dat Limit na počet uživatelů (do 25) Urči kriteria úspěchu realizace Největší riziko: neporozumění kvalitě a problémům v datech Zadokumentuj

57 Plán projektu a projektový managm.
Zdůvodnění rozsahu a záměru projektu ROI Náklady HW a SW Náklady na údržbu Náklady na interní vývoj Náklady na externí vývoj Náklady na školení Náklady na podporu ze strany externích řešitelů Náklady na další rozvoj Více

58 Plán projektu a projektový managm.
Výnosy Těžko se určuje, spíše odhady Potřeba zapojit business (business sponzora) Předpokládaný nárůst zákazníků vzhledem k lepším službám Méně odcházejících zákazníků Větší návratnost mailingových kampaní Méně pracovníků (vyšší produktivita) Zpětně ověřovat po skončení etapy – k jakému zlepšení došlo

59 Plán projektu a projektový managm.
Vytvořte úvodní návrh plánu projektu Bude průběžně upřesňován Určete jméno projektu Vyberte pracovníky na projekt Jeden pracovník může být v několika rolích Ne všichni jsou po celou dobu projektu, ale po danou část Sponzor projektu Zástupce business sponzora (business driver) Projektový manažer (zadavatel, konzultační firma) Business vedoucí Více

60 Plán projektu a projektový managm.
Vyberte pracovníky na projekt Business Analytik Specialista datového modelování Databázový administrátor Designer ETL Vývojář uživatelských aplikací Školitel Bezpečnostní architekt Technická podpora ETL programátor Data steward DQ manažer

61 Plán projektu a projektový managm.
Vývoj DW inhouse vs. externě Nedoporučuje se nechat vyvíjet jen konzultační firmou (neměla by obsadit všechny klíčové role v projektu) Konzultační firma má umožnit přenos know-how na firemní pracovníky Najmou specialisty Nebo najmou pracovníky na rutinní práce a uvolnit tak ruce firemním specialistům se znalostí provozních databází a fungování firmy Vše založit na obchodních požadavcích nikoliv si nechat doporučit technologii jenom proto, že daná konzultační firma s ní pracuje a jinou neovládá

62 Plán projektu a projektový managm.
Vytvoř projektový plán Jednotný Detailní Měl by obsahovat pro každý krok Zdroje Odhadovaný čas na provedení Začátek Předpokládaný konec Předpokládaný konec - aktuálně Status – kolik již vykonáno Počet dní do dokončení Závislost na jiných úkolech (co musí být dokončeno před zahájením) Zpoždění – A/N

63 Projektový management
Podobné projektovému managementu IS/ITC projektů Zvláštnosti: Různorodý tým s různou odpovědností Interaktnivní vývoj (nikdy nekončící vývoj DW) Nevypočitatelnost zdrojových dat a její dopady na plán projektu Velká očekávání uživatelů, projekt je na očích

64 Projektový management
Zahájení projektu – projekt tým kick-off Představení projektu DW koncept Tým a role Projektový management Administrační nástroje Milníky Plán projektu Diskuze Příští krok

65 Projektový management
Monitorování stavu projektu Projektové schůzky Většinou 1 hodina jednou týdně na stejném místě Jádro týmu plus aktuální lidé Dokumentovat – Dokument stavu projektu Projektový plán – změny, řešení otázek, řešení požadavků na změnu, práce vykonaná od poslední schůzky, plánovaná práce, otevřené otázky, požadavky na změnu Údržba projektové dokumentace a projektového plánu

66 Projektový management
Řízení rozsahu projektu Vedení seznamu otázek – řešení Vedení seznamu požadavků na změnu rozsahu projektu Změna – dopad na plán, rozpočet, rozsah projektu Dokumentovat požadavky na rozšíření řešení (např. slouží pro další etapy) Vytvoř a realizuj komunikační plán Komunikace je velmi důležitá S projektovým týmem Projektové schůzky, zápisy, … S business sponzorem Měsíční setkání, oběd, … S uživateli Intranet, informace o projektu, kick-off meeting, … Executive management Nepravidelná setkání, informace o výsledcích IS pracovníci Měsíční setkání, informace o projektu

67 Agenda BDLC Plán projektu a projektový management Business požadavky
Dimenzionální modelování Architektura Fyzický design ETL Uživatelské aplikace Nasazení Správa a růst DW

68 Business požadavky Uživatelské požadavky jsou kriticky důležité Určují
Jaká data budou v datovém skladě? Jak budou organizovaná? Jak často budou aktualizována? Dopad na všechny další fáze tvorby DW

69 Business požadavky Dimesionální model Architektura Fyzická realizace
Projektový plán a management Požadavky ETL Údržba a růst Nasazení Uživatelské aplikace

70 Business požadavky Přístup k získání požadavků
Nikoliv otázky co uživatelé chtějí za data Ale co dělají, jak hodnotí svojí práci (zpětná vazba), jak často, co jsou jejich priority Používat slovník uživatelů Realizace Interview - setkání s 1 nebo několika málo pracovníky, více do hloubky Setkání – s více pracovníky, brainstorming, rychleji více pracovníků, náročnější, těžší na svolání – sladit harmonogram mnoha lidí, získat konceptuální pohled Zahrnuje Uživatele IS pracovníky

71 Business požadavky Doporučuje se začít s uživateli Příprava
Identifikovat tým pro interview Vedoucí interview Zapisovatel Přihlížející Průzkum před interview Firemní zprávy, intranet, finanční zprávy, … Zjištění předchozích aktivit v oblasti DW, reporting řešení, podpory rozhodování – „kdo zapomněl na minulost je nucen ji opakovat“ Výběr uživatelů pro interview Společně s business sponzorem nebo projektovým vedoucím zadavatele Dle organizační struktury (dokumentované, nedokumentované) Porozumět formální i neformální struktuře Zvážit politické dopady když s někým nepovedeme interview Někdy podřízení vědí více Výběr pracovníků pro interview Business IS

72 Business požadavky Vést interview horizontálně i vertikálně po organizaci Horizontálně – poznat celkové potřeby – aby řešení bylo navrženo s ohledem na budoucí vývoj Vertikálně – porozumět strategii i jejímu taktickému naplňování Interview s IS pracovníky Porozumět provozním systémům Zda existují data pro naplnění potřeb a požadavků uživatelů S programátory, správci, tvůrci datových modelů, help desk Jiný průběh než interview s uživateli – systematické postupné poznání provozních databází a systémů (ne volná diskuze kam business půjde) Většinou náročnější než se na první pohled zdá – více interview Chyba např. chci profitabilitu, zjistím že jsou data o nákladech a příjmech, myslím že ok Problém že data mají různou granualitu (příjem na klienta, náklady na oddělení)

73 Business požadavky Připravit dotazník s otázkami na interview
Rozdílné dle typu interview Hrubá struktura Naplánovat interview Maximálně 3 – 4 za den pro jeden tým na interview Jedno interview (60 – 90 minut) Mezi interview alespoň 30 min přestávka Zápis dělat co nejdříve (kolem 4 hod na interview) Pozor na dovolené, pravidelné cesty, …

74 Business požadavky Nejdříve interview s business sponzorem
Pak začít středním managementem Pak vrcholový nebo nižší úroveň Postupně oddělení a IS Nedoporučuje se ukončit jedno oddělení a pak na druhé a tak dále… Každé oddělení jiný pohled, postupně si ho ujasňovat u všech oddělení Mix interview podle různých oddělení Naplánovat místo a čas interview U uživatele V konferenční místnosti Zvážit dostupnost místnosti (ne 20 min cesty od hlavního sídla v podzemní místnosti – nikdo nenajde) Zvládnout všechna interview v co nejkratším přijatelném čase

75 Business požadavky Začátek interview – svolat kick-off meeting uživatelů Úvod Popis projektu, proč Rozsah projektu Plán projektu (konceptuálně) Tým Role uživatelů (co od nich potřebujeme a proč) Milníky Příští krok

76 Business požadavky Před vlastním interview zaslat průvodní dopis – co od uživatelů chceme, proč Ať si připraví klíčové reporty Jazyk uživatelů ne DW Realizace interview Nezapomenou na role týmu pro interview (např. zapisovatel má zapisovat a ne se rozmluvit a přestat psát) Definujte terminologie Potvrzujte si čemu nerozumíte Nejprve představit projekt a cíl interview, na konec poděkovat a popsat následující kroky První minuty interview jsou klíčové pro celý průběh (naladění uživatele, připravit si dobře úvod) Být připraven na přidání nových interview do plánu Doporučí vhodné kandidáty na interview

77 Business požadavky Příklad dotazníků – Business Executive:
A. Představení Diskutuj cíle DW projektu a jeho celkový stav Diskutuj cíle interview (potřeba zjistit uživatelské potřeby, co je pracovní náplní, co by mělo být, proč) a popiš průběh interview. Představ tým pro interview a role Potvrď si čas na interview Popiš další krok v interview B. Zodpovědnosti Popište prosím Vaše oddělení a jeho vztah k celé organizaci Co je Vaše primární zodpovědnost, pracovní náplň? C. Obchodní cíle, potřeby a otázky Jaké jsou cíle Vašeho oddělení? Co se snažíte splnit? Jaký je Váš prioritní cíl, který chcete naplnit? Čím měříte úspěšnost Vaší práce? Jak poznáte, že vše jde dobře? Jak často měříte svou úspěšnost (zpětná vazba)? Jaké funkce a části (pododdělení) jsou ve vašem oddělení nejvíce důležité pro naplnění cílů? Jaké role hrají? Jak jednotlivé části oddělení spolupracují, aby dosáhli cílu a úspěchu? Jaké hlavní problémy teď řešíte? Co Vám brání v tom aby jste je vyřešili? Jaký to má dopad na oddělení? Jak poznáte (identifikujete), že někde vznikl problém, výjimka, nebo že se problém blíží? Jaké vidíte možnosti a příležitosti z zefektivnění práce (vyšší ziskovosti)? Kde vidíte Vaše konkurenty (podobné organizace) v používání IT technologie? Dokážete rychle reagovat na změny v okolí (trhu, konkurence), co Vám v tom brání?

78 Business požadavky D. Analytické požadavky E. Souhrn
Jakou roli hrají data a analýzy při Vašem rozhodování a rozhodování Vašeho oddělení? Jaké klíčové informace potřebuje pro své rozhodování, aby jste mohli dosáhnout svých cílů, a překonat problémy a předcházet jim? Jak tyto informace dnes získáváte? Kolik pracovníků pracuje ve Vašem oddělení? Kolik z nich pracuje z daty? Kolik z nich provádí analýzy? Jsou nějaké informace, které dnes nemáte k dispozici, ale věříte, že by Vám pomohli v rozhodování a dosažení Vašich cílů? Jaké reporty (výkazy) dnes používáte? Která data na reportech (výkazech) jsou důležitá – klíčová? Jak reporty (výkazy) využíváte? Kdyby Vaše reporty (výkazy) byly dynamické, jak by Vám to pomohlo, co by se tím změnilo? Jaké analýzy byste rádi prováděli? Jaké vidíte příležitosti k zlepšení Vašeho rozhodování, tím že bude zlepšen a zjednodušen přístup k informacím? Jaký to bude mít finanční dopad? E. Souhrn Shrň dosud získané poznatky (nahlas). Co musí projekt splnit aby jste ho považoval za úspěšný? Kritéria by měla být měřitelná. Poděkuj účastníkovi. Popiš další kroky, zaslání draft zápisu z interview do daného času, možnost znovu se sejít dle potřeby, …

79 Business požadavky Definování kriterii úspěchu od uživatelů
Příklady akceptovatelných kritérii Implementační metriky (počet GB dat, počet uživatelů, …) Aktivita (počet dotazů, počet login) Úroveň služeb Dostupnost DW Datová kvalita – počet chyb v datech Dostupnost dat v DW, kdy Odezva DW Odezva na podporu Dopady na business (zvýšení zisku, …) Výkonnost proti stavu před DW Hodinová analýza trvá jen 1 minutu

80 Business požadavky Překážky při interview Frustrovaný uživatel
„Už jsem všechno řekl co potřebuji oddělení IS“ Nikdo ho dosud nevyslyšel Říci mu, že pouze chceme si upřesnit a verifikovat jeho předchozí požadavky Využít znalosti předchozích interview Zaneprázdněný uživatel Lepší ho vynechat Nemá-li čas na interview nebude mít ani čas na kontrolu zápisu ani na školení ohledně využití DW, … Najít více kooperujícího uživatele je-li to možné

81 Business požadavky Nesdílný uživatel Nadšený uživatel
Odpovídá jedním slovem Výhodné klást více negativní otázky: co je špatně než jak to je Někdy lepší raději ukončit a nalézt náhradního uživatele je-li potřeba Nadšený uživatel Místo jednoho přijde sedm nadšených uživatelů, kteří chtějí sdělit své názory na DW Lze těžko stihnout v jedné hodině a dostat se k potřebným detailům Zjistit jak homogenní skupina to je (stejné nebo různé funkce, náplně, …) Vhodné rozdělit a naplánovat na více interview Neexistující uživatel IS: My nejlépe víme co uživatelé potřebují Vyhnout se tomuto přístupu

82 Business požadavky Po interview vytvořit zápis
Co nejdříve je to možné Popis pozice, odpovědnost, analytické potřeby, potřeba informací, kritéria úspěchu Ne přepis interview ale syntéza poznatků Nechat schválit uživatelem Vedoucí interview by si měl udržovat seznam otázek na které dosud nejsou známi odpovědi Vyhodnotit obdržené reporty Sloupce popisné – dimenze Čísla - fakta

83 Business požadavky Na závěr vytvořit dokument popisující zjištěné potřeby Manažerské shrnutí Popis projektu Uživatelské potřeby (typicky podle business procesů) Obecně Analytické a informační potřeby Prvotní analýza primárních systémů Co nejvíce navázáno na uživatelské potřeby Kritéria úspěchu Vysoká důležitost – ukazuje na relevanci projektu DW a na reálnou dostupnost primárních dat Nechat schválit sponzorem projektu, uživateli, managementem, …

84 Business požadavky Potřeba určit priority dalšího vývoje DW
Postupné etapy Setkání s uživateli a prezentace výsledků a dalších kroků

85 Praktický příklad 1 ETL – DTS: Načtení dat do 0. vrstvy datového skladu Využití průvodce Import and Export data (uložit DTS balíček, spouštět) Upravit vytvoření tabulky zákazník (pohlavi – varchar(10)) Přidání skriptu do transformace: Načtení dat Prohlídka balíčku DTS a databáze if DTSSource("pohlavi") = "M" then DTSDestination("pohlavi") = "Muž" end if if DTSSource("pohlavi") = "Z" then DTSDestination("pohlavi") = „Žena" else DTSDestination("pohlavi") = "Firma"

86 Praktický příklad 1

87 Praktický příklad 2 Čištění dat:
Podle informací od oddělení IT je primárním klíčem tabulky obj_detail dvojice atributů id_objednavka, id_produkt Neměly by existovat žádné duplicity Je to skutečně pravda? Napište SQL dotaz, který ověří tuto skutečnost

88 Praktický příklad 2 SQL dotaz: Vymazat duplicitu:
select id_objednavka, id_produkt from obj_detail group by id_objednavka, id_produkt having count(*) > 1 Vymazat duplicitu: select id_objednavka, id_produkt, max(mnozstvi) mnozstvi, max(cena) cena, max(cast(sleva as integer)) sleva into prac_duplicity from dbo.obj_detail delete from dbo.obj_detail where id_objednavka = 8 and id_produkt = 16 insert into dbo.obj_detail select * from prac_duplicity

89 Konec 1. dne Děkuji za pozornost

90 Děkujeme za pozornost Ing. David Pirkl


Stáhnout ppt "Datové sklady a BI aplikace"

Podobné prezentace


Reklamy Google