Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Datové sklady a BI aplikace MFF Část 1 Říjen 2004 Ing. David Pirkl.

Podobné prezentace


Prezentace na téma: "Datové sklady a BI aplikace MFF Část 1 Říjen 2004 Ing. David Pirkl."— Transkript prezentace:

1 Datové sklady a BI aplikace MFF Část 1 Říjen 2004 Ing. David Pirkl

2 1. Přednáška

3 Cíle školení Seznámit s architekturou aplikací BI  Datové sklady  Data Mining  CRM Podrobně popsat metodologii tvorby datových skladů Ukázat na možnosti dimensionálního modelování Pokročilé analytické techniky využití data  Obchodní příležitosti a typické úlohy

4 Co byste si měli odnést Představu o architektuře řešení BI a významu jednotlivých komponent Detailní znalost metodiky tvorby DW Principy dimensionálního modelování Znalost hlavních technik pokročilé analýzy dat a jejich možnosti využití Praktické zkušenosti s práce s řešením od firmy Microsoft a SPSS  MS SQL Server 2000, MS Analysis Services  Clementine, …

5 Předpoklady Žádné speciální znalosti nejsou požadovány Uživatelská znalost  Práce na PC  Databází (např. MS Access)  Základy statistiky a středoškolské matematiky

6 Literatura Kimball Raplh: The Data Warehouse Toolkit, John Wiley & Sons, 2002 Kimball Raplh: The Data Warehouse Lifecycle Toolkit, John Wiley & Sons, 1998 Inmon W. H.: Building the Data Warehouse, John Wiley & Sons, 2002 Lacko Luboslav: Databáze: datové sklady, OLAP a dolování dat s příklady v MS SQL Serveru a Oracle, Computer Press, 2003 Humphries M., Hawkins M. W. : Data warehousing : návrh a implementace, Computer Press, 2002 Berry M. J., Linoff G.: Data Mining Techniques for marketing, sales and customer support, John Wiley & Sons, 1997 Rud Olivia Parr: Data mining, Computer Press, 2001 Berka Petr: Dobývání znalostí z databází, Academia, 2003

7 Literatura Rozsáhle zdroje na Internetu:           …

8 Vyučuje Ing. David Pirkl

9 Agenda dne Základní pojmy Metodologie BDLC

10 Základní pojmy Mezi hlavní pojmy, s kterými se seznámíme, patří:  BI – Business Intelligence  Datový sklad  Datové tržiště  Proces ETL  OLAP  Reporting

11 Business intelligence (BI) Označuje proces transformace dat (údajů) na informace a převod těchto informací na znalosti, sloužící k podpoře podnikání (rozhodování)  Identifikovat trhlinu mezi obchodními potřebami a dostupnými informacemi

12 Business intelligence (BI) Data Informace Znalosti Zpracování dat Nízké Vysoké OLTP Operační databáze Data mining Neuronové sítě, … OLAP Reporting Data warehouse

13 Historie BI Navazuje na rozvoj databázových systémů:  Transakční systémy (OLTP)  60. léta – Dávkové zpracování výkazů Složité nalézt a analyzovat informace Nákladné a neflexibilní, přeprogramování dle nových požadavků  70. léta – první manažerské aplikace (Lockheed) Terminálově orientované EIS a DSS aplikace  80. léta – Desktopové aplikace a analytické nástroje Dotazovací nástroje, tabulkové procesory, GUI Jednoduché na používání, přístup pouze k operačním databázím  90. léta – Rozvoj datových skladů, integrace OLAP databází a DM technik

14 Co vedlo k BI Orientace na zákazníka Potřeba efektivních a flexibilních analýz – cena informace Potřeba oddělit analýzu od operačních potřeb Rozvoj technologie – relační databáze, OLAP databáze

15 Co vedlo k BI Nemohu nalézt informace, které potřebuji  Data jsou v různých místech po síti  Různé verze dat, liší se Nemohu se dostat k datům, která potřebuji  Potřeba kontaktovat IT experta Nerozumím datům, která jsem získal  Data nejsou dokumentována (metadata) Nemohu využít data, která jsem získal  Výsledky jsou nepravděpodobné (chyby)  Potřebuji transformovat data do jiné formy

16 Současný a zítřejší stav Mnoho nástrojů pro podporu řešení BI Propracovaná metodologie Vývoj směrem k co největší uživatelské přívětivosti Mnoho konzultačních firem nabízejících řešení BI

17 Komponenty a aplikace BI Mezi komponenty BI řešení lze zařadit:  Reportingová řešení  Datové sklady  Data Mining řešení  CRM  specializované aplikace (optimalizace zásob, obchodních cest, …)

18 Architektura BI Provoz Obchod Účetnictví Analytický data mart ODS Data marty Prodej Marketing Ekonomika Reporting Uživatelé/Analytici Kontaktní CRM OLAP analýza Data mining modely Centrální datový sklad 2. vrstva 1. vrstva 0. vrstva 1 ETL

19 Data Warehouse Datový sklad je podnikový strukturovaný depozitář předmětově orientovaných, vzájemně provázaných, časově neměnných, historických dat používaný na získávání informací a podporu rozhodování. V datovém skladu jsou uložena detailní a sumární data. Datový sklad je podnikový strukturovaný depozitář předmětově orientovaných, vzájemně provázaných, časově neměnných, historických dat používaný na získávání informací a podporu rozhodování. V datovém skladu jsou uložena detailní a sumární data. Bill Inmon Datový sklad je centrální úložiště různorodých dat firmy  Řešení integračních efektů  Jednotné místo uložení dat Určeno pro analytickou podporu rozhodování (drill-down, drill-up) Zahrnuje nejen data v databází, ale i nástroje pro extrakci dat, nástroje pro reporting, analýzu dat, data mining… Prezentace dat uživatelsky příjemným způsobem zaměřeným na střední a vyšší management

20 Předmětná orientace Prodejní systém Výplatní systém Nákupní systém Zákazník Prodejce Zaměstnanec Provozní systémy Aplikační orientace Datový sklad Předmětná orientace

21 Integrace Prodejní systém Výplatní systém Nákupní systém Zákazník Provozní systémy Aplikační orientace Datový sklad Předmětná orientace

22 Časová neměnnost, historie Výplatní systém Zákazník Provozní systémy Aplikační orientace Datový sklad Předmětná orientace insert načtení create updatedelete zobrazení

23 Přínosy řešení datového skladu Integrace a čistota dat, integrační efekty Podpora úloh analytického charakteru a jejich ekonomické a mimoekonomické efekty  Vyšší flexibilita řízení a realizace změn  Zpětná vazba  Nezávislost vedoucích pracovníků na oddělení IT  Kvalifikační efekty – v IT i v ekonomice řízení (práce s informacemi, uvažování v kontextu) Automatizace rutinních procesů (tvorba výkazů, zpráv) Kontrola plnění plánů a finanční analýza Více

24 Přínosy řešení datového skladu Podpora analýzy dat:  Trendy, sledování a analýza časových řad  Poměrové ukazatele  Identifikace odchylek  Drill-down, Drill-up, Drill-across, Slice-dice

25 OLTP Provozní databáze VlastnostOLTP Typická operaceUpdate Podpora analýzNízká Uživatelské rozhraníStabilní Velikost dat při transakciMalá Úroveň datDetailní Stáří datSoučasné OrientaceZáznam

26 OLTP vs. DW OLTPDW Podpora transakcí - každodenní operaceAnalýza i historických dat Data uložena na úrovni transakcíIntegrace dat Normalizovaný datový modelDenormalizovaný model

27 Data Mart (Datové tržiště) Logická podmnožina datového skladu Část řešení datového skladu určená pro podporu specifické analýzy (účetnictví) nebo oddělení firmy (marketing, prodej) VlastnostData WarehouseData Mart RozsahEnterpriseOddělení ObsahVíce oblastíJedna oblast ZdrojeHodněMálo Velikost (typicky)100 GB to > 1 TB< 100 GB ImplementaceMěsíce až rokyMěsíce

28 ETL Extraction-Transformation-Loading Kompletní proces načtení dat do datového skladu Zahrnuje mnoho subprocesů:  Extrakce – výběr dat  Transformace – ověření, čištění, integrace dat  Loading – načtení dat do DW  Kontrola kvality  Auditovaní  Bezpečnost  Zálohování & Obnova

29 OLAP On-Line Analytic Processing Obecné označení pro dotazování a zobrazení dat z datového skladu založené na dimenzionálním modelu Prakticky zkratka označuje multidimenzionální uložení a analýzu dat (OLAP databáze)

30 ODS Operational Data Store Architektura obsahující předmětově orientovaná, integrovaná, současná, rychle se měnící a detailní data pro operační potřeby ODS typicky obsahuje dat rychle se měnící v reálném čase Pro podporu analytických a CRM aplikací

31 Data Mining Data mining je netriviální proces zjišťování platných, neznámých, potencionálně užitečných a snadno pochopitelných znalostí z dat. Automatizované zpracování rozsáhlých datových souborů metodami na pokraji statistiky, strojového učení a umělé inteligence.

32 CRM Customer Relationship Management Systémy pro řízení vztahů se zákazníky

33 Shrnutí pojmů Shrnutí relevantních pojmů (některé budou probrány dále)  OLTP – transakční systémy  Datový sklad (DW)  Datové tržiště  ETL  ODS  OLAP  CRM  Data Mining (DM)  Dimensionální modelování  ROLAP, MOLAP, HOLAP  Dotazovací nástroje  DM techniky

34 DW - opakování Centrální úložiště relevantní firemních dat  Integrace firemních datových zdrojů  Historie v datech  Centrální místo pro podporu informačních potřeb uživatelů  Velké objemy dat  Navrženo pro podporu analýzy – speciální struktury uložení dat

35 Základní způsoby budování DW Existují dva základní přístupy k budování DW:  Metoda velkého třesku  Přírůstková metoda

36 Přístupy k tvorbě DS Uživatelé Data marty Provoz Obchod Účetnictví Marketing Prodej Ekonomika Centrální datový sklad Uživatelé „Velký třesk“ BUS Architektura Centrální datový sklad Data marty Uživatelé Inkrementální přírůstky Provoz Obchod Účetnictví Marketing Prodej Ekonomika

37 Nezávislé datové tržiště OLTP ETL Datové tržiště

38 Nezávislé datové tržiště ETL – 3 krát !!!

39 Nezávislé datové tržiště $ Duplikace práce na ETL Časově i finančně náročné Údržba nezávislých DM je náročná, těžkopádná $

40 DW architektura md DW Dept’l Detailní Uživatelské nástroje Závislé datové tržiště s odpovídajícími metadaty Metadata md

41 DW architektura sKomplexní architektura sKonzistence dat sDetailní i agregovaná data sMetadata jsou konzistentní * Rychlý vývoj, ale … ? Budou ETL konzistentní? ?Jak je řízena redundance? DW Detailní Dept’l md

42 Základní způsoby budování DW Dnes je preferovaná přírůstková metoda Přírůstková metoda zaručuje:  Projektovou zvládnutelnost řešení  Reálné časové horizonty jednotlivých etap (2-4 měsíce)  Řešení aktuálních uživatelských (obchodních) potřeb  Zpětnou vazbu uživatelů

43 Cíle datového skladu Zajistit dostupnost firemních informací Zajistit konzistenci firemních informací Vytvořit adaptivní a pružný zdroj informací Zabezpečit ochranu firemních informací Vytvořit základnu pro firemní podporu rozhodování (analytické centrum)

44 DW procesy Hlavní proces při tvorbě datového skladu Podprocesy:  Extrakce  Transformace Čištění dat Výběr dat Integrace Umělé klíče Agregace  Načtení (Loading) a tvorba indexů  Data Quality Assurance

45 DW procesy Další procesy v DW  Publikace dat (prezentační server)  Update dat  Dotazování  Zpětná vazba (čistá dat do OLTP, data z DM do DW)  Audit dat  Bezpečnost  Zálohování a obnova

46 Architektura Uložení dat: - 0. vrstva DW - Není pro přímé dotazování Procesy: - Čištění dat - Integrace - Full vs. Inkrem. - Výběr - Duplicity - Standardizace - Conformní dimenze - Převod do prezentační vrstvy - a další Uložení dat: - 0. vrstva DW - Není pro přímé dotazování Procesy: - Čištění dat - Integrace - Full vs. Inkrem. - Výběr - Duplicity - Standardizace - Conformní dimenze - Převod do prezentační vrstvy - a další B U S Datové tržiště - Dimenzionální - Předmětně orientované - BUS architekt. - OLAP Datové tržiště - Dimenzionální - Předmětně orientované - BUS architekt. - OLAP Datové tržiště DM modelování - scoring - předpovědi - segmentace - cross-selling - časové řady DM modelování - scoring - předpovědi - segmentace - cross-selling - časové řady Ad Hoc dotazování Ad Hoc dotazování Reportovací nástroje Reportovací nástroje Intranet Provozní databáze ETL Datový sklad „Prezentační vrstva“ Uživatelské aplikace Výsledky modelů Oprava chyb Extrakce Plnění Prezentace Analýza

47 Architektura Ekon. Obchod Provozní databáze dbf Externí data Excel Data mining aplikace Data mining modely Scoring, cross-selling, … MS DTS ETL Metainformační a reportingový portál MS Reporting Services MS SQL Server 2000 EE OLAP MS Analysis Services Relační databáze datového skladu (0. a 1. vrstva, datová tržiště a ODS) MS SQL Server 2000 Uživatelé CRM aplikace a Internetové aplikace Internetové a intranetové aplikace pro řízení vztahu se zákazníkem, podporu pracovníků distribuční sítě (např. on-line scoring) WWW prohlížeč (IE) Excel XP ProClarity

48 Produkty pro BI Nástroje pro BI  Microsoft (MS SQL Server, Analysis Services, Reporting Services)  Oracle  Sybase IQ  IBM DB2, DB2 OLAP Server  Microstrategy  SPSS  SAS  SAP – Business Warehouse Klientské nástroje  ProClarity  Oracle Discoverer  MS Excel 2000  Business Objects  Cognos: PowerPlay, Impromptu  Brio: Brio Query  Quadbase – EspressReport

49 2. Přednáška

50 Business Dimensional LifeCycle Standardní metodologie vývoje datového skladu od Ralpha Kimballa Projektový management Projektový plán Definice uživatelských požadavků Technická architektura Výběr produktů instalace Dimensionální modelování Fyzická úroveň ETL procesy Nasazení Údržba a růst Uživatelské aplikace specifikace Uživatelské aplikace vývoj

51 Popis metodologie Standardní metodologie tvorby datového skladu Modifikovaná metodika tvorby IS  Vyžaduje speciální znalosti analytiků/implementátorů Jednotlivé fáze mají rozdílnou váhu v jednotlivých etapách  1. etapa – nastartování tvorby datového skladu (HW, SW infrastruktura)  Další etapy – dopady řešení na stávající infrastrukturu

52 Agenda BDLC Plán projektu a projektový management Business požadavky Dimenzionální modelování Architektura Fyzický design ETL Uživatelské aplikace Nasazení Správa a růst DW

53 Plán projektu a projektový managm. Existuje poptávka po DW, od koho, proč?  Poptávka jediného oddělení  Informatika  Mnoho oddělení Ohodnotit připravenost pro projekt DW  Silný business sponzor  Pocit potřeby podpory businessu  Stupeň práce s informacemi dnes, ochota do budoucnosti („analytická kultura“)  Stav IS/IT  Proveditelnost (např. Existují zdroje dat?) Kritický faktor úspěchu podpora managementu

54 Plán projektu a projektový managm. Jak odstranit nepřipravenost?  Popsat hlavní potřeby business na konceptuální úrovni  Potřeby managementu  Prioritizace business potřeb  Proof of concept Pozor potom na přehnaná očekávání

55 Plán projektu a projektový managm. Nízké Vysoké Náročnost Obchodní dopad Etapa A Etapa D Etapa C Etapa B

56 Plán projektu a projektový managm. Definice rozsahu projektu – 1. etapy  Řízeno obchodními potřebami ne harmonogramem  Spolupráce IT a business  Doporučeno jednoduchý obchodní problém řešitelný z jednoho zdroje dat  Limit na počet uživatelů (do 25)  Urči kriteria úspěchu realizace Největší riziko: neporozumění kvalitě a problémům v datech Zadokumentuj

57 Plán projektu a projektový managm. Zdůvodnění rozsahu a záměru projektu ROI Náklady  HW a SW  Náklady na údržbu  Náklady na interní vývoj  Náklady na externí vývoj  Náklady na školení  Náklady na podporu ze strany externích řešitelů  Náklady na další rozvoj Více

58 Plán projektu a projektový managm. Výnosy  Těžko se určuje, spíše odhady  Potřeba zapojit business (business sponzora)  Předpokládaný nárůst zákazníků vzhledem k lepším službám  Méně odcházejících zákazníků  Větší návratnost mailingových kampaní  Méně pracovníků (vyšší produktivita) Zpětně ověřovat po skončení etapy – k jakému zlepšení došlo

59 Plán projektu a projektový managm. Vytvořte úvodní návrh plánu projektu  Bude průběžně upřesňován Určete jméno projektu Vyberte pracovníky na projekt  Jeden pracovník může být v několika rolích  Ne všichni jsou po celou dobu projektu, ale po danou část  Sponzor projektu  Zástupce business sponzora (business driver)  Projektový manažer (zadavatel, konzultační firma)  Business vedoucí Více

60 Plán projektu a projektový managm. Vyberte pracovníky na projekt  Business Analytik  Specialista datového modelování  Databázový administrátor  Designer ETL  Vývojář uživatelských aplikací  Školitel  Bezpečnostní architekt  Technická podpora  ETL programátor  Data steward  DQ manažer

61 Plán projektu a projektový managm. Vývoj DW inhouse vs. externě  Nedoporučuje se nechat vyvíjet jen konzultační firmou (neměla by obsadit všechny klíčové role v projektu)  Konzultační firma má umožnit přenos know-how na firemní pracovníky  Najmou specialisty  Nebo najmou pracovníky na rutinní práce a uvolnit tak ruce firemním specialistům se znalostí provozních databází a fungování firmy  Vše založit na obchodních požadavcích nikoliv si nechat doporučit technologii jenom proto, že daná konzultační firma s ní pracuje a jinou neovládá

62 Plán projektu a projektový managm. Vytvoř projektový plán  Jednotný  Detailní Měl by obsahovat pro každý krok  Zdroje  Odhadovaný čas na provedení  Začátek  Předpokládaný konec  Předpokládaný konec - aktuálně  Status – kolik již vykonáno  Počet dní do dokončení  Závislost na jiných úkolech (co musí být dokončeno před zahájením)  Zpoždění – A/N

63 Projektový management Podobné projektovému managementu IS/ITC projektů Zvláštnosti:  Různorodý tým s různou odpovědností  Interaktnivní vývoj (nikdy nekončící vývoj DW)  Nevypočitatelnost zdrojových dat a její dopady na plán projektu  Velká očekávání uživatelů, projekt je na očích

64 Projektový management Zahájení projektu – projekt tým kick-off  Představení projektu  DW koncept  Tým a role  Projektový management Administrační nástroje Milníky Plán projektu  Diskuze  Příští krok

65 Projektový management Monitorování stavu projektu  Projektové schůzky Většinou 1 hodina jednou týdně na stejném místě Jádro týmu plus aktuální lidé Dokumentovat – Dokument stavu projektu  Projektový plán – změny, řešení otázek, řešení požadavků na změnu, práce vykonaná od poslední schůzky, plánovaná práce, otevřené otázky, požadavky na změnu Údržba projektové dokumentace a projektového plánu

66 Projektový management Řízení rozsahu projektu  Vedení seznamu otázek – řešení  Vedení seznamu požadavků na změnu rozsahu projektu Změna – dopad na plán, rozpočet, rozsah projektu  Dokumentovat požadavky na rozšíření řešení (např. slouží pro další etapy) Vytvoř a realizuj komunikační plán  Komunikace je velmi důležitá  S projektovým týmem Projektové schůzky, zápisy, …  S business sponzorem Měsíční setkání, oběd, …  S uživateli Intranet, informace o projektu, kick-off meeting, …  Executive management Nepravidelná setkání, informace o výsledcích  IS pracovníci Měsíční setkání, informace o projektu

67 Agenda BDLC Plán projektu a projektový management Business požadavky Dimenzionální modelování Architektura Fyzický design ETL Uživatelské aplikace Nasazení Správa a růst DW

68 Business požadavky Uživatelské požadavky jsou kriticky důležité Určují  Jaká data budou v datovém skladě?  Jak budou organizovaná?  Jak často budou aktualizována? Dopad na všechny další fáze tvorby DW

69 Business požadavky Požadavky Dimesionální model Projektový plán a management Údržba a růst Nasazení Uživatelské aplikace ETL Fyzická realizace Architektura

70 Business požadavky Přístup k získání požadavků  Nikoliv otázky co uživatelé chtějí za data  Ale co dělají, jak hodnotí svojí práci (zpětná vazba), jak často, co jsou jejich priority Používat slovník uživatelů Realizace  Interview - setkání s 1 nebo několika málo pracovníky, více do hloubky  Setkání – s více pracovníky, brainstorming, rychleji více pracovníků, náročnější, těžší na svolání – sladit harmonogram mnoha lidí, získat konceptuální pohled Zahrnuje  Uživatele  IS pracovníky

71 Business požadavky Doporučuje se začít s uživateli Příprava  Identifikovat tým pro interview Vedoucí interview Zapisovatel Přihlížející  Průzkum před interview Firemní zprávy, intranet, finanční zprávy, … Zjištění předchozích aktivit v oblasti DW, reporting řešení, podpory rozhodování – „kdo zapomněl na minulost je nucen ji opakovat“  Výběr uživatelů pro interview Společně s business sponzorem nebo projektovým vedoucím zadavatele Dle organizační struktury (dokumentované, nedokumentované) Porozumět formální i neformální struktuře Zvážit politické dopady když s někým nepovedeme interview Někdy podřízení vědí více Výběr pracovníků pro interview  Business  IS

72 Business požadavky Vést interview horizontálně i vertikálně po organizaci  Horizontálně – poznat celkové potřeby – aby řešení bylo navrženo s ohledem na budoucí vývoj  Vertikálně – porozumět strategii i jejímu taktickému naplňování Interview s IS pracovníky  Porozumět provozním systémům  Zda existují data pro naplnění potřeb a požadavků uživatelů  S programátory, správci, tvůrci datových modelů, help desk  Jiný průběh než interview s uživateli – systematické postupné poznání provozních databází a systémů (ne volná diskuze kam business půjde)  Většinou náročnější než se na první pohled zdá – více interview Chyba např. chci profitabilitu, zjistím že jsou data o nákladech a příjmech, myslím že ok Problém že data mají různou granualitu (příjem na klienta, náklady na oddělení)

73 Business požadavky Připravit dotazník s otázkami na interview  Rozdílné dle typu interview  Hrubá struktura Naplánovat interview  Maximálně 3 – 4 za den pro jeden tým na interview  Jedno interview (60 – 90 minut)  Mezi interview alespoň 30 min přestávka  Zápis dělat co nejdříve (kolem 4 hod na interview)  Pozor na dovolené, pravidelné cesty, …

74 Business požadavky Nejdříve interview s business sponzorem  Pak začít středním managementem  Pak vrcholový nebo nižší úroveň  Postupně oddělení a IS  Nedoporučuje se ukončit jedno oddělení a pak na druhé a tak dále… Každé oddělení jiný pohled, postupně si ho ujasňovat u všech oddělení Mix interview podle různých oddělení Naplánovat místo a čas interview  U uživatele  V konferenční místnosti  Zvážit dostupnost místnosti (ne 20 min cesty od hlavního sídla v podzemní místnosti – nikdo nenajde) Zvládnout všechna interview v co nejkratším přijatelném čase

75 Business požadavky Začátek interview – svolat kick-off meeting uživatelů  Úvod  Popis projektu, proč  Rozsah projektu  Plán projektu (konceptuálně)  Tým  Role uživatelů (co od nich potřebujeme a proč)  Milníky  Příští krok

76 Business požadavky Před vlastním interview zaslat průvodní dopis – co od uživatelů chceme, proč  Ať si připraví klíčové reporty  Jazyk uživatelů ne DW Realizace interview  Nezapomenou na role týmu pro interview (např. zapisovatel má zapisovat a ne se rozmluvit a přestat psát)  Definujte terminologie  Potvrzujte si čemu nerozumíte  Nejprve představit projekt a cíl interview, na konec poděkovat a popsat následující kroky  První minuty interview jsou klíčové pro celý průběh (naladění uživatele, připravit si dobře úvod) Být připraven na přidání nových interview do plánu  Doporučí vhodné kandidáty na interview

77 Business požadavky Příklad dotazníků – Business Executive: A.Představení  Diskutuj cíle DW projektu a jeho celkový stav  Diskutuj cíle interview (potřeba zjistit uživatelské potřeby, co je pracovní náplní, co by mělo být, proč) a popiš průběh interview.  Představ tým pro interview a role  Potvrď si čas na interview  Popiš další krok v interview B.Zodpovědnosti  Popište prosím Vaše oddělení a jeho vztah k celé organizaci  Co je Vaše primární zodpovědnost, pracovní náplň? C.Obchodní cíle, potřeby a otázky  Jaké jsou cíle Vašeho oddělení? Co se snažíte splnit? Jaký je Váš prioritní cíl, který chcete naplnit?  Čím měříte úspěšnost Vaší práce? Jak poznáte, že vše jde dobře? Jak často měříte svou úspěšnost (zpětná vazba)?  Jaké funkce a části (pododdělení) jsou ve vašem oddělení nejvíce důležité pro naplnění cílů? Jaké role hrají? Jak jednotlivé části oddělení spolupracují, aby dosáhli cílu a úspěchu?  Jaké hlavní problémy teď řešíte? Co Vám brání v tom aby jste je vyřešili? Jaký to má dopad na oddělení?  Jak poznáte (identifikujete), že někde vznikl problém, výjimka, nebo že se problém blíží?  Jaké vidíte možnosti a příležitosti z zefektivnění práce (vyšší ziskovosti)?  Kde vidíte Vaše konkurenty (podobné organizace) v používání IT technologie?  Dokážete rychle reagovat na změny v okolí (trhu, konkurence), co Vám v tom brání?

78 Business požadavky D.Analytické požadavky  Jakou roli hrají data a analýzy při Vašem rozhodování a rozhodování Vašeho oddělení?  Jaké klíčové informace potřebuje pro své rozhodování, aby jste mohli dosáhnout svých cílů, a překonat problémy a předcházet jim? Jak tyto informace dnes získáváte?  Kolik pracovníků pracuje ve Vašem oddělení? Kolik z nich pracuje z daty? Kolik z nich provádí analýzy?  Jsou nějaké informace, které dnes nemáte k dispozici, ale věříte, že by Vám pomohli v rozhodování a dosažení Vašich cílů?  Jaké reporty (výkazy) dnes používáte? Která data na reportech (výkazech) jsou důležitá – klíčová? Jak reporty (výkazy) využíváte? Kdyby Vaše reporty (výkazy) byly dynamické, jak by Vám to pomohlo, co by se tím změnilo?  Jaké analýzy byste rádi prováděli?  Jaké vidíte příležitosti k zlepšení Vašeho rozhodování, tím že bude zlepšen a zjednodušen přístup k informacím? Jaký to bude mít finanční dopad? E.Souhrn  Shrň dosud získané poznatky (nahlas).  Co musí projekt splnit aby jste ho považoval za úspěšný? Kritéria by měla být měřitelná.  Poděkuj účastníkovi.  Popiš další kroky, zaslání draft zápisu z interview do daného času, možnost znovu se sejít dle potřeby, …

79 Business požadavky Definování kriterii úspěchu od uživatelů Příklady akceptovatelných kritérii  Implementační metriky (počet GB dat, počet uživatelů, …)  Aktivita (počet dotazů, počet login)  Úroveň služeb Dostupnost DW Datová kvalita – počet chyb v datech Dostupnost dat v DW, kdy Odezva DW Odezva na podporu  Dopady na business (zvýšení zisku, …)  Výkonnost proti stavu před DW Hodinová analýza trvá jen 1 minutu

80 Business požadavky Překážky při interview  Frustrovaný uživatel „Už jsem všechno řekl co potřebuji oddělení IS“ Nikdo ho dosud nevyslyšel Říci mu, že pouze chceme si upřesnit a verifikovat jeho předchozí požadavky Využít znalosti předchozích interview  Zaneprázdněný uživatel Lepší ho vynechat Nemá-li čas na interview nebude mít ani čas na kontrolu zápisu ani na školení ohledně využití DW, … Najít více kooperujícího uživatele je-li to možné

81 Business požadavky Nesdílný uživatel  Odpovídá jedním slovem  Výhodné klást více negativní otázky: co je špatně než jak to je  Někdy lepší raději ukončit a nalézt náhradního uživatele je-li potřeba Nadšený uživatel  Místo jednoho přijde sedm nadšených uživatelů, kteří chtějí sdělit své názory na DW  Lze těžko stihnout v jedné hodině a dostat se k potřebným detailům  Zjistit jak homogenní skupina to je (stejné nebo různé funkce, náplně, …)  Vhodné rozdělit a naplánovat na více interview Neexistující uživatel  IS: My nejlépe víme co uživatelé potřebují  Vyhnout se tomuto přístupu

82 Business požadavky Po interview vytvořit zápis  Co nejdříve je to možné  Popis pozice, odpovědnost, analytické potřeby, potřeba informací, kritéria úspěchu  Ne přepis interview ale syntéza poznatků  Nechat schválit uživatelem Vedoucí interview by si měl udržovat seznam otázek na které dosud nejsou známi odpovědi Vyhodnotit obdržené reporty  Sloupce popisné – dimenze  Čísla - fakta

83 Business požadavky Na závěr vytvořit dokument popisující zjištěné potřeby  Manažerské shrnutí  Popis projektu  Uživatelské potřeby (typicky podle business procesů) Obecně Analytické a informační potřeby  Prvotní analýza primárních systémů Co nejvíce navázáno na uživatelské potřeby  Kritéria úspěchu Vysoká důležitost – ukazuje na relevanci projektu DW a na reálnou dostupnost primárních dat Nechat schválit sponzorem projektu, uživateli, managementem, …

84 Business požadavky Potřeba určit priority dalšího vývoje DW  Postupné etapy Setkání s uživateli a prezentace výsledků a dalších kroků

85 Praktický příklad 1 ETL – DTS: Načtení dat do 0. vrstvy datového skladu  Využití průvodce Import and Export data (uložit DTS balíček, spouštět) Upravit vytvoření tabulky zákazník (pohlavi – varchar(10)) Přidání skriptu do transformace:  Načtení dat  Prohlídka balíčku DTS a databáze if DTSSource("pohlavi") = "M" then DTSDestination("pohlavi") = "Muž" end if if DTSSource("pohlavi") = "Z" then DTSDestination("pohlavi") = „Žena" else DTSDestination("pohlavi") = "Firma" end if

86 Praktický příklad 1

87 Praktický příklad 2 Čištění dat:  Podle informací od oddělení IT je primárním klíčem tabulky obj_detail dvojice atributů id_objednavka, id_produkt  Neměly by existovat žádné duplicity  Je to skutečně pravda?  Napište SQL dotaz, který ověří tuto skutečnost

88 Praktický příklad 2 SQL dotaz:  select id_objednavka, id_produkt from obj_detail group by id_objednavka, id_produkt having count(*) > 1 Vymazat duplicitu:  select id_objednavka, id_produkt, max(mnozstvi) mnozstvi, max(cena) cena, max(cast(sleva as integer)) sleva into prac_duplicity from dbo.obj_detail group by id_objednavka, id_produkt having count(*) > 1  delete from dbo.obj_detail where id_objednavka = 8 and id_produkt = 16  insert into dbo.obj_detail select * from prac_duplicity

89 Konec 1. dne Děkuji za pozornost

90 Děkujeme za pozornost Ing. David Pirkl


Stáhnout ppt "Datové sklady a BI aplikace MFF Část 1 Říjen 2004 Ing. David Pirkl."

Podobné prezentace


Reklamy Google