Master Data Management Konsolidace databází a kvalita dat ve státní správě a samosprávě Konference ISSS Hradec Králové, 2.-3.4. 2007 michal.klaus@adastracorp.com.

Slides:



Advertisements
Podobné prezentace
Stránka 1, © Vema, a. s.. Stránka 2, © Vema, a. s. Podnikové aplikace  Integrovaný podnikový systém (Integrated Business System):  komplex aplikací.
Advertisements

Informační systém krizového řízení kraje
ARBES FEIS [BI] ARBES Technologies, s.r.o.
eGovernment – aplikace principů v ISKN
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
Generální ředitelství cel Projekt ECR brána případová studie
Aleš Chudý ředitel divize IW Microsoft Slovakia.
Facility management ČSN EN
GORDIC ® + CA = vaše cesta ke zvýšení kvality a efektivity služeb DRMS FORUM Ing. Jakub Fiala vedoucí týmu CA Technologies programátor,
Informační systémy podnikové systémy CRM
SAP Ing. Jiří Šilhán.
Využití technologií pro zpracování dat ve veřejné správě Petr Zeman, Key Account Manager – Public Sector Tomáš Kočka, Consultant Adastra Corporation.
Customer Relationship Management Řízení vztahů se zákazníky.
Výhody užití architektury ITS ve veřejné osobní dopravě
Outsourcing jako strategický nástroj řízení nejen v komerční sféře
12. OPERATIVNÍ MANAGEMENT
Inovace výuky ve vazbě na požadavky Mezinárodních výukových standardů doc. Ing. Marie Pospíšilová,CSc. SVŠES.
Informační systémy Tomáš Maděra.
Datové schránky ve velké společnosti SharePoint partenrská konference Microsoft Pavel Salava Mainstream technologies,
Naši klienti  V současnosti naše systémy užívá 45 zdravotnických zařízení  Naši klienti jsou  rozmístěni v rámci celé ČR (všechny regiony)  tvoří cca.
Absolventská práce 2002 Aplikace XML rozhraní v prostředí krajského úřadu Autor : Marek Cop Vedoucí : Ing. Petr Pavlinec 2002.
Krajský úřad Plzeňského kraje Václav Koudele Projekt „Malá integrace“
Představení koncepce Business Intelligence 6.října 2005
Informatika pro ekonomy II přednáška 10
Podpora a rozvoj komunikační infrastruktury ISVS Ing. Lubomír Moravčík
LiveContent Univerzální Formulářové Řešení Michal Petrtýl, Marek Beneš.
Informační systémy TPS,MIS, SIS.
Informační systém pro řízení lidských zdrojů ve veřejné správě
Outsourcing ICT systémová a aplikační integrace v pojetí O2 Projekt Integrace sítě Ministerstva zemědělství.
Business Inteligence a její nástroje ve veřejné správě Petr Zeman, Key Account Manager – Public Sector Adastra Corporation.
Projekt realizace referenčního rozhraní Ing. Jan Pokorný Ministerstvo informatiky ČR ISSS, 5. dubna 2005.
Reinženýring cesta ke zvyšování výkonnosti státní správy s využitím procesního řízení Ing. Martin Čulík Notes CS a.s. Konference ISSS 2003 Hradec Králové.
ANECT a.s. – představení společnosti
Aleš Chudý IW BG Lead Microsoft Corporation. Lidé jsou klíčové aktivum firem Nové trendy práce Software jako platforma Strategická iniciativa (horizont.
Základní principy řešení a využití ERP aplikací
Zvýšení kvality řízení KÚPK aktivita A3 Informační strategie Analýza Workshop
IBM Global Services ČR © 2006 IBM Corporation April, 2006 E-stát a EU Pavel Hrdlička.
DATABÁZOVÉ SYSTÉMY. 2 DATABÁZOVÝ SYSTÉM SYSTÉM ŘÍZENÍ BÁZE DAT (SŘBD) PROGRAM KTERÝ ORGANIZUJE A UDRŽUJE NASHROMÁŽDĚNÉ INFORMACE DATABÁZOVÁ APLIKACE PROGRAM.
Realizační tým ICZ duben 2005
Teleworking v Asseco CR Renata Leflerová Ředitel LZ Praha
MV ČR 1 Nové podmínky pro krajské projekty Ing. Jaroslav Svoboda MV ČR.
Zkušenosti ze zavedení systému řízení bezpečnosti informací ve shodě s ISO a ISO na Ministerstvu zdravotnictví ČR Ing. Fares Shima Ing. Fares.
Databázové systémy Informatika pro ekonomy, př. 18.
ASP a.s. ASP a.s. ASP a.s. je mezinárodní softwarová společnost zaměřená na komplexní implementaci a maintenance FM systémů společností a institucí. 
1 Regionální a municipální informační systém RAMIS PVT, a.s., Kovanecká 30/2124, Praha 9 tel.: , fax:
Kvalita a bezpečnost IT ve zdravotnictví
ISSS 2003 Koncept využitelných stávajících datových zdrojů pro Portál veřejné správy ISSS 2003 Krajský úřad Plzeňského kraje Odbor informatiky Václav Koudele.
Základní rozdělení činností v podnikové informatice
Seminární práce z předmětu SIPOL
Prezentace společnosti GOLFER s.r.o Konference Partnerství pro budoucnost – CÍLOVÝ SYSTÉM ŘÍZENÍ MÍSTNÍHO ROZVOJE STRATEGIE A PROJEKTY.
Prof. Molnár1 Podnikové informační systémy Outsourcing IS/IT a ASP Prof. Ing. Zdeněk Molnár, CSc Ústav řízení a ekonomiky podniku
Zavedení ekonomického systému Microsoft Business Solutions – NAVISION v městě Ústí nad Labem Mgr. Petr Gandalovič primátor města Ústí nad Labem
Informační systémy Tomáš Maděra. Historie společnosti LCS International, a.s. založeno 1990 česká firma z aložení dceřiné společnosti na Slovensku.
Informační systém Microsoft Dynamics NAV ISSS
1 E - S V Ě T S E T O Č Í S T Á L E R Y C H L E J I. S T A Č Í T E M U ? Fenix II –IS na platformě.NET Michal Varga.
Vratislav Paulík ředitel projektů
identifikačního registru UIR-ADR
 KOMIX s.r.o. Použití webových služeb v komunikaci s centrálními registry státní správy příspěvek do sborníku konference ISSS/LORIS/V4DIS.
Profesní čipové karty Mgr. Lada Hrůzová Vedoucí projektu Konference ISSS, 24. – 25. březen 2003, KC Aldis Hradec Králové.
Struktura podnikatelského plánu
Interaktivní personální portál
MORAVSKÁ VYSOKÁ ŠKOLA OLOMOUC VÁŠ PARTNER PRO BYZNYS INOVACE.
“Analýza agend a optimalizace výkonu státní správy v resortu životního prostředí” Aleš Vokál Ministerstvo životního prostředí.
Základní registr územní identifikace a nemovitostí Zbyněk Havelda Úřad pro veřejné informační systémy Seminář sdružení Nemoforum.
Mezinárodní konference ICT Fórum PERSONALIS 2006 Procesní řízení informační bezpečnosti ve státní správě Ing. Jindřich KODL, CSc. Praha
Budování Integrovaného informačního systému Národního památkového ústavu Petr Volfík, NPÚ ÚP
Ing. Athanasios Podaras, Ph.D 2016
The Ministry for Regional Development of the Czech Republic (MRD)
Informatika pro ekonomy přednáška 8
Informační systémy podnikové systémy CRM
Transkript prezentace:

Master Data Management Konsolidace databází a kvalita dat ve státní správě a samosprávě Konference ISSS Hradec Králové, 2.-3.4. 2007 michal.klaus@adastracorp.com © 2006, 2007 Adastra Corporation. All rights reserved.

Business–Software Solutions O Adastře Kanadsko-česká společnost založená v roce 1994, působící v Evropě a severní Americe Přes 400 zaměstnanců Výnosy za rok 2006 více než 700 mil. Kč ISO 9001:2000 Moody’s certifikace Business–Software Solutions Master Data Management Integration MDM Consulting Data Quality Adastra Purity Business Intelligence DWH development Reporting ETL Development Data Mining Application Development Custom development Enterprise architecture

Vybraní zákazníci

Partnerství

Ocenění za rok 2006 Adastra je jednou z TOP 10 ICT firem roku 2006 Adastra patří mezi TOP 10 systémových integrátorů v letech 2006 a 2004 Adastra se dvakrát umístila mezi 50 nejlépe řízenými společnostmi v Kanadě v letech 2006 a 2005 Adastra se opět umístila mezi nejrychleji rostoucími firmami ve střední Evropě v žebříčku "Technology Fast 50" Adastra v žebříčku Fast 500 mezi pěti sty nejrychleji rostoucími firmami v regionu EMEA Adastra získala titul Progresivní zaměstnavatel roku 2006, partnerem ocenění je společnost CzechInvest

Adastra – ocenění 2004 Oracle Consulting Award (CEE) 2002 Oracle Partner of the Year (CZ) Microsoft Gold Certified Partner for Business Intelligence (CEE) 2002 Best Practices in CRM 2001 Best Practices in Data Warehousing The Best Data Warehouse 2000 2000 Innovator Award in Data Warehousing 1999 Excellence in Business Information Award

Agenda Místo úvodu Master Data Management je když… Adastra Purity Organizační opatření pro MDM Kde začít s MDM a řízením kvality dat? Dotazy

Namísto úvodu Poznámka: Hypotetický, ale ne příliš přehnaný příklad vzorku záznamů ze 4 systémů dvou organizací, které je třeba zkonsolidovat

Co je v jádru Master Data Managementu Unifikace Rozpoznání všech instancí jednoho subjektu v databázích Jednoduchá – s využitím jednoduchých pravidel, bez čištění a standardizace unifikovaných dat (databáze, jednoduché algoritmy) Pokročilá – s využitím sofistikovaných algoritmů unifikace po předchozím vyčištění a standardizaci unifikovaných dat (specializované nástroje) Merge Následný krok - fyzické vytvoření jednoho nového záznamu ze všech identifikovaných instancí

Unifikace 1 - lidský mozek Algoritmus: ?????? Výsledek Záznamy 1-11 téměř jistě označují jednu osobu 3 záznamy by bylo vhodné prověřit 2 záznamy označují jiné osoby

Unifikace 2 – jednoduchý algoritmus Úplná shoda na atributy Jmeno, Prijmeni a RČ, Čištění: Diakritika, odstranění titulů, odstranění lomítek Výsledek Tyto záznamy pravděpodobně označují 11(!) různých osob

Unifikace 3 – specializovaná technologie Algoritmus: Parsing,čištení a standardizace dat z využitím báze pravidel pro danou lokalitu (ČR, SR) Hierarchická unifikace - pravděpodobnostní shoda na Jmeno, Prijmeni, RC, Titul1 a Titul2 s využitím asociativního párování Výsledek Téměř jistě tyto záznamy 1-11 označují jednu osobu 2 záznamy by bylo vhodné prověřit (možno předrozhodnout na základě pravidel) Záznamy 12, 13 patří dalším osobám

Využití a přínosy kvalitní unifikace Konsolidace údajů o firmách a organizacích ve městech a krajích Konsolidace informací o občanech tamtéž Sběr dat a jejich konsolidace na úrovních krajů a centrálních orgánů Vytvoření a provoz jednotných centrálních registrů – prvotní konsolidace bude velmi náročná na ruční kontrolu a automatizované „předčištění“ může znamenat významné úspory Identifikaci daného subjektu v registru i při neúplném/chybném vstupu Veškeré aplikace portálového typu a elektronických podání, kdy uživatel vkládá svoji identifikaci, adresu, identifikaci firmy apod. Vyčištění a deduplikace historických dat v rámci migrace na nové systémy ministerstev Obecně kdekoliv, kde je potřeba jednorázově nebo pravidelně konsolidovat více zdrojů dat a nalézt v nich záznamy týkající se jedné entity

Agenda Místo úvodu Master Data Management je když… Adastra Purity Organizační opatření pro MDM Kde začít s MDM a řízením kvality dat? Dotazy

MDM je když … Master Data Management se zabývá konsolidací klíčových master (referenčních, vzorových) dat tak, aby byla jednotná, správná, spolehlivá a aktuální vždy, když jsou používána, kdekoliv v celé organizaci. MDM se realizuje pomocí: technických prostředků (klasických i nových, specializovaných technologií) procesů, lidí, jejich organizace znalostí (metodik, know-how) Na rozdíl od předchozích způsobů správy dat přináší „nemechanickou“ integraci dat, tj. konsolidace dat s ohledem na jejich obsah. Cílem zavedení MDM v organizaci je: konsolidace kritických podnikových informací zajištění integrity dat, jejich správnosti, platnosti a úplnosti zjednodušení správy komplexních dat zavedení jednoznačné zodpovědnosti za data zvýšení efektivity business rozhodování spolehlivé měření výkonnosti celé organizace Klíčové organizační koncepty v MDM jsou: Implementací pravidel zacházení s podnikovými daty (Data Governance) Výkonným mechanismem procesu vlastnictví, sdílení a péče o data (Data Stewardship)

+ MDM je nejen o technologiích Správa dat Integrace master dat Sponzor MDM Front end Správa a údržba master dat Databáze Master dat Datová integrace / vstup Kvalita dat Datová a aplikační integrace / výstup Metadata Procesy datové kvality Správa dat (Data Governance) Sponzor Účastníci Organizace Procesy Integrace master dat +

MDI komponenty Datová integrace / vstup Technologie MDM Front end Správa a údržba master dat Databáze Master dat Datová integrace / vstup Technologie pro kvalitu dat Datová a aplikační integrace / výstup Metadata

Adastra, MDM a kvalita dat 10 let zkušeností Konsolidace dat Kvalita dat Vývoj vlastního produktu a metodiky Nejprve jednoúčelová řešení Pak samostatný produkt Dnes samostatná divize Vývoj Implementace Profesionální služby – oblast řízení kvality dat 20 realizovaných projektů v ČR, SR a Kanadě Adastra Purity – produkt pro čištění a unifikaci dat primárně určený pro střední Evropu a východ

Agenda Místo úvodu MDM je když… Adastra Purity Organizační opatření pro MDM Kde začít s MDM a řízením kvality dat? Dotazy

MDI komponenty – Adastra Purity Datová integrace / vstup Adastra Purity Databáze Master dat Metadata MDM Front end Správa a údržba master dat Datová a aplikační integrace / výstup

Adastra Purity Specializovaná technologie pro čištění a unifikaci (nejen) adresních dat a dat o osobách Nástroj pro řízení kvality dat Prostředek pro verifikaci kvality dat na vstupu do systémů Dodáváno s bohatou bází pravidel a číselníky pro příslušný region (ČR, SK) Doplněno metodikou pro procesy řízení kvality dat Kvalitní a výkonné řešení vyzkoušené mnoha implementacemi S plány vývoje do roku 2010, orientace na regiony CEE

Vyčištění názvu města

Vyčištění křestního jména

Konsolidace informací o osobách

Unifikace přes rč - změna příjmení u žen

Postup zpracování Adresy Osoby Čištění Náhrady chybných částí adresy (obce, ulice) Parsing (15 000 vzorů) Dohledávání vazeb Výběr nejlepšího vzoru Určení adresního bodu Spojení stejných adres do skupin (unifikace) Čištění Určení typu osoby (z RČ, IČO, příjmení, název firmy) Čištění a validace RČ, IČO, dokladů, data narození, pohlaví, jmen a příjmení Parsing jmen (tituly, křestní, příjmení) Kde je třeba využijí se náhrady (cca 4 000) Unifikace - spojení záznamů o jedné osobě do skupiny

Adastra Purity

Adastra Purity = technologie+metodiky Pokrývá technologie nebo metodika Purity Pokrývá obecná metodika nezávislá na technologii

Purity web service interface Adastra Purity v IT architektuře DWH DQ historie Reporty Klientská data Analytická část CDI front end CDI ETL Metadata ETL Adastra Purity DQ metadata ETL Operativní část Klientská data Purity web service interface Produkční systémy

Purity Manager

Purity On-line

Adastra Purity – klíčové vlastnosti Škálovatelnost 64 bit architektura Paměť Multi-threading On-line i batch mode Výkon On-line – odezvy v řádu milisekund v prostředí velkých finančních institucí Batch mode – desítky milionů záznamů v řádu hodin-dnů Batch mode – závisí na přírůstku, ne na velikosti dat Řádově rychlejší než jakýkoliv RDBMS Integrace Purity navrženo jako komponenta do architektury Různé možnosti integrace Nezávislé na databázi Jedna verze kódu pro různé platformy (pure Java) Flexibilita a otevřenost Možnost konfigurovat na úrovni modulů nebo low-level algoritmů Otevřený datový model Vhodné pro jakékoliv business entity UNICODE Lokální know-how Metodiky Pravidla Jazyk Kultura Vyzkoušené řešení (15 instalací)

Purity Roadmap

Vybrané reference – MDM, kvalita dat Istrobanka Allianz Bell Canada Bank of Montreal ČSOB Pojišťovna (KBC Group) ČSOB (KBC Group) Česká pojišťovna Česká spořitelna (ERSTE) Consumer Finance Holding GE Money Bank HVB Bank ING Group Ministerstvo dopravy Poštová banka VÚB Dexia banka Union pojišťovna

Agenda Místo úvodu MDM je když… Adastra Purity Organizační opatření pro MDM Kde začít s MDM a řízením kvality dat? Dotazy

+ Procesy čištění dat Automatizované Manuální Dávkové (sekundární) On-line Preventivní („DQ firewall“) Manuální Metodika řízení datové kvality Organizace a procesy Data Governance MDM Front end Správa a údržba master dat Databáze Master dat Datová integrace / vstup Kvalita dat Datová a aplikační integrace / výstup Metadata Procesy datové kvality Správa dat (Data Governance) Sponzor Účastníci Organizace Procesy Integrace master dat +

Data Governance – účel, cíl, očekávání Akční program pro řízení datové kvality na globální - celopodnikové úrovni se zahrnutím zástupců všech dotčených systémů procházející napříč liniemi, útvary, projekty a iniciativami Soubor rolí, jejich zodpovědností a procesů, které jsou potřebné pro řízení informační hodnoty uchovávaných dat Pokrývá oblasti: správa datové architektury z pohledu business potřeb a její provázání na IT architekturu datová integrace správa metadat řízení datové kvality (DQM)

Program Data Governance Aktivity programu DG Přesahují horizont samotné databáze CCD Jejich úspěch závisí na efektivním pokrytí celého životního cyklu dat od okamžiku pořízení v primárních systémech, přes zpracování v CCD, až po prezentaci na front-endu JOK PK a zpětné promítnutí do PS Nároky programu DG Zasazení vysoko v organizační struktuře (náměstci, GŘ) Existence sponzora na exekutivní úrovni Zavedení procesů, pokrývajících veškeré informační systémy pojišťovny

Program Data Governance Klíčové součásti Sponzor Organizační schéma Procesy Klíčové role Sponzor programu DG Vlastník procesů DQM (Data Quality Manager) Správci dat (Data Stewardship) Korporátní datový správce (stevard) Doménoví (linioví) datoví správci (stevardi) Systémoví datoví správci (stevardi) Klíčové skupiny (stakeholders) Vlastníci dat Správci dat (datoví stevardi) Odběratelé (konzumenti, beneficienti) dat

Data Governance – organizační schema

Popis skupin DG Vlastníci dat Datoví správci (stevardi) Oddělení nebo skupiny, které produkují data a poskytují je organizaci Vlastní „obsah“ dat Jsou zodpovědní za definici a kvalitu tohoto obsahu Datoví správci (stevardi) Pověření zástupci, kteří jménem organizace spravují data a řídí související procesy Zajišťují plnění SLA na rozsah a kvalitu datového obsahu Odběratelé dat (beneficienti) Konzumenti dat, kteří jejich používáním získávají určitou měřitelnou hodnotu Koncoví uživatelé Navazující systémy a procesy Partneři pojišťovny

Agenda Místo úvodu MDM je když… Adastra Purity Organizační opatření pro MDM Kde začít s MDM a řízením kvality dat? Dotazy

Kde začít s MDM projektem? Typický první inkrement MDM

První krok k lepší kvalitě dat - příklad Analýza kvality adresních dat a osob Vyčištění a identifikace adres Vyčištění a unifikace informací o osobách Jednorázově Na přání kompletní outsourcing – bez nutnosti investovat do SW a HW infrastruktury Data Integration HW PROJECT START, Data and HW ready Profiling Cleansing Unification Matching Business Rules defined Final presentation PROJECT END Doc. SW working days 3 10 15 23

Kde začít s MDI projektem? Pokročilejší přístup

Děkuji za pozornost Doplňující informace viz sborník konference ISSS 2007

CANADA ADASTRA Corporation Le Parc Office Tower 8500 Leslie Street, Suite 600 Markham, Ontario, L3T 7M8 CANADA Tel: +1-905-881-7946 Fax: +1-905-881-4782 info@adastracorp.com   GERMANY ADASTRA GmbH Bockenheimer Landstraße 17/19 60325 Frankfurt GERMANY Tel: +49 (0) 69-710-455-202 Fax: +49 (0) 69-710-455-450 info@adastracorp.de CZECH REPUBLIC ADASTRA, s.r.o. Nile House Karolinská 654/2 180 00 Praha 8 - Karlín CZECH REPUBLIC Tel.: +420-271-733-303 Fax: +420-271-735-296 info@adastra.cz SLOVAKIA ADASTRA, s.r.o. Francisciho 4 811 08 Bratislava SLOVAKIA tel: +421-252-962-388 fax: +421-252-962-387 info@adastracorp.sk © 2006, 2007 Adastra Corporation. All rights reserved.

Vybrané reference HVB Bank – DQ, CDI Projekt pravidelného čištění a unifikace klientských záznamů v rámci projektu vývoje zákaznického DW, Purity.360 Consumer Finance Holding – DQ, CDI Projekt čištění a unifikace osob, součást komplexního projektu budování DW, Purity.360 Všeobecná úverová banka – SK – DQ, CDI Komplexní projekt konsolidace klienta, jeho součástí čištění dat o zákaznících a a deduplikace a obohacení klientských záznamů z 8 primárních systémů včetně zpětné propagace, Purity.360 Allianz – DQ, CDI Budování Customer DW, realisace klientského pohledu Integrální součástí je Purity.360

Vybrané reference ČSOB – DQ ČSOB Pojišťovna – DQ, CDI, PIM Konsolidace dat postupně migrovaných do centrální databáze ČSOB Pojišťovna – DQ, CDI, PIM Systém pro trvalé čištění a obohacování zákaznických dat včetně on-line identifikace, Purity.360 Česká pojišťovna – DQ, CDI, MDM Studie CCD (Purity.360 využito v analýze, dnes realisace plnohodnotné online konsolidace) Česká spořitelna – DQ, CDI Konsolidace dat v rámci velkého projektu GE – DQ, CDI Integrace dat ze 4 dceřiných společností Konsolidace klinetských dat pro reporting (Basel II) On-line identifikace klientů, kontaktů a motorových vozidel Householding (domácnosti a komerční)

Vybrané reference – ostatní Český telecom – DQ Čištění, unifikace a obohacení osobních údajů všech klientů Českého telecomu, Purity.360 Ministerstvo dopravy – DQ Čištění dat o držitelích řidičských průkazů Další reference ING Group Mapa SK Istrobanka Dexia