Ing. David Pejčoch Cvičení č. 1

Slides:



Advertisements
Podobné prezentace
Podpora terénních prací v projektu NIKM - národní inventarizace kontaminovaných míst, automatizace úloh Roman Bukáček, Jiří Chroust, Petr Pala, Jiří Zvolánek,
Advertisements

Integrovaný systém kvality v dalším profesním vzdělávání KVALITA V DALŠÍM VZDĚLÁVÁNÍ Liberec,
DSpace zkušenosti se zaváděním systému na Univerzitě Pardubice Seminář Systémy pro zpřístupňování eVŠKP 2007 Brno Lucie Vyčítalová Univerzitní.
Ing. David Pejčoch Tutorial
Tabulky v MS ACCESS Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Jiří Novák.
Ing. Jan Mittner MySQL Workbench 2. Základy práce s databází 3. Subversion 2.
Přednáška č. 3 Normalizace dat, Datová a funkční analýza
Změny v poskytování dat územní identifikace
Albertina a Report Mgr. Libuše Simandlová
Architektury a techniky DS Cvičení č. 4 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
Mapy a geografické informační systémy
© 2003 FSS, spol. s r.o. Všechna práva vyhrazena.1 e - Insurance Management System Financial Support Services Struktura systému.
DSpace zkušenosti se zaváděním systému na Univerzitě Pardubice Seminář Systémy pro zpřístupňování eVŠKP 2007 Brno Lucie Vyčítalová Univerzitní.
Verze Modul OCENĚNÍ DaMaSk
Informační systémy Modelování dynamiky objektového modelu. Koncepce modelu v programu MS Visio.
Znalostní fuzzy systém pro podporu rozhodování o určení výše finanční půjčky.
Popis systému DBMAN. Obecná charakteristika Systém DBMAN vychází ze snahy maximálně zobecnit přístup k datům v jednoduchých databázích. Původním záměrem.
Ing. Tomáš Cajthaml. Podklady Čerpat bylo možné z dotazníku: Přímé dotazy Nepřímé – nutné odvodit z výsledků záznamů schůzek další informace Z rozhovorů.
Informační strategie. řešíte otázku kde získat konkurenční výhodu hledáte jistotu při realizaci projektů ICT Nejste si jisti ekonomickou efektivností.
Zadání databázového systému
Databázové systémy 2 Cvičení V Ing. Tomáš Váňa Fakulta elektrotechniky a informatiky
Management a rozvoj obcí
Absolventská práce 2002 Aplikace XML rozhraní v prostředí krajského úřadu Autor : Marek Cop Vedoucí : Ing. Petr Pavlinec 2002.
Marie Borecká, Kristina Ficencová 6. kruh, 1. ročník VSRR
Informatika pro ekonomy II přednáška 10
Rozšíření IQ sestav v RZ Jak zobrazovat data na 100% ? Ing. Robert Naar Skalský Dvůr
Metadata a metainformační systémy (seminář)
Energetický audit ve velkém průmyslovém podniku z pohledu zadavatele Ing. Petr Matuszek Seminář AEM Brno
Architektury a techniky DS Cvičení č. 9 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
Dokumentace informačního systému
Úvod do managementu 1. seminář
Zvýšení kvality řízení KÚPK aktivita A3 Informační strategie Analýza Workshop
S NÁMI DOKÁŽETE VÍCE... Zákaznický den k verzi V E R Z E Systém a Personalistika Výdej
Realizační tým ICZ duben 2005
Databázové modelování
Databázové systémy Informatika pro ekonomy, př. 18.
ERD - příklad Pojistné smlouvy. Zadání Pojišťovna nabízí klientům různé produkty (např. životní pojištění, povinné ručení, cestovní pojištění, úrazové.
Architektury a techniky DS Cvičení č. 5 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
Analýza informačního systému. Podrobně zdokumentovaný cílový stav Paramentry spojené s provozem systému – Cena – Přínosy – Náklady a úspory – …
Seminář k ukončování projektů FS Státní fond životního prostředí ČR Praha,
Databázové systémy Datové modely.
Popis systému DBMAN (KEVIS). Obecná charakteristika Systém DBMAN vychází ze snahy maximálně zobecnit přístup k datům v jednoduchých databázích. Původním.
11/2003Přednáška č. 41 Regulace výpočtu modelu Předmět: Modelování v řízení MR 11 (Počítačová podpora) Obor C, Modul M8 ZS, 2003, K126 EKO Předn./Cvič.:
Systém řízení moderního podniku Management system of modern company
Návrh a implementace algoritmů pro údržbu,
David PETR, Kateřina VOISOVÁ
Organizace a řízení systému oceňování Richard Almy.
Systémová podpora procesů transformace systému péče o ohrožené děti a rodiny Klíčové aktivity realizované v Pardubickém kraji Pardubice, dne
Aplikace MS2014+ Portál IS KP14+.
Projektové procesy.  Podrobné procesní modely (PMBOK)  Zjednodušený procesní model  COBIT.
Projekt e-Sbírka a e-Legislativa Moderní systém pro přístup k právu a pro jeho tvorbu 12. června 2013 seminář Osvěta Aleš Gola odbor legislativy a koordinace.
ANALÝZA IS. Životní cyklus IS Specifikace problému, požadavků (studijní fáze) Analýza Návrh Implementace (realizace) Zavedení (instalace) a testování.
Univerzitní informační systém III., Lednice 2004 E-přihlášky Ing. Tomáš Majer
Import dat Access (16). Projekt: CZ.1.07/1.5.00/ OAJL - inovace výuky Příjemce: Obchodní akademie, odborná škola a praktická škola pro tělesně.
Sběr dat o drogách na regionální/místní úrovni MUDr. Viktor Mravčík.
XML a datový standard Zdeněk Jirkovec Softwarové Aplikace a systémy.
as4u advanced system for you
Oddělení pro vědu a výzkum, FHS UK Praha
Albertina a Report Mgr. Libuše Simandlová
Komerční pojišťovna.
Komplexní systém hodnocení
Digitální učební materiál
Evidence osob a správa externistů
Informatika pro ekonomy přednáška 8
Presentation Title 1st September 2002
Seriály v Souborném katalogu ČR
Otevřená data v České republice
Praktický modul - zadání
Projekt KA3: ZPRACOVÁNÍ METODIK TVORBY NÁSTROJŮ PRO IMPLEMENTACI NÁRODNÍ STRATEGIE ELEKTRONICKÉHO ZDRAVOTNICTVÍ (NSEZ)
Národního registru hospitalizací
Transkript prezentace:

Ing. David Pejčoch Cvičení č. 1 Řízení datové kvality Ing. David Pejčoch Cvičení č. 1

Osnova Cíle praktických cvičení Výstupy ze cvičení Analýza zadání praktické úlohy Proč se zabývat datovou kvalitou Architektura auditované firmy Popis situace Seznámení s dostupnými datovými zdroji pro úlohu Popis nástroje Talend Open Studio Popis nástroje CADaQuES

Cíle praktických cvičení Seznámit s funkcionalitou nástrojů pro řízení datové kvality Na praktických úlohách vyzkoušet audit datové kvality a návrh nápravných opatření Praktická demonstrace metod pro zvyšování datové kvality

Zadání praktické úlohy – 1. část S pomocí nástroje Talend Open Studio for Data Quality vytvořte profilaci dat (základní popisné statistiky, četnosti jednotlivých vzorů, …) Proveďte verifikaci proti dostupným číselníkům, registrům a validaci pomocí regulárních výrazů) Spočtěte úroveň kvantitativních vlastností dat (správnost, úplnost, konzistentnost, …) Na příkladu modelové firmy odhadněte roční výši nákladů na nekvalitní data Porovnejte možné přínosy nápravných opatření s vynaloženými náklady Proveďte prioritizaci scope řízení datové kvality Navrhněte externí datové zdroje pro obohacení Navrhněte strategii pro doplnění chybějících hodnot Výstup: dokument Zpráva auditora (viz šablona)

Zadání praktické úlohy – 2. část Proveďte standardizaci hodnot vybraných atributů Doplňte chybějící hodnoty podle navržené strategie Proveďte unifikaci a deduplikaci klientů Navrhněte byznys pravidla pro předcházení dalšímu vzniku chyb v datech Výstup: příloha k dokumentu Zpráva auditora, výstupní data (viz pokyny níže)

Pokyny pro formát odevzdaných dat Datová kvalita je vždy dodatečná informace, proto imputované / opravené hodnoty, informaci o slučování klientů, určení master záznamu vkládejte vždy do nových atributů označených suffixem _CL. Data odevzdejte formou txt extraktu (textový soubor oddělený svislítkem jako oddělovačem, kódování UTF8)

Architektura auditované firmy: jak to má být

Popis situace V architektuře pojišťovny zcela chybí MDM Hub centralizující kmenová data klientů. Vstupní kontroly duplicit jsou realizovány pouze na úrovni dvou oddělených provozních systémů. Online pojištění má svou vlastní datovou bázi a je s provozním systémem neživotního pojištění integrováno až v okamžiku, kdy dojde k platbě prvního pojistného. Klienti jsou v rámci aplikace pro online pojištění vždy nově zakládáni a stejně tak následně při jejich importu do systému neživotního pojištění. Provizní systém je napojen na oba systémy pro správu smluv, nicméně v rámci něj opět nedochází k deduplikaci klienta, neboť pro něj je stěžejní pohled přes jednotlivé získatele jednotlivých smluv, kteří mohou být u jednoho klienta rozdílní. K deduplikaci nedochází ani na úrovni datového skladu. Klient je na jeho úrovni definován na bázi identifikátoru z primárního systému, resp. rodného čísla / IČa.

Architektura auditované firmy

Datový model: PART_PARTY Název atributu Popis Datový typ PARTY_ID Primární klíč BIGINT PARTY_TYPE Typ klienta (C = Commercial, P = Private) CHAR(1) PARTY_FNAME Křestní jméno klienta VARCHAR(45) PARTY_LNAME Příjmení klienta VARCHAR(60) PARTY_NAME Název společnosti VARCHAR(255) PARTY_FORM Právní forma společnosti SMALLINT PARTY_CREGNUM Komerční registrační číslo VARCHAR(8) PARTY_RC Rodné číslo VARCHAR(10) PARTY_COUNTRY Kód země původu CHAR(3) PARTY_POFBIRTH Místo narození PARTY_AGE Věk klienta INT PARTY_GENDER Pohlaví klienta (M = Male, F = Female, O = Other) PARTY_DOFBIRTH Datum narození DATE PARTY_TITBEF Titul před jménem PARTY_TITAFT Titul za jménem PARTY_ESA95 Kód institucionálního sektoru PARTY_OKEC OKEČ kód CHAR(5) PARTY_SINCE Datum počátku statutu klient

Datový model: PART_ADDRESS Název atributu Popis Datový typ ADDR_ID Primární klíč BIGINT PARTY_ID Odkaz na ID tabulky PART_PARTY ADDR_TYPE Typ adresy (R = Resident, C = Correspondential, O = Other) CHAR(1) ADDR_COUNTRY Kód země CHAR(3) ADDR_CITY Město VARCHAR(60) ADDR_STREET Ulice VARCHAR(100) ADDR_NUM1 Číslo popisné VARCHAR(10) ADDR_NUM2 Číslo orientační ADDR_ZIP PSČ CHAR(5)

Datový model: PART_CONTACT Název atributu Popis Datový typ CONT_ID Primární klíč BIGINT PARTY_ID Odkaz na ID tabulky PART_PARTY CONT_TYPE Typ kontaktu (M = Mobil Phone, T = Telephone, E = Email, W = web) CHAR(1) CONT_PRIMARY_FLG Příznak primárního kontaktu (Y = Yes) CONT_VALUE Konkrétní kontakt VARCHAR(100)

Datový model: PROD_CONTRACT Název atributu Popis Datový typ CNTR_ID Primární klíč BIGINT PARTY_ID Odkaz na ID tabulky PART_PARTY PRODUCT_CODE Identifikátor produktu CHAR(3) CNTR_VALIDFROM Datum počátku kontraktu DATE CNTR_VALIDTO Datum konce kontraktu CNTR_CANCTYPE Typ ukončení kontraktu SMALLINT CNTR_PAY_FREQ Frekvence placení pojistného

Relevantní datové zdroje UIR-ADR Registr ekonomických subjektů (není volně dostupný) Číselníky České pošty Registr vozidel MVČR Číselníky titulů, jmen a příjmení na MVČR Credit Info – možný extrakt? Číselníky ČSÚ Kódy měn – ČNB Kody zemí - ČSÚ