© Adastra, Confidential Řešení datového skladu v prostředí Celní správy ČR Data pod kontrolou Připraveno pro konferenci ISSS 2008 David Kaláb 7. 4. 2008,

Slides:



Advertisements
Podobné prezentace
PLAYBOY Kalendar 2007.
Advertisements

Podpora personálních procesů v HR Vema Jaroslav Šmarda
Spisová služba pro organizace zřízené Olomouckým krajem
Stránka 1, © Vema, a. s.. Stránka 2, © Vema, a. s. Podnikové aplikace  Integrovaný podnikový systém (Integrated Business System):  komplex aplikací.
Produkce odpadů 2002 – 2007 obce ORP Šumperk
Nový přístup k aplikacím Vema
Základy databázových systémů
Business intelligence
Generální ředitelství cel Projekt ECR brána případová studie
Přednáška č. 5 Proces návrhu databáze
Microsoft SQL server Databázový systém. Úvod  aktuální verze na trhu je MS SQL  verze: plná komerční - Enterprise Edition pro vyzkoušení volně.
IISPP ■ pojem definován v letech v rámci přípravy výzkumných záměrů NPÚ na roky ■ dlouhodobý projekt na vybudování nového komplexního.
Přínosy virtualizace a privátního cloudu
EGovernment Zpracoval: Ing. Tomáš Vašica 1 Datum: Jednání implementátorů ORP Moravskoslezského kraje Zpracoval: Ing. Tomáš Vašica Datum: 20.
1 Extreme programming v praxi Martin Junek, product manager
Případová studie Business Intelligence ve společnosti Mountfield, a.s.
Studie proveditelnosti datového skladu KrÚ Vysočina - zhodnocení
Úvod do databází Databáze.
Vizualizace projektu větrného parku Stříbro porovnání variant 13 VTE a menšího parku.
Dělení se zbytkem 3 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
Podnikový systém SEWSS Jakub Charvát STATISTICA Enterprise-wide SPC System.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Využití technologií pro zpracování dat ve veřejné správě Petr Zeman, Key Account Manager – Public Sector Tomáš Kočka, Consultant Adastra Corporation.
M O R A V S K O S L E Z S K Ý K R A J 1 Vedení správních řízení ve spisové službě a statistika vyřizování dokumentů.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.

1 Přínosy analytických nástrojů ve veřejné správě Případová studie Kraje Vysočina PVT, a.s. Kovanecká 30/2124, Prague 9, Czech Republic.
GEOPORTÁL ZEMĚMĚŘICKÉHO ÚŘADU
IBM SYPOSIUM O SPOLUPRÁCI © 2006 IBM Corporation Datamining z Domina R7 Dan Vrána CubeTeam ®
D ATOVÉ MODELY Ing. Jiří Šilhán. D ATABÁZOVÉ SYSTÉMY Patří vedle textových editorů a tabulkových kalkulátorů k nejrozšířenějším představitelům programového.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Architektura databází Ing. Dagmar Vítková. Centrální architektura V této architektuře jsou data i SŘBD v centrálním počítači. Tato architektura je typická.
Datové schránky ve velké společnosti SharePoint partenrská konference Microsoft Pavel Salava Mainstream technologies,
Konference SI Praha Ladislav Přívozník is:energy czech a.s.
8. dubna 2013ISSS - Portál interních identit, Z. Motl1 Portál interních identit jako nadstavba identity managementu Mgr. Boleslav Bobčík, T-Systems Czech.
Představení koncepce Business Intelligence 6.října 2005
1 Informační systém autoservisu Softwarové inženýrství 2003.
IS DIS Zdeňka Fialová. Obsah 1.Základní informace 2.Využití 3.DIS POV 4.Ukázka 5.Související problémy.
17. března 2003 Univerzální přípojka – brána do IVS Miroslav Nováček Libor Neumann.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Evropský celní informační portál (ECIP) – první fáze.
Krajský rok informatiky České Budějovice 26. –
Celní služby 2000 Radek Sedláček TranSoft a.s Radek Sedláček TranSoft a.s
Reporting Ing. Jan Přichystal, Ph.D.. Úvod Uživatelé obvykle přistupují k DW pomocí BI aplikace Většina využívá předdefinované reporty Poskytují standardizovaný.
LiveContent Univerzální Formulářové Řešení Michal Petrtýl, Marek Beneš.
Excelent v EKOSu Ing. Daniela Dufková. Excelent v EKOSu Ing. Daniela Dufková.
1 © Mediaresearch, a.s., 2008 NetMonitor a AdMonitoring Výsledky za říjen 2008.
Business Inteligence a její nástroje ve veřejné správě Petr Zeman, Key Account Manager – Public Sector Adastra Corporation.
2 Ing. Jan Keprt Centrální správa uživatelů 3 Jak to bylo dosud Bylo třeba nastavení uživatelů provést zvlášť, v každém modulu samostatně. Uživatel si.
Reinženýring cesta ke zvyšování výkonnosti státní správy s využitím procesního řízení Ing. Martin Čulík Notes CS a.s. Konference ISSS 2003 Hradec Králové.
Strana: 1 © Vema, a. s. Ucelené řešení pro řízení lidských zdrojů, ekonomiky a logistiky.
Manažerský informační systém pro organizace veřejné správy
Copyright (C) 1999 VEMA počítače a projektování, spol. s r.o.1 Lucián Piller Intranet HR.
1 Elektronická evidence paleontologických sbírek na příkladu paleontologických kolekcí České geologické služby Pavel Bokr, Petr Budil, Jan Sedláček, Marika.
© Adastra, Confidential Krátká úvaha Správa dat veřejných Připraveno pro konferenci ISSS 2008 Vladimír Kyjonka, David Slánský
Erik Eckhardt Portál pro podporu rozhodování
organizační struktury Implementace EOS III na Olomouckém kraji Pro:Krajský rok informatiky 2005 Autor:Jan Kadlec Datum:
Databázové modelování
Pilotní projekt DeepSee. O Prezentaci O nás a o IS-MLINE Datový sklad Co dál? DeepSee Pilot Ukázky Shrnutí projektu.
2 Fučíková Sylvie HR/Win – moderní technologie pro osvědčené aplikace.
Portál veřejné správy spolupráce s BusinessInfo CS – Zákaznická řešení pro státní správu Ing. Jitka Novotná Ministerstvo informatiky.
Klomfar Petr.  Adresářová služba  specializovaná databáze optimalizovaná pro čtení a vyhledávání.  popisující objekt pomocí atributů. Na rozdíl od.
1 E - S V Ě T S E T O Č Í S T Á L E R Y C H L E J I. S T A Č Í T E M U ? Regionální a municipální informační systém RAMIS Ing. Petra Mikulecká,
Global network of innovation Identity a Access Management v heterogenním prostředí Marta Vohnoutová 19. dubna 2015.
Miroslav Skokan IT Security Consultant
Nokia Czech Republic, s.r.o. Igor Šmerda, program manager.
Nasazení nástrojů BI pro analýzu dat z IS STAG Řešitel: Vladimíra Zádová Datum:
Budování Integrovaného informačního systému Národního památkového ústavu Petr Volfík, NPÚ ÚP
Transkript prezentace:

© Adastra, Confidential Řešení datového skladu v prostředí Celní správy ČR Data pod kontrolou Připraveno pro konferenci ISSS 2008 David Kaláb , Hradec Králové

2 Hlavní motto 1/2 Je pěkné mít data nashromážděná, ještě lepší je však mít data vhodně uspořádaná a dostupná

3 Hlavní motto 2/2  Sběr dat ̶ Obvykle není problém ̶ Úloha primárních systémů  Vhodné uspořádání dat ̶ Často problematické ̶ Úloha datového skladu  Dostupnost dat ̶ Problematické ̶ Úloha datového skladu

4 Situace před nasazením Datového skladu

5 Situace před nasazením datového skladu - hlavní charakteristiky  Data jsou rozmístěna po několika až mnoha primárních systémech  Vzájemná provázanost primárních systémů je na nízké úrovni  Požadavky na datové výstupy (reporty, exporty, datové pohledy, …) jsou řešeny prostřednictvím mnoha tzv. „tvůrců reportů“ (informatici, správci systémů, administrátoři, vývojáři, analytici, power users …)  Datové výstupy různých tvůrců jsou díky neexistující jednotné metodice těžko porovnatelné

6 Situace před nasazením datového skladu - nevýhody  Obtížné, problémové i nemožné vytváření konsolidovaných datových výstupů  Obtížná porovnatelnost datových výstupů z různých oblastí (primárních systémů)  Obtížná porovnatelnost dat i v rámci 1 systému např. po změně aplikace primárního systému  Data primárních systémů jsou často nevalidovaná na číselníky (nejasná čistota dat)  Velké nároky na „tvůrce reportů“  Dlouhá doba na uspokojování požadavků (dny, týdny)  Nemožnost zadávání mlhavých požadavků  Nemožnost analýzy dat

7 Situace po nasazení Datového skladu … co je Datový sklad? Datový sklad CS ČR je řešení (komponenty, nástroje, způsob zpracování dat, způsob práce s daty, prezentace dat…)

8 Hlavní přínosy datového skladu pro CS ČR  Konsolidace dat  Možnost analýzy dat  Jediná verze pravdy  Snadná dostupnost dat  Nové reporty a pohledy na data  Podpora čištění dat  Odlehčení primárním systémům  DS jako zdroj pro specializované aplikace  Centralizace dat

9 Konsolidace dat 1/2 Xyz, s.r.o. Xyz XYZ s.r.o. Xzy  Konsolidace číselníků  Např. číselníky organizací

10  Konsolidace oblastí / agend / evidencí Konsolidace dat 2/2

11 Možnost analýzy dat  DS obsahuje data ve strukturách podporujících efektivní analýzu dat ̶ Podpora analytických funkcí ̶ Zajištění rychlé odezvy  DS je věcně orientovaný ̶ Analytik neztrácí čas studiem datových struktur, vztahů mezi daty, …  DS obsahuje analytické nástroje umožňující efektivně využívat data v DS pro provádění analýz. ̶ Uživatelské rozhraní ̶ Analytické funkce ̶ Grafické výstupy  DS umožňuje zadávat mlhavé dotazy a postupně je zpřesňovat  DS umožňuje zadávat ad-hoc dotazy

12 Jediná verze pravdy  Pravda může mít mnoho verzí  Výstupy z různých systémů mohou být obtížně porovnatelné  Datový sklad definuje společné principy, pravidla a algoritmy, kterými jsou zpracována veškerá data

13 Snadná dostupnost dat  Data v datovém skladu mohou být snadno dostupná všem pracovníkům organizace  Stačí pouze přidělit patřičná přístupová oprávnění  Pomocí klientských analytických nástrojů a obecného dotazovacího nástroje si může uživatel během několika sekund vytvořit vlastní datové výstupy (reporty, datové pohledy, …)

14 Nové reporty a pohledy na data 1/2  Nové možnosti DS (konsolidace dat, možnost zadávání mlhavých dotazů a možnost ad-hoc dotazování, …) umožňují vznik novým reportům a pohledům na data

15 Nové reporty a pohledy na data 2/2 Pozn. Jedná se o surové agregace dat datového skladu, které nejsou očištěným výstupem dle metodiky vykazování zahraničního obchodu ČR.

16 Podpora „čištění“ dat 1/2  Primární data vykazují různou „čistotu“ ̶ Překlepy ve jménech, názvech, … ̶ Odkazy na neexistující číselníkové záznamy a neexistující dokumenty ̶ Zjevně nesprávné hodnoty (např. budoucí data, prehistorická data, …) ̶ Nezadané hodnoty ̶ …  DS „nečistotu“ identifikuje  DS umožňuje kvantifikovat objem chybných dat  DS chybná data neopravuje!

17 Podpora čištění dat 2/2 Zboží2006-Q12006-Q22006-Q32006-Q42007-Q12007-Q22007-Q32007-Q4 #Neuvedeno1141 #Neznámo  Počet položek dovozních deklarací dle zboží HS2 (absolutně)  Počet položek dovozních deklarací dle zboží HS2 (relativně) 2006-Q12006-Q22006-Q32006-Q42007-Q12007-Q22007-Q32007-Q4 #Neuvedeno0, , , #Neznámo0, , , , , ,002990, , , , , , , , , , , , , , , ,079310, , ,000140, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,018075

18 Odlehčení primárním systémům  DS přebírá úlohu primárních systémů: ̶ Reportingu ̶ do nasazení DS reporting řešen zpravidla primárními systémy ̶ Exportingu ̶ do nasazení DS exporting řešen zpravidla primárními systémy ̶ Analytického dotazování ̶ Ad-hoc dotazování  Fyzické zatížení přechází na datový sklad

19 DS jako zdroj pro specializované aplikace  DS bývá vhodným zdrojem pro další specializované aplikace vyžadující konsolidovaná data  Příklady: ̶ Dataminingové aplikace ̶ Analýza rizik celních deklarací

20 Centralizace dat  Data z různých oblastí jsou dostupná na jednom místě, jednotným způsobem a prostřednictvím jednotného uživatelského rozhraní

21 Výsledek budování datového skladu

22 Problematika řešená datovým skladem CS ČR Dluhy Vývoz Dovoz Delikty... Spotřební daněIntrastat Kontroly (fyzické, následné, dokumentační, …) Tranzit VzorkyRiziková analýza Globální záruky

23 Základní komponenty datového skladu CS ČR Vzorky Vývoz Dovoz Databáze datového skladu Tranzit... Zdrojové systémy Specializované aplikace Aplikace pro podporu rozhodování Spotřební daně Statistické analýzy Riziková analýza Data mining Reporting Exporting Analytické prostory Intrastat CesDic TARIC Kontrolní protokoly Dotazovací oblasti QDS Reporty Exporty Datový sklad Obecné dotazování Analytické dotazování

24 Použité technologie  Relační vrstva ̶ Microsoft SQL Server 2000 Enterprise Edition IAP64 databázový stroj (Failover cluster)  ETL ̶ Microsoft SQL Server 2000 DTS, Job Agent  Multidimenzionální vrstva ̶ Server: Microsoft SQL Server 2000 Analysis Services (Failover cluster) ̶ Klient: ̶ Microsoft Excel 2007 ̶ ProClarity Desktop  Reporty ̶ Reportovací server: Microsoft SQL Server 2000 Reporting Services ̶ Klient: Internet Explorer  Exporty ̶ bcp utilita ̶ Uživatelské rozhraní: Reporting Services, Internet Explorer  Obecný dotazovací nástroj ̶ QDS – Na zakázku vyrobený systém

25 Komu doporučit DS  DS lze doporučit zejména tam, ̶ kde nelze nebo je obtížné provádět dotazy do primárních systémů z důvodu: ̶ Roztříštěnosti dat ̶ Nečistoty dat ̶ Zajištění chodu primárních aplikací ̶ Kde je potřeba provádět analýzu dat ̶ Kde je potřeba data centralizovat a srovnávat ̶ Kde existuje potřeba nasazení dalších BI řešení (datamining, vyhledávání podvodů, vyhodnocení rizik, apod.)

26 CZECH REPUBLIC Adastra, s.r.o. Karolinská 654/ Praha 8 CANADA Adastra Corporation 8500 Leslie St. Markham, Ontario, L3T 7M8 SLOVAK REPUBLIC Adastra, s.r.o. Francisciho Bratislava GERMANY Adastra GmbH Bockenheimer Landstr. 17/ Frankfurt am Main BULGARIA Adastra Bulgaria EOOD 29 Panayot Volov street Sofia