Použití datových skladů v pojistné matematice Mgr. Patrik Hinca 10.10.2003
Obsah přednášky Datové sklady Historie datových skladů Vytváření datových skladů Základní pojmy v datových skladech Používaní datových skladů Datové sklady v pojistné matematice Datové sklady jako zdroj dat Vytváření reportů Praktická ukázka
Historie datových skladů Nástup elektronických technologii >> shromažďování dat Začátek 70. let vznik relačních databází Následně definice SQL 80. léta vznik velkých serverových databází 1986 uvedena první client-server aplikace začátek 90. let oddělování specifických dat pro MIS a DSS polovina 90. let vznik datových skladů konec 90. let rozvoj datových skladů – e-businnes, systém datamartů, data mining,
Výstup Výstup Výstup Výstup Integrace dat Kdo je klient? Marketing Výstup Finance Výstup Odborné odd. Výstup Účetnictví Výstup
Výstup DWH Integrace dat Marketing Finance Odborné odd. Účetnictví Kdo je klient? Marketing Finance Výstup DWH Odborné odd. Účetnictví
Co je datový sklad? Samostatný informační systém postaven na již pořízených datech určen především k jejich analýze dat Hlavní výhody DWH primární je integrace dat rychlý přístup k datem, dynamický přístup (ad-hoc) uložistě historických dat zdroj dat pro analýzy (MIS, DSS) charakterizace klienta read-only systém (uživatel pouze čte) – validita dat snížení nákladů na pořízení dat
Smlouva Klient Domácnost Pohled na data z hlediska systému 80. léta až první polina 90. let Smlouva druhá polina 90. let až současnost Klient Současnost a blízká budoucnost Domácnost
ETL DWH Výstavba datového skladu Staging area DM1 DM2 DM3 DM4 Primární systém 1 Primární systém 2 Primární systém 3 Staging area ETL DWH DSS aplikace E-commerce DM1 DM2 DM3 DM4 CRM Data mine
DWH Struktura datového skladu Data na nízké úrovni Agregační data Strukturované indexy Operative data store Exploration data store Metadata Logická struktura dat
Obsah datového skladu fakt – měřitelná hodnota (platby, zůstatky) metrika – agregační funkce faktu (suma, průměr, počet) mezisoučty – souhrny na definovaných úrovních atribut – agregační úroveň dat (tarif, kraj, rok počátku) dimenze – seskupení atributů stejného hlediska (geografická dimenze, časová dimenze) filtr – výběrové kritérium seskupení – samostatné skupiny prvků atributu transformace – definice úrovní pro porovnávání (měsíce) uživatelské prvky – doplňkové funkce, analytické nástroje
Jádro datového skladu METADATA DWH Správce Uživatel
Jádro datového skladu řídí veškerou činnost nad datovým skladem vytváří metadata a tím i logickou strukturu dat jako jediný má přímý přístup k datům DWH řídí požadavky koncových uživatelů (priority, SQL generátor) kontroluje bezpečnost přístupu analytický nástroj (mutlidimenzionální analýzy, statistické analýzy, analýzy časových řad) úprava dat pro koncového uživatele (dokument, graf, tabulka) zpracování odezvy uživatele
Uživatelé datového skladu Administrátor kontroluje činnost DWH řídí uživatele (práva, definice skupin) Architekt vytváří logický model DWH aplikační model DWH (objekty, funkce, nástroje pro analýzy) Report creator vytváří standardní výstupy DWH (reporty, grafy, dokumenty) Analytik vytváří pokročilé výstupy DWH provádí „průzkum dat“, Data Mining Koncový uživatel Vývojář
Používání datového skladu statické výstupy – předem definované výstupy dynamické výstupy – ad-hoc analýza dat (provrtávání) parametrické výstupy – report s volitelnými vstupními parametry dokumenty – sestava několika nezávislých reportů, tabulek grafů, možnost vkládaní vlastních komentářů elektronické výstupy – email/fax, SMS, Pager hlasové výstupy – voice mail, eCall centrum operativní výstupy – registrace odpovědí a jejich analýzy
Datové sklady v pojistné matematice Část II
DWH – zdroj dat potřeba pojistného matematika - data na nízké úrovni výpočet hodnot pro jednotlivé smlouvy (rezervy, rozklad pojistného, technické změny) určité statistiky souhrnného charakteru (odhad rizik, úmrtnosti, rizikového kapitálu) statistické analýzy kmene (vývoj škodního procenta, vývoj úmrtnosti, porovnání s plánem) finanční analýzy (předpisy, zaplacené pojistné, vývoj rizikového kapitálu) odvozené statistiky (solventnost, hodnota kmene)
DWH – základní dimenze produktová skupina – produkt – tarif – kámen tarifu rok – kvartál – měsíc – týden – den (časové údaje, datum podpisu, počátku, konce, narození) stát – region – kraj – okres – obec – část obce firma – obchodní region – agentura – agent (makléř) stav smlouvy – metoda – forma – status uplynutá doba v letech – kvartálech – měsících (doba do konce smlouvy) riziková skupina – typ rizika – riziko domácnost (rodina) – klient – smlouva
DWH DWH Vytváření reportů – bez využití DWH APLIKACE APLIKACE Data nízké úrovně VÝSTUP DWH APLIKACE DWH VÝSTUP
Agregovaný mezivýsledek Vytváření reportů s využitím DWH Agregovaný mezivýsledek APLIKACE VÝSTUP DWH Pomocná databáze obsahující aplikační funkčnost VÝSTUP
Ukázka použití DWH
D O T A Z Y