Dobývání znalostí z databází OLAP a datové kostky

Slides:



Advertisements
Podobné prezentace
Systémová integrace Business Intelligence
Advertisements

Multidimenzionální analýza zdravotnických dat v prostředí webu RNDr. Karel Drdla RNDr. Zlata Kubů DCB Actuaries and Consultants
Ing. David Pejčoch Tutorial
PowerDesigner 16.5 Ondřej Diviš.
Přednáška č. 1 Úvod, Historie zpracování dat, Základní pojmy
Aplikační a programové vybavení
Microsoft Office Access
Business intelligence
Business Intelligence
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
SAS Jan Blaťák Laboratoř vyhledávání znalostí Fakulta informatiky Masarykova Univerzita, Brno
IS V EKONOMICKÝCH SUBJEKTECH Ing. Jiří Šilhán. IS IS – data+lidi+HW, prvky + relace mezi uživateli, které splňují nějaké cílové chování – tak aby byly.
PROGRAMOVACÍ JAZYKY (c) Tralvex Yeap. All Rights Reserved.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
Lukáš Navrátil, Dotazovací jazyky I, MFF UK
1IT Relační datový model
Databáze Jiří Kalousek.
Analýza dat Jiří Slabý Nástroje pro analýzu dat SQL SERVER - součást Small Business serveruSQL SERVER - součást Small Business serveru Kontingenční tabulkyKontingenční.
M O R A V S K O S L E Z S K Ý K R A J 1 Vedení správních řízení ve spisové službě a statistika vyřizování dokumentů.
Databáze Úvod.
Microsoft Access Prezentace základních uživatelských nástrojů
Databázové systémy II Přednáška č. 8 – Pohledy (Views)
Jako intranet Bc. Jan Beneš. Intranet - obecná funkcionalita  sdílení dokumentů  diskusní fórum  databáze kontaktů  novinky a aktuality  firemní.
Školení správců II. Petr Pinkas RNDr. Vít Ochozka.
Rozumíme si s MDX Š.Havlíček.
Caché for Business Inteligence Applications Michal Tomek, Martin Zubek.
Relační databáze.
SQL – základní pojmy Ing. Roman Danel, Ph.D.
Aplikace VT v hospodářské praxi Byznys inteligence
Business Inteligence a její nástroje ve veřejné správě Petr Zeman, Key Account Manager – Public Sector Adastra Corporation.
Architektury a techniky DS Cvičení č. 9 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
Erik Eckhardt Portál pro podporu rozhodování
Systémová integrace Big Data
Databázové modelování
Access Vysvětlení pojmu databáze - 01
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová III. Kontingenční tabulky v Excelu.
Databázové systémy Informatika pro ekonomy, př. 18.
SERVICESSERVER CLIENT Operating System Relational Database Application ServicesSystems Management Developer Tools Programming Model Applications.
Robert Hernady Regional Solution Architect Microsoft.
Přehled SAS Institute software For 22 Years: “If It Moves, We Can Analyze It”
Data Warehousing Růst obratu: $10 miliard v 1999
Nasazení nástrojů BI pro analýzu dat z IS STAG Řešitel: Vladimíra Zádová Datum:
Miloš Sobotka Systems Engineer Microsoft s.r.o.. Microsoft a BI Excel 2007 jako klient SSAS Translations v SSAS Implementace ve Visual Studiu Konzumace.
Web services. Co jsou webservices Součinná spolupráce počítačů v síti Technologie pro vzdálené volání procedur (RPC) Nezávislá na platformě Data v XML.
Business Intelligence Pavel Cach
Úvod do PostGIS Jan Ježek.
Databázové systémy Úvod, Základní pojmy. Úvod S rozvojem lidského poznání roste prudce množství informací. Jsou kladeny vysoké požadavky na ukládání,
Úvod do databází zkrácená verze.
NÁZEV ŠKOLY:SOŠ Net Office, spol. s r.o. Orlová Lutyně AUTOR: Mgr. Jana Kijonková NÁZEV: Podpora výuky v technických oborech TEMA: Relační databáze – dotazy.
Nástroje self service Business Intelligence Jiří Neoral
Databázové systémy Roman Danel Institut ekonomiky a systémů řízení 2016.
Databáze MS ACCESS 2010.
Databázové systémy přednáška 5 – Přístup na data
BI? Power BI? Aleš Hejduk 10986B
Ukládání dat biodiverzity a jejich vizualizace
Systémy pro podporu managementu 2
Unix a Internet 9. SQL server
SQL – příkaz SELECT Ing. Roman Danel, Ph.D.
BI-Datove sklady (DATAWAREHOUSE) – ETL -OLAP
Business Intelligence
Datové sklady Analýza dat
Dobývání znalostí z databází znalosti
Informační systémy Business Inteligence
Ing. Athanasios Podaras, Ph.D 2016
Databázové systémy přednáška 13 – Analýza a reporting
BI řešení pro ne BI lidi Jiří Neoral BI Data Architect Dixons Carphone
Roman Péchal, Jan Čongva, Martin Durák
Základy business intelligence Jaroslav Šmarda
Analýza velkých dat strukturovaně či nestrukturovaně?
Transkript prezentace:

Dobývání znalostí z databází OLAP a datové kostky Roman Danel Institut ekonomiky a systémů řízení 2017

Důvod vzniku Problémy s reportingem u relačních db – při velkém množství dat pomalé Idea – předpřipravit data pro reporting z OLTP zdrojů V teorii databází se jedná o projekci relace

OLAP Datový sklad Fakta, dimenze Data jsou prezentována ve formě datové kostky – snapshot dat Multidimenzionální pohled na data (může mít více než tři dimenze)

Dimenze kostky s narůstajícím počtem dimenzí kostky (se zvětšující se kostkou) je mnoho buněk (představujících specifické kombinace atributů) prázdných. Využití kapacity uložiště není efektivní. není vhodné za každou cenu vytvářet jednu kostku o vysokém počtu dimenzí, ale spíše více kostek o menším počtu dimenzí.

Dimenzní tabulky Vlastnosti, podle kterých jsou data agregována S tabulky faktů propojeny přes primární klíč

Data Storage Models ROLAP MOLAP HOLAP – hybridní Data v tabulkách v OLTP systému MOLAP Data v multidimenzionální struktuře (datový sklad) Vyšší výkon výpočtů Při změně se musí vše přepočítat HOLAP – hybridní Část dat je uložena v datovém skladu a část v OLTP

Nástroje a výrobci MOLAP ROLAP Hyperion, Executive Viewer, CFO Vision, BI/Analyze, PowerPlay, Business Objects, Genita, Holos, MS OLAP Services, Pilot, ProCube ROLAP Discover 3 from Oracle, DSS Agent from MicroStrategy, MetaCube from IBM Informix, Platinum Beacon from Platinum, Brio, Business Objects, Cognos Powerplay

Microsoft Analysis Services Business Intelligent Development Studio Analysis Project Data Sources Data Sources Views Cubes Dimensions

Postup vytvoření OLAP kostky Definování datových zdrojů Definování pohledů na datové zdroje Návrh dimenzí Lze využít funkci Auto Build Návrh kostky Kostka může mít jednu až n dimenzí.

Návrh dimenzí kostky - MS Standardní dimenze Časová dimenze Časově-serverová dimenze

Návrh kostky – Cube Wizard Solution Explorer – Cube – New cube Výběr tabulky faktů a dat, se kterými chceme pracovat Výběr dimenzí Systém vypočítá pro zvolené dimenze agregace faktů

Cube Cube Builder Dimension Usage Calculations KPI – Key Performance Indicators Actions – definování akcí pro navrženou kostku Partions – pohled na kostku, možnost editace Perpsective Translations - pohledy Browser – návrh kontigenční tabulky

Browser Využívá Office Web Components Kontingenční tabulka

OLAP v MySQL Typ ROLAP Pivot table jPivot – OLAP cube browser

Degenerate dimensions

Přehled OLAP serverů https://en.wikipedia.org/wiki/Comparison_of_OLAP_Servers

Mondrian Open source OLAP tool Pentaho open source BI, licence EPL In-memory OLAP cache Podpora: MDX – query language Oalp4j – olap interface pro Java app http://www.olap4j.org/ XML for analysis (XMLA) – standard interface pro analytické služby, od konsorcia Microsoft-SAS-Hyperion Eclipse Public License

MDX Query language pro OLAP databáze MultiDimensional Expression Pohledy na data uložená v kostce

XMLA 2000-2003 Založen na XML, SOAP, HTTP Query language: MDXML

Olap server „Cubes“ 2014, Python, JSON Licence MIT http://cubes.databrewery.org/

Jedox In-memory OLAP server www.jedox.com GPL nebo proprietární Excel jako interface

Druid Open-source OLAP tool for real-time analytics

Pivot Table Nástroj pro sumarizaci dat – v tabulkových procesorech nebo BI Jednodušší verze OLAPu Pozn. Polsky – tabela przestawna

Základní operace s datovou kostkou Drill-down – umožňuje uživateli ve zvolené(-ých) instanci(-ích) jisté agregační úrovně nastavit nižší(jemnější) agregační úroveň Roll-up – jde o opak předešlé operace. Ve zvolených instancích jisté agregační úrovně nastavuje vyšší (hrubší) agregační úroveň. Pivoting – umožňuje „otáčet“ datovou krychlí, tj. měnit úhel pohledu na data na úrovni presentace obsahu datového skladu. Slicing – dovoluje provádět řezy datovou kostkou, tj. nalézt pohled, v němž je jedna dimenze fixována v jisté instanci určité agregační úrovně. Jinými slovy tato dimenze aplikuje filtr na instance příslušné agregační úrovně dané dimenze. Dicing – je obdobou „slicingu“, jenž umožňuje nastavit takový filtr pro více dimenzí

Roll-up, drill-down

Roll-up Agregace dat v kostce Odpovídá GROUP BY: SELECT [attribute list], SUM [attribute names] FROM [table list] WHERE [condition list] GROUP BY [grouping list]

Drill-down Zvyšuje počet dimenzí Opak roll-up Sumarizuje data na nižší úrovni hierarchie

Drill-through Drill-through - operace drill-down až na nejnižší úroveň (až ke zdroji v relační db)

Pivoting