Power BI – Datové modelování a optimalizace

Slides:



Advertisements
Podobné prezentace
#3 Úvod do PowerPivot a jazyka DAX Jiří Neoral BI Data Architect – Dixons Carphone
Advertisements

Téma: Využití Accessu pro tvorbu evidence našeho podnikání Vypracovala: Jana Wasserbauerová.
:-) Asymptotická složitost algoritmů Autor: Antonín DANĚK Semestrální projekt 1 – Y14TED.
Mgr. Renáta Davidová.  Hrací plocha je rozdělena do 2 sloupců, které představují různé kategorie otázek.  Každé otázce ve sloupci je přiřazeno bodové.
  Pevný disk (HDD – Hard Disk Drive)  Používá se k dočasnému nebo trvalému uchovávání dat pomocí magnetické indukce.  Jeho předchůdci byli magnetická.
Klíčová slova z Demusu přímo do EXIF hlaviček digitálních fotografií? RNDr. Marie Kocinová
Tým 32, varianta b/4/I.  Jakub Kadlubiec  Roman Pijáček  Petr Pliska  Jan Štourač  Václav Tunka (vedoucí)
Univerzita třetího věku kurz Znalci Databáze 2.
Maticové počítače. Při operacích s maticí se větší počet prvků matice zpracovává současně a to při stejné operaci. Proto se pro tyto operace hodí nejlépe.
Název školyZákladní škola praktická Rožnov pod Radhoštěm Číslo projektuCZ / / Číslo materiáluVY_32_INOVACE_225 AutorMgr. Romana Rybiařová.
1 Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Vladimír Mikulík. Slezské gymnázium, Opava, příspěvková organizace. Vzdělávací materiál.
Volný pád a svislý vrh Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Radim Frič. Slezské gymnázium, Opava, příspěvková organizace.
Výpočetní technika VY_32_INOVACE_12_16_Excel. Excel Tabulkový procesor pro vytváření tabulek a grafů Pochází z kancelářského balíku Microsoft Office Nejčastěji.
KOMPRESE. Co to je komprese? Je způsob zakódování datového souboru (text, hudba, video atd.) do podoby, kdy velikost souboru je menší než před kompresí.
OPERAČNÍ SYSTÉMY Část 5 – souborové systémy
Databáze © Mgr. Petr Loskot
Microsoft Excel verze 2010 Mgr. Přemysl Kejzlar.
Seminář o stavebním spoření
Excel a self service business intelligence nástroje
Systémové databáze v SQL Serveru
Počet čísel Počet hodnot
Vytvořil: Robert Döring
ZÁKLADNÍ ŠKOLA, JIČÍN, HUSOVA 170 Číslo projektu
Tvorba jednoduché tabulky - rozvrh
Číslicová technika.
Databázové systémy a SQL
Obrázky Ram Rom Nástupci ROM Počítačová pamět Obrázky Paměti Ram rom
Excel – tabulkový procesor
Power BI – Produkt „hodný, zlý a ošklivý“
ZAL – 9. cvičení 2016.
R nejen v SQL Serveru Jiří Neoral BI Data Architect
Databáze MS ACCESS 2010.
ROZVRHOVÁNÍ SLUŽEB VE ZDRAVOTNICKÉM ZAŘÍZENÍ
Programovací jazyky Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Jitka Vlčková. Dostupné z Metodického portálu ISSN.
Maďarská metoda Kirill Šustov Michal Bednář Stanislav Běloch
Datové typy v jazyce C Datové typy void skalární aritmetické
Výzkum přírodních geochemických a remediačních procesů a jejich využití pro sanace po těžbě nerostů GEOCHEM Kontrolní den ‘04 GEOCHEM – KD 2004.
Tvorba tabulek ve Wordu II.
Název projektu: ZŠ Háj ve Slezsku – Modernizujeme školu
Souběh Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Libor Otáhalík. Dostupné z Metodického portálu ISSN: 
Databázová aplikace 1 Aplikace soubory se sekvenčním přístupem
Stránkování Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Libor Otáhalík. Dostupné z Metodického portálu ISSN: 
Informatika pro ekonomy přednáška 8
Databázové systémy a SQL
Počítačová cvičení z předmětu Datové sklady
Microsoft Office Access
MU002 Informatika II Základy algoritmizace 1/13
Dotazovací jazyk SQL I.
Úvod do SQL Server Integration Services
BI řešení pro ne BI lidi Jiří Neoral BI Data Architect Dixons Carphone
Power BI Import dat, živé připojení a kompozitní modely
Výukový materiál zpracovaný v rámci projektu
Materiál byl vytvořen v rámci projektu
Jiří Vyskočil, Marko Genyg-Berezovskyj 2010
A5M33IZS – Informační a znalostní systémy
MS Access Tabulka letní semestr 2013.
Datové typy v jazyce C Datové typy void skalární aritmetické
Power BI – Best Practices
Power BI – Příprava dat Jiří Neoral
Command line nástroje Jednoúčelové, ale mocné nástroje pro transformace textu Jak získat: Linux (a Mac) – součást operačního systému Windows – musí se.
Informatika pro ekonomy přednáška 8
Informatika – Základní operace s buňkami
Algoritmizace a datové struktury (14ASD)
Seminář o stavebním spoření
Procesy – základní pojmy
Opakování ze 4. cvičení int a; printf("Zadej číslo: ");
Diagnostika dítěte předškolního věku
Union neboli sjednocení Bitová pole
Digitální učební materiál
SQL Server 2017: Automatic tuning
Transkript prezentace:

Power BI – Datové modelování a optimalizace Jiří Neoral BI Data Architect, Dixons Carphone CoE s.r.o. MVP: Data Platform jiri@neoral.cz | www.neoral.cz @JiriNeoral

Osnova VertiPaq Tvorba jednoduchého modelu (nákupní košík) Relace DAX Troubleshooting výkonu a toolset [RLS]

VertiPaq = xVelocity Engine V průběhu processingu (načítání do paměti) Načítání zdrojového datasetu tabulky do sloupcových struktur VertiPaq, kódování a komprese Tvorba slovníků a indexů pro každý sloupec Tvorba datových struktur pro vazby Počítání a komprese počítaných sloupců

Row Store

Column Store

Charakteristiky Column Store Přístup k jednotlivým sloupcům velmi rychlý Pokud výraz používá mnoho sloupců, algoritmus je komplexnější, musí přistupovat k různým blokům paměti v různých časech a uchovávat postup v nějakém dočasném úložišti Čím více sloupců potřebujeme pro výpočet, tím složitější je získat finální hodnotu, až se v extrému může engine rozhodnout vytvořit RowStore pro výpočet výrazu. Column store má za cíl omezit čas na čtení, využívá ale víc CPU k přetváření struktur

Komprese ve VertiPaq VertiPaq se snaží kompresí zmenšit nároky na paměť jednak kvůli lepšímu využití HW a menší model se dá rychleji přečíst z paměti a tím pádem dosahuje vyššího výkonu

VertiPaq Value Encoding (int datové typy, curr)

VertiPaq Dictionary Encoding

Dictionary Encoding – Postup + dopady Tvorba slovníku obsahujícího unikátní hodnoty Nahrazení sloupce integerem Dopady VertiPaq je nezávislý na datových typech Mohou se lišit maximálně velikosti slovníku Vyhněte se GUID a obecně vysoké kardinalitě

Run Length Encoding

RLE

Faktory ovlivňující kompresi Kardinalita Distribuce hodnot v rámci sloupce Počet řádků v tabulce Datový typ sloupce (ovlivňuje velikost slovníku) RLE je závislé na Sort Order

Po načtení sloupců ze zdroje Struktury pro relace Struktury hierarchií Počítané sloupce (nemohou být použity pro řazení) tedy SQL > DAX

Tvorba modelu (Demo) Načtení tabulek Relace Hierarchie chybí jednostranná obousměrná Hierarchie

DAX Počítané sloupce Measures Calculate

Trouble shooting výkonu VertiPaq Analyzer DAX Studio

PUG a další zdroje www.sqlbi.com Definitive quide to DAX https://www.pbiusergroup.com/home

Dotazy Jiří Neoral BI Data Architect, Dixons Carphone CoE s.r.o. MVP: Data Platform jiri@neoral.cz | www.neoral.cz @JiriNeoral