Netezza – to pravé řešení pro Vaše náročné analytické potřeby Martin Pavlík 14. Června 2011.

Slides:



Advertisements
Podobné prezentace
SoftPC SQL Prezentace nového SQL modulu Mzdy a personalistika
Advertisements

PRŮZKUM NA TÉMA: „Dopady finanční krize“ eficia .
ARBES FEIS [BI] ARBES Technologies, s.r.o.
KIV/ZIS Cvičení 6 SQL - SELECT.
Easy CRM Posys,spol. s r.o. Duben Hlavní kategorie sw AdresářAktivityPenízeWorkflowZnalostiPoštaSpráva.
Mainstream Technologies, s.r.o.
Ing. Jan Mittner Profiling aplikací 2. Zend_Cache 3. Optimalizace výkonu databáze 4. Optimalizace rychlosti načítání webu 5. Další tipy.
Zpracování SQL Lubomír Andrle 5. přednáška
Robert Havránek Microsoft
Základy databázových systémů
DB1 – 9. cvičení Optimalizace dotazu Konkurenční přístup a deadlock Indexace Transakce.
Elektronický obchod. Požadavky na funkčnost aplikace nabídka zboží zboží se může prodávat za různé ceny (akční nabídky, sezónní výprodeje) evidence zákazníků.
Fakulta elektrotechniky a informatiky
Zpracování komplexních událostí a Apama Michal Džmuráň
Architektury a techniky DS Tvorba efektivních příkazů I Přednáška č. 3 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
IS V EKONOMICKÝCH SUBJEKTECH Ing. Jiří Šilhán. IS IS – data+lidi+HW, prvky + relace mezi uživateli, které splňují nějaké cílové chování – tak aby byly.
Siemens PLM Software © Siemens Product Lifecycle Management Software Inc. All rights reserved Využití CAM Express pro řízení obráběcích strojů a.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
A4B33DS & X33MIS Zdeněk Kouba
Temporální Databáze Jaroslav Dražan. Čím se budeme zabývat Proč je čas v DB důležitý Práce s časem pomocí klasického SQL Reprezentace časové domény Spojování.
Úvod do databází Databáze.
M O R A V S K O S L E Z S K Ý K R A J 1 Vedení správních řízení ve spisové službě a statistika vyřizování dokumentů.
© 2010 IBM Corporation Stanislav Michelfeit, IBM IDC ČR, Služby – výzkum a výuka IT jako služba SSME - Service – Science, Management and Engineering =
Netezza – to pravé řešení pro analytický datový sklad – technický pohled na řešení Martin Pavlík 23. Listopadu 2011.
Vnější paměť Ukládání dat pouze do operační paměti by při práci s počítačem nestačilo. Pro uchování vytvořených dat mají počítače ještě další, tzv. diskové.
© IBM Corporation Smart Computing Martin Pavlík – Data integration technical presale, Netezza System Engineer.
1 | Kaspersky Endpoint Security Přehled. 2 | Kaspersky Endpoint Security Kaspersky Endpoint Security for Windows Kaspersky Endpoint Security for Mac Kaspersky.
Školení správců II. Petr Pinkas RNDr. Vít Ochozka.
Intelligent Technologies, s.r.o. Optimalizace CPM Everest.
Architektura databází Ing. Dagmar Vítková. Centrální architektura V této architektuře jsou data i SŘBD v centrálním počítači. Tato architektura je typická.
Informační systémy Tomáš Maděra.
Oracle Linux Jakub Ježek 3IT. Přednosti Oracle Linuxu Rychlost : Je o 75% rychlejší než Red Hat Enterprice Linux Moderní funkce : Přináší zákazníkům všechny.
ŘÍZENÍ RETAILINGOVÉ FIRMY
Netezza – to pravé řešení pro analytický datový sklad Martin Pavlík 23. Listopadu 2011.
Microsoft System Center Operations Manager
1 Informační systém autoservisu Softwarové inženýrství 2003.
Databázové systémy. Práce s daty Ukládání dat Aktualizace dat Vyhledávání dat Třídění dat Výpočty a agregace.
Databázové systémy Architektury DBS.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Bezpečnost IS David Krch Solutions Specialist IS Technolog. Fyzická Osobní Organizační Komplexní pohled na bezpečnost Technolog. IS.
Databázové systémy II Přednáška č. X Ing. Tomáš Váňa, Ing. Jiří Zechmeister Fakulta elektrotechniky a informatiky
Informační systémy TPS,MIS, SIS.
Multiplatformní, řídící systém elektronického vzdělávání pro školy eDoceo Multiplatformní, řídící systém elektronického vzdělávání pro školy Tomáš Hrdonka.
Letsim 1 letecký simulátor Prezentace projektu - 36SI.
Základní principy řešení a využití ERP aplikací
IBM Global Services ČR © 2006 IBM Corporation April, 2006 E-stát a EU Pavel Hrdlička.
Obecné informace Příklad procesu a práce s IS Využití pro manažerské rozhodování (analytické a statistické výstupy) xsebm172.
DATABÁZOVÉ SYSTÉMY. 2 DATABÁZOVÝ SYSTÉM SYSTÉM ŘÍZENÍ BÁZE DAT (SŘBD) PROGRAM KTERÝ ORGANIZUJE A UDRŽUJE NASHROMÁŽDĚNÉ INFORMACE DATABÁZOVÁ APLIKACE PROGRAM.
© 2007 IBM Corporation Duben, 2007 Dokumentová řešení IBM pro státní správu Daniel Beneš.
Výpočetní Cluster “Mazlik” Nové Hrady FROV JU Jihočeská univerzita v Českých Budějovicích Bc. Martin Šafánek.
Gymnázium, SOŠ a VOŠ Ledeč nad Sázavou I NFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE Ing. Jan Roubíček.
Prof. Molnár1 Podnikové informační systémy Outsourcing IS/IT a ASP Prof. Ing. Zdeněk Molnár, CSc Ústav řízení a ekonomiky podniku
Informační systémy Tomáš Maděra. Historie společnosti LCS International, a.s. založeno 1990 česká firma z aložení dceřiné společnosti na Slovensku.
Delphi a databáze MS SQL Server.
Data Warehousing Růst obratu: $10 miliard v 1999
Administrace Oracle Paralelní zpracování.
SQL Server 2008 SKUs -All prices are ‘Open’ rounded up -Workgroup ~$140/CAL *Require a CAL to connect to paid SKUs **Free download with MSDN subscription.
ECM – Enterprise Content Management
Architektura databází DBS=SŘBD+DB
YOUR SYSTEM, spol. s r. o. Ing
Klient pro správu databází MySQL 1 Klient pro správu databází MySQL Zbyněk Munzar České vysoké učení technické v Praze Fakulta elektrotechnická.
24 Používání relačních databází (základní pojmy a principy z oblasti relačních databází, struktura databáze,oblasti použití relačních databází, vkládání.
Diskový oddíl. Diskové oddíly (partition) slouží k rozdělení fyzického disku na logické oddíly, se kterými je možné nezávisle manipulovat jeden disk se.
AS/400 (IBM iSeries) Úvod. Co vlastně je AS/400 (IBM i)? Aplikační systém 400 (AS/400) byl navržen jako počítač obecně použitelný v obchodním prostředí.
Ing. Athanasios Podaras, Ph.D 2016
Databázová aplikace 1 Aplikace soubory se sekvenčním přístupem
Optimalizace SQL dotazů
Business intelligence shapes security
Správa disků
Roman Péchal, Jan Čongva, Martin Durák
Transkript prezentace:

Netezza – to pravé řešení pro Vaše náročné analytické potřeby Martin Pavlík 14. Června 2011

2 Napříč odvětvími Retail Telekomunikace Digitální media Zdravotnictví Věda a výzkum Finanční instituce Veřejný sektor Energetika Co Netezza dodává Vysoce výkonné appliance Řešení pro ukládání a dotazování nad PB dat Datové sklady a pokročilé analýzy Filozofie Jednoduchost po všech stránkách Akvizice IBM Netezza se stává součástí portfolia produktů brandu Information Management Co je Netezza? Firma Špičková technologie pro oblast datových skladů Zaměstnanci 500+ Zákazníci 500+ Reference 400+ Kde působí? Po celém světě Zejména však v severní Americe

Co Netezza dodává Vysoce výkonné appliance Řešení pro ukládání a dotazování se nad PB dat Datové sklady a pokročilé analýzy 3 Co Netezza dodává Vysoce výkonné appliance Řešení pro ukládání a dotazování se nad PB dat Datové sklady a pokročilé analýzy  Rychlost  Škálovatelnost  Jednoduchost  Chytrost

Co je to appliance v případě Netezzy?

Aby to bylo komplikované Aby to bylo hooooodně drahé Proč appliance? Aby to EFEKTIVNĚ FUNGOVALO A co vlastně má efektivně fungovat? Vyhodnocování analytických / ad-hoc dotazů

Není OLTP databázovým serverem – Není vhodná jako db pod ERP, CRM,... Co Netezza není? Kde Netezza fakticky nemá konkurenci? Náročné Analytické dotazy Ad-hoc dotazy Když jsou konvenční technologie maximálně vyladěné pro konkrétní dotazovací potřebu Má co do činění s velmi malým objemem dat Kdy Netezza obvykle není rychlejší?

Analytik IT Potřeboval bych vyhodnotit závislost mezi vzděláním a velikosti bytu. OK. Musíme udělat řadu statistik, nastavit správně indexy a partitioning. 5 dní práce to spraví

Analytik IT Paráda. Mockrát děkuji. Hned to zkusím. Hotovo. Můžete spustit Váš analytický dotaz.

Analytik IT Výborně. Vidím tady pěkné závislosti. Teď bych se na to potřeboval podívat ještě jinak Ale ale, to jsou k nám hosti. No, tak to máme dalších 5 dní práce Neeee !!! Tady se nedá pracovat !

A teď s Netezzou...

Analytik IT Potřeboval bych vyhodnotit závislost mezi vzděláním a velikosti bytu.

Analytik IT Výborně. Vidím tady pěkné závislosti. Teď bych se na to potřeboval podívat ještě jinak. S Netezzou můžu dotaz zadat hned. Odpověď bude za stejnou dobu IT se může věnovat něčemu jinému

MPP architektura – Koncept “Shared Nothing” – Rozdělení práce na několik menších úloh Velká úloha je rozdělena vertikálně do série menších úloh Menší úlohy běží paralelně / naprosto nezávisle Pro každou menší úlohu je přiděleno stejné množství fyzických zdrojů Komunikace mezi jednotlivými úlohami je jen na začátku a konci Přínosy – Obrovské úlohy jsou vykonány ve významně kratším čase – Maximální využitelnost zdrojů Masivní paralelní architektura “Rozděl a panuj”

Massively Parallel Intelligent Storage  Network Fabric SMP Host Front End Netezza TwinFin Appliance High-Speed Loader/Unloader ODBC 3.X JDBC Type 4 OLE-DB SQL/92 Execution Engine SQL Compiler Query Plan Optimize Admin Source Systems Client High Performance Loader 3rd Party Apps DBA CLI ETL Server SOLARIS LINUX HP-UX AIX WINDOWS TRU64 High-Performance Database Engine Streaming joins, aggregations, sorts S-Blade Processor & streaming DB logic S-Blade Processor & streaming DB logic S-Blade Processor & streaming DB logic S-Blade Processor & streaming DB logic

High-Performance Database Engine Streaming joins, aggregations, sorts S-Blade Processor & streaming DB logic S-Blade Processor & streaming DB logic S-Blade Processor & streaming DB logic S-Blade Processor & streaming DB logic Execution Engine Massively Parallel Intelligent Storage  Network Fabric SMP Host Front End Netezza TwinFin Appliance High-Speed Loader/Unloader SQL Compiler Query Plan Optimize Admin SQL Snippets SQL Source Systems Client High Performance Loader 3rd Party Apps DBA CLI ETL Server SOLARIS LINUX HP-UX AIX WINDOWS TRU64

Zpracování toku dat jednotkou S-Blade Jádro (Core) FPGAJádro CPU Dekomprese dat Projekce Selekce, Autorizace Komplexní ∑ Joiny, Aggr, atd. Datová Cache Select sex, age, count(*) From MultiBillionRowTable Where BirthDate < ’01/01/1967’ And PostCode like ’SW%’ Group by sex, age; Každý S-Blade obsahuje 8 n-tic s vlastním: Diskem Datovou cache Jádrem FPGA jednotky Jádrem CPU

High-Performance Database Engine Streaming joins, aggregations, sorts, etc. S-Blade Processor & streaming DB logic S-Blade Processor & streaming DB logic S-Blade Processor & streaming DB logic S-Blade Processor & streaming DB logic Asymmetric Massively Parallel Processing™ Massively Parallel Intelligent Storage  Network Fabric SMP Host Front End Netezza TwinFin Appliance High-Speed Loader/Unloader SQL Compiler Query Plan Optimize Admin Consolidate Execution Engine ODBC 3.X JDBC Type 4 OLE-DB SQL/92 Source Systems Client High Performance Loader 3rd Party Apps DBA CLI ETL Server SOLARIS LINUX HP-UX AIX WINDOWS TRU64

18 The Netezza TwinFin™ Appliance SQL Compiler Query Plan Optimalizátor Administrace Každý disk je rozdělen na 3 oblasti: Uživatelská data „Swap“ „Mirror“ SMP Servery Jednotky S-Blade™ (s databázovým akcelerátorem FPGA) Disky

19 Produkty rodiny Netezza SkimmerTwinFin Většinou jako: systém pro vývoj systém pro testování Datový sklad Náročné analytické úlohy 1 TB to 10 TB1 TB to 1.5 PB

20 Základní přínosy řešení NETEZZA Rychlost Datový streaming realizovaný přímo na úrovni HW (díky FPGA) Škálovatelnost skutečná MPP architektura Jednoduchost Black-box Žádné ladění Téměř žádná administrace Inteligence Vestavěné funkce pro pokročilé analýzy vykonávány přímo nad db s využitím masivního paralelismu

Konkurenční technologie mají obrovské množství parametrů a databázových objektů, které pomáhají výrazně zlepšovat výkonnost systémů. Musejí být tedy lepší. Netezza má celou řadu z nich taky, ale jejich hodnoty si spravuje sama a nezatěžuje tím uživatele. Používá tedy vlastně jakési implicitní hodnoty parametrů Jenže v případě Netezzy platí: Výkonnost systému s implicitními parametry je dostatečná Tak takhle nějak jsem se na to tvářil poprvé, podruhé,... a ještě mockrát,... Těším se na Vaše dotazy Martin Pavlík