Netezza – to pravé řešení pro analytický datový sklad Martin Pavlík 23. Listopadu 2011
2 Napříč odvětvími Retail Telekomunikace Digitální media Zdravotnictví Věda a výzkum Finanční instituce Veřejný sektor Energetika Co Netezza dodává Vysoce výkonné appliance Řešení pro ukládání a dotazování nad PB dat Datové sklady a pokročilé analýzy Filozofie Jednoduchost po všech stránkách Akvizice IBM Netezza se stává součástí portfolia produktů brandu Information Management Co je Netezza? Firma Špičková technologie pro oblast datových skladů Zaměstnanci 500+ Zákazníci 500+ Reference 400+ Kde působí? Po celém světě Zejména však v severní Americe
Co je to appliance v případě Netezzy?
Aby to bylo komplikované Aby to bylo hooooodně drahé Proč appliance? Aby to EFEKTIVNĚ FUNGOVALO A co vlastně má efektivně fungovat? Vyhodnocování analytických / ad-hoc dotazů
Není OLTP databázovým serverem – Není vhodná jako db pod ERP, CRM,... Co Netezza není? Kde Netezza fakticky nemá konkurenci? Analytické dotazy (např. statistika, data mining) Ad-hoc dotazy Když jsou konvenční technologie maximálně vyladěné = obrovská investice času a peněz pro konkrétní dotazovací potřebu – např. statické reporty objem dat je to 1 TB Kdy Netezza obvykle není rychlejší?
6 Používali byste dále Google, kdyby získání odpovědi na Váš dotaz trvalo 3 dny a bylo k tomu potřeba 7 lidí? Information Management
Téměř 70% implementací datových skladů se setkává s výkonnostními problémy různého charakteru. 7 ” “ - Gartner 2010 Magic Quadrant nasazení systému trvá měsíce poměrně velká potřeba specialistů neustálá potřeba ladění zpracování dotazů v desítkách hodin až dnech Information Management
Logický datový sklad – další vývojový krok - I Datový sklad dnes –Základ performance management systému Typicky největší databáze v organizaci Postavena často na OLTP db platformách Analytická zátěž db je jiná než zátěž při OLTP či statickém reportingu Nové datové zdroje, Nestrukturovaná data
Logický datový sklad – další vývojový krok - II vnímá rok 2011 jako zásadní rok v pohledu na „warehousing“ –„Traditional enterprise data warehouse vision has, in general, not been achieved“ –Začíná se uplatňovat koncept tzv. „Logického datového skladu“. Základními principy jsou: Zpracování úloh na odpovídajících technologiích Koordinace správy systému a data governance
Logický datový sklad – další vývojový krok - III Požadavky, které musí být splněny: –Výkonnost a specializace –Přenášení dat mezi uzly –Virtualizace dat –Sofistikovaná centrální správa
Smart computing – praktické využití – jeden ze scénářů 1.Nové zdroje generují obrovské objemy dat 2.Předzpracování a případná filtrace relevantních dat 3.Uložení dat do logického DWH Pokročilá analytika nad PB dat odhaluje vzory chování a zjednodušuje detekci nových podobných vzorů Zákazníkovo aktuální chování v prodejně / v eShopu či jinde je s využitím dat z logického DWH prostředky operační analýzy vyhodnoceno a zákazník dostává cílenou nabídku
12 Produkty rodiny Netezza Netezza 100 (Skimmer)Netezza 1000 (TwinFin)Netezza C1000 (Cruiser) systém pro vývoj systém pro testování Datový sklad Náročné analytické úlohy Archivní řešení s možností velmi rychlého dotazování až 10 TBaž 32 TB – 64 TB TB PB500 TB – 10 PB cca Kč za 1 TB uživatelských dat Kč / 1 TB Jedná se o list price v úrovni base line (např. zákazníci v úrovni J mají list price automaticky o 20% nižší)
13 Srovnání cenových principů NETEZZATERADATAORACLE Cena za TBVyšší PricingJedna položka za vše (včetně advanced analytics) KomplexníExtrémně komplexní Cena za servicesNejsou potřebaTeradata professional services jsou velmi drahé Výrazně navyšují TCO
Reference u zákazníků známých v ČR
Netezza překonává složitosti, které připravují tradiční datové sklady o jejich plný potenciál Citace zákazníků
Information Management 16 Výkonný analytický engine Appliance (mix. HW, SW) Standardní rozhraní Velmi nízké TCO Speed: x rychlejší než tradiční systémy Simplicity: Minimální administrace a ladění Scalability: od 1 TB až po PBs dat Smart: Vysoce výkoná pokročilá analytika out of the box IBM Netezza Jednoduchá Appliance pro smysluplné analýzy.
Konkurenční technologie mají obrovské množství parametrů a databázových objektů, které pomáhají výrazně zlepšovat výkonnost systémů. Musejí být tedy lepší. Netezza má celou řadu z nich taky, ale jejich hodnoty si spravuje sama a nezatěžuje tím uživatele. Používá tedy vlastně jakési implicitní hodnoty parametrů Jenže v případě Netezzy platí: Výkonnost systému s implicitními parametry je dostatečná Tak takhle nějak jsem se na to tvářil poprvé, podruhé,... a ještě mockrát,... Těším se na Vaše dotazy Martin Pavlík