Analýza velkých dat strukturovaně či nestrukturovaně?

Slides:



Advertisements
Podobné prezentace
Stránka 1, © Vema, a. s.. Stránka 2, © Vema, a. s. Podnikové aplikace  Integrovaný podnikový systém (Integrated Business System):  komplex aplikací.
Advertisements

HRADLOVÁ POLE REKONFIGUROVATELNÁ ZA PROVOZU ZAŘÍZENÍ Soběslav Valach Ústav automatizace a měřicí techniky, FEKT, VUT Brno, Czech Republic.
Virtuální akademie Řešení privátního cloudu.
Robert Havránek Microsoft
Přednáška č. 1 Úvod, Historie zpracování dat, Základní pojmy
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
Přednáška č. 5 Proces návrhu databáze
1. 3 Business priorita Scénář Řešení Produkty Rozvoj a podpora Partneři.
Možnosti implementace temporálních Databází v Caché Lukáš Rychnovský
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
Tvorba webů pomocí Web CMS Michal Neuwirth Product Manager Kentico Software s.r.o. Ondřej Výšek Samostatný konzultant Optimalizovane-it.
Úvod do databází Databáze.
Databáze Jiří Kalousek.
Popis systému DBMAN. Obecná charakteristika Systém DBMAN vychází ze snahy maximálně zobecnit přístup k datům v jednoduchých databázích. Původním záměrem.
Platforma Windows Azure (v obrazech)
Jako intranet Bc. Jan Beneš. Intranet - obecná funkcionalita  sdílení dokumentů  diskusní fórum  databáze kontaktů  novinky a aktuality  firemní.
Architektura databází Ing. Dagmar Vítková. Centrální architektura V této architektuře jsou data i SŘBD v centrálním počítači. Tato architektura je typická.
Rozšíření jednouživatelské verze IS na víceuživatelskou Prezentace Diplomové práce Autor : Libor Tomášek Spoluautoři : Pobucký M., Drábek L. Vedoucí :
Vypracoval: Ondřej Dvorský Třída: VIII.A
Databázové systémy. Práce s daty Ukládání dat Aktualizace dat Vyhledávání dat Třídění dat Výpočty a agregace.
Databázové systémy Architektury DBS.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Informatika pro ekonomy II přednáška 10
CIS Cizinecký informační systém
Návrh a tvorba WWW Přednáška 5 Úvod do jazyka PHP.
Databáze.
Copyright (C) 1999 VEMA počítače a projektování, spol. s r.o.
Systémová integrace Big Data
uložené procedury (stored procedures) triggery, sekvence, pohledy, funkce, parametrické dotazy (prepared statements) komplexní agregace a SQL dotazy jiné.
organizační struktury Implementace EOS III na Olomouckém kraji Pro:Krajský rok informatiky 2005 Autor:Jan Kadlec Datum:
Databázové modelování
Redakční systém dopravní informace pro státní správu ISSS 4. dubna 2006.
Databázové systémy Informatika pro ekonomy, př. 18.
ISSS IS HN/SS Softwarová architektura informačního systému hmotné nouze a sociálních služeb Jindřich Štěpánek
INTERNET VE STÁTNÍ SPRÁVĚ A SAMOSPRÁVĚ 2008 © Copyright IBM Corporation 2008 Správa obsahu v podání IBM 7. – 8. dubna 2008 ibm.com/cz/public Daniel Beneš.
XML data na disku jako databáze Kamil Toman
Petr Šetka solutions architect Mainstream Technologies, s.r.o.
Global network of innovation easyXchange Milan Mydlář Siemens Business Services.
Microsoft SQL server Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T.G. Masaryka, Kostelec nad Orlicí.
1 E - S V Ě T S E T O Č Í S T Á L E R Y C H L E J I. S T A Č Í T E M U ? Fenix II –IS na platformě.NET Michal Varga.
Nasazení nástrojů BI pro analýzu dat z IS STAG Řešitel: Vladimíra Zádová Datum:
Vícerozměrný přístup pro indexování XML dat
Popis systému DBMAN (KEVIS). Obecná charakteristika Systém DBMAN vychází ze snahy maximálně zobecnit přístup k datům v jednoduchých databázích. Původním.
Databázové systémy Úvod, Základní pojmy. Úvod S rozvojem lidského poznání roste prudce množství informací. Jsou kladeny vysoké požadavky na ukládání,
WEBOVÝ PORTÁL O POČÍTAČOVÝCH HRÁCH ROMAN POSPĚCH.
Perzistence XML dat Kamil Toman
Klient pro správu databází MySQL 1 Klient pro správu databází MySQL Zbyněk Munzar České vysoké učení technické v Praze Fakulta elektrotechnická.
ORSOFT RADNICE OPEN – ÚVODNÍ SEZNÁMENÍ Petra Hoffmanová.
ICT – TEORIE A PRAXE – ŠKOLY A FIRMY Miloš Maryška, Katedra informačních technologií, VŠE Praha
Univerzitní informační systém VIII., Karlov 2009 Fulltextové vyhledávání v UIS Miroslav Prachař.
YOUR LOGO C# Entity Framework. YOUR LOGO  Entity framework nám poskytuje: -Vytváří objektový model na základě databázového schématu -Mapuje tabulky,
Co nového na SQL Serveru 2016 aneb koupit, či nekoupit?
A jeho praktická aplikace Štěpán Vacek Univerzita Hradec Králové Liberecké informatické fórum 2010.
BI-Exercise/Project Topics October 2016 TUL Ing. Athanasios Podaras, Ph.D.
Databázové systémy Roman Danel Institut ekonomiky a systémů řízení 2016.
Demoverze QI Informace pro partnery DCC
Databázové systémy přednáška 11 – NoSQL
Entity Framework Core - vo co de?
Business Inteligence – úvod
Ing. Athanasios Podaras, Ph.D 2016
Informatika pro ekonomy přednáška 8
METODOLOGIE PROJEKTOVÁNÍ
Jak načítat externí data na SQL Server
Úvod do SQL Server Integration Services
SQL Server Query Store Miloslav Peterka
Roman Péchal, Jan Čongva, Martin Durák
Vytvořil: Robert Döring
Využití strojového učení na SQL Serveru 2016/2017
SQL Server 2017: Automatic tuning
Transkript prezentace:

Analýza velkých dat strukturovaně či nestrukturovaně? Vladimír Mužný MVP: Data Platform | MCSE | MCT Vladimir.muzny@dropman.cz @VladimirMuzny Marek Chmel MVP: Data Platform | MCSE | MCT Marek.chmel@technet.cz @MarekChmel

Agenda What about NoSQL? And what about YesSQL? Vlastnosti SQL zdrojů dat a jejich implementace Vlastnosti NoSQL dat a jejich implementace

NoSQL? YesSQL? SQL: NoSQL Relační koncept Dlouholetá praxe Mnoho implementátorů Mnoho aplikací NoSQL Schema agnostický koncept Moderní aplikace Často open-source nebo komunitní projekt

Výhody a nevýhody „YesSQL“ konceptu Neměnná struktury Přísný k datům Široce rozšířený Nevýhody Složitá teorie návrhu Velmi složitá optimalizace Neměnné struktury Manipulace s daty přes dedikovaný driver

Výhody a nevýhody NoSQL konceptu Schema agnostičnost Schéma informace je dáno informací samotnou, ne složitě předchystaným designem Flexibilita Přístup prakticky jakkoliv Od webAPI… … až po notepad Nevýhody Poměrně mladý Není přísný k datům (co neuložím, neexistuje)

CO JEN VYBRAT??

„YesSQL“ na MS SQL Serveru Stírá se rozdíl mezi on-premise a Azure On-premise Data in-house Plná funkcionalita Nároky na správu Složitá topologie pro velká data Azure Azure SQL Database Azure SQL Server Azure SQL Data Warehouse Managed Instances

Storage struktury MS SQL a Velká data I Data pages – row based data Random I/O Složitá indexace B+-trees

Storage struktury MS SQL a Velká data II Columnstore Nonclustered columnstore Odbourání konkurence random I/O a sequence reads Přímočarý návrh Clustered columnstore Velká fakta Velké dimenze Omezení DT

TAK UKAŽ!

Storage struktury MS SQL a Velká data III In-Memory OLTP Primárně pro rychlou manipulaci s daty Data rezidují v operační paměti REAL-TIME OPERATIONAL ANALYTICS

MS SQL Server v Azure GDPR COMPLIANT!!! Azure SQL Database Database as a Service Menší databáze Nikdy více databází pro jeden IS Azure SQL Server VM hostovaná v Azure Veškerá správa je na administrátorovi Azure SQL Data Warehouse Shluk SQL Serverů Compute and Storage Load balance pomocí Polybase Drahé, ale výkonné

Charakteristiky NoSQL konceptu Častý formát uložení dat: JSON UTF-8 Čitelný Přirozený strom Méně „upovídaný“ než XML Hlavní účel: rychlý přísun malých dat Stav letů GPS sledování vozidel Sledování výrobních procesů Gaming

Implementace NoSQL MongoDB CosmosDB Komunitní projekt Umí uložit i binární data (BSON) CosmosDB Azure-only Implementuje několik typů úložišť Velmi progresivní koncept

Cosmos DB Globálně distribuovaná Nativně indexovaná Až do třech regionů Nativně indexovaná Interní indexy Linearizovaný strom do B-tree Konzistentní v závislosti na požadavku Strong Bounded Staleness Session Consistent Prefix Eventual Různá nachystaná API

Storage v CosmosDB

Architektura CosmosDB

TAK UKAŽ!

Resumé YesSQL NoSQL Tradiční koncept Rigidní struktury Umí i „rychlá“ data (in-memory OLTP) SQL dotazování Umí JSON (ale neindexuje) NoSQL Moderní Konzistentní v závislosti na požadavku Dobrá podpora např. serverless a mobilních aplikací, IoT SQL-like dotazování