Jak načítat externí data na SQL Server

Slides:



Advertisements
Podobné prezentace
Ing. David Pejčoch Tutorial
Advertisements

Základy jazyka SQL Jan Tichava
Základy databázových systémů
SQL: DDL v ORACLE CREATE TABLE jméno_tabulky (atribut datový_typ [DEFAULT][attribut_constraint] [, atribut datový_typ [DEFAULT] [attribut_constraint]],...
Aplikační a programové vybavení
Microsoft Office Access
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
Modelování procesů pomocí workflow
SAS Jan Blaťák Laboratoř vyhledávání znalostí Fakulta informatiky Masarykova Univerzita, Brno
Integrační služby MS SQL Server a BIDS.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
Úvod do databází Databáze.
M O R A V S K O S L E Z S K Ý K R A J 1 Vedení správních řízení ve spisové službě a statistika vyřizování dokumentů.
Databáze výhody a nevýhody Ing. Emilie Šeptáková
Platforma Windows Azure (v obrazech)
Školení správců II. Petr Pinkas RNDr. Vít Ochozka.
Rozšíření jednouživatelské verze IS na víceuživatelskou Prezentace Diplomové práce Autor : Libor Tomášek Spoluautoři : Pobucký M., Drábek L. Vedoucí :
Databázové systémy teorie a návrh relačních databázových systémů část II.
Relační databáze.
Vypracoval: Ondřej Dvorský Třída: VIII.A
Databázové systémy. Práce s daty Ukládání dat Aktualizace dat Vyhledávání dat Třídění dat Výpočty a agregace.
Databázové systémy Architektury DBS.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
KIV/ZIS cvičení 6 Tomáš Potužák. Pokračování SQL Klauzule GROUP BY a dotazy nad více tabulkami Stáhnout soubor studenti_dotazy_sql.mdb.
Principals, Securables, Schema Vít Ochozka. Entity databáze - zdroje Securables –Entity databáze (zdroje), ke kterým SQL reguluje přístup podle práv –Hierachie.
LiveContent Univerzální Formulářové Řešení Michal Petrtýl, Marek Beneš.
Architektury a techniky DS Cvičení č. 9 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
Copyright (C) 1999 VEMA počítače a projektování, spol. s r.o.
Copyright (C) 2000 Vema, a. s.1 V3 klient Michal Máčel Provozní integrace G2, HR/Win a internetu.
Systémová integrace Big Data
ADO – práce s databázemi
DATABÁZOVÉ SYSTÉMY. 2 DATABÁZOVÝ SYSTÉM SYSTÉM ŘÍZENÍ BÁZE DAT (SŘBD) PROGRAM KTERÝ ORGANIZUJE A UDRŽUJE NASHROMÁŽDĚNÉ INFORMACE DATABÁZOVÁ APLIKACE PROGRAM.
organizační struktury Implementace EOS III na Olomouckém kraji Pro:Krajský rok informatiky 2005 Autor:Jan Kadlec Datum:
Databázové modelování
Dynamic SQL P. Částek. Dynamic SQL Embedded SQL je překládaný preprocesorem => za běhu nelze nechat uživatele rozhodovat o vzhledu samotných SQL příkazů.
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUM VY_32_INOVACE_01B13 Autor Ing. Jiří Kalousek Období vytvoření březen.
EGovernment Struktura služeb a řešení. Obsah 1.Požadavky KIVS a řešené problémy 2.Vývoj koncepcí 3.Stávající KIVS a její rozvoj v souladu s koncepcemi.
SOA = Architektura orientovaná na služby
Databázové Aplikace Slidy ke cvičení DBI026, část 3 KSI MFF UK Verze
Milan Cvrkal Dynamics ERP Insider Product Specialist Czech Republic Microsoft.
Microsoft SQL server Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T.G. Masaryka, Kostelec nad Orlicí.
Delphi a databáze MS SQL Server.
1 E - S V Ě T S E T O Č Í S T Á L E R Y C H L E J I. S T A Č Í T E M U ? Fenix II –IS na platformě.NET Michal Varga.
Databázové aplikace v Delphi
Protálová řešení Příklady reálných nasazení Tomáš Kutěj System Engineer Microsoft.
Klient pro správu databází MySQL 1 Klient pro správu databází MySQL Zbyněk Munzar České vysoké učení technické v Praze Fakulta elektrotechnická.
24 Používání relačních databází (základní pojmy a principy z oblasti relačních databází, struktura databáze,oblasti použití relačních databází, vkládání.
Úvod do databází zkrácená verze.
B2B Systémová integrace Jiří Macháček. Osnova ► Úvod ► Terminologie ► Parametry – požadavky ► Způsoby integrace ► Web-Services ► Příklady.
YOUR LOGO C# Entity Framework. YOUR LOGO  Entity framework nám poskytuje: -Vytváří objektový model na základě databázového schématu -Mapuje tabulky,
NÁZEV ŠKOLY:SOŠ Net Office, spol. s r.o. Orlová Lutyně
Databázové systémy přednáška 5 – Přístup na data
Databázové systémy přednáška 6 – Indexy
Unix a Internet 9. SQL server
Budování Integrovaného informačního systému Národního památkového ústavu Petr Volfík, NPÚ ÚP
Ing. Athanasios Podaras, Ph.D 2016
Technologie ADO.NET Technologie ADO.NET
R nejen v SQL Serveru Jiří Neoral BI Data Architect
Identity management v UIS
Informatika pro ekonomy přednáška 8
Databázové systémy a SQL
Šablona 32 VY_32_INOVACE_038.ICT.34
Databázové systémy a SQL
Úvod do SQL Server Integration Services
Roman Péchal, Jan Čongva, Martin Durák
Přednáška 9 Triggery.
Analýza velkých dat strukturovaně či nestrukturovaně?
WORDPRESS AFFILIATE DATA V XML.
Využití strojového učení na SQL Serveru 2016/2017
Transkript prezentace:

Jak načítat externí data na SQL Server Mgr. Vladimír Mužný MVP: Data Platform | MCSE: Data Platform | MCT vladimir.muzny@dropman.cz @VladimirMuzny

Motivace Data vznikají a jsou distribuována různými kanály Proto je nutná jejich konsolidace Je konsolidace vždy nutná? Jak se vyznat v nástrojích pro zpracování externích dat na SQL Serveru? Linked server bcp BULK INSERT SSIS ADF Polybase

Co jsou to externí data? Jiná relační databáze Flat files MS SQL Server Jiný stroj Flat files Uloženy on-premises Uloženy v cloudu Semistrukturované soubory (JSON, XML) NoSQL data Mongo DB Cosmos DB (Azure) Hadoop Bloby (obrázky, videa)

Další otázky kladené v souvislosti s externími daty Potřebujeme tato data real-time, nebo sneseme „data delay“? Existuje rozumný dostupný nástroj pro přístup k externím datům? Chceme z vlastních dat také dělat externí data? Předchozí dotazy podle odpovědi pomáhají s volbou technologie

Linked Servers Serverový objekt SQL Serveru Uložená definice providera, umístění a credentials Umožňuje přímé dotazy do cizího zdroje dat

bcp Příkazová řádka dodávaná spolu se SQL Serverem Výhody: Umí směr dovnitř i ven Nevýhody Značně nepřehledná (velké množství command switches) Není to T-SQL příkaz (nelze zavolat ze SQL Serveru, kromě velmi nebezpečného povolení xp_cmdshell)

Příklad užití bcp Vygenerování fmt souboru Export dat ze SQL Serveru bcp database.schema.tabulka format nul –f „cesta\format.fmt“ –T –c Export dat ze SQL Serveru bcp database.schema.tabulka OUT „cesta\outputsoubor.bcp“ –T –c Import dat na SQL Server Bcp database.schema.tabulka IN „cesta\outputsoubor.bcp“ –T -c

BULK INSERT SQL Příkaz Na rozdíl od klasického INSERT vkládá data netransakčně Velmi rychlý Příklad BULK INSERT tabulka FROM ‘cesta\outputsoubor.bcp’ WITH (DATAFILETYPE = ‘Char’)

XML/JSON Soubory SQL Server umí data číst z disku Další zpracování už záleží na formátu (XML funkce, JSON funkce) Zápis zpátky na disk jedině přes bcp DECLARE @soubor xml = (SELECT * FROM OPENROWSET(BULK ‘soubor’, SINGLE_CLOB) AS corrName) Poznámka: OPENROWSET se nemusí explicitně povolovat

SQL Server Integration Services (nejen) ETL řešení dodávané spolu s SQL Serverem Primárně určeno pro neprogramátory Přesto obsahuje všechny náležitosti programování Rozšiřitelné o vlastní komponenty .NET programování „Pomalé“ přesuny dat, např. do DWH Řízení toku transformací dat Schopnost spouštět uložené procedury, příkazovou řádku apod.

Architektura SSIS Control Flow Data Flow Přípravné a úklidové úlohy (FTP download, File system, …) Spuštění Data Flow Task „algoritmus“ Containers Precedence constraints Variables Data Flow Samotné ETL (source, transformations, destination)

Životní cyklus vývoje a nasazení Vývoj v SQL Server Data Tools (Visual Studio) Nasazení: Package Deployment (zastaralý) Project Deployment Centrální databáze SSISDB na SQL Serveru Metadata Monitoring Diagnostika Environments

Vestavěná užití SSIS Maintenance Plans Správa SQL Serveru BACKUP ALTER INDEX… REBUILD/REORGANIZE A další Data Collection (sledování výkonnosti) Načítání dat ze sledovaných SQL Serverů Ukládání dat do MDW Pomocné administrátorské akce Přenos loginů mezi SQL Servery

Azure Data Factory Transformační služba v Azure Vývoj na webu (přes Azure Portal) Placení za spuštění Umožňuje integraci s SSIS na webu

ADF objekty Linked Service: connection string pro získání/uložení datasetu Dataset: Jedna sada záznamů Activity: transformační akce Pipeline: Batch pro spuštění transformace

Polybase Enterprise feature od SQL Serveru 2016 Slouží k: Masivně paralelnímu zpracování dat na více SQL Serverech Propojení relačních a nerelačních dat Jednotné dotazování v T-SQL Stojí na pozadí Azure SQL DWH

Architektura Polybase

Polybase: External Tables Externí tabulky jsou napojením na Hadoop data Zabezpečení Zdroj dat Formát dat Ext. tabulka CREATE MASTER KEY; CREATE DATABASE SCOPED CREDENTIAL AzureStorageCredential WITH IDENTITY = 'user', SECRET = '<azure_storage_account_key>' ; CREATE EXTERNAL DATA SOURCE AzureStorage WITH ( TYPE = HADOOP, LOCATION = 'wasbs://<blob_cnt_name>@<azure_storage_acc_name>.blob.core.windows.net', CREDENTIAL = AzureStorageCredential ); CREATE EXTERNAL FILE FORMAT TextFile WITH ( FORMAT_TYPE = DelimitedText, FORMAT_OPTIONS (FIELD_TERMINATOR = ',') ); CREATE EXTERNAL TABLE dbo.DimDate2External ( DateId INT NOT NULL, CalendarQuarter TINYINT NOT NULL, FiscalQuarter TINYINT NOT NULL ) WITH ( LOCATION='/datedimension/', DATA_SOURCE=AzureStorage, FILE_FORMAT=TextFile );

Kde se dozvědět více? Kurzy GOPAS, a. s. MOC 20767 – MS SQL Server: Implementace datového skladu GOC 670 – Úvod do strojového učení na SQL Serveru a v Azure A další na téma SQL Serveru

Dotazy Mgr. Vladimír Mužný MVP: Data Platform | MCSE: Data Platform | MCT vladimir.muzny@dropman.cz @VladimirMuzny