Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

R nejen v SQL Serveru Jiří Neoral BI Data Architect

Podobné prezentace


Prezentace na téma: "R nejen v SQL Serveru Jiří Neoral BI Data Architect"— Transkript prezentace:

1 R nejen v SQL Serveru Jiří Neoral BI Data Architect
Dixons Carphone CoE s. r. o.

2 Osnova Představení R obecně R & Microsoft Úvod do syntaxe Příklady R
pro vizualizaci v SQL Serveru v SSRS v Power BI v Azure ML

3 R R je implementací jazyka S (a nedělám si legraci)
Integrovaná sada softwaru pro práci s daty, výpočty a grafické zobrazení Open Source In – Memory & Defaultně jedno jádro Rozšiřitelné prostředí r-project.org

4 R + Microsoft Microsoft R Server dříve Revolution R for Enterprise
specializované konektory pr SQL Server, Hadoop, Oracle, Teradata ... Azure ML – používá R interně Power BI R jako zdroj R vizualizace R pro čištění dat (nové) SQL Server volá R ze SQL Serveru

5 Základní operátory Operace Operátor Příklad Subtract - 5 - 4 = 1 Add +
5 + 4 = 9 Multiply * 5 * 4 = 20 Divide / 5 / 4 = 1.25 Raise to the power ^ 5 ^ 4 = 625 Modulus %% 9 %% 4 = 1 Integer division %/% 9 %/% 4 = 2 Basic sequence : 1:3 = 1, 2, 3

6 Stavy Operace Operátor Příklad Less than < 5 < 5 = FALSE
Less than or equal to <= 5 <= 5 = TRUE Greater than > 5 > 5 = FALSE Greater than or equal to >= 5 >= 5 = TRUE Equal all.equal() all.equal( , ) is TRUE Exactly equal == ( ) == ( ) is FALSE, 2 == 2 is TRUE Not equal != ( ) != ( ) is TRUE, 2 != 2 is FALSE

7 Přiřazení do proměnné Operace Operátor Příklad
Create / update a variable <- a <- 10

8 Accessors Operace Operátor Příklad Use public function from package ::
memisc::cases() Use private function from package ::: optiRum:::pounds_format() Get a component e.g a data.frame column $ iris$Sepal.Length Extract a property from a class @ Refer to positions in a data.frame or vector [ ] iris[5:10,1] Refer to item in a list [[ ]] list(iris=iris,mtcars=mtcars)[["iris"]]

9 Logické operátory Operace Operátor Příklad Less than <
5 < 5 = FALSE Less than or equal to <= 5 <= 5 = TRUE Greater than > 5 > 5 = FALSE Greater than or equal to >= 5 >= 5 = TRUE Equal all.equal() all.equal( , ) is TRUE Exactly equal == ( ) == ( ) is FALSE, 2 == 2 is TRUE Not equal != ( ) != ( ) is TRUE, 2 != 2 is FALSE

10 Meta-Operátory Operace Operátor Příklad Comment # # This is my comment
Help ? ?data.table Identifier ` `1`<-2

11 Datové typy Datový typ Příklad Integer 1 Logical TRUE Numeric 1.1
String / character “Red” Factor (enumerated string) “Amber” or 2 in c(“Red”,“Amber”,“Green”) Complex i Date “ ”

12 Datové struktury Datový typ Info Příklad Vector
A 1D set of values of the same data type c(1,“a”) , 1:3 , LETTERS Matrix A 2D set of values of the same data type matrix(LETTERS,nrow=13, ncol=2) , rbind(1:5,2:6) Array An nD set of values of the same data type array(LETTERS, c(13,2)) Data.frame A 2D set of values of different data types data.frame(a=1:26, b=LETTERS) List A collection of objects of various data types list(vector=c(1,“a”), df=data.frame(a=1:6))

13 Vektor - Tvorba handCrafted<-c(1,2,3,4) seqCrafted<-1:4 named<-c(a=1,b=2,c=3,d=4) named ## a b c d ##

14 Vektor - Filtrace handCrafted[1] ## [1] 1 seqCrafted[-1] ## [1] named["b"] ## b ## 2

15 Vektor - Update handCrafted[2]<-99 handCrafted ## [1]

16 Vektor - Manipulace mode(seqCrafted) ## [1] "numeric"

17 Vektor - Řazení preOrder<-sample(letters, 6) preOrder ## [1] "n" "a" "x" "z" "s" "q" order(preOrder) ## [1] ordered<-preOrder[order(preOrder)] ordered ## [1] "a" "n" "q" "s" "x" "z"

18 Tabulka – Tvorba a filtrace
df<-data.frame(a=1:4, b=LETTERS[5:8], c=rnorm(4),row.names = letters[9:12]) df df[1, ] df[ ,1] df[1,1] df[-(3:4),] df[,"a"] df[ , c(TRUE, TRUE, FALSE)] df[df$a<4,]

19 Tabulka - Update df[1,1]<-2 df Odebrání sloupce df[,2] df[,2]<-NULL Odebrání řádku df[2,] df<-df[-2,]

20 Tabulka append superDF<-data.frame(df,d=5:7) superDF df$newcol<-5:7 df df[4,]<-c(1,1,1)

21 Vizualizace Vestavěná knihovna pairs(iris) plot(lm(Sepal.Length~Petal.Length, iris))

22 ggplot2 library(ggplot2) p <- ggplot(data=iris) #Přidat osy p <- ggplot(data=iris, aes(x=Sepal.Width, y=Sepal.Length, colour=Species)) #Přidat geometrii p <- p + geom_point() #Volitelně přidat statistiku p <- p + stat_boxplot(fill="transparent") p

23 Pokračování #Úprava os p <- p + coord_flip() p p <- p + facet_grid(.~Species) pp p <- p + theme_minimal()

24 Načítání z flat file setwd('C:/Users/Jiri/Desktop/WUG/000 SQL Bootcamp/R nejen v SQL Serveru') BikeData<-read.csv('BikeData.csv')

25 Načítání z SQL Serveru library(RODBC) cn <- odbcDriverConnect(connection="Driver={SQL Server Native Client 11.0};server=wppdwlz01;database=AdventureWorksDW2012;trusted_connection=yes;") dataset<-sqlQuery(cn,"SELECT OrderDate = datefromparts(Orderdatekey/10000,OrderDateKey%10000/100,1) ,Sales = sum(f.salesamount) FROM dbo.FactInternetSales f GROUP BY datefromparts(Orderdatekey/10000,OrderDateKey%10000/100,1) order by 1") dataset

26 Úklid v paměti rm(list=ls())

27 R v SQL Serveru

28 R v Azure ML

29 R v Power BI SELECT OrderDate = datefromparts(Orderdatekey/10000,OrderDateKey%10000/100,1) ,Sales = sum(f.salesamount) FROM dbo.FactInternetSales f GROUP BY datefromparts(Orderdatekey/10000,OrderDateKey%10000/100,1) order by 1

30 Děkuji Vám za pozornost
Dotazy teď, nebo později u stánku Dixons Carphone CoE Kontakty


Stáhnout ppt "R nejen v SQL Serveru Jiří Neoral BI Data Architect"

Podobné prezentace


Reklamy Google