Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Talend Open Studio Ing. David Pejčoch Tutorial. Instalace a spuštění 1.Stáhněte zip soubor z webu Talend.com (velikost cca 240 MB) 2.Rozzipujte na disk.

Podobné prezentace


Prezentace na téma: "Talend Open Studio Ing. David Pejčoch Tutorial. Instalace a spuštění 1.Stáhněte zip soubor z webu Talend.com (velikost cca 240 MB) 2.Rozzipujte na disk."— Transkript prezentace:

1 Talend Open Studio Ing. David Pejčoch Tutorial

2 Instalace a spuštění 1.Stáhněte zip soubor z webu Talend.com (velikost cca 240 MB) 2.Rozzipujte na disk H 3.Spusťte TOS_DQ-win32-x86.exe 4.Při spuštění přeskočte registraci kliknutím na „Register Later“

3 Stažení z webu Talend.com

4 Talend Open Studio: úvodní obrazovka

5 Integrovaný help „for Dummies“ Help se zobrazuje v záložce v pravé části úvodního okna. Neumožňuje přímé spouštění wizardů, pouze odkazuje na jednotlivé kroky.

6 Vytvoření připojení k databázi

7 Připojení k MySQL Vyplňte příslušný login, heslo, adresu serveru a název databáze.

8

9 Vytvoření pravidel pro oskórování dat

10

11 Popis základních funkčních prvků • Rules = pouze WHERE klauzule • Patterns = vzory pro validaci – pomocí regulárních výrazů (nástroj obsahuje předpřipravené regulární výrazy v různých složkách podle domén) – pomocí SQL LIKE klauzule specifické pro různá RDBMS • Source files = SQL příkazy, které lze spustit pomocí Data Expolreru (v rámci existujícího připojení na databázi) • Indicators = SQL příkazy s využitím sady předdefinovaných templatů – Pattern Matching: počet záznamů, které vyhovují regulárnímu výrazu; počet záznamů, které vyhovují SQL LIKE klauzuli – Pattern Finder = hledání četností vzorů – Soundex: tabulka četností Soundex hodnot –...

12 Popis funkcionalit v rámci DB Connection • Na úrovni připojení: porovnání databází, overview analýza (počty tabulek, řádků, indexů v tabulkách) • Na úrovni databáze: overview analýza • Na úrovni seznamu tabulek: porovnání tabulek • Na úrovni tabulek: – analýza tabulky pomocí SQL rules, – column analysis (na základě výběru datového typu, vzoru, indikátoru, sloupců a where podmínky provede analýzu s grafickým výstupem), – pattern frequency analysis (viz. předchozí, ale zkoumá četnosti vzorů; z výsledků lze vidět záznamy odpovídající jednotlivým vzorům, generovat ze vzorů regulární výrazy) – preview table (přehodí do módu s konzolí pro SQL)

13 Popis funkcionalit v rámci DB Connection • Na úrovni sloupce: – Analýza hodnot z množiny sloupců – Analýza korelace mezi sloupci – Analýza kategorií nominální proměnné – Pattern frequency analysis + další viz na úrovni tabulek


Stáhnout ppt "Talend Open Studio Ing. David Pejčoch Tutorial. Instalace a spuštění 1.Stáhněte zip soubor z webu Talend.com (velikost cca 240 MB) 2.Rozzipujte na disk."

Podobné prezentace


Reklamy Google