Cum să folosești metadata repository în Talend?

Ce este metadata?

Metadata sunt informații structurate ce descriu diverse surse de date și fișiere, care pot fi gestionate și reutilizate în cadrul joburilor.

De ce se folosește metadata?

Crearea de metadata este o Practică Recomandată deoarece simplifică configurarea conexiunilor și accesul la sursele de date. Metadata sunt definite o singură dată și pot fi reutilizate în mai multe joburi.

Cum se utilizează metadata în componente?

Când configurăm componente în Designer, putem selecta parametri, cum ar fi credențiale, schema bazei de date, folosind proprietățile Built-In și Repository.

Built-In: proprietăți configurate manual la nivelul componentei

Repository: proprietăți moștenite din metadata din Repository

Proprietatea Repository permite reutilizarea de diferite componente în cadrul diferitelor job-uri

În această #SkillPill, vei descoperi pas cu pas cum să folosești metadata din repository cu Talend.

 

Pasul 1: Creează jobul

→ Deschide Talend Studio și creează un nou job cu un nume specific pentru subiectul ales

Pasul 2: Creează conexiunile bazei de date

→ În Repository, extinde Metadata, dă clic dreapta pe Db Connections și selectează Crează o conexiune.

Pagina Step 1 of 2: setează numele, scopul și descrierea noii conexiuni.

Pagina Step 2 of 2 setează Tipul DB: Vertica, configurează conexiunea:

Db Version: VERTICA 9.X

Login/Password: LOCAL_TALEND

Server: 192.168.56.101

Port: 5433

Baza de date: localverticadb01

Schema: project_source

Pasul 3: Utilizează Database Metadata

→ Creează o schemă de tabel pentru Customers în Repository -> Metadata -> Db Connections

→ Dă clic dreapta pe conexiunea nou creată VerticaDB_project_source și selectează Retrieve Schema

→ Alege tabelul Customers, apoi dă clic pe Next

→ Se deschide o fereastră nouă unde poți vedea lista coloanelor din tabel și seta tipurile de date -> Finish

Pasul 4: Utilizează Delimited File Metadata

→ Creează un fișier text delimitat (CSV) în Repository -> Metadata

→ Dă clic dreapta pe File delimited și selectează Create file delimited; se va deschide o fereastră nouă

Pagina Step 1 of 4: setează numele, scopul și descrierea fișierului CSV -> Next

Pagina Step 2 of 4: dă clic pe Browse și selectează locația fișierului, setează Formatul la WINDOWS -> Next

Pagina Step 3 of 4:

File Settings: AlegeUS-ASCII, semicolumn, standard EOL

Escape Char Settings: Delimited

Rows To Skip: Bifează Hedear și introdu valoarea 1

Preview: Bifează Set heading row as column names -> Refresh Preview -> Next

Pagina Step 4 of 4: Setează lungimea și tipul de date al coloanelor în câmpul Description of the Schema -> Finish

Pasul 5: Adaugă componentele pentru conexiune 

→ Folosește componentele tPreJob și tDBConnection pentru a seta conexiunile la baza de date

→ Folosește componentele tPostJob și tDBClose pentru a închide conexiunea la baza de date

Pasul 6: Adaugă componenta de tBDInput

→ Trage și plasează metadata din Repository în job, în zona Designer

→ Alege componenta tDBInput, bifează Use an existing connection și setează lista componentelor

→ Adaugă o componentă tLogRow și seteaz-o să afișeze în modul tabel

→  Setează un link Main între tDBInput și tLogRow

Pasul 7: Adaugă componenta tFileInputDelimited

→ Trage și plasează metadata din Repository în job, în zona Designer

→ Alege componenta tFileInputDelimited

→ Adaugă o componentă tLogRow și seteaz-o să afișeze în modul tabel

→ Setează un link Main între tFileInputDelimited și tLogRow

→ Adaugă un link OnSubjobOk între cele două subjoburi

 

Rulează procesul și verifică rezultatul!

Aici este rezultatul în Talend:

Urmărește tutorialul video aici:

Despre  btProvider:

Echipa noastră de Data Analysts este calificată să explice și să ghideze echipele interne ale companilor în călătoria lor spre o cultură mult mai centrată în jurul datelor.

Deținem certificările tehnice necesare pentru produse:TalendTableau Desktop, Tableau Public, Tableau Server, Tableau Prep, and Tableau Data Management, VerticaSalesforceMulesoftWrite-Back.

Cu Talend – cea mai bună platformă de gestionare a datelor – poți înțelege întotdeauna mai bine datele tale. Utilizând Talend, vei lua decizii inteligente și strategice și vei integra, asigura calitatea și guverna datele tale fără efort. Vezi și alte tutoriale video #skillpill aici:

Cum să creezi un Barcode Chart

Creează un Set top N

Utilizarea numelor de măsură în acțiunile parametrice

 

Ești interesat să afli mai multe despre Talend – acceleratorul pentru soluții eficiente și cuprinzătoare de gestionare a datelor în întreaga companie.

Contactează-ne!