Cum să efectuezi „database landing” cu Talend ?

 Ce este tDBInput? 

tDBInput este o componentă Talend folosită pentru citirea datelor dintr-o bază de date având scopul de a extrage, transforma și încărca datele (procese ETL).  

Caracteristici: 

→  Acceptă multiple baze de date precum Microsoft SQL Server, MySQL, PostgreSQL, Oracle, IBM DB2, Vertica etc

→  tDBInput necesită date de conectare precum portul, numele bazei de date, utilizatorul și parola 

→  SQL Query – permite scrierea și executarea interogări SQL 

Ce este tDBOutput? 

tDBOutput este o componentă Talend folosită pentru a insera, actualiza sau șterge date într-un tabel din baza de date. Aceasta acceptă diverse baze de date și poate efectua diferite tipuri de manipulări de date. 

În acest SkillPill, vei descoperi pas cu pas cum să efectuezi „database landing” cu Talend:

 

Pasul 1: Creează un job

→ Deschide Talend Studio si creează un nou job cu denumirea specifică topicului ales 

 

Pasul 2: Creează conexiunea

Creează două conexiuni către VerticaDB cu scheme pentru sursă și target. (Repository -> Metadata -> DB Connection) 

 

Pasul 3: Adaugă componentele pentru conexiune 

Utilizează componentele tPreJob, tDBConnection pentru a seta conexiunile la baza de date 

→ Utilizează componentele tPostJob, tDBClose pentru a închide conexiunea la baza de date 

 

Pasul 4: Adaugă componentele tDBInput  

Utilizează două componente tDBInput și denumește-le CustomersUS, StatesUS 

→  Selectează meniul Basic setting, setează Database -> Vertica 

→  Bifează Use an existing connection 

→  Alege din Component List conexiunea la schema din sistemul sursă 

→  Selectează Schema -> Repository și alege tabelele CustomersUS, respectiv StatesUS 

→  Generează query-ul cu ajutorul Guess Query 

 

Pasul 5: Adaugă tMap și creează legaturile dintre componente 

Utilizează componeta tMap, apoi setează legaturile  

→  Leagă CustomersUS la tMap printr-un Row > Main 

→  Leagă StatesUS la tMap printr-un Row > Main (Lookup) 

→  De remarcat ca tMap acceptă mai multe surse, doar una este de tip Main, restul sunt Lookup 

→  Leagă tMap la Customers_States printr-un Row > Main 

 

Pasul 6: Configurează tMap 

Mapează conținutul tabelelor de la stânga la dreapta folosind butonul AutoMap 

→ Pentru configurarea Inner Join asociază  StateID din CustomersUS cu StateID din tabela StatesUS 

→ În tMapSetting setează Join Model cu valoarea Inner Join, apoi Apply -> Ok 

 

Pasul 7: Adaugă componenta tDBOutput 

Utilizează o componentă  tDBOutput si denumește-o  Customers_States 

→  Selectează meniul Basic setting, setam Database -> Vertica 

→  Bifează  Use an existing connection 

→  Alege din Component List conexiunea la schema din sistemul target 

→  Selectează  Schema -> Repository și alege tabela Customers_States 

→  Leagă  tMap de tDBOutput cu Main 

 

Rulează procesul și verifică rezultatul. 

 

Iată rezultatul în Talend:

Urmărește tutorialul video aici:

 

 

Despre  btProvider:

Echipa noastră de Data Analysts este calificată să explice și să ghideze echipele interne ale companilor în călătoria lor spre o cultură mult mai centrată în jurul datelor.

Deținem certificările tehnice necesare pentru produse:TalendTableau Desktop, Tableau Public, Tableau Server, Tableau Prep, and Tableau Data Management, VerticaSalesforceMulesoftWrite-Back.

Cu Talend – cea mai bună platformă de gestionare a datelor – poți înțelege întotdeauna mai bine datele tale. Utilizând Talend, vei lua decizii inteligente și strategice și vei integra, asigura calitatea și guverna datele tale fără efort. Vezi și alte tutoriale video #skillpill aici:

Cum să creezi un Barcode Chart

Creează un Set top N

Utilizarea numelor de măsură în acțiunile parametrice

 

Ești interesat să afli mai multe despre Talend – acceleratorul pentru soluții eficiente și cuprinzătoare de gestionare a datelor în întreaga companie.

Contactează-ne!