Informatica Transformations: The Heart and Soul of Informatica PowerCenter



Obțineți o înțelegere completă a ceea ce este Informatica Transformations și obțineți o perspectivă asupra diferitelor transformări majore Informatica cu cazuri de utilizare.

Transformările Informatica sunt obiecte de depozit care pot citi, modifica sau transmite date către structurile țintă definite, cum ar fi tabelele, fișierele sau orice alte ținte necesare. O transformare este practic utilizată pentru a reprezenta un set de reguli, care definesc fluxul de date și modul în care datele sunt încărcate în ținte. Informatica PowerCenter oferă multiple transformări, fiecare servind o anumită funcționalitate.În plus, cu Informatica lider pe piața de astăzi în platforma de integrare a datelor, Transformările Informatica vin ca un concept crucial necesar .

Pentru a înțelege mai bine Transformările Informatica, să înțelegem mai întâi ce este cartarea? O mapare este o colecție de obiecte sursă și țintă legate între ele printr-un set de transformări. Prin urmare, transformările într-o mapare reprezintă operațiunile pe care serviciul de integrare le va efectua asupra datelor în timpul execuției fluxului de lucru. Pentru a înțelege mai bine fluxul de lucru, puteți consulta blogul nostru Tutorial Informatica: Managementul fluxului de lucru





Care sunt diferitele transformări Informatica?

Transformările Informatica pot fi clasificate în principal în două categorii. În primul rând, se bazează pe conectivitatea (Linking in mapping) a transformărilor între ele, iar al doilea se bazează pe modificarea numărului total de rânduri dintre sursă și țintă. Să începem prin a arunca o privire asupra transformărilor Informatica bazate pe conectivitate.

1) Tipuri de transformări în Informatica bazate pe conectivitate:



  • Transformări conectate.
  • Transformări neconectate.

În Informatica, acele transformări care sunt conectate la una sau mai multe transformări sunt numite ca Transformări conectate .

Transformările conectate sunt utilizate atunci când pentru fiecare rând de intrare se apelează o transformare și se așteaptă să returneze o valoare. De exemplu, putem utiliza o transformare de căutare conectată pentru a cunoaște numele fiecărui angajat care lucrează într-un anumit departament, specificând ID-ul departamentului în expresia de căutare.

Unele dintre principalele transformări Informatica conectate sunt Aggregator, Router, Joiner, Normalizer etc.



Acele transformări care nu sunt conectate la alte transformări sunt numite Transformări neconectate .Funcționalitatea lor este utilizată prin apelarea lor în alte transformări, cum ar fi transformarea expresiei. Aceste transformări nu fac parte din conducta de mapare.

Transformările neconectate sunt utilizate atunci când funcționalitatea lor este necesară numai în baza anumitor condiții.De exemplu, în calitate de programator, doriți să efectuați o operație complicată asupra datelornu doriți să utilizați transformări Informatica cum ar fi expresie sau transformări de filtru pentru a efectua această operație. Într-un astfel de caz, puteți crea o bibliotecă partajată externă DLL sau UNIX cu codurile pentru a efectua operația și a le apela în transformarea procedurii externe.

Există 3 transformări Informatica și anume. Procedură externă, căutare și procedură stocată care pot fi neconectate într-o mapare validă (O mapare pe care serviciul de integrare o poate executa).

2) Tipuri de transformări Informatica bazate pe modificarea în niciun rând

  • Transformări active
  • Transformări pasive

Transformări active :- O transformare activă poate efectua oricare dintre următoarele acțiuni:

  • Schimbați numărul de rânduri care trece prin transformare: De exemplu, transformarea Filter este activă deoarece elimină rândurile care nu îndeplinesc condiția de filtrare.
  • Schimbați granița tranzacției: o graniță a tranzacției este o graniță care cuprinde toate tranzacțiile înainte ca un commit să fie apelat sau între două apeluri de commit. De exemplu, în timpul unei operațiuni tranzacționale, utilizatorul simte că după anumite tranzacții este necesară o confirmare și apelează comanda commit pentru a crea un punct de salvare și prin aceasta utilizatorul modifică limita implicită a tranzacției. În mod implicit, granița tranzacției se află între începutul fișierului către punctul de confirmare automată sau EOF.
  • Schimbați atributul tip rând: Atributul tip rând este un tip de înregistrare care reprezintă un rând dintr-un tabel. Înregistrarea poate stoca un întreg rând de date selectate din tabel sau prelua dintr-un pointer sau o variabilă de pointer. De exemplu, Transformarea strategiei de actualizare semnalează tipul de rând ca 0 pentru inserarea valorilor, 1 pentru actualizare, 2 pentru ștergere sau 3 pentru respingere.
  • Aggregator, Filter, Joiner, Normalizer etc. sunt câteva exemple de transformare activă.

Transformarea pasivă : O transformare pasivă este una care va satisface toate aceste condiții:

  • Numărul de rânduri înainte și după transformare este același.
  • Menține limita tranzacției.
  • Menține atributul de tip rând.
  • Expression, ExternalProcedure, HTTP etc. sunt câteva exemple de transformare pasivă.

În transformarea pasivă, nu sunt create rânduri noi sau rândurile existente sunt abandonate.

Trebuie să vă întrebați de ce sunt utilizate transformările pasive dacă nu modifică numărul de rânduri. Ele sunt utilizate în general pentru actualizarea valorilor, apelarea unei proceduri externe dintr-o bibliotecă partajată și pentru a defini intrarea și ieșirea mapletelor. O mapletă este o colecție de numai transformările din mapare. De exemplu, pentru o bază de date pentru studenți, dorim să actualizăm valorile coloanei de mărci la percentilă în loc de procent, acest lucru se poate face utilizând o transformare a expresiei care va converti valorile și se va actualiza în aceleași coloane, păstrând același număr total de rânduri după transformări.

Nu există nicio restricție că, dacă o transformare este utilizată ca transformare pasivă, ea nu poate fi utilizată ulterior ca transformare activă. În mod similar, o transformare neconectată poate fi utilizată ca o transformare conectată conform nevoilor. Toate combinațiile posibile se pot forma între aceste categorii și aceasta este magia transformărilor Informatica. Veți avea o idee mai bună mai târziu în acest blog despre tipurile posibile la care poate aparține o transformare.

Acum, că am înțeles diferitele tipuri de transformări Informatica, să începem să le explorăm.Mai jos sunt câteva tipuri majore de transformări Informatica:

Transformare Tip Descriere
AgregatorConectat activEfectuează calcule agregate.
ExpresieConectat pasivCalculează o valoare.
JavaConectat activ sau conectat pasivExecută logica utilizatorului codată în Java. Bytecode-ul pentru logica utilizatorului este stocat în depozit
TâmplarConectat activAlătură date din diferite baze de date sau sisteme de fișiere plate.
Privește în susActiv conectat sau pasiv conectat sau activ neconectat sau pasiv neconectatCăutați și returnați datele dintr-un fișier plat, dintr-un tabel relațional, din vizualizare sau din sinonim.
NormalizatorConectat activFolosit în conductă pentru normalizarea datelor din surse de fișiere relaționale sau plate.
RangConectat activLimită înregistrările la un interval superior sau inferior.
RouterConectat activDirecționează datele în transformări multiple pe baza condițiilor de grup.
SQLConectat activ sau conectat pasivExecută interogări SQL împotriva unei baze de date.
UniuneConectat activFuzionează date din diferite baze de date sau sisteme de fișiere plate.
Generator XMLConectat activCitește date de la unul sau mai multe porturi de intrare și ieșire XML printr-un singur port de ieșire.
Parser XMLConectat activCitește XML de la un port de intrare și transmite date la unul sau mai multe porturi de ieșire.
Calificator sursă XMLConectat activReprezintă rândurile pe care serviciul de integrare le citește dintr-o sursă XML atunci când rulează o sesiune.

Să începem acum să analizăm transformările una câte una.

Transformarea agregatorului

Transformarea agregatorului este o transformare activă și conectată. Această transformare Informatica este utilă pentru a efectua calcule, cum ar fi medii și sume (în principal pentru a efectua calcule pe mai multe rânduri sau grupuri). De exemplu, pentru a calcula numărul total de vânzări zilnice sau pentru a calcula media vânzărilor lunare sau anuale. Funcțiile agregate, cum ar fi AVG, FIRST, COUNT, PERCENTILE, MAX, SUM etc., pot fi utilizate în transformarea agregatului.

Căutare Transformare

Transformarea căutării este cea mai populară și utilizată transformare Informatica. Pe baza cerințelor pe care le are utilizatorul, transformarea căutării poate fi utilizată ca transformare conectată sau neconectată, combinând-o ca transformare activă sau pasivă. Eut este utilizat pentru a căuta în principal detaliile dintr-o sursă, un calificator de sursă sau o țintă pentru a obține datele relevante necesare. De asemenea, puteți căuta un „fișier plat”, „tabel relațional”, „vizualizare” sau „sinonim”. Se poate utiliza mai multe transformări de căutare într-o mapare.

Transformarea căutării este creată cu următorul tip de porturi (puncte logice pentru transferul de informații):

  • Port de intrare (I)
  • Port de ieșire (O)
  • Căutați porturi (L)
  • Port de retur (R) (Numai în cazul căutării neconectate)

Diferențele dintre transformarea căutării conectate și neconectate:

c ++ stl întrebări de interviu
  • Căutarea conectată primește valori de intrare direct din conducta de mapare, în timp ce căutarea neconectată primește valori din căutare expresie dintr-o altă transformare. O mapare în Informatica poate conține sursă, transformări și ținte conectate împreună sunt considerate ca o conductă.
  • Căutarea conectată returnează mai multe coloane din același rând, deoarece au mai multe porturi de returnare, undesCăutarea neconectată are un singur port de returnare și returnează o coloană din fiecare rând. De exemplu, dacă folosim o căutare conectată într-o bază de date a angajaților pentru un anumit ID de departament ca parametru, putem obține toate detaliile legate de angajații departamentului respectiv, cum ar fi numele lor, numărul de identificare al angajatului, adresa etc., în timp ce cu o căutare neconectată putem obține un singur atribut al angajatului, cum ar fi numele sau numărul de identificare al angajatului sau orice atribut specificat de utilizator.
  • Căutarea conectată cache toate coloanele de căutare, în timp ce căutarea neconectată cache doar ieșirea căutării și condițiile de căutare.
  • Căutarea conectată acceptă valorile implicite definite de utilizator, în timp ce căutarea neconectată nu acceptă valorile definite de utilizator. De exemplu, dacă doriți să schimbați toate valorile unei anumite coloane la NULL după căutare, puteți seta valoarea implicită a acelor coloane la NULL în expresiile de căutare. Cu toate acestea, această caracteristică nu este posibilă în cazul căutării neconectate.

Să presupunem că dintr-o bază de date pentru clienți, doresc să aflu detaliile clienților care au mai mult de o factură ne-anulată. Pentru a obține aceste date, putem folosi o transformare de căutare.

Iată pașii.

  1. Începeți prin încărcarea tabelului Facturi ca sursă în proiectantul de mapare. În cazul în care nu știți cum să încărcați datele sursă în Designer, Click aici . lookup-source-informatica transformations-edureka
  2. Să filtrăm acum facturile care nu sunt anulate. Pentru aceasta, creați un nou filtru numit fil_ODS_CUSTOMER_ACTIVE la calificatorul sursă cu proprietatea NOT (ISNULL (DATE_CLOSED)) ȘI ANULAT = 0.
  3. Acum adăugați o transformare de căutare în designer așa cum se vede mai jos cu numele ca lkp_CUSTOMER :

  4. Specificați tabelul de căutare ca tabel client.
  5. Faceți dublu clic pe antetul lkp_CUSTOMER pentru a deschide meniul de editare. Sub fila Condiție setați condiția de căutare ca CUST_ID = CUST_NO.
  6. În fila Proprietăți schimbați Informațiile conexiunii în $ Sursa și faceți clic pe O.K pentru a salva transformarea:
  7. Conectați lkp_CUSTOMER porturi către ODS_CUSTOMER_ACTIVE porturi pentru a finaliza transformarea necesară acolo unde ODS_CUSTOMER_ACTIVE este fișierul țintă necesar:
  8. Harta iconică finală, inclusiv transformarea căutării, ar trebui să fie după cum urmează:

Transformarea expresiei

Transformarea expresiei este o transformare Informatică pasivă și conectată. Transformările de expresie sunt utilizate pentru manipularea în rânduri. Pentru orice tip de manipulare pe care doriți să o efectuați într-o înregistrare individuală, utilizați o transformare Expression. Transformarea Expression acceptă datele în rânduri, le manipulează și le transmite țintei. De exemplu, pentru a calcula reducerea pentru fiecare produs sau pentru a concatena numele și prenumele sau pentru a converti datele într-un câmp șir.

Transformarea tâmplarului

Transformarea Joiner este o transformare Informatica activă și conectată utilizată pentru a uni două surse eterogene. Transformarea jonctorului unește surse bazate pe o condiție specificată care se potrivește cu una sau mai multe perechi de coloane între cele două surse. Cele două conducte de intrare includ o conductă principală și o conductă de detaliu sau ramură. Pentru a alătura mai mult de două surse, trebuie să alăturați ieșirea transformării de asamblare cu o altă sursă. Pentru a alătura n număr de surse într-o cartografiere, aveți nevoie de transformări n-1 de asamblare. Transformarea Joiner acceptă următoarele tipuri de îmbinări:
  • Normal
  • Maestru exterior
  • Detaliu exterior
  • Complet exterior
Normal join elimină toate rândurile de date de la sursa principală și de detaliu care nu se potrivesc, pe baza condiției. Maestrul exterior Alăturați elimină toate rândurile neegalate din sursa master și păstrează toate rândurile din sursa de detalii și rândurile potrivite din sursa master. Detaliu oute r join păstrează toate rândurile de date din sursa principală și rândurile potrivite din sursa de detalii. El renunță la rândurile de neegalat din sursa de detalii. Complet exterior join păstrează toate rândurile de date atât din sursele master, cât și din cele de detaliu.

Nu putem alătura mai mult de două surse folosind o singură asamblare. Pentru a alătura trei surse, trebuie să avem două transformări de jonctor.

Să presupunem că vrem să ne alăturăm trei tabele - Angajați, departamente și locații - folosind Joiner. Vom avea nevoie de doi tâmplari. Joiner-1 se va alătura, angajații și departamentele și Joiner-2 se vor alătura, rezultatul din tabelul Joiner-1 și Locations.

java diferența dintre aruncări și aruncări

Iată pașii:

  1. Aduceți trei surse în proiectantul de cartografiere.
  2. Creați Joiner -1 pentru a vă alătura angajaților și departamentelor utilizând Department_ID.

  3. Creați următorul tâmplar, Joiner-2. Luați ieșirea din Joiner-1 și porturile din Locations Table și aduceți-le în Joiner-2. Alăturați-vă acestor două surse de date folosind Location_ID.
  4. Ultimul pas este trimiterea celor necesareporturide la Joiner-2 la țintă sau printr-o expresietransformarela tabelul țintă.

Transformarea Uniunii

Transformarea Uniunii este o transformare informatică activă și conectată. Este folosit pentru a îmbina mai multe seturi de date din diverse fluxuri sau conducte într-un singur set de date. Această transformare Informatica funcționează similar cu comanda UNION ALL din SQL, dar nu elimină niciun rând duplicat. Se recomandă utilizarea unui agregator pentru a elimina duplicatele care nu sunt așteptate la țintă.

Transformarea normalizatorului

Normalizator Transformarea este o transformare informatică activă și conectată. Este una dintre cele mai utilizate transformări Informatica, în principal cu surse COBOL, unde de cele mai multe ori datele sunt stocate în format de-normalizat. De asemenea, transformarea normalizatorului poate fi utilizată pentru a crea mai multe rânduri dintr-un singur rând de date.

Să încercăm să încărcăm un fișier plat de date separate prin virgulă dintr-un fișier plat / sursă Cobol.

Iată pașii:

  1. Începeți prin încărcarea magazinului (fișier plat) cu numele magazinului și veniturile trimestriale:
  2. Creați o nouă transformare Normalizer numită NRM_STORE_EXP cu două porturi Store și Quarter (se repetă de 4 ori, deoarece avem date pentru 4 trimestre), după cum se vede mai jos:
  3. Fila Porturi ar trebui să fie așa cum se vede mai jos:
  4. Copiați / legați următoarele coloane și conectați-vă la Transformarea normalizatorului.
    Magazin
    Trimestrul1
    Trimestrul2
    Trimestrul3
    Trimestrul4
    Cartarea ar trebui să arate după cum urmează:
  5. Creați o nouă transformare a expresiei cu exp_STORE . Copiați / legați următoarele coloane și conectați-vă la Transformarea expresiei, după cum se vede mai jos:
    Magazin
    Sfert
    GK_QUARTER
    GCID_QUARTER
  6. Conectați expresia la ținta finală pentru a finaliza maparea utilizând transformarea de normalizare.

Transformare XML

Transformările XML sunt o transformare informatică activă și conectată. În transformările Informatica, transformarea XML este utilizată în principal atunci când fișierul sursă este de tip XML sau datele sunt de tip XML. Transformarea XML poate fi clasificată în principal în 3 transformări:

  • Transformare calificator sursă XML.
  • Transformare analizor XML.
  • Transformare generator XML.

Calificator sursă XML Transformare : XML Source Qualifier este o transformare activă și conectată. Calificatorul sursă XML este utilizat numai cu o definiție a sursei XML. Reprezintă elementele de date pe care Serverul Informatica le citește atunci când execută o sesiune cu surse XML. Calificatorul sursă XML are un port de intrare sau ieșire pentru fiecare coloană din sursă. Dacă eliminați o definiție sursă XML dintr-o mapare, Designerul elimină și transformarea corespunzătoare a calificatorului sursă XML.

Transformare analizor XML: Transformarea parserului XML este o transformare activă și conectată. Transformarea analizorului XML este utilizată pentru a extrage XML într-o conductă și apoi pentru a trece acest lucru către țintă. XML-ul este extras din sistemele sursă, cum ar fi fișiere sau baze de date. Transformarea XML Parser citește date XML dintr-un singur port de intrare și scrie date pe unul sau mai multe porturi de ieșire.

Transformare generator XML: XML Generator este o transformare activă și conectată. Transformarea XML Generator este utilizată pentru a crea XML într-o conductă. XML Generator Transformation citește date de la unul sau mai multe porturi de intrare și iese XML printr-un singur port de ieșire.

Transformarea rangului

Transformarea rangului este o transformare activă și conectată. Este o transformare Informatica care vă ajută să selectați rangul superior sau inferior al datelor. De exemplu, pentru a selecta primele 10 regiuni în care volumul vânzărilor a fost foarte mare sau pentru a selecta 10 produse cu cel mai mic preț.

Luați în considerare faptul că doriți să încărcați prima și ultima înregistrare într-un tabel țintă din baza de date a angajaților mei. Ideea din spatele acestui lucru este să adăugați un număr de ordine la înregistrări și apoi să luați clasamentul Top 1 și Rankul inferior 1 din înregistrări.

  1. Trageți și plasați porturile de la calificatorul sursă la două transformări de rang.
  2. Creați un generator de secvență reutilizabil cu valoarea de pornire 1 și conectați următoarea valoare la ambele transformări de rang.
  3. Setați proprietățile de rang după cum urmează. Portul de secvență nou adăugat trebuie ales ca Port de rang. Nu este nevoie să selectați niciun port ca Grup după Port.Rank - 1
  4. Rang - 2
  5. Faceți două instanțe ale țintei.Conectați portul de ieșire la țintă.

Transformarea routerului

Routerul este o transformare activă și conectată. Este similar cu transformarea filtrului. Singura diferență este că transformarea filtrului elimină datele care nu îndeplinesc condiția, în timp ce routerul are opțiunea de a captura datele care nu îndeplinesc condiția. Este util să testați condiții multiple. Are grupuri de intrare, ieșire și implicite.

Să presupunem că doriți să separați înregistrările impare și pare ale unui tabel, acest lucru se poate face utilizând o transformare a routerului.

Ideea este să adăugați un număr de secvență la înregistrări și apoi să împărțiți numărul de înregistrare la 2. Dacă este divizibil, mutați-l la țintă pare și dacă nu, mutați-l la țintă impară.

  1. Trageți sursa și conectați-vă la o transformare a expresiei.
  2. Adăugați următoarea valoare a unui generator de secvențe la transformarea expresiei.
  3. În transformarea expresiei faceți două porturi, unul este „ciudat” și altul „par”.
  4. Scrieți expresia ca mai jos
  5. Conectați o transformare a routerului la expresie.
  6. Faceți două grupuri sub transformarea routerului.
  7. Dați condiția ca mai jos
  8. Apoi trimiteți cele două grupuri către ținte diferite. Acesta este întregul flux.

Sper că acest blog Informatica Transformation a fost de ajutor pentru a vă înțelege diferitele transformări Informatica și a creat suficient interes pentru a afla mai multe despre Informatica.

Dacă vi s-a părut util acest blog, puteți consulta și seria noastră de bloguri Informatica Tutorial și Tutorial Informatica: Înțelegerea „Inside Out” a Informatica .În cazul în care căutați detalii despre certificarea Informatica, puteți consulta blogul nostru Certificare Informatica: Tot ce trebuie să știți .

Dacă ați decis deja să începeți Informatica ca o carieră, v-aș recomanda de ce să nu aruncați o privire asupra noastră pagina cursului. Instruirea de certificare Informatica de la Edureka vă va face un expert în Informatica prin sesiuni în direct conduse de instructor și instruire practică folosind cazuri de utilizare din viața reală.