Cum funcționează LOD Expressions în Tableau?



Tableau LOD Expressions reprezintă un mod elegant și puternic de a răspunde la întrebări care implică mai multe niveluri de granularitate într-o singură vizualizare.

Scopul oricărui instrument BI este să ofere Analiza datelor un flux mai bun. Dacă unul, ca profesionist, se confruntă cu dificultatea de a utiliza instrumentul în timp ce rezolvă o problemă, starea fluxului este ruptă. O cauză comună a acestei probleme este necesitatea de a lucra cu date care au fost agregate la diferite Nivelul de detaliu în tablou (LOD) .

Tabloul plasat deasupra grămezii pentru a 6-a oară la rând, pe Gartner’s Magic Quadrant, spune cu siguranță ceva despre cererea sa pe piață. Acesta este probabil cel mai bun moment pentru a .





Acest blog vă va ajuta să înțelegeți expresiile LOD și să discutați următoarele subiecte:



Tablou LOD: De ce ai nevoie de LOD?

Există adesea întrebări pe care cineva trebuie să le întâmpine atunci când analizăm date. Aceste întrebări sunt deseori simple de pus, dar greu de răspuns. De multe ori sună ceva de genul:

Întrebări în Tableau - LOD Tableau - EdurekaPentru a aborda aceste tipuri de întrebări, a fost introdusă o nouă sintaxă numită Nivelul de detaliu în Tabloul 9.0. Această nouă sintaxă a simplificat și extins limbajul de calcul al Tableau, făcând posibilă abordarea directă a acestor întrebări.

Tablou LOD: Ce este LOD?

Expresiile LOD reprezintă un mod elegant și puternic de a răspunde la întrebări care implică mai multe niveluri de granularitate într-o singură vizualizare.



Nivelul de detaliu în expresiile Tableau sau LOD vă permit să calculați valori la nivelul sursei de date și la nivelul de vizualizare. Cu toate acestea, expresiile LOD vă oferă și mai mult control asupra nivelului de granularitate pe care doriți să îl calculați. Ele pot fi efectuate la a mai granular nivel (INCLUDE Calcul), a mai puțin granulare nivel (EXCLUDE Calcul) sau un complet blând independent l (Calcul FIX).

Tablou LOD: Expresii nivel rând și nivel vizualizare

Nivel rând

În Tableau, expresii de referință neagregat coloanele sursei de date sunt calculate pentru fiecare rând din tabelul de bază. În acest caz, dimensionalitatea expresiei este nivelul rândului . Un exemplu de expresie la nivel de rând este:

[Vânzări] / [Profit]

Acest calcul va fi evaluat în fiecare rând al bazei de date. Valoarea vânzărilor din fiecare rând va fi împărțită la valoarea profitului din acel rând, producând o nouă coloană cu rezultatul înmulțirii (un raport de profit).

Dacă creați un calcul cu această definiție, salvați-l cu numele [ProfitRatio], apoi glisați-l din Panoul de date pe un raft, Tableau va agrega de obicei câmpul calculat pentru vizualizare:

SUM [ProfitRatio]

Nivel de vizualizare

Prin contrast, expresiile de referință agregate coloanele sursei de date sunt calculate la dimensionalitatea definită de dimensiunile din vizualizare. În acest caz, dimensionalitatea expresiei este la nivel de vizualizare. Un exemplu de expresie la nivel de vizualizare este:

sortare algoritmi c ++

SUM (Vânzări) / SUM (Profit)

Dacă trageți acest calcul pe un raft (sau îl tastați direct pe un raft ca calcul ad-hoc), Tableau îl încadrează într-un Funcția AGG :

AGG (SUM (Vânzări) / SUM (Profit))

Aceasta este ceea ce este cunoscut sub numele de Calcul agregat .

Tablou LOD: Expresii de agregare și LOD

Expresia LOD este mai aspră decât nivelul de detaliere al vizualizării

O expresie are un nivel de detaliu mai grosier decât vizualizarea atunci când face referire la a subset de dimensiuni în vedere.

De exemplu, pentru o vizualizare care conținea dimensiunile [Categorie] și [Segment], puteți crea un nivel de detaliu în Tableau care utilizează doar unul dintre aceste dimensiuni:

{FIXED [Segment]: SUM ([Vânzări])}

În acest caz, expresia are un nivel de detaliu mai grosier decât vizualizarea. Își bazează valorile pe o singură dimensiune ([Segment]), în timp ce viziunea își bazează viziunea pe două dimensiuni ([Segment] și [Categorie]).

Rezultatul este că utilizarea nivelului de exprimare a detaliilor în vizualizare determină reproducerea anumitor valori - adică pentru apar de mai multe ori .

Expresia LOD este mai bună decât nivelul de detaliere al vizualizării

O expresie are un nivel de detaliu mai fin decât vizualizarea atunci când face referire la a superset al dimensiunilor în vedere.

Când utilizați o astfel de expresie în vizualizare, Tableau va agrega rezultatele până la nivelul vizualizării. De exemplu, următorul nivel de detaliu din Tableau face referire la două dimensiuni:

{FIXED [Segment], [Category]: SUM ([Sales])}

Când această expresie este utilizată într-o vizualizare care are doar [Segment] ca nivel de detaliu, valorile trebuie agregate . Iată ce ați vedea dacă ați tras expresia pe un raft:

AVG ([{FIXED [Segment]], [Category]]: SUM ([Sales]])}])

Un agregare (în acest caz, media) este atribuită automat de Tableau. Puteți modifica agregarea după cum este necesar.

Adăugarea unei expresii LOD la vizualizare

Dacă un nivel de detaliu în expresia Tableau este agregat sau reprodus în vizualizare este determinat de tipul expresiei și granularitate .

  • Expresiile INCLUDE vor avea fie același nivel de detaliu ca vizualizarea, fie un nivel de detaliu mai fin decât vizualizarea. Prin urmare, valorile nu vor fi niciodată reproduse.
  • Expresiile FIXED pot avea un nivel de detaliu mai fin decât vizualizarea, un nivel de detaliu mai grosier sau același nivel de detaliu. Necesitatea de a agrega rezultatele unui nivel de detaliu FIX depinde de ce dimensiuni sunt în vizualizare.
  • Expresiile EXCLUDE determină întotdeauna să apară valori replicate în vizualizare. Atunci când calculele, inclusiv nivelurile EXCLUDE de expresii de detaliu, sunt plasate pe un raft, Tableau implicit la Agregare ATTR spre deosebire de SUM sau AVG, pentru a indica faptul că expresia nu este de fapt agregată și că schimbarea agregării nu va avea niciun efect asupra vizualizării.

Expresiile de nivel de detaliu sunt întotdeauna înfășurate automat în agregat atunci când sunt adăugate la un raft în vizualizare, cu excepția cazului în care sunt utilizate ca dimensiuni.

Tablou LOD: Filtre și expresii LOD

Imaginea de aici descrieordinea de execuție a filtrelor de sus în jos.Textul din dreapta arată unde sunt evaluate expresiile LOD în această succesiune.

Filtrele de extracție (în portocaliu) sunt relevante numai dacă creați un extract de tablou dintr-o sursă de date. Filtrele de calcul ale tabelelor (albastru închis) se aplică după executarea calculelor și, prin urmare, ascund semnele fără a filtra datele de bază utilizate în calcule.

Calculele FIXE sunt aplicate înainte de filtrele de dimensiune, deci dacă nu promovați câmpurile de pe raftul Filtru pentru a îmbunătăți performanța vizualizării cu filtre de context, acestea vor fi ignorate.

Tablou LOD: Tipuri de expresii LOD

INCLUDE Calcul

INCLUDE calculează valori utilizând dimensiunile specificate, în plus față de orice dimensiuni sunt în vizualizare. Acest nivel de expresie a detaliilor este cel mai util atunci când includeți o dimensiune care nu este în vizualizare.

De exemplu: {INCLUDE [Nume client]: SUM ([Vânzări])}

EXCLUDE Calcul

EXCLUDE elimină în mod explicit dimensiunile din expresie - adică scad dimensiunile din nivelul de detaliere al vizualizării. Acest nivel de detaliu din Tableau este cel mai util pentru eliminarea unei dimensiuni în vizualizare.

De exemplu: {EXCLUDE [Region]: SUM ([Sales])}

Calcul FIX

FIXED calculează valorile folosind dimensiunile specificate fără referire la nivelul de detaliu al vizualizării - adică fără referire la alte dimensiuni din vizualizare. Acest nivel de expresie a detaliilor ignoră, de asemenea, toate filtrele din vizualizare, altele decât filtrele contextuale, filtrele sursei de date și filtrele extrase.

De exemplu: {FIXED [Region]: SUM ([Sales])}

Tablou LOD: Crearea expresiilor LOD

Sintaxa unei expresii LOD

Un nivel de expresie a detaliilor are următoarea structură:

INCLUDE

Pasul 1: configurați vizualizarea

  1. Deschideți Tableau Desktop și conectați-vă la Sample-Superstore sursa de date salvată.
  2. Navigați la o nouă foaie de lucru.
  3. De la Date , sub Dimensiuni, trageți Regiune la Coloane Raft.
  4. De la Date , sub Măsuri, trageți Vânzări la Rânduri Raft. Apare un grafic cu bare care arată suma vânzărilor pentru fiecare regiune.

Pasul 2: Creați expresia LOD

În loc de suma tuturor vânzărilor pe regiune, poate doriți să vedeți și vânzările medii pe client pentru fiecare regiune. Puteți utiliza o expresie LOD pentru a face acest lucru.

  1. Selectați Analiză > Creați câmp calculat.
  2. În editorul de calcul care se deschide, efectuați următoarele:
    • Denumiți calculul, Vânzări pe client.
    • Introduceți următoarea expresie LOD:

      {INCLUDE [Nume client]: SUM ([Vânzări])}

  3. Când ați terminat, faceți clic pe O.K. Expresia LOD nou creată este adăugată la panoul de date, sub Măsuri.

Pasul 3: utilizați expresia LOD în vizualizare

  1. De la Date , sub Măsuri, trageți Vânzări pe client la Rânduri raft și așezați-l în stânga SUM (Vânzări).
  2. Pe raftul Rows, faceți clic dreapta Vânzări pe client și selectați Măsura (Suma) > In medie. Acum puteți vedea atât suma tuturor vânzărilor, cât și media vânzărilor pe client pentru fiecare regiune. De exemplu, puteți vedea că în regiunea Centrală, vânzările au totalizat aproximativ 500.000 USD cu o vânzare medie pentru fiecare client fiind de aproximativ 800 USD .

Tablou LOD: Surse de date care susțin expresiile LOD

Sursă de date Suportat / Neacceptat
Actian VectorwiseNu sunt acceptate.
Amazon EMR Hadoop HiveHive acceptat de la 0,13 în sus.
Amazon RedshiftSprijinit.
Baza de date AsterVersiunea acceptată 4.5 în continuare.
Cloudera HadoopHive acceptat de la 0,13 în sus.
Cloudera ImpalaSuportat Impala 1.2.2 în continuare.
Cuburi (surse de date multidimensionale)Nu sunt acceptate.
DataStax EnterpriseNu sunt acceptate.
EXASOLSprijinit.
FirebirdVersiunea 2.0 acceptată în continuare.
ODBC genericLimitat. Depinde de sursa de date.
Google Big QuerySuportat pentru SQL standard, nu pentru Legacy.
IBM DB2Versiunea 8.1 acceptată în continuare.
MarkLogicVersiunea 7.0 acceptată în continuare.
SAP HANASprijinit.
SAP Sybase ASESprijinit.
SAP Sybase IQVersiunea acceptată 15.1 în continuare.
Spark SQLSprijinit.
SplunkNu sunt acceptate.
Tabel de extragere a datelorSprijinit.
TeradataSprijinit.
VerticaVersiunea acceptată 6.1 în continuare.
Microsoft AccessNu sunt acceptate.
Conexiuni Microsoft Jet-basedNu sunt acceptate.
Hortonworks Hadoop HiveHive acceptat de la 0,13 în sus.

În versiunea 1.1 a HIVE, expresiile LOD care produc îmbinări încrucișate nu sunt fiabile.

IBM BigInsightsSprijinit.
Microsoft SQL ServerSQL Server 2005 acceptat în continuare.
MySQLSprijinit.
IBM PDA (Netezza)Versiunea 7.0 acceptată în continuare.
OracolVersiunea acceptată 9i în continuare.
Matricea Actiană (ParAccel)Versiunea 3.1 acceptată în continuare.
Greenplum pivotVersiunea 3.1 acceptată în continuare.
PostgreSQLVersiunea 7.0 acceptată în continuare.
Progres OpenEdgeSprijinit.

Tablou LOD: Calcule de tabel vs LOD

Expresiile LOD nu sunt o formă nouă de calcule de tabel. Deși pot înlocui multe calcule de tabel, scopul lor principal este de a deschide noi posibilități.Expresiile LOD și calculele de tabel funcționează diferit.

Calcule de tabel Expresii LOD
Calculele tabelului sunt generate de Rezultatele interogării .Expresiile LOD sunt generate ca parte a interogării către sursa de date subiacentă . Ele sunt exprimate ca o selecție imbricată, deci, în funcție de performanța SGBD.
Calculele tabelului pot produc doar rezultate egale sau mai puțin granulare decât numitul LOD.LOD poate produce rezultate independent de LOD menționat .
Dimensiunile care controlează operațiunile unui tabel sunt separate de sintaxa de calcul.Dimensiunile care controlează operațiunile unei expresii LOD sunt încorporat în expresie în sine.
Calculele de tabel sunt utilizate ca măsuri agregate .Expresiile LOD pot fi utilizate în alte construcții.
Filtrele din calculele tabelului acționează ca un ASCUNDE .Filtrele de pe LOD acționează ca un EXCLUDE .

Tablou LOD: Limitări ale LOD

Următoarele sunt constrângerile care se aplică expresiilor LOD.

  • Expresiile LOD care fac referire la măsuri în virgulă mobilă tind să se comporte într-o manieră nesigură atunci când sunt utilizate într-o vedere care necesită o comparație a valorilor din expresie.
  • LOD nu este afișat pe pagina Sursă de date.
  • Când faceți referire la un parametru într-o declarație de dimensionalitate, utilizați întotdeauna numele parametrului și nu valoarea parametrului.
  • În cazul amestecării datelor, câmpul de conectare din sursa de date primară trebuie să fie în vizualizare înainte de a putea utiliza o expresie de nivel de detaliu din sursa de date secundară.

În plus, unele surse de date au limite de complexitate. Tabloul nu va dezactiva calculele pentru aceste baze de date, dar erorile de interogare sunt o posibilitate dacă calculele devin prea complexe.