Scopul oricărui instrument BI este să ofere Analiza datelor un flux mai bun. Dacă unul, ca profesionist, se confruntă cu dificultatea de a utiliza instrumentul în timp ce rezolvă o problemă, starea fluxului este ruptă. O cauză comună a acestei probleme este necesitatea de a lucra cu date care au fost agregate la diferite Nivelul de detaliu în tablou (LOD) .
Tabloul plasat deasupra grămezii pentru a 6-a oară la rând, pe Gartner’s Magic Quadrant, spune cu siguranță ceva despre cererea sa pe piață. Acesta este probabil cel mai bun moment pentru a .
Acest blog vă va ajuta să înțelegeți expresiile LOD și să discutați următoarele subiecte:
- De ce aveți nevoie de nivel de detaliu în Tableau?
- Ce este nivelul de detaliu în Tableau?
- Expresii nivel rând și nivel vizualizare
- Tipuri de expresii LOD
- Expresii de agregare și LOD
- Filtre și expresii LOD
- Crearea expresiilor LOD
- Surse de date care susțin nivelul de detaliu în Tableau
- Tabel Calcule vs Nivel de detaliu în Tablou
- Limitări ale nivelului de detaliu în tablou
Tablou LOD: De ce ai nevoie de LOD?
Există adesea întrebări pe care cineva trebuie să le întâmpine atunci când analizăm date. Aceste întrebări sunt deseori simple de pus, dar greu de răspuns. De multe ori sună ceva de genul:
Pentru a aborda aceste tipuri de întrebări, a fost introdusă o nouă sintaxă numită Nivelul de detaliu în Tabloul 9.0. Această nouă sintaxă a simplificat și extins limbajul de calcul al Tableau, făcând posibilă abordarea directă a acestor întrebări.
Tablou LOD: Ce este LOD?
Expresiile LOD reprezintă un mod elegant și puternic de a răspunde la întrebări care implică mai multe niveluri de granularitate într-o singură vizualizare.
Nivelul de detaliu în expresiile Tableau sau LOD vă permit să calculați valori la nivelul sursei de date și la nivelul de vizualizare. Cu toate acestea, expresiile LOD vă oferă și mai mult control asupra nivelului de granularitate pe care doriți să îl calculați. Ele pot fi efectuate la a mai granular nivel (INCLUDE Calcul), a mai puțin granulare nivel (EXCLUDE Calcul) sau un complet blând independent l (Calcul FIX).
Tablou LOD: Expresii nivel rând și nivel vizualizare
Nivel rând
În Tableau, expresii de referință neagregat coloanele sursei de date sunt calculate pentru fiecare rând din tabelul de bază. În acest caz, dimensionalitatea expresiei este nivelul rândului . Un exemplu de expresie la nivel de rând este:
[Vânzări] / [Profit]
Acest calcul va fi evaluat în fiecare rând al bazei de date. Valoarea vânzărilor din fiecare rând va fi împărțită la valoarea profitului din acel rând, producând o nouă coloană cu rezultatul înmulțirii (un raport de profit).
Dacă creați un calcul cu această definiție, salvați-l cu numele [ProfitRatio], apoi glisați-l din Panoul de date pe un raft, Tableau va agrega de obicei câmpul calculat pentru vizualizare:
SUM [ProfitRatio]
Nivel de vizualizare
Prin contrast, expresiile de referință agregate coloanele sursei de date sunt calculate la dimensionalitatea definită de dimensiunile din vizualizare. În acest caz, dimensionalitatea expresiei este la nivel de vizualizare. Un exemplu de expresie la nivel de vizualizare este:
sortare algoritmi c ++
SUM (Vânzări) / SUM (Profit)
Dacă trageți acest calcul pe un raft (sau îl tastați direct pe un raft ca calcul ad-hoc), Tableau îl încadrează într-un Funcția AGG :
AGG (SUM (Vânzări) / SUM (Profit))
Aceasta este ceea ce este cunoscut sub numele de Calcul agregat .
Tablou LOD: Expresii de agregare și LOD
Expresia LOD este mai aspră decât nivelul de detaliere al vizualizării
O expresie are un nivel de detaliu mai grosier decât vizualizarea atunci când face referire la a subset de dimensiuni în vedere.
De exemplu, pentru o vizualizare care conținea dimensiunile [Categorie] și [Segment], puteți crea un nivel de detaliu în Tableau care utilizează doar unul dintre aceste dimensiuni:
{FIXED [Segment]: SUM ([Vânzări])}
În acest caz, expresia are un nivel de detaliu mai grosier decât vizualizarea. Își bazează valorile pe o singură dimensiune ([Segment]), în timp ce viziunea își bazează viziunea pe două dimensiuni ([Segment] și [Categorie]).
Rezultatul este că utilizarea nivelului de exprimare a detaliilor în vizualizare determină reproducerea anumitor valori - adică pentru apar de mai multe ori .
Expresia LOD este mai bună decât nivelul de detaliere al vizualizării
O expresie are un nivel de detaliu mai fin decât vizualizarea atunci când face referire la a superset al dimensiunilor în vedere.
Când utilizați o astfel de expresie în vizualizare, Tableau va agrega rezultatele până la nivelul vizualizării. De exemplu, următorul nivel de detaliu din Tableau face referire la două dimensiuni:
{FIXED [Segment], [Category]: SUM ([Sales])}
Când această expresie este utilizată într-o vizualizare care are doar [Segment] ca nivel de detaliu, valorile trebuie agregate . Iată ce ați vedea dacă ați tras expresia pe un raft:
AVG ([{FIXED [Segment]], [Category]]: SUM ([Sales]])}])
Un agregare (în acest caz, media) este atribuită automat de Tableau. Puteți modifica agregarea după cum este necesar.
Adăugarea unei expresii LOD la vizualizare
Dacă un nivel de detaliu în expresia Tableau este agregat sau reprodus în vizualizare este determinat de tipul expresiei și granularitate .
- Expresiile INCLUDE vor avea fie același nivel de detaliu ca vizualizarea, fie un nivel de detaliu mai fin decât vizualizarea. Prin urmare, valorile nu vor fi niciodată reproduse.
- Expresiile FIXED pot avea un nivel de detaliu mai fin decât vizualizarea, un nivel de detaliu mai grosier sau același nivel de detaliu. Necesitatea de a agrega rezultatele unui nivel de detaliu FIX depinde de ce dimensiuni sunt în vizualizare.
- Expresiile EXCLUDE determină întotdeauna să apară valori replicate în vizualizare. Atunci când calculele, inclusiv nivelurile EXCLUDE de expresii de detaliu, sunt plasate pe un raft, Tableau implicit la Agregare ATTR spre deosebire de SUM sau AVG, pentru a indica faptul că expresia nu este de fapt agregată și că schimbarea agregării nu va avea niciun efect asupra vizualizării.
Expresiile de nivel de detaliu sunt întotdeauna înfășurate automat în agregat atunci când sunt adăugate la un raft în vizualizare, cu excepția cazului în care sunt utilizate ca dimensiuni.
Tablou LOD: Filtre și expresii LOD
Imaginea de aici descrieordinea de execuție a filtrelor de sus în jos.Textul din dreapta arată unde sunt evaluate expresiile LOD în această succesiune.
Filtrele de extracție (în portocaliu) sunt relevante numai dacă creați un extract de tablou dintr-o sursă de date. Filtrele de calcul ale tabelelor (albastru închis) se aplică după executarea calculelor și, prin urmare, ascund semnele fără a filtra datele de bază utilizate în calcule.
Calculele FIXE sunt aplicate înainte de filtrele de dimensiune, deci dacă nu promovați câmpurile de pe raftul Filtru pentru a îmbunătăți performanța vizualizării cu filtre de context, acestea vor fi ignorate.
Tablou LOD: Tipuri de expresii LOD
INCLUDE Calcul
INCLUDE calculează valori utilizând dimensiunile specificate, în plus față de orice dimensiuni sunt în vizualizare. Acest nivel de expresie a detaliilor este cel mai util atunci când includeți o dimensiune care nu este în vizualizare.
De exemplu: {INCLUDE [Nume client]: SUM ([Vânzări])}
EXCLUDE Calcul
EXCLUDE elimină în mod explicit dimensiunile din expresie - adică scad dimensiunile din nivelul de detaliere al vizualizării. Acest nivel de detaliu din Tableau este cel mai util pentru eliminarea unei dimensiuni în vizualizare.
De exemplu: {EXCLUDE [Region]: SUM ([Sales])}
Calcul FIX
FIXED calculează valorile folosind dimensiunile specificate fără referire la nivelul de detaliu al vizualizării - adică fără referire la alte dimensiuni din vizualizare. Acest nivel de expresie a detaliilor ignoră, de asemenea, toate filtrele din vizualizare, altele decât filtrele contextuale, filtrele sursei de date și filtrele extrase.
De exemplu: {FIXED [Region]: SUM ([Sales])}
Tablou LOD: Crearea expresiilor LOD
Sintaxa unei expresii LOD
Un nivel de expresie a detaliilor are următoarea structură:
INCLUDE
Pasul 1: configurați vizualizarea
- Deschideți Tableau Desktop și conectați-vă la Sample-Superstore sursa de date salvată.
- Navigați la o nouă foaie de lucru.
- De la Date , sub Dimensiuni, trageți Regiune la Coloane Raft.
- De la Date , sub Măsuri, trageți Vânzări la Rânduri Raft. Apare un grafic cu bare care arată suma vânzărilor pentru fiecare regiune.
Pasul 2: Creați expresia LOD
În loc de suma tuturor vânzărilor pe regiune, poate doriți să vedeți și vânzările medii pe client pentru fiecare regiune. Puteți utiliza o expresie LOD pentru a face acest lucru.
- Selectați Analiză > Creați câmp calculat.
- În editorul de calcul care se deschide, efectuați următoarele:
- Denumiți calculul, Vânzări pe client.
- Introduceți următoarea expresie LOD:
{INCLUDE [Nume client]: SUM ([Vânzări])}
- Când ați terminat, faceți clic pe O.K. Expresia LOD nou creată este adăugată la panoul de date, sub Măsuri.
Pasul 3: utilizați expresia LOD în vizualizare
- De la Date , sub Măsuri, trageți Vânzări pe client la Rânduri raft și așezați-l în stânga SUM (Vânzări).
- Pe raftul Rows, faceți clic dreapta Vânzări pe client și selectați Măsura (Suma) > In medie. Acum puteți vedea atât suma tuturor vânzărilor, cât și media vânzărilor pe client pentru fiecare regiune. De exemplu, puteți vedea că în regiunea Centrală, vânzările au totalizat aproximativ 500.000 USD cu o vânzare medie pentru fiecare client fiind de aproximativ 800 USD .
Tablou LOD: Surse de date care susțin expresiile LOD
Sursă de date | Suportat / Neacceptat |
Actian Vectorwise | Nu sunt acceptate. |
Amazon EMR Hadoop Hive | Hive acceptat de la 0,13 în sus. |
Amazon Redshift | Sprijinit. |
Baza de date Aster | Versiunea acceptată 4.5 în continuare. |
Cloudera Hadoop | Hive acceptat de la 0,13 în sus. |
Cloudera Impala | Suportat Impala 1.2.2 în continuare. |
Cuburi (surse de date multidimensionale) | Nu sunt acceptate. |
DataStax Enterprise | Nu sunt acceptate. |
EXASOL | Sprijinit. |
Firebird | Versiunea 2.0 acceptată în continuare. |
ODBC generic | Limitat. Depinde de sursa de date. |
Google Big Query | Suportat pentru SQL standard, nu pentru Legacy. |
IBM DB2 | Versiunea 8.1 acceptată în continuare. |
MarkLogic | Versiunea 7.0 acceptată în continuare. |
SAP HANA | Sprijinit. |
SAP Sybase ASE | Sprijinit. |
SAP Sybase IQ | Versiunea acceptată 15.1 în continuare. |
Spark SQL | Sprijinit. |
Splunk | Nu sunt acceptate. |
Tabel de extragere a datelor | Sprijinit. |
Teradata | Sprijinit. |
Vertica | Versiunea acceptată 6.1 în continuare. |
Microsoft Access | Nu sunt acceptate. |
Conexiuni Microsoft Jet-based | Nu sunt acceptate. |
Hortonworks Hadoop Hive | Hive acceptat de la 0,13 în sus. În versiunea 1.1 a HIVE, expresiile LOD care produc îmbinări încrucișate nu sunt fiabile. |
IBM BigInsights | Sprijinit. |
Microsoft SQL Server | SQL Server 2005 acceptat în continuare. |
MySQL | Sprijinit. |
IBM PDA (Netezza) | Versiunea 7.0 acceptată în continuare. |
Oracol | Versiunea acceptată 9i în continuare. |
Matricea Actiană (ParAccel) | Versiunea 3.1 acceptată în continuare. |
Greenplum pivot | Versiunea 3.1 acceptată în continuare. |
PostgreSQL | Versiunea 7.0 acceptată în continuare. |
Progres OpenEdge | Sprijinit. |
Tablou LOD: Calcule de tabel vs LOD
Expresiile LOD nu sunt o formă nouă de calcule de tabel. Deși pot înlocui multe calcule de tabel, scopul lor principal este de a deschide noi posibilități.Expresiile LOD și calculele de tabel funcționează diferit.
Calcule de tabel | Expresii LOD |
Calculele tabelului sunt generate de Rezultatele interogării . | Expresiile LOD sunt generate ca parte a interogării către sursa de date subiacentă . Ele sunt exprimate ca o selecție imbricată, deci, în funcție de performanța SGBD. |
Calculele tabelului pot produc doar rezultate egale sau mai puțin granulare decât numitul LOD. | LOD poate produce rezultate independent de LOD menționat . |
Dimensiunile care controlează operațiunile unui tabel sunt separate de sintaxa de calcul. | Dimensiunile care controlează operațiunile unei expresii LOD sunt încorporat în expresie în sine. |
Calculele de tabel sunt utilizate ca măsuri agregate . | Expresiile LOD pot fi utilizate în alte construcții. |
Filtrele din calculele tabelului acționează ca un ASCUNDE . | Filtrele de pe LOD acționează ca un EXCLUDE . |
Tablou LOD: Limitări ale LOD
Următoarele sunt constrângerile care se aplică expresiilor LOD.
- Expresiile LOD care fac referire la măsuri în virgulă mobilă tind să se comporte într-o manieră nesigură atunci când sunt utilizate într-o vedere care necesită o comparație a valorilor din expresie.
- LOD nu este afișat pe pagina Sursă de date.
- Când faceți referire la un parametru într-o declarație de dimensionalitate, utilizați întotdeauna numele parametrului și nu valoarea parametrului.
- În cazul amestecării datelor, câmpul de conectare din sursa de date primară trebuie să fie în vizualizare înainte de a putea utiliza o expresie de nivel de detaliu din sursa de date secundară.
În plus, unele surse de date au limite de complexitate. Tabloul nu va dezactiva calculele pentru aceste baze de date, dar erorile de interogare sunt o posibilitate dacă calculele devin prea complexe.