Waarom zou je mixen als je al kunt deelnemen aan Tableau?



Data Blending in Tableau - een methode die wordt gebruikt wanneer er gerelateerde data in meerdere databronnen staat, die je samen in één weergave wilt analyseren.

In een wereld die 2,5 quintillion bytes aan data per dag genereert en verbruikt, zijn organisaties ongetwijfeld op zoek naar nieuwe methoden om data te transformeren en te combineren om zo een optimale efficiëntie te bereiken. Een van die methoden om gegevens te combineren is Data Blending in Tableau .

Omdat dit zo'n belangrijk doel dient in de gegevenscyclus van een bepaalde organisatie, is het in de meeste organisaties een zeer essentiële module . In deze blog bespreken we de volgende concepten:





Waarom heb je Data Blending nodig in Tableau?

Stel dat u een Ontwikkelaarstabel wie transactiegegevens heeft opgeslagen in Salesforce en quotagegevens heeft opgeslagen in Access. De gegevens die u wilt combineren, worden in verschillende databases opgeslagen en de granulariteit van de gegevens die in elke tabel zijn vastgelegd, verschilt in de twee gegevensbronnen, dus gegevensblending is de beste manier om deze gegevens te combineren.

Het combineren van gegevens is nuttig onder de volgende omstandigheden:



  1. U wilt gegevens uit verschillende databases combineren die niet worden ondersteund door cross-database joins.

    Cross-database joins ondersteunen geen verbindingen met kubussen (bijvoorbeeld Oracle Essbase) of met sommige alleen-extract-verbindingen (bijvoorbeeld Google Analytics). Stel in dat geval afzonderlijke gegevensbronnen in voor de gegevens die u wilt analyseren, en gebruik vervolgens gegevensblending om de gegevensbronnen op één blad te combineren.

  2. Gegevens zijn op verschillende detailniveaus.

    Soms legt één dataset gegevens vast met behulp van verschillende detailniveaus d.w.z. grotere of kleinere granulariteit dan de andere dataset.

    Stel dat u transactiegegevens en quotagegevens analyseert. Transactiegegevens kunnen alle transacties vastleggen. Quotagegevens kunnen echter transacties op kwartaalniveau aggregeren. Omdat de transactiewaarden in elke gegevensset op verschillende detailniveaus worden vastgelegd, moet u gegevensovervloeiing gebruiken om de gegevens te combineren.



Wat is gegevensblending in Tableau?

Data Blending is een zeer krachtige functie in Schoolbord . Het wordt gebruikt als er gerelateerde gegevens zijn in meerdere gegevensbronnen, die u samen in één weergave wilt analyseren. Het is een methode voor het combineren van gegevens die een tabel met gegevens uit de ene gegevensbron aanvult met kolommen met gegevens uit een andere gegevensbron.

statisch blokvoorbeeld in java

Gewoonlijk gebruikt u joins om dit soort gegevenscombinaties uit te voeren, maar er zijn momenten dat het, afhankelijk van factoren zoals het type gegevens en de granulariteit, beter is om gegevensblending te gebruiken.

Wat is het verschil met het samenvoegen van gegevens?

Data blending simuleert een traditionele linkse join. Het belangrijkste verschil tussen de twee is wanneer de join wordt uitgevoerd met betrekking tot aggregatie.

Linker toetreden

Als u een linkse join gebruikt om gegevens te combineren, wordt een query verzonden naar de database waar de join wordt uitgevoerd. Als u een linkse join gebruikt, worden alle rijen uit de linkertabel geretourneerd en alle rijen uit de rechtertabel met een overeenkomende rij in de linkertabel. De resultaten van de join worden vervolgens teruggestuurd naar en geaggregeerd door Tableau.

Stel dat u de volgende tabellen heeft. Als de gemeenschappelijke kolommen gebruikersnaam , een linkse join neemt alle gegevens uit de linkertabel en alle gegevens uit de rechtertabel, omdat elke rij een overeenkomende rij heeft in de linkertabel.

Gegevens samenvoegen - Gegevens mengen in Tableau - EdurekaGegevens mengen

Wanneer u gegevensblending gebruikt om gegevens te combineren, wordt een query naar de database verzonden voor elke gegevensbron die op het blad wordt gebruikt. De resultaten van de queries, inclusief de geaggregeerde data, worden teruggestuurd en gecombineerd door Tableau. De weergave gebruikt alle rijen uit de primaire gegevensbron, de linkertabel en de geaggregeerde rijen uit de secundaire gegevensbron, de rechtertabel, op basis van de dimensie van de koppelingsvelden.

U kunt het koppelingsveld wijzigen of meer koppelingsvelden toevoegen om verschillende of extra rijen gegevens uit de secundaire gegevensbron in de blend op te nemen, door de geaggregeerde waarden te wijzigen.

Stel dat u de volgende tabellen heeft. Als de koppelingsvelden gebruikersnaam in beide tabellen worden uw gegevens gemengd met alle gegevens uit de linkertabel, en de linkertabel aangevuld met de gegevens uit de rechtertabel. In dit geval kunnen niet alle waarden deel uitmaken van de resulterende tabel vanwege het volgende:

  • Een rij in de linkertabel heeft geen overeenkomende rijovereenkomst in de rechtertabel, zoals aangegeven door de null-waarde.
  • Er zijn meerdere overeenkomstige waarden in de rijen in de rechtertabel, zoals aangegeven door de asterisk (*).

Stel dat u dezelfde tabellen heeft als hierboven, maar de secundaire gegevensbron bevat een nieuw veld met de naam Doeleinden . Nogmaals, als het koppelingsveld is gebruikersnaam Als u uw gegevens combineert, worden alle gegevens uit de linkertabel gehaald en aangevuld met gegevens uit de rechtertabel. In dit geval ziet u dezelfde null-waarde en sterretjes in het vorige voorbeeld, naast het volgende:

  • Omdat de Doeleinden veld is een maat, u ziet de rijwaarden voor deDoeleindenveld geaggregeerd voordat de gegevens in de rechtertabel worden gecombineerd met de gegevens in de linkertabel.
  • Net als bij het vorige voorbeeld heeft een rij in de linkertabel niet de bijbehorende rij voor de Doeleinden veld, zoals aangegeven door de tweede null-waarde.

Wanneer te vervangen door lid te worden van Mengen

1. Gegevens moeten worden opgeschoond.

Als uw tabellen na een samenvoeging niet correct met elkaar overeenkomen, stelt u gegevensbronnen in voor elke tabel, brengt u de nodige aanpassingen aan (dat wil zeggen: hernoem kolommen, wijzig kolomgegevenstypen, maak groepen, gebruik berekeningen, enz.), En gebruik vervolgens data blending om de data te combineren.

2. Joins veroorzaken dubbele gegevens.

Dubbele gegevens na een join is een symptoom van gegevens op verschillende detailniveaus. Als u dubbele gegevens opmerkt, kunt u in plaats van een join te maken, gegevensovervloeiing gebruiken om op een gemeenschappelijke dimensie te mengen.

3. Je hebt veel gegevens.

Gewoonlijk worden joins aanbevolen voor het combineren van gegevens uit dezelfde database. Joins worden afgehandeld door de database, waardoor joins gebruik kunnen maken van enkele van de native mogelijkheden van de database. Als u echter met grote sets gegevens werkt, kunnen joins de database onder druk zetten en de prestaties aanzienlijk beïnvloeden. In dit geval kan het combineren van gegevens helpen. Omdat Tableau zorgt voor het combineren van de gegevens nadat de gegevens zijn geaggregeerd, zijn er minder gegevens om te combineren. Als er minder gegevens moeten worden gecombineerd, verbetert de prestatie over het algemeen.

Je gegevens combineren in Tableau

U kunt gegevensblending gebruiken als u gegevens in afzonderlijke gegevensbronnen hebt die u samen op één blad wilt analyseren. Tableau heeft twee ingebouwde databronnen genaamd Voorbeeld-superstore en Voorbeeld koffieketen.mdb die zal worden gebruikt om het mengen van gegevens te illustreren.

Stap 1: Maak verbinding met uw gegevens en stel de gegevensbronnen in

  • Maak verbinding met een set gegevens en stel de gegevensbron in op de gegevensbronpagina. Een iknbuilt gegevensbron Voorbeeld koffieketen.mdb ,dat een MS Access-databasebestand is, zal worden gebruikt om het mengen van gegevens te illustreren.
  • Ga naar Gegevens > Nieuwe gegevensbron, maak verbinding met de tweede set gegevens.In dit voorbeeld wordt de Voorbeeld - Superstore databron. Then het opzetten van de gegevensbron.
  • Klik op de bladtab om uw weergave te bouwen.

Stap 2: Wijs een primaire gegevensbron aan

  • Sleep ten minste één veld van uw primaire gegevensbron naar de weergave om deze aan te wijzen als de primaire gegevensbron. In de Gegevens op de gegevensbron die u wilt aanwijzen als de primaire gegevensbron. In dit voorbeeld Voorbeeld koffieketen is geselecteerd.
  • De volgende schermafbeelding toont de verschillende tabellen en joins die beschikbaar zijn in het bestand.

Stap 3: Wijs een secundaire gegevensbron aan

  • Velden die in de weergave worden gebruikt vanuit gegevensbronnen die niet de primaire gegevensbron of actieve koppelingen zijn, wijzen automatisch volgende gegevensbronnen aan als de secundaire gegevensbron. In dit geval Sample Superstore.

Stap 4: gegevens mengen

  • Nu kunt u de gegevens van beide bronnen integreren op basis van een gemeenschappelijke dimensie ( Staat , in dit geval). Merk op dat er een kleine linkafbeelding verschijnt naast de dimensie - Staat. Dit geeft de gemeenschappelijke dimensie tussen de twee gegevensbronnen aan.
  • Stel dat u een staafdiagram maakt met Winstverhouding in de kolomplank en Staat in de Row Shelf laat de grafiek zien hoe de winstverhouding varieert voor elke staat in zowel de superstore als de coffeeshops.

Beperkingen van Data Blending in Tableau

  1. Er zijn enkele beperkingen voor het mengen van gegevens rond niet-additieve aggregaten, zoals MEDIAAN , en RAWSQLAGG .
  2. Data Blending brengt de snelheid van Query in hoge granulariteit in gevaar.
  3. Wanneer u probeert te sorteren op een berekend veld dat gemengde gegevens gebruikt, wordt het berekende veld niet weergegeven in de vervolgkeuzelijst Veld van het dialoogvenster Sorteren.
  4. Kubusgegevensbronnen kunnen alleen worden gebruikt als de primaire gegevensbron voor het mengen van gegevens in Tableau. Ze kunnen niet worden gebruikt als secundaire gegevensbronnen.

Ik hoop dat jullie er nu allemaal een goed idee van hebben Data Blending in Tableau van deze blog. Hongerig naar meer kennis? Maak u geen zorgen, deze video geeft u een beter begrip van het concept.