Power BI proeftuin (1/3)

Inleiding

Microsoft timmert de laatste paar jaar enorm aan de weg met Power BI. Het product wordt maandelijks verrijkt met nieuwe functies en daarmee steeds beter. Dit wordt ook gezien door de markt en marktonderzoekers zoals Gartner met hun ‘magic quadrant for BI and Analytics’.

In dit artikel gaan we aan de hand van een demonstratie dataset (2 dimensionele modellen) aan de slag om in concrete stappen toe te werken naar bruikbare ‘analytics’.
Daarbij lopen we tegen praktische zaken aan, en zullen dan ook ingaan op de wijze waarop we die hebben aangepakt.

Alhoewel we soms een vergelijking maken met OBIEE, is dit artikel vooral niet bedoeld om de twee producten te vergelijken en een oordeel te geven. De vergelijking is vooral gedaan, omdat onze kennis en kunde van oorsprong ligt bij de Oracle technologie.

We willen in een serie van 3 artikelen vooral laten zien waar we tegenaan gelopen zijn bij lastiger onderwerpen, en hoe we dit hebben opgelost.

  • Artikel 1: Uitleg van de proeftuin en samenvatting bevindingen (dit artikel)
  • Artikel 2: Modelleren en “shapen” van de data
  • Artikel 3: Visualisaties maken en publicatie

Achterliggend datamodel

Voor de set van gegevens is gebruik gemaakt van een datamodel dat gaat over verkopen van producten. Naast deze verkopen – realisatiecijfers – is er ook de beschikbaarheid van een budget (forecasts).

Er zijn dus twee dimensionele modellen, waarbij sprake is van 2 gedeelde dimensies. De figuur hieronder geeft aan hoe deze modellen zijn opgebouwd.

In deze figuur zien we de volgende opvallende zaken:

  • Tijd en Verkoper zijn gedeelde dimensies;
  • Verkoper is voor actuals en forecasts op hetzelfde niveau gekoppeld (conformed dimension);
  • Tijd is op een verschillend niveau gekoppeld aan de actuals en forecasts;
  • Markt en Product zijn alleen gekoppeld aan de actuals.

Bij de uitwerking van het datamodel in Power BI moet er vooral gezocht worden naar een oplossing voor ongelijkheid tussen maanden en dagen, om toch de actuals en forecasts te kunnen combineren.

En bij het maken van rapporten waarbij de forecasts worden gecombineerd met product en/of markt zijn we benieuwd wat de uitkomst is, en of we nog bijzondere voorzieningen in het Power BI datamodel (tabular model) moeten treffen.

Overall stappenplan

In een eerder artikel zijn we al een keer ingegaan op het stappenplan om van data te komen tot analytics. Dit stappenplan is:

  1. Specificeren van het model. Dit is het maken van een datamodel. Je legt relaties tussen dimensies en feiten.
  2. Afronden van het model. Je maakt optioneel meetwaarden en afgeleide attributen. Verder kun je de gegevens typeren (tekst, datum, getal) en formatteren. Ook kun je bepaalde gegevens die je voor de techniek nodig hebt, verbergen voor de business users.
  3. Creatie van visualisaties. Dit is het maken van rapporten op basis van de dataset.

Deze eerste drie stappen leiden tot een definitie van een Power BI desktop document, een .pbix bestand.

  1. Publicatie van de gemaakte BI-oplossing. Dit is het inlezen van het Power BI desktop document in powerbi.com. Daarna kun je bepaalde visualisaties op een dashboard plaatsen en de BI-oplossing delen met andere personen.

Samenvatting bevindingen

  • In het tabular model kun je omgaan met feiten en gedeelde dimensies op niet-gelijk niveau door ze op hetzelfde (laagste) niveau te brengen.
  • In rapporten zie je altijd hetzelfde getal voor een meetwaarde die je combineert met een dimensie, maar die eigenlijk geen verband hebben. Dit is een keuze; naar ons idee was het beter om geen waarde te tonen. Dan zie je direct dat je combinaties maakt die er niet zijn.
  • Een speciale dimensie voor de tijd (kalender) maken en vullen is in de praktijk handig.
  • Hiërarchieën hebben weinig toegevoegde waarde. Je kunt in de visualisaties zelf bepalen welk detailniveau en drill-down gewenst is. Daarmee krijg je alle vrijheid die je wenst.
  • Aandachtspunt is de gebruikte taal in Power BI Desktop en de Power BI service. De standaard namen van attributen kunnen daardoor wijzigen.

Dit artikel wordt vervolgd in deel 2 en 3.

Reacties zijn gesloten.