Het belang van master data voor BI

Inleiding

Business Intelligence is in veel organisaties niet meer weg te denken als onderdeel van een effectieve bedrijfsvoering. Het belang hiervan neemt toe in vrijwel alle soorten organisaties, groot of klein. Dit komt doordat leveranciers van standaard (ERP) applicaties BI meenemen in hun aanbod, en ook doordat nieuwe spelers op de markt zorgen voor een neerwaartse prijsdruk.

In eerdere artikelen hebben we al stilgestaan bij wat BI betekent, dus laten we het dit keer kort belichten: Met behulp van BI willen we door middel van mensen en een organisatie, tezamen met middelen en producten ruwe data omzetten naar betekenisvolle data (informatie) om aan de hand daarvan een organisatie beter te sturen.

Het belang van data integratie

Belangrijk is dat bestaande data met behulp van definities wordt omgevormd (getransformeerd) naar betekenisvolle data. Daarbij maakt het nogal een verschil of deze data afkomstig is uit een enkele bron, of uit meerdere bronnen die samengevoegd moeten worden.

In het laatste geval spelen discussies over datakwaliteit vaak een rol.

Deze discussies ontstaan vooral doordat gegevens in de optiek van elke bron op orde zijn (actueel, correct, compleet, uniek identificeerbaar), maar bij elkaar niet meer.

Dit heeft vooral te maken met het feit dat gegevens die gedeeld worden – master data genaamd – niet in elke bron voor een BI oplossing hetzelfde is opgebouwd.

Definities van soorten data

De term “master data” is gevallen. Laten we eerst stilstaan bij wat we verstaan onder master data. Zo onderscheiden we momenteel drie typen gegevens ie binnen een onderneming aanwezig zijn. Deze typen zijn:

Master Data

Master gegevens zijn entiteiten die in meerdere systemen binnen een organisatie worden gebruikt. Zo is de entiteit product een sprekend voorbeeld, maar ook klanten, leveranciers, medewerkers, etc. Een belangrijk aandachtspunt is dat deze gegevens met verschillende attributen in meerdere systemen (redundant) zijn opgeslagen.

Meta Data

Meta gegevens zijn gegevens over gegevens. Meta gegevens beschrijven de entiteiten op een technische en functionele manier.

Voorbeelden van technische beschrijvingen zijn datatypen (numeriek, tekst) en lengtes.

Voorbeelden van functionele beschrijvingen zijn definities, bewerkingen en herkomst.

Transaction Data

Met de transactiegegevens worden de specifieke feiten benoemd die kenmerkend zijn voor een bepaald systeem. Bijvoorbeeld ordergegevens in een ordersysteem en verkoopgegevens in een verkoopsysteem. Deze gegevens zijn uniek binnen een bepaald systeem.

Master data

Om tot een flexibele en schaalbare BI-oplossing te komen, zal men meer aandacht moeten besteden aan de kwaliteit van de gegevens binnen de onderneming. Probeerde men eerst vooral de gegevens eenduidig te maken door deze uniform op te slaan in een centrale database en deze uniform te houden over meerdere bronnen, tegenwoordig zal er steeds meer gebruik worden gemaakt van zogenaamde master data management systemen (MDM systemen of hubs).

Dit wordt vooral ingegeven doordat veel organisaties kiezen voor een zo standaard mogelijke ERP implementatie (“vanilla” implementatie) waardoor aanpassingen om gegevens uniform over meerdere ERP’s te houden niet wenselijk zijn.

De gedeelde gegevens zullen dan door middel van andere manieren aan elkaar gerelateerd moeten worden. Logica als gegevens “matching & merging” is noodzakelijk.

Matching om op basis van data inhoud tot de conclusie komen welke gegevens identiek zijn.

Merging om op basis van meerdere definities te komen tot een “golden row”.

De plaats van master data

Dit betekent dus dat de gegevens op een andere plaats uniform vastgelegd moeten worden. Dit kan een data warehouse zijn, als onderdeel van een BI-oplossing, maar ook is een apart MDM systeem (een zogenaamde hub) een mogelijkheid.

Analytisch MDM-systeem

Wanneer we kiezen voor MDM als onderdeel van een Data Warehouse, dan noemen we dit een “analytisch MDM-systeem”. Binnen het Data Warehouse worden gedeelde gegevens vanuit meerdere bronnen aan elkaar gerelateerd met behulp van MDM.

Nadeel van deze manier van MDM regelen is dat je achteraf vaak tot de conclusie komt welke gegevens bij elkaar horen. De data is dan al geladen in een Data Warehouse en staat klaar voor publicatie. Ook is een nadeel dat het feitelijke databeheer komt te liggen bij een BI-team, voor wie data-inhoud niet de primaire taak is.

Operationeel MDM-systeem

Een andere manier om MDM te implementeren is door het systeem onderdeel van de bronapplicaties te laten zijn. Daarbij wordt er een aparte “hub” gemaakt voor de masterdata. Elke bron levert op zijn beurt gegevens aan voor matching & merging. Het MDM-systeem is daarmee een additionele bron voor de BI-oplossing.

Voordeel van deze opzet is dat het eigenaarschap van de data blijft bij de doelgroep waar deze behoort: de business users. Het MDM-systeem levert de data aan van de ‘golden rows’, als wel de sleutelgegevens van de gerelateerde data uit de overige bronsystemen.

Samenvatting

Om tot een flexibele en schaalbare BI-oplossing te komen is het onderkennen van het belang van master data cruciaal. Vooral wanneer data vanuit meerdere bronnen bijeen moet komen voor relevante BI.

MDM onderbrengen bij de bronapplicaties lijkt een logische keuze vanuit het oogpunt van de organisatie en beheer rondom master data. Daarmee is niet gezegd dat MDM een gemakkelijk onderwerp is. Niet voor niets worstelen heel veel organisatie hiermee…

Reacties zijn gesloten.