Masterdata management en datakwaliteit

5 december 2019

Erwin Lima

Digital strategist

Eenduidige definities en data governance

Een data-gedreven cultuur en een flexibel dataplatform zijn goede basisvereisten. Maar de toegevoegde waarde van Data & Analytics valt of staat met de kwaliteit van uw data. Hoe borgt u de kwaliteit van uw data? We bespreken hieronder de processen, governance, het beleid, en de richtlijnen die u kunt gebruiken om continu uw bedrijfskritische data te (her)definiëren en te managen.

Data biedt enorm veel mogelijkheden om de bedrijfsvoering effectiever en efficiënter te maken. Maar om de maximale waarde uit uw data te halen, is veel meer nodig dan een data-oplossing als Microsoft Power BI. Om echt meerwaarde te halen uit de data die organisaties vandaag de dag rijk zijn, zijn vier kritische factoren benodigd:

  1. Een data-gedreven manier van werken en denken. In de whitepaper “Data-gedreven werken: veel meer dan alleen techniek” leest u meer over het creëren van een data-gedreven organisatie.
  2. Een flexibel dataplatform dat het mogelijk maakt om data te verzamelen, aan elkaar te koppelen en te analyseren. Lees hier meer over het creëren van een toekomstbestendig dataplatform.
  3. Masterdata management, wat helpt zorgen voor schone data en voor one version of the truth: iets dat onontbeerlijk is voor data-gedreven besluitvorming.
  4. Gekoppeld aan Masterdata management is data governance: een proces voor het verbeteren en borgen van de kwaliteit van data.

In dit artikel leest u meer over de onderste twee punten.

Masterdata management: hoe krijg je de datakwaliteit op orde?

We spreken veel en vaak over data-gedreven werken en denken, hoe de medewerker mee te krijgen in gewenste veranderingen en over het opzetten van een flexibel dataplatform. Maar hoe pak je datakwaliteit aan? We zien in veel sectoren en organisaties dat datakwaliteit een struikelblok is voor de reis naar een echt data-gedreven werkwijze. Hoe zorgt u ervoor dat uw masterdata op orde is?

Stap 1: Het begint bij de vraag

Eén van de eerste dingen die u moet doen wanneer u aan de slag wilt gaan met het opzetten of verbeteren van een dataplatform, of het data-gedreven werken, is een controlevraag stellen. En dat is vaak een heel eenvoudige vraag die u aan de organisatie stelt. Die vraag kan bijvoorbeeld zijn:

“Hoeveel klanten heb je?” of; “Hoeveel producten verkoop je?” En dan wat complexer: “Hoeveel producten verkoop je per klant?”

U zult zien dat heel veel organisaties geen betrouwbaar antwoord kunnen geven op deze vragen. Deze constatering is een goed begin. Hoe kan het dat zo’n simpele vraag zo lastig te beantwoorden is? En hoe los je dat op?

Vervuilde data en een definitieprobleem

Het feit dat veel organisaties zulke simpele vragen eigenlijk niet helder kunnen beantwoorden, komt onder andere doordat er vaak sprake is van vervuilde data.

Een praktisch voorbeeld: we kijken bij een grote Nederlandse logistieke organisatie, waarvan de medewerkers al hun transacties registreren in een financieel systeem. Als we echter van iets dichterbij naar dat systeem gaan kijken, dan zien we dat sommige klanten daar vijftien keer “uniek” in voorkomen.

Dat heeft dan puur te maken met het feit dat een klantnaam op verschillende manieren is geschreven, dus bijvoorbeeld ‘Motion10’, ‘Motion 10’, ‘Motion10 bv’, etc. Merk op; dit zijn voorbeelden die in de praktijk letterlijk voorkomen.

Dat dit het geval is, maakt het heel lastig om bijvoorbeeld echt klantgericht te worden. Meer klantgericht werken is vaak één van de business drivers voor organisaties om de volgende stap te zetten met Data & Analytics.

“Als je niet eens weet hoeveel klanten je hebt, hoe kun je dan ooit echt klantgericht worden?”

Vervuilde data heeft – naast slordige invoer en laks beheer van data, ook te maken met het voeren van eenduidige definities binnen uw organisatie. Wat is de definitie van een klant? En van een product? Welke kenmerken en data horen daar allemaal aan gekoppeld te zijn?

Het is dus belangrijk dat u uw data schoon invoert, en schoonhoudt. En daarnaast is het van fundamenteel belang dat u eenduidige definities vastlegt en hanteert. En dat u de kwaliteit van uw data continu monitort.

De toegevoegde waarde van Data & Analytics begint bij het hanteren van éénduidige definities van alles waarover u data verzamelt.

Stap 2: Het belang van eenduidige definities en schone data

Als u dus naar de oplossing wilt kijken, is van het grootste belang dat de mensen in uw organisatie het allereerst over één gegeven eens zijn: Dat het belangrijk is om een eenduidig klantbeeld te hebben. En een eenduidig productbeeld, et cetera.

Een organisatiebreed gedeeld bewustzijn over het belang van eenduidige definities en de kwaliteit van data is onontbeerlijk.

Stap 3: Hoe kom je tot eenduidige definities?

Consensus over definities bereiken is één van de meest uitdagende stappen in het werken met Data Analytics. Ons advies daarvoor is: stel om te beginnen een definitie voor, bijvoorbeeld van een klant.

De definitie van een klant zou kunnen zijn: “Een klant is iemand die bekend staat met de naam waarmee hij bij de KvK bekend staat; waar een financiële relatie mee is, en waar goederen of diensten aan geleverd zijn.” Door deze definitie voor te stellen neemt u eigenlijk een standpunt in.

U zal zien dat u enkel een reactie krijgt van de mensen die met deze definitie te maken hebben, en die kritisch zijn op het voorstel. Dat maakt het proces vele malen makkelijker dan reactief iedereen  in de organisatie om input te vragen. Het ideale scenario is overigens dat de uiteindelijk overeengekomen definitie gedragen wordt vanuit de directie.

Stap 4: Data opschonen en beheren

Wilt u vandaaruit de data die u al verzameld heeft gaan opschonen? Dan zult u drie belangrijke stappen moeten ondernemen: ten eerste bekijken waar u de data moet gaan opschonen, ten tweede bepalen hoe u die data gaat opschonen, en ten derde zorgen dat de eenduidigheid en daarmee de betrouwbaarheid van uw data beheerd blijven.

  1. Bekijk waar u de vervuilde data moet gaan opschonen.
    Er zijn algoritmes die u kunnen helpen met uitvinden waar u moet zoeken, maar u zult dit zeker nog grotendeels handmatig moeten vaststellen. In welke datasets, systemen, en bestanden zitten de foutieve records?
  2. Bepaal hoe u gaat opschonen.
    Bijvoorbeeld: Alles waar ‘Motion 10’ met een spatie staat, gaat u vervangen. Dat betekent dus dat u daadwerkelijk de brondata op gaat schonen. Dat is een optie, maar het is wel inefficiënt.Een andere manier om de data op te schonen is door een koppeling te creëren. Dan bepaalt u: “De rapportagenaam van mijn klant is ‘Motion10’, en ik weet dat die in een operationeel systeem, of meerdere systemen, onder ‘Motion10’, ‘Motion 10’, ‘Motion 10 BV’ etc. genoemd wordt”. De koppeling zorgt ervoor dat uw dataplatform dit dan herkent als één en dezelfde klant.
  3. Zorg dat de data beheerd blijft (Governance).
    Data governance heeft te maken met het inregelen van applicatiebeheer en systemen, maar primair met interne afspraken over bepaalde processen. “Wat gebeurt er als jij een nieuwe klantnaam aanmaakt? Hoe loopt dat proces?”Continue monitoring van de datakwaliteit is ook een belangrijke manier om de kwaliteit van uw data en daarmee van uw besluiten te kunnen verbeteren. Monitoring van datakwaliteit kunt u ook ondersteund door systemen uitvoeren, maar ook dit is primair gestoeld op een continu proces van aanscherping van uw werkafspraken.

Meer weten over Masterdata management?

Wilt u vanuit een breder perspectief bekijken hoe u uw organisatie naar de volgende stap helpt in het Data-gedreven werken en denken? Bekijk dan onze nieuwste whitepaper, of neem direct contact op met één van onze experts op het gebied van Masterdata management.