Menu

Eenduidige definities en datakwaliteit

De toegevoegde waarde van Marketing Intelligence, Integrated Analytics, data analyse, en slim omgaan met data en koppelingen daartussen, valt of staat met het voeren van eenduidige definities van alles waarover u data verzamelt. En met de kwaliteit van uw data. We bespreken hieronder de processen, governance, het beleid, en de richtlijnen die u kunt gebruiken om continu uw bedrijfskritische data te (her)definiëren en te managen.

Om echt meerwaarde te halen uit de data die organisaties vandaag de dag rijk zijn, zijn vier kritische factoren benodigd:

  1. Een data-gedreven manier van werken en denken.
  2. Een flexibel dataplatform dat het mogelijk maakt om data te verzamelen, aan elkaar te koppelen en te analyseren.
  3. Masterdata management, wat helpt zorgen voor schone data en voor one version of the truth: iets dat onontbeerlijk is voor data-gedreven besluitvorming.
  4. Een proces voor het verbeteren en borgen van de kwaliteit van data.

We spreken veel en vaak over data-gedreven werken en denken, hoe de medewerker mee te krijgen in gewenste veranderingen en over het opzetten van een flexibel dataplatform. Maar hoe pak je datakwaliteit aan? Hoe zorgt u ervoor dat uw masterdata op orde is?

Het begint bij de vraag

Eén van de eerste dingen die u moet doen wanneer u aan de slag wilt gaan met het opzetten of verbeteren van een dataplatform, of het data-gedreven werken, is een controlevraag stellen. En dat is vaak een heel eenvoudige vraag die u aan de organisatie stelt. Die vraag kan bijvoorbeeld zijn:

“Hoeveel klanten heb je?” of; “Hoeveel producten verkoop je?” En dan wat complexer: “Hoeveel producten verkoop je per klant?”

U zult zien dat heel veel organisaties geen betrouwbaar antwoord kunnen geven op deze vragen.

Vervuilde data en een definitieprobleem

Dat komt onder andere doordat er sprake is van vervuilde data. Een praktisch voorbeeld: we kijken bij een grote Nederlandse logistieke organisatie, waarvan de medewerkers al hun transacties registreren in een financieel systeem. Als we echter van iets dichterbij naar dat systeem gaan kijken, dan zien we dat sommige klanten daar vijftien keer “uniek” in voorkomen.

Dat heeft dan puur te maken met het feit dat een klantnaam op verschillende manieren is geschreven, dus bijvoorbeeld ‘Motion10’, ‘Motion 10’, ‘Motion10 bv’, etc. Merk op; dit zijn voorbeelden die in de praktijk letterlijk voorkomen.

Dat dit het geval is, maakt het heel lastig om echt customer centric te worden.

“Als je niet eens weet hoeveel klanten je hebt, hoe kun je dan ooit echt klantgericht worden?”

Vervuilde data heeft – naast slordige invoer en laks beheer van data, ook te maken met het voeren van eenduidige definities binnen uw organisatie. Wat is de definitie van een klant? En van een product? Welke kenmerken en data horen daar allemaal aan gekoppeld te zijn?

Het is dus belangrijk dat u uw data schoon invoert, en schoonhoudt. En daarnaast is het van fundamenteel belang dat u eenduidige definities vastlegt en hanteert. En dat u de kwaliteit van uw data continu monitort.

Informatie is de basis

De basis is nu niet meer de afdeling, of de organisatie: de basis is nu de informatie.

Een eenduidige definitie en schone data

Als u dan naar de oplossing wilt kijken, is van het grootste belang dat de mensen in uw organisatie het over één gegeven eens zijn: Dat het belangrijk is om een eenduidig klantbeeld te hebben. En een eenduidig productbeeld, et cetera.

Een organisatiebreed gedeeld bewustzijn over het belang van eenduidige definities en de kwaliteit van data is onontbeerlijk.

Eenduidige definities

Consensus over definities bereiken is één van de meest uitdagende stappen in het werken met data analytics. Oscar: “Mijn advies zou daarvoor zijn: stel een definitie voor, bijvoorbeeld van een klant – dat is iemand die bekend staat met de naam waarmee hij bij de KvK bekend staat; waar een financiële relatie mee is, en waar goederen of diensten mee geleverd zijn – en neem daarmee een standpunt in.

Je zal zien dat je enkel een reactie krijgt van de mensen die met deze definitie te maken hebben, en die kritisch zijn op het voorstel. Dat maakt het proces vele malen makkelijker dan reactief iedereen  in de organisatie om input te vragen. Het ideale scenario is overigens dat de voorgestelde definitie gedragen wordt vanuit de directie.”

Data opschonen

Wilt u vandaaruit de data die u al verzameld heeft gaan opschonen? Dan zult u drie belangrijke stappen moeten ondernemen: ten eerste bekijken waar u de data moet gaan opschonen, ten tweede bepalen hoe u die data gaat opschonen, en ten derde zorgen dat de eenduidigheid en daarmee de betrouwbaarheid van uw data beheerd blijven.

  1. Bekijk waar u de vervuilde data moet gaan opschonen. Er zijn algoritmes die u kunnen helpen met uitvinden waar u moet zoeken, maar u zult dit zeker nog grotendeels handmatig moeten vaststellen. In welke datasets, systemen, en bestanden zitten de foutieve records?
  2. Bepaal hoe u gaat opschonen. Bijvoorbeeld: Alles waar ‘Motion 10’ met een spatie staat, gaat u vervangen. Dat betekent dus dat u daadwerkelijk de brondata op gaat schonen. Dat is een optie, maar het is wel inefficiënt.Een andere manier om de data op te schonen is door een koppeling te creëren. Dan bepaalt u: “De rapportagenaam van mijn klant is ‘Motion10’, en ik weet dat die in een operationeel systeem, of meerdere systemen, onder ‘Motion10’, ‘Motion 10’, ‘Motion 10 BV’ etc. genoemd wordt”. De koppeling zorgt ervoor dat uw dataplatform dit dan herkent als één en dezelfde klant.
  3. Zorg dat de data beheerd blijft (Governance). Governance heeft te maken met het inregelen van applicatiebeheer en systemen, maar primair met interne afspraken over bepaalde processen. “Wat gebeurt er als jij een nieuwe klantnaam aanmaakt? Hoe loopt dat proces?” Continue monitoring van de datakwaliteit is ook een belangrijke manier om de kwaliteit van uw data en daarmee van uw besluiten te kunnen verbeteren. Monitoring van datakwaliteit kunt u ook ondersteund door systemen uitvoeren, maar is primair gestoeld op een continue proces van aanscherping van uw werkafspraken.

Meer weten?

Wilt u meer weten over bijvoorbeeld het vaststellen van eenduidige definities of procesafspraken ten bate van datakwaliteit? Download de whitepaper “Meer Customer Centric met data” of neem direct contact op met één van onze experts op het gebied van Masterdata management.