The Next S-Curve is een serie gesprekken over positieve progressie en innovatie met hosts Pierre de Wit en Philine Toet. In deze aflevering duiken we in een thema waar elke organisatie vroeg of laat tegenaan loopt: datakwaliteit. Wat gebeurt er als dezelfde informatie op meerdere plekken staat, elkaar tegenspreekt of simpelweg niet klopt? We besteden aandacht aan de oorzaak, maar ook de “so what?”. Tot slot bespreken we hoe organisaties datakwaliteitsproblemen kunnen oplossen en kunnen beginnen met dwijlen, ondanks dat de kraan nog open staat.
Onze gast en onderwerp
We gaan in gesprek met onze collega’s Jasper Stoop (data architect) en Mathijs de Meijer (datasysteemarchitect) bij Eraneos. Zij nemen ons mee in de wereld van data-unity: het proces van ontdubbelen en opschonen van data, allemaal voor dat ene “golden record”. Aan de hand van verschillende praktijkvoorbeelden beantwoorden we de “so what?” vraag en bespreken we de oorzaken, hoe onstaat deze wirwar van data eigenlijk? Natuurlijk bespreken we ook de oplossing, hoe je met behulp van AI, businesslogica en slimme matchingmodellen één betrouwbaar golden record kan krijgen. Daarbij blijft de mens een centrale spil in het web. De mens bepaalt de businesslogica en wat we nou als die ene waarheid aanschouwen.
Wil je weten hoe je chaos omzet in overzicht? Je hoort het in deze aflevering! Jasper en Matthijs hebben ook een whitepaper geschreven over Data Unity. Deze vind je hier.
Weten wat wij voor je kunnen betekenen? Bekijk de demo! https://mora.demo.eraneos.com.
Nieuwsgierig naar andere innovatie gerelateerde onderwerpen? Onze website wordt regelmatig aangevuld met nieuwe podcasts en andere content. Voor meer afleveringen van The Next S-Curve, ga naar https://www.eraneos.com/thenextscurve
Hoofdstukken
We behandelen deze onderwerpen tijdens ons gesprek met onze gast.
- 00:00 Waarom datakwaliteit nu relevanter is dan ooit – We maken kennis met onze gasten, Jasper Stoop en Mathijs de Meijer en introduceren het onderwerp. We bespreken herkenbare situaties waar slechte data voor grote frustratie zorgt, van problemen met parkeervergunningen tot klanten die dubbel in systemen staan.
- 04:07 Technische én menselijke oorzaken van datafragmentatie – Jasper en Mathijs leggen uit hoe organisaties al snel data dupliceren. Verschillende oorzaken komen voorbij zoals door groei, migraties, typfouten of afdelingen die los van elkaar systemen bouwen. Niet alleen door mensen, ook door systemen.
- 08:14 Voorbeeld case: een brouwerij met onderdelen op voorraad, maar geen overzicht – Een voorbeeld van hoe slechte datakwaliteit direct geld kost en hoe je met één ‘golden record’ veel winst kunt behalen. Hebben we dat ene schroefje nou wel of niet op voorraad? En zo ja, waar?
- 12:22 Voorbeeld case: dubbele klantdata en de gevolgen hiervan – Dezelfde klant in verschillende systemen, met een ander adres. Of verschillende klanten met hetzelfde adres. Van dubbele aanbiedingen tot AVG problemen: Jasper en Mathijs schetsen risico’s die vaak onzichtbaar blijven, maar grote impact hebben.
- 16:29 Voorbeeld case: van handmatig meldingen verwerken naar een golden record – Meldingen bij de gemeente uitprinten en sorteren? Ja, het gebeurd echt. We leggen uit hoe automatisering hier een enorme efficiencywinst biedt.
- 20:36 De oplossing: hoe kom je tot een golden record – Mathijs legt uit hoe AI, NLP en statistische modellen helpen om records te vergelijken, matchkansen toe te kennen en twijfelgevallen te signaleren. Zo kom je tot een golden record, maar hoe houd je ook het golden record?
- 24:43 Met businesslogica bepaal je wanneer iets hetzelfde is – Wanneer zijn twee schroefjes hetzelfde? Of twee klanten? De context van gebruik bepaalt hoe je data moet beoordelen. De mens is onmisbaar, business logica is nodig en de mens zal altijd beoordelen wat de echte golden record is.
- 28:50 Van proof of concept naar productie-integratie – We bespreken een eerste goede stap richting een golden record. Hoe je de oplossing test met echte data en hoe je dit vervolgens veilig opschaalt.
- 32:57 Veranderen begint bij bewustzijn en dat is er vaak pas als het misgaat – Zolang de pijn niet groot genoeg is, blijft een lage datakwaliteit een blinde vlek. Pas als het echt misgaat, ontstaat er urgentie
- 37:04 Nieuwe AI technieken lossen oude beperkingen op – Met moderne AI kun je nu ook ongestructureerde data (zoals tekst, foto’s of video’s) efficiënt vergelijken. Dat maakt schaalbare datakwaliteit mogelijk en daarmee sluiten we ook deze podcast af met een blik op de toekomst.
The Next S-Curve en meer
The Next S-Curve is de interview podcast over innovatie en positieve progressie met Pierre de Wit en Philine Toet. Beide werken bij Eraneos als innovatie experts en ze geven advies over alles wat over innovatie gaat.