De Data Detective: Ons eerste probleem was het vinden van alle sappige details. Klantenbestellingen waren verspreid over plakkertjes, losse bonnetjes en zelfs een verfrommeld servet in onze zak (vies!). Het was als een detectiveverhaal, het samenvoegen van informatie uit al deze willekeurige bronnen (databases, flat files, message logs, noem maar op!).
Dezelfde Taal Spreken: Zelfs toen we de data vonden, was het niet altijd duidelijk. Sommige notities zeiden “Klant Blij!” terwijl anderen alleen maar een droevig gezicht hadden. We hadden een vertaler nodig (data standaardisatie) om ervoor te zorgen dat de spion begreep wat elke krabbel betekende.
De Juiste Vragen Stellen: Uiteindelijk moesten we uitzoeken wat we eigenlijk wilden weten. Waren de rijen lang omdat mensen langzaam bestelden, of namen we misschien te veel tijd om de limonade te maken? De juiste vragen stellen hielp ons onze dataverzameling te richten (verschillende inzichten in de data).
Het blijkt dat het opruimen van deze datarommel een heel nieuw avontuur was. Maar in het volgende hoofdstuk zie je hoe we, met een beetje speurwerk en wat hulp van onze dataliefhebbende spion, erin slaagden om onze limonadekraam te optimaliseren en de trots van de buurt te worden!
2: De Grote Data Opgraving
Onze limonadekraam was een groot succes, maar de rijen waren een ramp! We wisten dat we onze data-spion (Process Mining) nodig hadden om ons te helpen, maar eerst moesten we het voorzien van redelijke informatie. Dat betekende een diepe duik in de wereld van data-extractie – eigenlijk het vinden van alle verborgen aanwijzingen over onze klanten en ze omzetten in iets dat onze spion kon begrijpen.
Dit is wat we ontdekten:
Schattenjacht: Soms was de data als een verborgen schat – verstopt in stoffige hoekjes van onze systemen (websites, e-mails, PDFs). We moesten data-archeologen worden, door oude bestanden graven en gebruikmaken van geavanceerde tools (screen scraping) om de informatie die we nodig hadden te ontgraven.
Lost in Translation: Zelfs wanneer we de data vonden, was het niet altijd duidelijk. Sommige aanwijzingen waren gekrabbeld op servetten (ongestructureerde data) en anderen waren opgesloten in een geheime code (ontbrekende metadata). We hadden een vertaler (data standaardisatie) nodig om het allemaal te ontcijferen.
Focus is essentieel: Met zoveel databronnen (duizenden tabellen!), was het verleidelijk om alles te pakken. Maar net zoals je niet alle smaken in de ijswinkel zou proberen, moesten we ons concentreren op de vragen die we wilden beantwoorden. Namen klanten te veel tijd om te bestellen, of waren wij de bottleneck bij het maken van limonade? Door ons te concentreren op deze belangrijke vragen, konden we prioriteren welke data we moesten extraheren.
Het was niet gemakkelijk, maar met een beetje doorzettingsvermogen en een flinke dosis nieuwsgierigheid slaagden we erin om een schat aan data te ontdekken. In het volgende hoofdstuk zullen we zien hoe we deze rommel opruimden en eindelijk onze data-spion voor ons aan het werk kregen!
3: De Data Ontgifting
We hadden een berg data, dankzij onze heroïsche inspanningen voor extractie (zie Hoofdstuk 3). Maar houd je vast, want deze data was een gemengd zakje – enkele nuttige klantgegevens, wat willekeurige krabbels en een heleboel dingen die we gewoon niet nodig hadden. Het was tijd voor een data detox!
Filtering werd onze nieuwe beste vriend. Denk eraan als het sorteren van een rommelige gereedschapskist. We begonnen met de grote lijnen (coarse-grained scoping) toen we de data uit de chaos haalden. Nu was het tijd om in detail te treden (fine-grained scoping).
Hier is hoe we de filteruitdaging aanpakten:
Focus op de Sterren: Stel je de meest voorkomende klantbestellingen voor als de glimmende nieuwe gereedschappen in onze gereedschapskist. We besloten ons te concentreren op de top 10 meest voorkomende activiteiten (bestellen, wachten, limonade ontvangen) om het beheersbaar te houden voor onze data-spion. De rest kon even wachten in de schuur (voorlopig).
Iteratie is Key: Filteren was geen eenmalige aangelegenheid. Naarmate onze data-spion begon met het analyseren van de schone data, wees hij ons op nieuwe gebieden om op te focussen. Het was als een detective die leads volgt en voortdurend onze filter verfijnt op basis van nieuwe inzichten.
Met de data glinsterend schoon (nou ja, meestal schoon), was het eindelijk tijd om de echte kracht van onze data-spion (Process Mining) vrij te laten in het volgende hoofdstuk! We zouden verschillende technieken verkennen zoals discovery, conformance en enhancement om de problemen van onze limonadekraam te diagnosticeren en de meest efficiënte limonadeoperatie in de buurt te worden!
4: De Data Makeover
Onze data detox (Hoofdstuk 4) deed wonderen, maar er was nog één cruciale stap voordat we onze data-spion (Process Mining) vrijlieten – de data makeover! Stel je een klant voor die onze stand binnenkomt met een verfrommeld geldbiljet. We zouden ze niet afwijzen, maar het zou veel gemakkelijker zijn als het biljet fris en schoon was. Daarom is datacleaning zo belangrijk.
Dit is wat we moesten doen:
Case Gesloten: Een proces is net als de reis van een klant – het heeft een begin, een midden en een einde. We moesten alle gebeurtenissen die betrekking hadden op een enkele klant (case) verbinden – hun bestelling, wachttijd en uiteindelijk het ontvangen van hun limonade. Denk eraan als het organiseren van alle bonnetjes voor een enkel klantbezoek.
Spreken van Proces: Onze data sprak niet altijd de proces-taal. Activiteiten moesten duidelijk worden gedefinieerd als statuswijzigingen voor de reis van elke klant (case). Bijvoorbeeld, “Klanten Blij!” was niet specifiek genoeg. We hadden een duidelijke status nodig zoals “Limonade Geleverd.”
Het was niet het meest glamoureuze deel van het avontuur, maar met een beetje data wrangling en helder denken, hadden we eindelijk een glinsterend schone dataset! Met deze door onze data-spion getransformeerde data onthullen we de geheimen achter onze lange rijen en veranderen we onze limonadekraam in een bruisend baken van efficiëntie (en heerlijkheid)!