Documenten Lijst
Op Deze Pagina

Ondersteunde Data Formats voor Event Logs

Bestandsformaten voor data upload

ProcessMind ondersteunt de volgende bestandsformaten voor het uploaden van event logs:

  • .csv — Comma-separated values. Veelgebruikt, lichtgewicht en eenvoudig te exporteren uit systemen zoals Excel of ERP.
  • .tsv — Tab-separated values. Vergelijkbaar met CSV, maar gebruikt tabs; handig wanneer data komma’s bevat.
  • .txt — Platte tekstbestanden. Te gebruiken als ze consistent en gescheiden zijn.
  • .xls — Excel spreadsheet (oude versie). Ondersteund, maar kan trager laden dan nieuwere formaten.
  • .xlsx — Modern Excel formaat. Breed gebruikt, volledig ondersteund en vaak de voorkeur voor gestructureerde data.
  • .xlsb — Excel Binary Workbook. Sneller laden en beter voor grote datasets dan .xlsx, maar minder universeel ondersteund.
  • .xes — Standaardformaat voor event logs in Process Mining tools. Ideaal voor gedetailleerde tracking met timestamps en case IDs.

Algemene eisen aan bestandsstructuur

Voor succesvolle Process Mining in ProcessMind moeten je geüploade bestanden — of het nu Excel-formaten zijn (XLS, XLSX, XLSB), tekstbestanden (CSV, TSV, TXT) of XML (XES) — aan specifieke structuurvereisten voldoen. Zo kan het platform de data correct interpreteren en een goede analyse uitvoeren.

1. Header Row (Excel- of Tekstbased)

  • Het bestand moet beginnen met een header row op de eerste regel (bijv. cel A1 voor Excel-bestanden of regel 1 voor CSV, TSV of TXT). Deze kopregel beschrijft de kolomnamen en geeft aan welk type data elke kolom bevat (bijv. “Case ID”, “Activity”, “Timestamp”).
  • Voor CSV-, TSV- en TXT-formaten worden delimiters en quotes automatisch herkend, waardoor je eenvoudig je data kunt uploaden zonder extra instellingen.

2. Minimale set van attributen

Om een event log-structuur voor Process Mining te ondersteunen, moet je bestand minimaal de volgende attributen (kolommen) bevatten. De kolomnamen hoeven niet exact gelijk te zijn aan (CASE ID, Activity, etc.), maar de inhoud moet overeenkomen.

  • Case ID: Identificeert elke procesinstantie (case) uniek. Elke rij van dezelfde procesinstantie heeft dezelfde Case ID.
  • Activity: Geeft de specifieke activiteit of event aan die wordt geregistreerd (bijv. “Order Created”, “Payment Processed”).
  • Timestamp: Elke activiteit moet gekoppeld zijn aan een timestamp die het exacte tijdstip of datum aangeeft.
  • Let op: Het timestamp-formaat wordt zoveel mogelijk automatisch gedetecteerd. Veelgebruikte formaten zoals yyyy-MM-dd HH:mm:ss, MM/dd/yyyy en andere worden automatisch herkend.
  • Optionele attributen: Je kunt extra kolommen toevoegen voor meer analyse, zoals:
  • Resource: Geeft aan wie de activiteit heeft uitgevoerd (bijv. gebruiker, afdeling).
  • Cost: Eventuele kosten van de activiteit.
  • Andere custom data: Je kunt eigen velden toevoegen die relevant zijn voor jouw proces, zolang de verplichte kolommen aanwezig zijn.

3. Data Formatting

  • Zorg dat je data overal hetzelfde is opgemaakt:
  • Timestamps moeten in een standaard formaat als yyyy-MM-dd HH:mm:ss staan; ProcessMind probeert het zelf te detecteren als het anders is.
  • Vermijd lege rijen tussen de data, dit kan het importproces verstoren.
  • Zorg dat getallen (zoals kosten, doorlooptijden) als nummers zijn opgemaakt in Excel, of correct in tekstbestanden (CSV, TSV, TXT).
  • Bij CSV-, TSV- en TXT-bestanden detecteert ProcessMind automatisch de delimiters (komma’s, tabs, puntkomma’s, etc.) en quotes, zodat uploaden soepel verloopt.

4. Sheet selectie (Alleen voor Excel-bestanden)

  • ProcessMind verwerkt automatisch de data van het eerste sheet in je Excel-bestand (XLS, XLSX of XLSB), ongeacht de naam. Zet de benodigde event log data op het eerste sheet, want extra sheets worden bij het importeren niet meegenomen.

5. XES

Het .xes (eXtensible Event Stream) formaat is een standaard formaat voor event logs in Process Mining. Het bevat gedetailleerde info over procesinstantie, zoals case IDs, activiteiten, timestamps en andere relevante attributen.

Dit formaat wordt breed ondersteund door Process Mining tools en is ideaal voor een nauwkeurige reconstructie van echte procesflows.

🔗 Voor technische specificaties en details, zie de officiële XES standaard website.

5. Tips

Prestatie Tip: Gebruik XLSB Formaat voor Snellere Verwerking

Hoewel alle ondersteunde formaten door ProcessMind kunnen worden geüpload en verwerkt, raden we ten zeerste aan om het XLSB-formaat te gebruiken voor Excel-bestanden. Het XLSB-formaat slaat uw Excel-bestand op in een binair formaat, wat aanzienlijke prestatievoordelen biedt, vooral voor grote datasets. Dit betekent snellere laadtijden en snellere verwerking in vergelijking met XLS of XLSX-formaten.