Ondersteunde Data Formats voor Event Logs

Ondersteuning van bestandsindelingen voor data-upload

ProcessMind ondersteunt de volgende bestandsindelingen voor het uploaden van event logs:

  • XLS: Oudere Excel-indeling, nog steeds ondersteund door veel systemen.
  • XLSX: De meest gebruikte en moderne indeling voor Excel-sheets.
  • XLSB: Een binaire Excel-indeling die snellere laad- en verwerkingstijden biedt en de bestandsgrootte vermindert. We raden aan om XLSB te gebruiken voor snellere verwerking van grote event logs.
  • CSV: Komma-gescheiden waardenbestand, een eenvoudige en veelgebruikte tekstindeling voor het opslaan van tabelgegevens.
  • TSV: Tab-gescheiden waardenbestand, vergelijkbare indeling als CSV maar met tabtekens om kolommen te scheiden.
  • TXT: Tekstbestand, dat verschillende scheidingstekens zoals komma’s, tabs of puntkomma’s kan gebruiken om data te structureren.

Algemene Bestandsstructuur Vereisten

Voor succesvolle process mining binnen ProcessMind moeten uw geüploade bestanden—ongeacht of ze in Excel-indelingen (XLS, XLSX, XLSB) of tekstgebaseerde indelingen (CSV, TSV, TXT) zijn—voldoen aan specifieke structurele richtlijnen. Dit zorgt ervoor dat de app de data correct kan interpreteren en nauwkeurige analyses kan uitvoeren.

1. Header Row

  • Het bestand moet beginnen met een header row, die zich op de eerste regel moet bevinden (bijv. cel A1 voor Excel-bestanden of regel 1 voor CSV-, TSV- of TXT-bestanden). De header definieert de kolomnamen en moet duidelijk aangeven welk type data in elke kolom staat (bijv. “Case ID,” “Activity,” “Timestamp”).
  • Voor CSV-, TSV- en TXT-indelingen worden scheidingstekens en aanhalingstekens automatisch gedetecteerd, waardoor het gemakkelijker wordt om uw data te uploaden zonder deze instellingen handmatig te hoeven opgeven.

2. Minimale Set van Attributen

Om een structuur van een process mining event log te ondersteunen, moet uw bestand minimaal de volgende attributen (kolommen) bevatten:

  • Case ID: Deze kolom identificeert uniek elke procesinstantie (of case). Elke rij die overeenkomt met dezelfde procesinstantie moet dezelfde Case ID hebben.
  • Activity: Deze kolom moet de specifieke activiteit of het evenement beschrijven dat wordt vastgelegd (bijv. “Order Created,” “Payment Processed”).
  • Timestamp: Elke activiteit moet worden geassocieerd met een timestamp die het exacte tijdstip of de datum markeert waarop het evenement plaatsvond.
    • Opmerking: Het timestamp-formaat wordt zoveel mogelijk automatisch gedetecteerd. Veelgebruikte formaten zoals yyyy-MM-dd HH:mm:ss, MM/dd/yyyy worden automatisch herkend.
  • Optionele Attributen: U kunt extra kolommen opnemen om uw analyse te verbeteren, zoals:
    • Resource: Identificeert wie de activiteit heeft uitgevoerd (bijv. gebruiker, afdeling).
    • Cost: Kosten die aan de activiteit zijn verbonden.
    • Andere Aangepaste Data: U kunt aangepaste velden opnemen die relevant zijn voor uw specifieke proces, zolang de vereiste kolommen aanwezig zijn.

3. Dataformattering

  • Zorg ervoor dat uw data consistent is geformatteerd over alle kolommen:
    • Timestamps moeten in een standaard, herkenbaar formaat zijn (bijv. yyyy-MM-dd HH:mm:ss), hoewel ProcessMind zal proberen om het datumformaat automatisch te detecteren als dit anders is.
    • Vermijd lege rijen tussen datainvoer, omdat dit het importproces kan verstoren.
    • Zorg ervoor dat numerieke data (bijv. kosten, duur) als getallen zijn geformatteerd in Excel, of correct geformatteerd in tekstgebaseerde bestanden (CSV, TSV, TXT).
  • Voor CSV-, TSV- en TXT-indelingen detecteert ProcessMind automatisch scheidingstekens (komma’s, tabs, puntkomma’s, etc.) en behandelt het geciteerde tekst, waardoor bestandsuploads naadloos verlopen.

4. Sheet Selectie (Alleen voor Excel-bestanden)

  • ProcessMind verwerkt automatisch data van het eerste blad in uw Excel-bestand (XLS, XLSX of XLSB), ongeacht de naam ervan. Zorg ervoor dat de vereiste event log data op het eerste blad staat, aangezien aanvullende bladen niet in aanmerking worden genomen tijdens de import.

5. Tips

Prestatie Tip: Gebruik XLSB Formaat voor Snellere Verwerking

Hoewel alle ondersteunde formaten door ProcessMind kunnen worden geüpload en verwerkt, raden we ten zeerste aan om het XLSB-formaat te gebruiken voor Excel-bestanden. Het XLSB-formaat slaat uw Excel-bestand op in een binair formaat, wat aanzienlijke prestatievoordelen biedt, vooral voor grote datasets. Dit betekent snellere laadtijden en snellere verwerking in vergelijking met XLS of XLSX-formaten.