Unterstützte Dateiformate für Event Logs
Dateiformate für Data Upload
ProcessMind unterstützt folgende Dateiformate für das Hochladen von Event Logs:
- .csv — Kommagetrennte Werte. Weit verbreitet, leichtgewichtig und einfach aus Systemen wie Excel oder ERP exportierbar.
- .tsv — Tab-getrennte Werte. Wie CSV, nutzt aber Tabulatoren als Trennzeichen; hilfreich, wenn die data Kommas enthält.
- .txt — Textdateien. Nutzbar, wenn sie durchgängig und mit Trennzeichen formatiert sind.
- .xls — Älteres Excel-Format. Wird unterstützt, kann aber langsamer laden als neuere Formate.
- .xlsx — Modernes Excel-Format. Standard im Business-Bereich und ideal für strukturierte data.
- .xlsb — Excel Binary Workbook. Sehr schnell beim Laden und ideal für große Datenmengen, aber nicht überall unterstützt.
- .xes — Standardformat für Event Logs in Process Mining Tools. Perfekt für detaillierte Protokolle mit Timestamps und Case ID.
Allgemeine Anforderungen an die Dateistruktur
Für erfolgreiches Process Mining mit ProcessMind müssen Ihre hochgeladenen Dateien – ob Excel-Formate (XLS, XLSX, XLSB), textbasierte Formate (CSV, TSV, TXT) oder XML (XES) – bestimmte Vorgaben zur Struktur erfüllen. So kann die App Ihre data richtig interpretieren und genau analysieren.
1. Kopfzeile (Excel oder Text)
- Die Datei muss mit einer Kopfzeile beginnen, die sich in der ersten Zeile befindet (z.B. Zelle A1 bei Excel oder Zeile 1 bei CSV, TSV, oder TXT). Die Kopfzeile definiert die Spaltennamen und sollte klar angeben, welche data in den Spalten enthalten sind (z.B. “Case ID”, “Activity”, “Timestamp”).
- Bei CSV, TSV und TXT werden Trennzeichen und Anführungszeichen automatisch erkannt, sodass Sie file uploads ohne manuelle Einstellungen durchführen können.
2. Minimale Attributanforderungen
Damit Ihre Datei als Event Log für Process Mining passt, muss sie mindestens diese Attribute (Spalten) enthalten. Die Spaltennamen müssen nicht exakt (Case ID, Activity usw.) heißen, sondern sollten die geforderten Inhalte abdecken.
- Case ID: Identifiziert jede Prozessinstanz eindeutig. Jede Zeile einer Instanz muss dieselbe Case ID haben.
- Activity: Gibt die jeweilige Aktivität oder das Event an (z.B. “Order Created”, “Payment Processed”).
- Timestamp: Jeder Vorgang braucht einen Timestamp, der Datum und Uhrzeit des Events markiert.
- Hinweis: Das Timestamp-Format wird so weit wie möglich automatisch erkannt. Gängige Formate wie
yyyy-MM-dd HH:mm:ss,MM/dd/yyyyu.a. erkennt das System selbständig. - Optionale Attribute: Weitere Spalten können Ihre Analyse verbessern, z.B.:
- Resource: Wer die Activity ausgeführt hat (z.B. User, Abteilung).
- Cost: Kosten zur Aktivität.
- Weitere eigene data: Eigene Felder, sofern die Pflichtspalten enthalten sind, sind jederzeit möglich.
3. Datenformatierung
- Achten Sie auf eine durchgehend einheitliche Formatierung aller Spalten:
- Timestamps sollten ein standardisiertes, gut erkennbares Format haben (z.B.
yyyy-MM-dd HH:mm:ss). ProcessMind erkennt das Datumsformat meist automatisch. - Leere Zeilen zwischen Dateneinträgen vermeiden, da dies den Import stören kann.
- Zahlenwerte (z.B. Kosten, Durchlaufzeiten) als Zahlen formatieren; in Excel entsprechend, in Textdateien (CSV, TSV, TXT) korrekt kennzeichnen.
- Bei CSV, TSV und TXT erkennt ProcessMind automatisch die Trennzeichen (Komma, Tab, Semikolon usw.) und verarbeitet Anführungszeichen, sodass Uploads reibungslos gelingen.
4. Auswahl des Tabellenblatts (nur Excel)
- ProcessMind verarbeitet automatisch die data aus dem ersten Blatt Ihrer Excel-Datei (XLS, XLSX oder XLSB), unabhängig vom Namen. Legen Sie deshalb die relevanten Event Logs auf das erste Blatt, weitere Sheets werden beim Import ignoriert.
5. XES Format
Das .xes (eXtensible Event Stream) Format ist ein Standard für Event Logs im Process Mining. Es enthält detaillierte Infos zu Prozessinstanzen wie Case ID, Activities, Timestamps und weitere Attribute.
Das Format wird von allen führenden Process Mining Tools unterstützt und ist ideal, um reale Prozessabläufe exakt abzubilden.
🔗 Details und Spezifikationen finden Sie auf der offiziellen XES-Standard-Website.
6. Tipps
Performance-Tipp: Mit XLSB schneller verarbeiten
Alle unterstützten Formate sind mit ProcessMind nutzbar. Für Excel-Dateien empfehlen wir jedoch das XLSB-Format. XLSB speichert Ihre Datei binär, was bei großen Datenmengen einen deutlichen Performance-Vorteil bringt – das Laden und Verarbeiten ist schneller als mit XLS oder XLSX.