Elenco Documenti
In Questa Pagina

Formati di dati supportati per i log degli eventi

Supporto file per upload dati

ProcessMind supporta questi formati per caricare event log:

  • .csv — Comma-separated values. Diffuso, leggero e facile da esportare da Excel, ERP, ecc.
  • .tsv — Tab-separated values. Simile a CSV ma usa tab, utile se i dati hanno virgole.
  • .txt — File testo semplice. Usabile se ha formato strutturato e delimitato.
  • .xls — Excel vecchio formato. Supportato ma può essere lento rispetto ai formati più recenti.
  • .xlsx — Excel moderno. Molto usato e supportato, ideale per dati strutturati.
  • .xlsb — Excel Binary Workbook. Più veloce nel caricamento e migliore per grandi dataset rispetto a .xlsx, ma meno diffuso.
  • .xes — Formato standard di event log per il Process Mining. Perfetto per tracciare attività con timestamp e case ID.

Requisiti generali struttura file

Per un process mining efficace con ProcessMind, i file caricati—Excel (XLS, XLSX, XLSB), testo (CSV, TSV, TXT) o XML (XES)—devono seguire linee guida strutturali ben precise. Così la piattaforma interpreta ed elabora i dati in modo corretto e accurato.

1. Intestazione (Excel / Formati testo)

  • Il file deve iniziare con una riga d’intestazione nella prima riga (ad esempio cella A1 per Excel o riga 1 per CSV, TSV o TXT). L’intestazione indica i nomi delle colonne e il tipo di dato (es. “Case ID”, “Activity”, “Timestamp”).
  • In CSV, TSV e TXT, separatori e virgolette sono rilevati automaticamente, non serve configurarli.

2. Attributi minimi

Per un event log di process mining, il file deve avere almeno questi attributi (colonne). I nomi non devono essere per forza (Case ID, Activity ecc.), ma i contenuti sì.

  • Case ID: Identifica in modo univoco ogni processo (case). Tutte le righe dello stesso processo devono avere lo stesso Case ID.
  • Activity: Descrive l’attività o evento registrato (es. “Order Created”, “Payment Processed”).
  • Timestamp: Ogni attività va collegata a un timestamp che indica data e ora.
  • Nota: Il formato del timestamp viene rilevato automaticamente dove possibile. Formati comuni come yyyy-MM-dd HH:mm:ss, MM/dd/yyyy ecc. sono riconosciuti.
  • Attributi opzionali: Puoi aggiungere colonne per arricchire l’analisi, ad esempio:
  • Resource: Indica chi svolge l’attività (utente, team, reparto).
  • Cost: Costi associati all’attività.
  • Altri dati custom: Inserisci campi su misura per il tuo processo, purché ci siano le colonne obbligatorie.

3. Formattazione dati

  • I dati devono essere formattati in modo uniforme su tutte le colonne:
  • I timestamp vanno messi in formato standard e riconoscibile (es. yyyy-MM-dd HH:mm:ss). ProcessMind prova comunque a rilevare formati diversi.
  • Non inserire righe vuote tra i dati: potrebbero dare errori nell’importazione.
  • I dati numerici (costi, durate, ecc.) vanno inseriti come numeri in Excel o formattati correttamente nei file testo (CSV, TSV, TXT).
  • Nei file CSV, TSV e TXT ProcessMind rileva automaticamente separatori (virgole, tab, punto e virgola…) e gestisce testi tra virgolette per semplificare l’upload.

4. Selezione foglio (solo Excel)

  • ProcessMind prende i dati dal primo foglio del tuo Excel (XLS, XLSX o XLSB), indipendente dal nome. Metti l’event log richiesto sul primo foglio: gli altri non verranno importati.

5. XES

Il formato .xes (eXtensible Event Stream) è lo standard per event log nel Process Mining. Raccoglie tutte le info su processi: case ID, attività, timestamp e altri attributi rilevanti.

Molto usato nei tool di process mining, è ideale per ricostruire i processi reali in modo preciso.

🔗 Per dettagli tecnici visita il sito ufficiale dello standard XES.

5. Suggerimenti

Suggerimento di Prestazioni: Usa il formato XLSB per un'elaborazione più rapida

Sebbene tutti i formati supportati possano essere caricati ed elaborati da ProcessMind, raccomandiamo vivamente l’uso del formato XLSB per i file Excel. Il formato XLSB memorizza il tuo file Excel in un formato binario, che offre significativi vantaggi di prestazioni, soprattutto per i dataset di grandi dimensioni. Ciò significa tempi di caricamento più veloci ed elaborazione più rapida rispetto ai formati XLS o XLSX.