Formati di dati supportati per i log degli eventi

Formati di file supportati per il caricamento dati

ProcessMind supporta i seguenti formati di file per il caricamento dei log degli eventi:

  • XLS: Formato Excel legacy, ancora supportato da molti sistemi.
  • XLSX: Il formato moderno più comune per i fogli di calcolo Excel.
  • XLSB: Un formato Excel binario che offre tempi di caricamento più rapidi e dimensioni ridotte dei file. Raccomandiamo l’uso di XLSB per una gestione più veloce di grandi log di eventi.
  • CSV: File di valori separati da virgola, un formato di testo semplice e comunemente usato per memorizzare dati tabellari.
  • TSV: File di valori separati da tabulazione, simile al CSV ma con tabulazioni per separare le colonne.
  • TXT: File di testo semplice, che può usare vari delimitatori come virgole, tabulazioni o punti e virgola per strutturare i dati.

Requisiti generali per la struttura dei file

Per un mining efficace all’interno di ProcessMind, i file caricati—che siano in formati Excel (XLS, XLSX, XLSB) o formati di testo (CSV, TSV, TXT)—devono seguire linee guida strutturali specifiche. Questo garantisce che l’app possa interpretare correttamente i dati ed eseguire un’analisi accurata.

1. Riga di intestazione

  • Il file deve iniziare con una riga di intestazione, che dovrebbe trovarsi nella prima riga (ad es., cella A1 per file Excel o riga 1 per file CSV, TSV o TXT). L’intestazione definisce i nomi delle colonne e dovrebbe indicare chiaramente il tipo di dati in ogni colonna (ad es., “Case ID,” “Attività,” “Timestamp”).
  • Per i formati CSV, TSV e TXT, i delimitatori e le virgolette saranno rilevati automaticamente, semplificando il caricamento dei dati senza dover specificare queste impostazioni manualmente.

2. Set minimo di attributi

Per supportare una struttura di log di eventi per il process mining, il file deve contenere, almeno, i seguenti attributi (colonne):

  • Case ID: Questa colonna identifica in modo univoco ogni istanza di processo (o caso). Ogni riga corrispondente alla stessa istanza di processo deve avere lo stesso Case ID.
  • Attività: Questa colonna dovrebbe descrivere l’attività o l’evento specifico registrato (ad es., “Ordine Creato,” “Pagamento Elaborato”).
  • Timestamp: Ogni attività deve essere associata a un timestamp che segna l’esatto momento o data in cui l’evento si è verificato.
    • Nota: Il formato del timestamp sarà rilevato automaticamente per quanto possibile. Formati comuni come yyyy-MM-dd HH:mm:ss, MM/dd/yyyy, e altri sono riconosciuti automaticamente.
  • Attributi opzionali: Puoi includere colonne aggiuntive per arricchire l’analisi, come:
    • Risorsa: Identifica chi ha svolto l’attività (ad es., utente, reparto).
    • Costo: Qualsiasi costo associato all’attività.
    • Altri dati personalizzati: È possibile includere campi personalizzati rilevanti per il processo specifico, purché siano presenti le colonne richieste.

3. Formattazione dati

  • Assicurati che i tuoi dati siano formattati in modo coerente su tutte le colonne:
    • I timestamp dovrebbero essere in un formato standard e riconoscibile (ad es., yyyy-MM-dd HH:mm:ss), sebbene ProcessMind tenterà di rilevare automaticamente il formato della data se è diverso.
    • Evita righe vuote tra le voci di dati, poiché ciò potrebbe interrompere il processo di importazione.
    • Assicurati che i dati numerici (ad es., costi, durate) siano formattati come numeri in Excel o correttamente formattati in file basati su testo (CSV, TSV, TXT).
  • Per i formati CSV, TSV e TXT, ProcessMind rileverà automaticamente i delimitatori (virgole, tabulazioni, punti e virgola, ecc.) e gestirà il testo tra virgolette, rendendo i caricamenti di file senza problemi.

4. Selezione foglio (solo per file Excel)

  • ProcessMind elabora automaticamente i dati dal primo foglio del tuo file Excel (XLS, XLSX o XLSB), indipendentemente dal suo nome. Assicurati che i dati richiesti del log degli eventi siano collocati nel primo foglio, poiché i fogli aggiuntivi non verranno considerati durante l’importazione.

5. Suggerimenti

Suggerimento di Prestazioni: Usa il formato XLSB per un'elaborazione più rapida

Sebbene tutti i formati supportati possano essere caricati ed elaborati da ProcessMind, raccomandiamo vivamente l’uso del formato XLSB per i file Excel. Il formato XLSB memorizza il tuo file Excel in un formato binario, che offre significativi vantaggi di prestazioni, soprattutto per i dataset di grandi dimensioni. Ciò significa tempi di caricamento più veloci ed elaborazione più rapida rispetto ai formati XLS o XLSX.