Liste des Documents
Sur Cette Page

Formats de données pris en charge pour les journaux d'événements

Prise en charge des fichiers pour le téléchargement de données

ProcessMind prend en charge les formats de fichiers suivants pour le téléchargement des journaux d’événements :

  • XLS : Format Excel hérité, encore pris en charge par de nombreux systèmes.
  • XLSX : Le format le plus couramment utilisé et moderne pour les feuilles de calcul Excel.
  • XLSB : Un format binaire Excel offrant des temps de chargement plus rapides et une taille de fichier réduite. Nous recommandons l’utilisation de XLSB pour un traitement plus rapide des gros journaux d’événements.
  • CSV : Fichier de valeurs séparées par des virgules, un format texte simple et couramment utilisé pour stocker des données tabulaires.
  • TSV : Fichier de valeurs séparées par des tabulations, un format similaire au CSV mais avec des caractères de tabulation utilisés pour séparer les colonnes.
  • TXT : Fichier texte brut, qui peut utiliser divers délimiteurs tels que des virgules, des tabulations ou des points-virgules pour structurer les données.

Exigences générales en matière de structure de fichiers

Pour un Process Mining réussi avec ProcessMind, vos fichiers téléversés—qu’ils soient au format Excel (XLS, XLSX, XLSB) ou au format texte (CSV, TSV, TXT)—doivent respecter des directives structurelles spécifiques. Cela garantit que l’application peut interpréter correctement les données et effectuer une analyse précise.

1. Ligne d’en-tête

  • Le fichier doit commencer par une ligne d’en-tête, qui doit être située à la première ligne (par exemple, cellule A1 pour les fichiers Excel ou ligne 1 pour les fichiers CSV, TSV ou TXT). L’en-tête définit les noms des colonnes et doit indiquer clairement le type de données dans chaque colonne (par exemple, “Case ID,” “Activity,” “Timestamp”).
  • Pour les formats CSV, TSV et TXT, les délimiteurs et guillemets seront détectés automatiquement, ce qui facilite le téléversement de vos données sans avoir besoin de spécifier ces paramètres manuellement.

2. Ensemble minimum d’attributs

Pour prendre en charge la structure d’un journal d’événements de Process Mining, votre fichier doit contenir, au minimum, les attributs suivants (colonnes) :

  • Case ID : Cette colonne identifie de manière unique chaque instance de processus (ou cas). Chaque ligne correspondant à la même instance de processus doit avoir le même Case ID.
  • Activity : Cette colonne doit décrire l’activité ou l’événement spécifique enregistré (par exemple, “Order Created,” “Payment Processed”).
  • Timestamp : Chaque activité doit être associée à un timestamp marquant le moment exact où l’événement s’est produit.
    • Remarque : Le format de timestamp sera détecté automatiquement autant que possible. Les formats courants comme yyyy-MM-dd HH:mm:ss, MM/dd/yyyy et d’autres sont reconnus automatiquement.
  • Attributs optionnels : Vous pouvez inclure des colonnes supplémentaires pour améliorer votre analyse, telles que :
    • Resource : Identifie qui a effectué l’activité (par exemple, utilisateur, département).
    • Cost : Tous les coûts associés à l’activité.
    • Other Custom Data : Vous pouvez inclure des champs personnalisés pertinents pour votre processus spécifique, tant que les colonnes requises sont présentes.

3. Formatage des données

  • Assurez-vous que vos données sont formatées de manière cohérente dans toutes les colonnes :
    • Les timestamps doivent être dans un format standard et reconnaissable (par exemple, yyyy-MM-dd HH:mm:ss), bien que ProcessMind essaiera de détecter automatiquement le format de date s’il est différent.
    • Évitez les lignes vides entre les entrées de données, car cela pourrait perturber le processus d’importation.
    • Assurez-vous que les données numériques (par exemple, coûts, durées) sont formatées sous forme de nombres dans Excel, ou correctement formatées dans les fichiers texte (CSV, TSV, TXT).
  • Pour les formats CSV, TSV et TXT, ProcessMind détectera automatiquement les délimiteurs (virgules, tabulations, points-virgules, etc.) et gérera le texte entre guillemets, rendant le téléversement de fichiers fluide.

4. Sélection de la feuille (uniquement pour les fichiers Excel)

  • ProcessMind traite automatiquement les données de la première feuille de votre fichier Excel (XLS, XLSX ou XLSB), quel que soit son nom. Assurez-vous que les données requises du journal d’événements sont placées sur la première feuille, car les feuilles supplémentaires ne seront pas prises en compte lors de l’importation.

5. Conseils

Conseil de performance : Utilisez le format XLSB pour un traitement plus rapide

Bien que tous les formats pris en charge puissent être téléversés et traités par ProcessMind, nous recommandons fortement l’utilisation du format XLSB pour les fichiers Excel. Le format XLSB stocke votre fichier Excel dans un format binaire, offrant des avantages de performance significatifs, notamment pour les grands ensembles de données. Cela se traduit par des temps de chargement plus rapides et un traitement plus rapide par rapport aux formats XLS ou XLSX.