事件日志支持的数据格式

数据上传文件支持

ProcessMind 支持以下文件格式用于上传事件日志:

  • XLS:旧版 Excel 格式,许多系统仍然支持。
  • XLSX:最常用的现代 Excel 表格格式。
  • XLSB:二进制 Excel 格式,加载速度更快,文件大小更小。我们建议使用 XLSB 加速大事件日志的处理。
  • CSV:逗号分隔值文件,常用的简单文本格式,用于存储表格数据。
  • TSV:制表符分隔值文件,类似于 CSV 格式,但使用制表符区分列。
  • TXT:纯文本文件,使用逗号、制表符或分号等分隔符来组织数据。

固定文件结构要求

为成功在 ProcessMind 中进行流程挖掘,您上传的文件(无论是 Excel 格式(XLS, XLSX, XLSB)还是文本格式(CSV, TSV, TXT))必须符合特定的结构指南。这可确保应用程序正确解释数据并执行准确的分析。

1. 标题行

  • 文件必须以标题行开始,位置应在第一行处(例如,Excel 文件的 A1 单元格或 CSV、TSV、TXT 文件的 第 1 行)。标题定义了列名,并应清楚说明每列的数据类型(例如,“Case ID”,“Activity”,“Timestamp”)。
  • 对于 CSV、TSV 和 TXT 格式,分隔符和引号将自动检测,便于上传数据,无需手动指定这些设置。

2. 最小属性集

为支持流程挖掘事件日志结构,您的文件至少应包含以下属性(列):

  • Case ID:此列唯一标识每个流程实例(或案例)。每行对应于相同流程实例的必须有相同的 Case ID。
  • Activity:此列应描述录制的特定活动或事件(例如,“Order Created”,“Payment Processed”)。
  • Timestamp:每个活动必须关联一个时间戳,标记事件发生的确切时间或日期。
    • 注意:时间戳格式将尽可能自动检测。常见格式如 yyyy-MM-dd HH:mm:ssMM/dd/yyyy 等会自动识别。
  • 可选属性:您可以包括其他列以增强您的分析,例如:
    • Resource:标识执行活动的人(例如,用户,部门)。
    • Cost:与活动相关的任何成本。
    • 其他自定义数据:在存在所需列的情况下,可以包括与特定流程相关的自定义字段。

3. 数据格式化

  • 确保您的数据在所有列中格式一致:
    • 时间戳应为标准且可识别的格式(例如,yyyy-MM-dd HH:mm:ss),尽管 ProcessMind 会尽量自动检测日期格式。
    • 避免在数据条目之间出现空行,以免中断导入过程。
    • 确保数值数据(如成本、持续时间)在 Excel 中格式为数字,或在基于文本的文件中正确格式化(CSV、TSV、TXT)。
  • 对于 CSV、TSV 和 TXT 格式,ProcessMind 将自动检测分隔符(逗号、制表符、分号等)并处理引号文本,使文件上传无缝进行。

4. 工作表选择(仅限 Excel 文件)

  • ProcessMind 自动处理您 Excel 文件(XLS、XLSX 或 XLSB)中的第一张工作表中的数据,无论其名称如何。确保所需的事件日志数据置于第一张工作表中,因为在导入期间不会考虑其他工作表。

5. 提示

性能提示:使用 XLSB 格式加速处理

尽管 ProcessMind 可以上传和处理所有支持的格式,但我们强烈推荐使用 Excel 文件的 XLSB 格式。XLSB 格式以二进制格式存储您的 Excel 文件,这提供了显著的性能优势,特别是对于大型数据集。这意味着与 XLS 或 XLSX 格式相比,加载时间更短和处理速度更快。