文档列表
本页目录

事件日志支持文件格式

支持的数据上传文件格式

ProcessMind 支持以下文件格式用于上传 event log:

  • .csv — 逗号分隔值。常见、体积小,易于从大多数系统(如 Excel、ERP)导出。
  • .tsv — Tab 分隔值。与 CSV 类似,但用制表符,适合数据中含逗号。
  • .txt — 纯文本。只需要内容有统一分隔结构即可导入。
  • .xls — 旧版 Excel 格式。支持但加载速度比新版慢。
  • .xlsx — 新版 Excel 格式。各类数据常用,兼容性和可用性强。
  • .xlsb — Excel 二进制工作簿。加载更快,大数据集更优,但兼容性略差。
  • .xes — Process Mining 工具标准 event log 格式,适合包含 timestamp 和 Case ID 的详细活动追踪。

通用文件结构要求

为保障 ProcessMind 顺利开展 process mining,无论上传的文件是 Excel 格式(XLS、XLSX、XLSB)、文本格式(CSV、TSV、TXT)还是 XML(XES),都需遵循如下结构规则,以便系统准确解析和分析。

1. 表头行(Excel 或文本文件)

  • 文件需以表头行开头,位于首行(如 Excel 的 A1 单元格 或 CSV/TSV/TXT 的第 1 行)。表头应准确标注每列字段(如 “Case ID”、“Activity”、“Timestamp”)。
  • CSV、TSV、TXT 格式中,系统会自动识别分隔符和引号,无需手动设置。

2. 最少必需字段

为支持 process mining event log 结构,文件中至少要有以下属性(列),字段名称可自定,但内容需符合:

  • Case ID:唯一标识每个流程实例,相同实例各行必须有相同 Case ID。
  • Activity:描述具体活动或事件(如 “订单创建”、“付款完成”)。
  • Timestamp:每条活动需带时间戳,标明事件发生时间。
  • 说明:系统会自动检测时间戳格式,如 yyyy-MM-dd HH:mm:ssMM/dd/yyyy 等常用格式。
  • 可选属性:可增加更多列辅助分析,比如:
  • Resource:执行活动的人员、账号或部门。
  • Cost:与活动有关的费用。
  • 其它自定义数据:可按实际业务增加自定义列,只要包含上述必需列。

3. 数据格式要求

  • 所有字段的格式应保持一致:
  • 推荐时间戳使用通用格式(如 yyyy-MM-dd HH:mm:ss),如不一致系统也会自动解析。
  • 数据间不要有空行,避免导入出错。
  • 数字数据(如成本、时长)建议在 Excel 设为数值格式,或在 CSV/TSV/TXT 合理存储。
  • CSV、TSV、TXT 支持系统自动检测分隔符(逗号、Tab、分号等)与引号文本,上传更方便。

4. Sheet 选择(仅限 Excel 文件)

  • ProcessMind 默认读取 Excel 文件(XLS、XLSX、XLSB)的第一个 Sheet数据,不论 sheet 名称。请将 event log 必需数据放在首个 sheet,其他 sheet 不会导入。

5. XES 格式

.xes(eXtensible Event Stream)为 process mining 领域 event log 标准格式,包含 Case ID、Activity、Timestamp 等详细信息。

主流 process mining 工具均支持,是精准还原真实业务流程的理想选择。

🔗 技术规范详见 官方 XES 标准网站

6. 小贴士

性能提示:使用 XLSB 格式提升效率

ProcessMind 支持上传上述全部格式,但 Excel 文件强烈推荐使用 XLSB 格式。XLSB 采用二进制存储,数据量大时加载与处理速度显著提升,优于 XLS 和 XLSX。