文档列表
本页内容

事件日志支持的数据格式

数据上传文件格式支持

ProcessMind 支持以下文件格式上传 event log:

  • .csv — 逗号分隔值。常用、轻量,易从 Excel、ERP 等导出。
  • .tsv — 制表符分隔值。结构类似 CSV,但用 Tab 替代逗号,适合数据包含逗号时。
  • .txt — 纯文本文件,只要结构一致并有分隔符即可。
  • .xls — 旧版 Excel 格式,支持但加载速度低于新版。
  • .xlsx — 新版 Excel 格式,广泛使用,推荐用于结构化 data。
  • .xlsb — Excel 二进制工作簿,适合大数据量,加载比 .xlsx 快,但通用性略低。
  • .xes — process mining 行业标准 event log 格式,适合详细追踪 timestamp、Case ID 等。

文件结构通用要求

在 ProcessMind 中进行 process mining,上传的文件(Excel 格式(XLS、XLSX、XLSB)、文本格式(CSV、TSV、TXT)或 XML(XES))必须符合结构规范,确保系统能正确识别 data 并准确分析。

1. 表头行(Excel / 文本格式)

  • 文件需以表头行开头,位于第一行(如 Excel 的 A1 单元格或 CSV、TSV、TXT 的第 1 行)。表头需标明各列数据类型,如 “Case ID”、“Activity”、“Timestamp”。
  • 对于 CSV、TSV、TXT 格式,分隔符和引号会自动识别,上传更方便。

2. 最小字段要求

为满足 process mining event log 结构,文件至少要包含以下字段(列)。字段名无须与“CASE ID”、“Activity”等完全一致,但内容需相符。

  • Case ID:唯一标识流程实例(case),同一实例的所有行需相同 Case ID。
  • Activity:记录具体活动/事件 (如“订单创建”、“支付处理”等)。
  • Timestamp:每个 activity 必须配有 timestamp,标注事件发生的准确时间或日期。
  • 注意:timestamp 格式会尽量自动识别,常见如 yyyy-MM-dd HH:mm:ssMM/dd/yyyy 等。
  • 可选字段:可增加其他分析字段,如:
  • Resource:执行 activity 的用户、部门等。
  • Cost:活动的相关费用。
  • 自定义字段:可添加自定义内容,只要包含必选字段即可。

3. 数据格式规范

  • 数据需保持各列格式一致:
  • timestamp 建议用标准格式(如 yyyy-MM-dd HH:mm:ss),ProcessMind 会尽量自动识别。
  • 避免数据行间有空行,以免导入失败。
  • 数值型 data(如费用、时长)在 Excel 须设为数字型,CSV、TSV、TXT 文件也应格式正确。
  • CSV、TSV、TXT 格式下,ProcessMind 会自动检测分隔符(逗号、Tab、分号等)及处理引号,上传更流畅。

4. 工作表选择(仅限 Excel 文件)

  • ProcessMind 会自动读取 Excel 文件(XLS、XLSX、XLSB)中的第一个工作表,无论表名。请确保 event log 数据位于首个 sheet,其它 sheet 不参与分析。

5. XES 格式说明

.xes(eXtensible Event Stream)是 process mining 行业标准 event log 格式,可记录流程实例所有细节,如 Case ID、Activity、Timestamp 及相关属性。

主流 process mining 工具均支持此格式,适合精准还原真实流程行为。

🔗 技术标准及详情参见 官方 XES 标准网站

5. 提示

性能提示:使用 XLSB 格式加速处理

尽管 ProcessMind 可以上传和处理所有支持的格式,但我们强烈推荐使用 Excel 文件的 XLSB 格式。XLSB 格式以二进制格式存储您的 Excel 文件,这提供了显著的性能优势,特别是对于大型数据集。这意味着与 XLS 或 XLSX 格式相比,加载时间更短和处理速度更快。