本页内容
事件日志支持的数据格式
数据上传文件格式支持
ProcessMind 支持以下文件格式上传 event log:
- .csv — 逗号分隔值。常用、轻量,易从 Excel、ERP 等导出。
- .tsv — 制表符分隔值。结构类似 CSV,但用 Tab 替代逗号,适合数据包含逗号时。
- .txt — 纯文本文件,只要结构一致并有分隔符即可。
- .xls — 旧版 Excel 格式,支持但加载速度低于新版。
- .xlsx — 新版 Excel 格式,广泛使用,推荐用于结构化 data。
- .xlsb — Excel 二进制工作簿,适合大数据量,加载比 .xlsx 快,但通用性略低。
- .xes — process mining 行业标准 event log 格式,适合详细追踪 timestamp、Case ID 等。
文件结构通用要求
在 ProcessMind 中进行 process mining,上传的文件(Excel 格式(XLS、XLSX、XLSB)、文本格式(CSV、TSV、TXT)或 XML(XES))必须符合结构规范,确保系统能正确识别 data 并准确分析。
1. 表头行(Excel / 文本格式)
- 文件需以表头行开头,位于第一行(如 Excel 的 A1 单元格或 CSV、TSV、TXT 的第 1 行)。表头需标明各列数据类型,如 “Case ID”、“Activity”、“Timestamp”。
- 对于 CSV、TSV、TXT 格式,分隔符和引号会自动识别,上传更方便。
2. 最小字段要求
为满足 process mining event log 结构,文件至少要包含以下字段(列)。字段名无须与“CASE ID”、“Activity”等完全一致,但内容需相符。
- Case ID:唯一标识流程实例(case),同一实例的所有行需相同 Case ID。
- Activity:记录具体活动/事件 (如“订单创建”、“支付处理”等)。
- Timestamp:每个 activity 必须配有 timestamp,标注事件发生的准确时间或日期。
- 注意:timestamp 格式会尽量自动识别,常见如
yyyy-MM-dd HH:mm:ss、MM/dd/yyyy等。 - 可选字段:可增加其他分析字段,如:
- Resource:执行 activity 的用户、部门等。
- Cost:活动的相关费用。
- 自定义字段:可添加自定义内容,只要包含必选字段即可。
3. 数据格式规范
- 数据需保持各列格式一致:
- timestamp 建议用标准格式(如
yyyy-MM-dd HH:mm:ss),ProcessMind 会尽量自动识别。 - 避免数据行间有空行,以免导入失败。
- 数值型 data(如费用、时长)在 Excel 须设为数字型,CSV、TSV、TXT 文件也应格式正确。
- CSV、TSV、TXT 格式下,ProcessMind 会自动检测分隔符(逗号、Tab、分号等)及处理引号,上传更流畅。
4. 工作表选择(仅限 Excel 文件)
- ProcessMind 会自动读取 Excel 文件(XLS、XLSX、XLSB)中的第一个工作表,无论表名。请确保 event log 数据位于首个 sheet,其它 sheet 不参与分析。
5. XES 格式说明
.xes(eXtensible Event Stream)是 process mining 行业标准 event log 格式,可记录流程实例所有细节,如 Case ID、Activity、Timestamp 及相关属性。
主流 process mining 工具均支持此格式,适合精准还原真实流程行为。
🔗 技术标准及详情参见 官方 XES 标准网站。
5. 提示
性能提示:使用 XLSB 格式加速处理
尽管 ProcessMind 可以上传和处理所有支持的格式,但我们强烈推荐使用 Excel 文件的 XLSB 格式。XLSB 格式以二进制格式存储您的 Excel 文件,这提供了显著的性能优势,特别是对于大型数据集。这意味着与 XLS 或 XLSX 格式相比,加载时间更短和处理速度更快。