事件日志支持的数据格式
数据上传文件支持
ProcessMind 支持以下文件格式用于上传事件日志:
- XLS:旧版 Excel 格式,许多系统仍然支持。
- XLSX:最常用的现代 Excel 表格格式。
- XLSB:二进制 Excel 格式,加载速度更快,文件大小更小。我们建议使用 XLSB 加速大事件日志的处理。
- CSV:逗号分隔值文件,常用的简单文本格式,用于存储表格数据。
- TSV:制表符分隔值文件,类似于 CSV 格式,但使用制表符区分列。
- TXT:纯文本文件,使用逗号、制表符或分号等分隔符来组织数据。
固定文件结构要求
为成功在 ProcessMind 中进行流程挖掘,您上传的文件(无论是 Excel 格式(XLS, XLSX, XLSB)还是文本格式(CSV, TSV, TXT))必须符合特定的结构指南。这可确保应用程序正确解释数据并执行准确的分析。
1. 标题行
- 文件必须以标题行开始,位置应在第一行处(例如,Excel 文件的 A1 单元格或 CSV、TSV、TXT 文件的 第 1 行)。标题定义了列名,并应清楚说明每列的数据类型(例如,“Case ID”,“Activity”,“Timestamp”)。
- 对于 CSV、TSV 和 TXT 格式,分隔符和引号将自动检测,便于上传数据,无需手动指定这些设置。
2. 最小属性集
为支持流程挖掘事件日志结构,您的文件至少应包含以下属性(列):
- Case ID:此列唯一标识每个流程实例(或案例)。每行对应于相同流程实例的必须有相同的 Case ID。
- Activity:此列应描述录制的特定活动或事件(例如,“Order Created”,“Payment Processed”)。
- Timestamp:每个活动必须关联一个时间戳,标记事件发生的确切时间或日期。
- 注意:时间戳格式将尽可能自动检测。常见格式如
yyyy-MM-dd HH:mm:ss
,MM/dd/yyyy
等会自动识别。
- 注意:时间戳格式将尽可能自动检测。常见格式如
- 可选属性:您可以包括其他列以增强您的分析,例如:
- Resource:标识执行活动的人(例如,用户,部门)。
- Cost:与活动相关的任何成本。
- 其他自定义数据:在存在所需列的情况下,可以包括与特定流程相关的自定义字段。
3. 数据格式化
- 确保您的数据在所有列中格式一致:
- 时间戳应为标准且可识别的格式(例如,
yyyy-MM-dd HH:mm:ss
),尽管 ProcessMind 会尽量自动检测日期格式。 - 避免在数据条目之间出现空行,以免中断导入过程。
- 确保数值数据(如成本、持续时间)在 Excel 中格式为数字,或在基于文本的文件中正确格式化(CSV、TSV、TXT)。
- 时间戳应为标准且可识别的格式(例如,
- 对于 CSV、TSV 和 TXT 格式,ProcessMind 将自动检测分隔符(逗号、制表符、分号等)并处理引号文本,使文件上传无缝进行。
4. 工作表选择(仅限 Excel 文件)
- ProcessMind 自动处理您 Excel 文件(XLS、XLSX 或 XLSB)中的第一张工作表中的数据,无论其名称如何。确保所需的事件日志数据置于第一张工作表中,因为在导入期间不会考虑其他工作表。
5. 提示
性能提示:使用 XLSB 格式加速处理
尽管 ProcessMind 可以上传和处理所有支持的格式,但我们强烈推荐使用 Excel 文件的 XLSB 格式。XLSB 格式以二进制格式存储您的 Excel 文件,这提供了显著的性能优势,特别是对于大型数据集。这意味着与 XLS 或 XLSX 格式相比,加载时间更短和处理速度更快。