本页目录
数据集配置指南
数据集上传及配置界面手册
当您的数据集完成上传后,您将看到 数据集界面。在这里,可以设置数据如何用于 Process Mining 分析。界面分为多个主要区域,可用于管理数据集、分配数据列属性,并查看文件属性。

1. 显示名称
在页面左上角,显示名称 字段可让您:
- 编辑数据集名称:可修改为更有意义、能反映数据内容的命名(例如“客户订单数据”或“事件报告”)。
2. 上传数据集
页面中部为 上传数据集 区域,您可以:
- 拖放文件进行上传;
- 或点击区域手动选择电脑文件;
- 文件上传后,该区域会显示已上传文件的详细信息。
3. 文件属性
右侧 属性 面板会显示上传文件的详细信息,包括:
- 文件名:上传文件的名称(如
P2P event log.csv)。 - 上传时间:文件实际上传的日期和时间。
- 文件大小:数据集文件的大小(如
7.89Mb)。 点击(信息)图标可查看更多系统中的文件使用情况。 - 行数:数据集记录数(如
50,000行)。 - 最后修改时间:上传前文件的最后修改时间(如
2024年2月28日)。
此部分可帮助您确认上传的是正确的文件。
4. 配置选项卡
在数据集名称和上传区域下方,有一个分栏导航,包括:
- Process Mining(当前激活)
- Attributes
- Activities
- Data
每个选项卡都可以配置数据集的不同方面。本节重点介绍 Process Mining 选项卡。
5. Process Mining 选项卡
Process Mining 选项卡用于将数据集各列映射到 process mining 必须或可选字段。这样确保系统能正确识别与分析数据。
必填字段
Case ID:
- 表示每个流程实例(或“case”)的唯一标识符。
- 请选择对应的 Case ID 列(该字段为分析必需)。
Activity:
- 表示正在分析的具体活动或 event(如“订单创建”或“付款完成”)。
- 选择数据集中表示活动的列(如“activity_due”)。
End Time:
- 记录活动或 event 发生的时间。
- 选择表示结束时间的列(如“system_created_on”)。
可选字段
Start Time:
- 活动开始的时间。
- 如数据集包含开始时间,用下拉菜单选择对应列。
User:
- 执行该活动的用户或主体(如员工、系统、部门)。
- 如有,选择包含此信息的列。
Cost:
- 每个活动或 event 相关的成本。
- 若有成本信息,请映射包含成本的列。
CO2:
- 各活动的 CO2 排放量(如有)。
- 选择拥有 CO2 数据的列,方便追踪环境影响。
6. 其他选项卡可选配置
配置好 Process Mining 选项卡的必填和可选字段后,还可以在以下选项卡进一步设置:
- Attributes:自定义并分配数据集属性。
- Activities:配置活动相关设置,提升流程分析效果。
- Data:分析前查看或清洗数据。
最后步骤
- 检查您的选择,确保正确的列已映射到对应的字段。
- 所有内容映射无误后,即可基于已配置的数据执行 Process Mining 分析。
按照这些步骤操作,可以确保数据集正确设置用于分析,助您在 ProcessMind 的 process mining 工作中获得有价值的洞察。