文档列表
本页目录

数据集配置指南

数据集上传及配置界面手册

当您的数据集完成上传后,您将看到 数据集界面。在这里,可以设置数据如何用于 Process Mining 分析。界面分为多个主要区域,可用于管理数据集、分配数据列属性,并查看文件属性。

数据集上传与Process Mining配置界面

1. 显示名称

在页面左上角,显示名称 字段可让您:

  • 编辑数据集名称:可修改为更有意义、能反映数据内容的命名(例如“客户订单数据”或“事件报告”)。

2. 上传数据集

页面中部为 上传数据集 区域,您可以:

  • 拖放文件进行上传;
  • 点击区域手动选择电脑文件;
  • 文件上传后,该区域会显示已上传文件的详细信息。

3. 文件属性

右侧 属性 面板会显示上传文件的详细信息,包括:

  • 文件名:上传文件的名称(如 P2P event log.csv)。
  • 上传时间:文件实际上传的日期和时间。
  • 文件大小:数据集文件的大小(如 7.89Mb)。 点击(信息)图标可查看更多系统中的文件使用情况。
  • 行数:数据集记录数(如 50,000 行)。
  • 最后修改时间:上传前文件的最后修改时间(如 2024年2月28日)。

此部分可帮助您确认上传的是正确的文件。


4. 配置选项卡

在数据集名称和上传区域下方,有一个分栏导航,包括:

  • Process Mining(当前激活)
  • Attributes
  • Activities
  • Data

每个选项卡都可以配置数据集的不同方面。本节重点介绍 Process Mining 选项卡。


5. Process Mining 选项卡

Process Mining 选项卡用于将数据集各列映射到 process mining 必须或可选字段。这样确保系统能正确识别与分析数据。

必填字段

  1. Case ID

    • 表示每个流程实例(或“case”)的唯一标识符。
    • 请选择对应的 Case ID 列(该字段为分析必需)。
  2. Activity

    • 表示正在分析的具体活动或 event(如“订单创建”或“付款完成”)。
    • 选择数据集中表示活动的列(如“activity_due”)。
  3. End Time

    • 记录活动或 event 发生的时间。
    • 选择表示结束时间的列(如“system_created_on”)。

可选字段

  1. Start Time

    • 活动开始的时间。
    • 如数据集包含开始时间,用下拉菜单选择对应列。
  2. User

    • 执行该活动的用户或主体(如员工、系统、部门)。
    • 如有,选择包含此信息的列。
  3. Cost

    • 每个活动或 event 相关的成本。
    • 若有成本信息,请映射包含成本的列。
  4. CO2

    • 各活动的 CO2 排放量(如有)。
    • 选择拥有 CO2 数据的列,方便追踪环境影响。

6. 其他选项卡可选配置

配置好 Process Mining 选项卡的必填和可选字段后,还可以在以下选项卡进一步设置:

  • Attributes:自定义并分配数据集属性。
  • Activities:配置活动相关设置,提升流程分析效果。
  • Data:分析前查看或清洗数据。

最后步骤

  • 检查您的选择,确保正确的列已映射到对应的字段。
  • 所有内容映射无误后,即可基于已配置的数据执行 Process Mining 分析。

按照这些步骤操作,可以确保数据集正确设置用于分析,助您在 ProcessMind 的 process mining 工作中获得有价值的洞察。