运行Process Mining需要什么条件？

运行 Process Mining 需要什么？

有原始 data 吗？这只是第一步！Process Mining 最适合用干净、规范的 event data。分析、准备、优化你的 data，挖掘流程洞察力。

假设你经营着柠檬水摊，但你的记性特别差！为了了解摊位的运营情况，你决定记录一些基本信息：

Customer ID (CaseID)：相当于给每位顾客分一个编号。这样你能知道是不是同一个顾客回来买柠檬水（或者回来投诉柠檬水太酸）。
Action Taken (Activity)：描述发生了什么，比如“Take Order”、“Prepare Lemonade”或“Resolve Angry Customer Complaint”（希望这种情况不太多！）。
Action Time (Timestamp)：每个动作完成的时间。掌握各个动作的顺序很重要！

有了这三个data，Process Mining就像你摊位上的智能小助手。它能帮你看到顾客的基本流转、找到流程卡点（比如做柠檬水慢）、甚至判断哪些顾客经常不高兴（也许该改进配方了）。

比如下表就是样例：

Customer ID (CaseID)	Action Time (Timestamp)	Action Taken (Activity)
1	10:00 AM	Take Order
1	10:02 AM	Prepare Lemonade
1	10:05 AM	Serve Customer
2	10:03 AM	Take Order
2	10:10 AM	Resolve Angry Customer Complaint (yikes!)
2	10:12 AM	Prepare Lemonade
2	10:15 AM	Serve Customer (hopefully happier this time!)

这些信息看似很少，但对于Process Mining来说已经足以开始分析、提出问题，并帮你发现柠檬水摊的运营效率！

我们的柠檬水摊生意火爆，顾客们都喜欢我们的独家配方（大多数人都爱），订单大增。但成功也带来新难题：顾客实在太多了！排队很长，大家情绪有点激动，更糟糕的是，我们根本不知道问题出现在哪里！

还记得那个被我们请来的“小侦探”（Process Mining）吗？其实它也不是万能的，它需要好情报，而我们只有几行草草的记事。状况变得混乱：

最后发现，要把这些混乱数据整顿干净其实也是一种全新冒险。但下一章你会看到，靠着一点侦探精神和Process Mining帮忙，我们如何把柠檬水摊做到了让街坊羡慕！

我们的柠檬汁摊非常受欢迎，但队伍却是个噩梦！我们知道需要我们的数据间谍（Process Mining）的帮助，但首先，我们得给它一些可靠的情报。这意味着要深入数据提取的世界——基本上就是找到所有关于顾客的隐藏线索并转换为间谍可以理解的东西。

这是我们发现的：

寻宝： 有时，数据就像埋藏的宝藏——藏在我们系统的尘土堆里（网页、电子邮件、PDF）。我们必须成为数据考古学家，翻阅旧文件并使用高科技工具（屏幕抓取）挖掘所需的信息。
翻译难题： 即便找到了数据，它依旧不总是清晰。一些线索写在餐巾纸上（非结构化数据），另一些则隐藏在秘密代码中（缺失元数据）。我们需要一个翻译器（数据标准化）来解码这一切。
重点是关键： 面对如此多的数据来源（数千个表格！），很容易被诱惑而抓取所有东西。但就像在冰激凌店里你不会尝试所有口味，我们需要专注于想要回答的问题。顾客点餐花费太长时间，还是我们制作柠檬汁拖慢了进度？聚焦在这些关键问题上帮助我们优先考虑提取哪些数据。

过程并不轻松，但经过一点努力和足够的好奇心，我们成功挖掘出一堆数据宝藏。在下一章，我们将看到如何清理这些混乱并最终让我们的数据间谍起作用！

在我们第三章的“数据大作战”后，终于攒下了一大堆数据。但这些数据五花八门——有用的客户信息、乱七八糟的涂鸦，还有一堆没用的东西。是时候来场数据排毒了！

筛选成了我们的新帮手。就像整理乱糟糟的工具箱，最开始要先做大范围（粗粒度）筛选，现在得精细（细粒度）筛查。

我们是这样攻克筛选难题的：

数据终于焕然一新（大体如此），终于可以在下一章让Process Mining发挥真正威力！我们会尝试discovery、conformance、enhancement等技术，查明摊位问题，把柠檬水业务做到全街最高效！

经过 data 净化（第 4 章），体验大提升，但要释放 Process Mining 潜能，最后一步就是 data 焕新！就像顾客来买柠檬水递上一张皱钞，虽然能收但新钞更顺。这就是 data cleaning 的意义。

我们要做的有：

Case归集完整： 流程就像顾客旅程，有开头、有过程、有结尾。我们需要把一个顾客（case）下单、等待、取柠檬水的所有event关联起来，相当于把一位顾客的所有消费凭证整合好。
流程表达统一： 原始数据不总是“流程语言”。各活动要清楚标记为状态变更。例如，“客户满意！”太模糊，我们要像“柠檬水已送达”这样的明确状态。

虽然 data 整理并不炫酷，但通过整理归类加标准化，我们终于得到了干净、高质量的数据集！有了 data 侦探加工后的数据，我们就能揭开排队背后秘密，把柠檬水摊变成高效又受欢迎的榜样店！