事实证明,清理这堆数据混乱是一个全新的冒险。但在下一个章节中,您将看到,通过一点侦查工作和我们的数据间谍的帮助,我们能够优化我们的柠檬水摊,成为社区的羡慕对象!
我们的柠檬水摊非常受欢迎,但长长的队伍让人抓狂!我们知道需要数据间谍(Process Mining)的帮助,但首先,我们需要一些可靠的信息,这意味着要深入数据提取领域——基本上就是寻找关于我们顾客的所有隐藏线索,并将其转化为间谍能够理解的东西。
这是我们发现的:
虽然不容易,但通过一些努力和强烈的好奇心,我们挖掘出了一整套数据。在下一章中,我们将看到我们如何整理这一烂摊子,并最终让我们的数据间谍为我们工作!
感谢我们英雄般的提取努力(见第3章),我们拥有了大量的数据。但请抓紧您的帽子,因为这些数据参差不齐——有一些有用的客户信息,随机的涂鸦,还有许多我们不需要的东西。是时候进行数据排毒了!
过滤成了我们的新好朋友。想象一下整理一个杂乱的工具箱。当我们提取数据时,我们先从大的方向着手(粗粒度范围)。现在是时候详细处理(细粒度范围)了。
这是我们如何应对过滤挑战的方法:
随着数据变得洁净(好吧,大部分是干净的),终于到了在下一章释放我们数据间谍(Process Mining)真正力量的时候了!我们将探索发现、合规性和增强等不同技术来诊断我们柠檬水摊的问题,成为街区最有效率的柠檬水操作!
我们的数据排毒(第4章)效果显著,但在释放我们数据间谍(Process Mining)之前,还有一个关键步骤——数据改造!想象一下顾客带着皱巴巴的钞票走到我们的摊位。我们不会拒绝他们,但如果钞票是平整干净的会更容易处理。这就是数据清理的理念。
这是我们需要做的:
即使这不是探险中最华丽的部分,但通过一点数据整理和清晰的思维,我们终于得到了一个一尘不染的数据集!借助这个数据,我们的数据间谍揭示了我们长队背后的秘密,并将我们的柠檬水摊变成一个充满活力的效率灯塔(和美味)!