- データ探偵: 最初の問題は、すべての重要な詳細を見つけることでした。顧客の注文は付箋、緩いレシート、そしてポケットにしまったクシャクシャのナプキン(ちょっとひどい!)に散らばっていました。それはまるで探偵小説のようで、ランダムな情報源(データベース、フラットファイル、メッセージログなど)から情報を集めてつなぎ合わせるものでした。
- 同じ言語で話す: データが見つかっても、それがいつも明確というわけではありません。あるメモには「お客様ご満悦!」とあり、他のメモには不機嫌な顔が描かれていました。スパイが各走り書きの意味を理解するために(データ標準化)という翻訳者が必要でした。
- 正しい質問をする: 最後に、実際に知りたいことを具体化する必要がありました。列が長いのは、注文が遅いからなのか、それともレモネードを作るのに時間がかかりすぎているのか?正しい質問をすることでデータ収集(データに対する異なる見解)を集中させることができました。
このデータの混乱を整理することが、新たな冒険であることがわかりました。次の章では、探偵のような作業とデータを愛するスパイの助けを借りて、レモネードスタンドを最適化し、近隣の羨望の的になることができた様子をお見せします!
2: 偉大なデータ堀り
私たちのレモネードスタンドは大成功でしたが、行列は悪夢のようでした!データスパイ(Process Mining)が必要だとわかっていましたが、まずはまともなインテリジェンスを準備しなければなりませんでした。それはつまり、顧客に関するすべての隠された手がかりを見つけ出し、それをスパイが理解できるものに変換することを意味しました。
私たちが見つけたものは次の通りです:
- 宝探し: データは時として埋もれた宝のように、システムの埃をかぶった端に隠れていました(ウェブページ、メール、PDF)。古いファイルを掘り起こし、洗練されたツール(スクリーンスクレイピング)を使って必要な情報を引き出す必要がありました。
- 翻訳の迷子: データを見つけても、それがいつも明確とは限りません。ナプキンに走り書きされた手がかり(非構造化データ)や秘密のコードに閉じ込められた情報(欠けているメタデータ)について理解するためには、翻訳者(データ標準化)が必要でした。
- 焦点が重要: データソースが多すぎると(何千ものテーブル!)、すべてを一度に掴み取りたくなります。しかし、アイスクリームショップで全ての味を試す訳にはいかないのと同様に、答えたい質問に注力する必要があります。お客様は注文に時間をかけすぎているのか、それとも私達がレモネードを作るのが遅いのか?これらの重要な質問に焦点を当てることで、どのデータを抽出するか優先順位をつけることができました。
簡単ではありませんでしたが、少しの労力と健康的な好奇心で、膨大なデータの宝庫を発掘することができました。次の章では、この混乱を整理し、ついにデータスパイをうまく機能させる方法についてお話しします!
3: データデトックス
私たちは、英雄的なデータ抽出の努力(第3章を参照)の結果、大量のデータを持っていました。しかし、帽子を持ってください。このデータは玉石混交で、有用な顧客情報、一部のランダムな走り書き、そして必要のないものがたくさんありました。データのデトックスの時がきました!
フィルタリングは新しい親友です。乱雑なツールボックスを整理するようなものだと考えてください。データを抽出するときには、大局的なこと(粗粒度のスコーピング)から始めました。今や、詳細に取り組む時がきました(細粒度のスコーピング)。
フィルタリングの課題をどう乗り越えたかをご覧ください:
- スターにフォーカス: 最も頻繁な顧客の注文を、私たちのツールボックスの中のきらめく新しいツールだと想像してください。データスパイを管理しやすくするために、最も一般的な活動トップ10(注文、待機、レモネード受け取り)にフォーカスすることにしました。他は後回しにしました(とりあえず)。
- 繰り返しが鍵: フィルタリングは一度きりのものではありません。クリーンなデータをデータスパイが分析し始めると、新たに焦点を当てるべき領域を教えてくれました。探偵が手掛かりを追うように、新しい洞察に基づいてフィルタを絶えず改良しました。
データがきらめくようにきれいになると(まあまあきれいですが)、次の章ではデータスパイ(Process Mining)の真の力を解き放つ時がきました!発見、適合、強化など様々な技法を探求し、私たちのレモネードスタンドの問題を診断し、最も効率的なレモネード運営にすることができました!
4: データメイクオーバー
データデトックス(第4章)は大変有効でしたが、データスパイ(Process Mining)を解放する前にまだ重要なステップがありました。それがデータメイクオーバーです!お客様がクシャクシャの紙幣を持ってスタンドにやってくることを想像してください。私たちはその人を拒絶しませんが、紙幣がパリっときれいなら扱いやすいですよね。これがデータクリーニングのアイデアです。
次に必要なことは次の通りです:
- ケース終了: プロセスは顧客の旅のようなものです - 始まり、中間、そして終わりがあります。1人の顧客(ケース)に関連するすべてのイベントをつなげる必要がありました - 注文、待ち時間、そして最終的にレモネードを受け取ること。単一の顧客訪問に対してすべてのレシートを整理するようなものです。
- プロセスを話す: 私たちのデータは常にプロセスの言語を話しているわけではありません。各顧客の旅(ケース)のための状態変化として活動が明確に定義される必要がありました。たとえば、「お客様ご満悦!」だけでは不十分です。「レモネードが届けられた」というような明確なステータスが必要でした。
それは冒険の中で最も華やかな部分ではありませんでしたが、多少のデータ操作と明確な考え方で、最終的にきらめくようにクリーンなデータセットを得ることができました!このデータをデータスパイが変換して、お客様を長らく待たせてしまうことの原因を発見し、レモネードスタンドを効率の高い(そして美味しい)輝く灯台に変えることができました!