プロセスマイニングを実行するために必要なものは?

生データを持っていますか? それは最初の要素に過ぎません!Process Miningはクリーンなデータを好むので、イベントデータを完璧に探索、準備、整えましょう。それが強力なプロセスインサイトを生み出す秘訣です!

プロセスマイニングを始めるために必要なデータとは

あなたがレモネードスタンドを運営していると想像してください。しかし、あなたの記憶はとてもひどいです!スタンドがどれほど順調なのか把握するために、基本的な情報を追跡することにしました:

  • 顧客ID (CaseID): これはお客様ごとに与える番号のようなものです。同じ人がレモネードを再度買いに来ていることを知らせることができ、(もしかしたら不満を言ってくるのかもしれません)
  • 取られた行動 (Activity): これが起こったことです!「注文を取る」、「レモネードを準備する」、あるいは「怒った顧客の苦情を解決する」(頻繁でないことを願います!)
  • 行動日時 (Timestamp): アクションをした時間です。あなたの行動の順番を知ることは重要です!

この3つのデータだけで、Process Miningはスタンドにいる小さなスパイのようなものです。それは顧客の基本的な流れを観察し、ボトルネックを特定し(あなたがレモネードを作るのが遅いかもしれません!)、さらには一部の顧客が他の人よりも頻繁に不機嫌であるか教えてくれます(レシピを改善する時です!)。

データがどう見えるかの例をご覧ください:*

顧客ID (CaseID)行動日時 (Timestamp)取られた行動 (Activity)
110:00 AM注文を取る
110:02 AMレモネードを準備する
110:05 AM顧客に提供する
210:03 AM注文を取る
210:10 AM怒った顧客の苦情を解決する (びっくり!)
210:12 AMレモネードを準備する
210:15 AM顧客に提供する (今回は満足してくれることを願っています!)

これはほんの少しの情報に見えるかもしれませんが、Process Miningが質問を始め、レモネードスタンドの効率に関する基本的な洞察を明らかにするには十分なのです!

1. レモネードログの失われたケース

私たちのレモネードスタンドは大成功でした!お客様は私たちの秘伝のレシピを愛し(ほとんど)、ビジネスは活況を呈していました。しかし、大きな成功とともに、新たな課題が生じました: 私たちは顧客に溺れかけていました。行列が長く、気が立っている顧客もおり、最悪なのはなぜそうなのか全くわからなかったことです!

雇った小さいスパイ(Process Mining)を覚えていますか?奇跡を起こすことはできませんが、良い情報が必要です。そして私たちにあったのはナプキンに書かれた数語だけでした。ここで全てが混乱しました:

  • データ探偵: 最初の問題は、すべての重要な詳細を見つけることでした。顧客の注文は付箋、緩いレシート、そしてポケットにしまったクシャクシャのナプキン(ちょっとひどい!)に散らばっていました。それはまるで探偵小説のようで、ランダムな情報源(データベース、フラットファイル、メッセージログなど)から情報を集めてつなぎ合わせるものでした。
  • 同じ言語で話す: データが見つかっても、それがいつも明確というわけではありません。あるメモには「お客様ご満悦!」とあり、他のメモには不機嫌な顔が描かれていました。スパイが各走り書きの意味を理解するために(データ標準化)という翻訳者が必要でした。
  • 正しい質問をする: 最後に、実際に知りたいことを具体化する必要がありました。列が長いのは、注文が遅いからなのか、それともレモネードを作るのに時間がかかりすぎているのか?正しい質問をすることでデータ収集(データに対する異なる見解)を集中させることができました。
レモネードログ

このデータの混乱を整理することが、新たな冒険であることがわかりました。次の章では、探偵のような作業とデータを愛するスパイの助けを借りて、レモネードスタンドを最適化し、近隣の羨望の的になることができた様子をお見せします!

2: 偉大なデータ堀り

私たちのレモネードスタンドは大成功でしたが、行列は悪夢のようでした!データスパイ(Process Mining)が必要だとわかっていましたが、まずはまともなインテリジェンスを準備しなければなりませんでした。それはつまり、顧客に関するすべての隠された手がかりを見つけ出し、それをスパイが理解できるものに変換することを意味しました。

私たちが見つけたものは次の通りです:

  • 宝探し: データは時として埋もれた宝のように、システムの埃をかぶった端に隠れていました(ウェブページ、メール、PDF)。古いファイルを掘り起こし、洗練されたツール(スクリーンスクレイピング)を使って必要な情報を引き出す必要がありました。
  • 翻訳の迷子: データを見つけても、それがいつも明確とは限りません。ナプキンに走り書きされた手がかり(非構造化データ)や秘密のコードに閉じ込められた情報(欠けているメタデータ)について理解するためには、翻訳者(データ標準化)が必要でした。
  • 焦点が重要: データソースが多すぎると(何千ものテーブル!)、すべてを一度に掴み取りたくなります。しかし、アイスクリームショップで全ての味を試す訳にはいかないのと同様に、答えたい質問に注力する必要があります。お客様は注文に時間をかけすぎているのか、それとも私達がレモネードを作るのが遅いのか?これらの重要な質問に焦点を当てることで、どのデータを抽出するか優先順位をつけることができました。

簡単ではありませんでしたが、少しの労力と健康的な好奇心で、膨大なデータの宝庫を発掘することができました。次の章では、この混乱を整理し、ついにデータスパイをうまく機能させる方法についてお話しします!

3: データデトックス

私たちは、英雄的なデータ抽出の努力(第3章を参照)の結果、大量のデータを持っていました。しかし、帽子を持ってください。このデータは玉石混交で、有用な顧客情報、一部のランダムな走り書き、そして必要のないものがたくさんありました。データのデトックスの時がきました!

フィルタリングは新しい親友です。乱雑なツールボックスを整理するようなものだと考えてください。データを抽出するときには、大局的なこと(粗粒度のスコーピング)から始めました。今や、詳細に取り組む時がきました(細粒度のスコーピング)。

フィルタリングの課題をどう乗り越えたかをご覧ください:

  • スターにフォーカス: 最も頻繁な顧客の注文を、私たちのツールボックスの中のきらめく新しいツールだと想像してください。データスパイを管理しやすくするために、最も一般的な活動トップ10(注文、待機、レモネード受け取り)にフォーカスすることにしました。他は後回しにしました(とりあえず)。
  • 繰り返しが鍵: フィルタリングは一度きりのものではありません。クリーンなデータをデータスパイが分析し始めると、新たに焦点を当てるべき領域を教えてくれました。探偵が手掛かりを追うように、新しい洞察に基づいてフィルタを絶えず改良しました。
フォーカス

データがきらめくようにきれいになると(まあまあきれいですが)、次の章ではデータスパイ(Process Mining)の真の力を解き放つ時がきました!発見、適合、強化など様々な技法を探求し、私たちのレモネードスタンドの問題を診断し、最も効率的なレモネード運営にすることができました!

4: データメイクオーバー

データデトックス(第4章)は大変有効でしたが、データスパイ(Process Mining)を解放する前にまだ重要なステップがありました。それがデータメイクオーバーです!お客様がクシャクシャの紙幣を持ってスタンドにやってくることを想像してください。私たちはその人を拒絶しませんが、紙幣がパリっときれいなら扱いやすいですよね。これがデータクリーニングのアイデアです。

次に必要なことは次の通りです:

  • ケース終了: プロセスは顧客の旅のようなものです - 始まり、中間、そして終わりがあります。1人の顧客(ケース)に関連するすべてのイベントをつなげる必要がありました - 注文、待ち時間、そして最終的にレモネードを受け取ること。単一の顧客訪問に対してすべてのレシートを整理するようなものです。
  • プロセスを話す: 私たちのデータは常にプロセスの言語を話しているわけではありません。各顧客の旅(ケース)のための状態変化として活動が明確に定義される必要がありました。たとえば、「お客様ご満悦!」だけでは不十分です。「レモネードが届けられた」というような明確なステータスが必要でした。

それは冒険の中で最も華やかな部分ではありませんでしたが、多少のデータ操作と明確な考え方で、最終的にきらめくようにクリーンなデータセットを得ることができました!このデータをデータスパイが変換して、お客様を長らく待たせてしまうことの原因を発見し、レモネードスタンドを効率の高い(そして美味しい)輝く灯台に変えることができました!