プロセスマイニングを始めるために必要なこと

プロセスマイニングの実行に必要なものは？

生データはスタート地点。プロセスマイニングは、整理されたクリーンなイベントデータで最大の効果を発揮します。データを確認・準備・整形し、ビジネスプロセスの強力なインサイトを引き出しましょう。

プロセスマイニングに必要なデータ

あなたがレモネードスタンドを運営しているとして、物忘れしやすいとします。お店がどのくらいうまくいっているかを知るために、基本的な情報を記録しましょう。

Customer ID（CaseID）：お客様ごとに付ける番号です。同じ人がリピートしたり、クレームを言っているのか分かります。
Action Taken（Activity）：どんな行動をしたかです。「Take Order」「Prepare Lemonade」「Resolve Angry Customer Complaint」（あまり出てほしくないですが！）など、実際の作業を指します。
Action Time（Timestamp）：そのアクションをした時刻です。工程の順番を知るために大切！

この3つだけあれば、プロセスマイニングがあなたの店の小さなスパイになって動きを見抜きます。顧客の流れを把握し、bottleneck（例えばレモネードを作るのが遅いなど）を見つけたり、よく不機嫌になるお客様を特定してレシピ改良のきっかけにできます。

データ例（テーブル形式）：

Customer ID（CaseID）	Action Time（Timestamp）	Action Taken（Activity）
1	10:00 AM	Take Order
1	10:02 AM	Prepare Lemonade
1	10:05 AM	Serve Customer
2	10:03 AM	Take Order
2	10:10 AM	Resolve Angry Customer Complaint
2	10:12 AM	Prepare Lemonade
2	10:15 AM	Serve Customer

情報は少なくても、この3項目でプロセスマイニングが質問を生み出し、レモネードスタンドの効率改善のヒントが得られます！

1. 消えたレモネードログ事件

私たちのレモネードスタンドは大人気！秘伝レシピが好評でビジネスも絶好調。でも、成功の裏側には新たな問題が。お客様の行列はどんどん長くなり、イライラする人も増えて、何が原因なのかわからない…！

あの小さなスパイ（プロセスマイニング）を覚えていますか？実は魔法じゃなく、良い情報が必要。でも手元にあるのはナプキンの走り書きだけ。ここから混乱が始まりました：

このデータ整理は新たな冒険でした。でも、少しの探偵力とデータ好きなスパイの力で、次の章ではレモネードスタンドを最適化し、ご近所の自慢になったのです！

2. データ発掘大作戦

レモネードスタンドは大成功したものの、行列は悪夢でした！データスパイ（プロセスマイニング）の助けが必要であることはわかっていましたが、まずはそれに適した情報を手に入れる必要がありました。それは、データ抽出の世界に深く入ることで、基本的に顧客に関する隠れた手掛かりを見つけ、スパイが理解できるものに変えることを意味していました。

ここで発見したこと:

宝探し: 時々、データは埋もれた宝物のようで、システムのほこりをかぶった隅に隠されていました（ウェブページ、メール、PDFなど）。古いファイルを掘り起こし、スクリーンスクレイピングなどのツールを使って必要な情報を発掘する必要がありました。
失われた翻訳: データを見つけても、はっきりしないことがよくありました。ナプキンに書かれたヒント（非構造化データ）や、秘密のコードに隠されたもの（メタデータの欠如）さえありました。それらを解読するための翻訳者（データ標準化）が必要でした。
焦点が鍵: データソースが非常に多く（数千のテーブル！）、すべてを取り込むことが誘惑的でした。しかし、アイスクリーム店で全てのフレーバーを試してみることはできないのと同様に、答えを求めている質問に焦点を合わせる必要がありました。顧客が注文に時間がかかりすぎているのか、それともレモネードを作るところがbottleneckになっているのか？これらの重要な質問に焦点を当てることで、抽出するデータの優先順位を決定するのに役立ちました。

簡単ではありませんでしたが、少しの労力と好奇心のおかげで、データの宝庫を発掘することができました。次の章では、この混乱をどう片づけ、そしてついにデータスパイを使いこなせるようになったかを見ていきます！

3. データデトックス（不要データ排除）

第3章の頑張りでデータは山のように集まりました。でも、その中身は使える顧客情報もあれば意味のないメモも混ざったごちゃ混ぜ状態。データの断捨離が必要になりました！

ここで大活躍したのがフィルタリング。散らかったツールボックスを整理するようなものです。最初は大きな枠（coarse-grained scoping）でデータを抽出し、次は細かく（fine-grained scoping）仕分けしました。

フィルタリングのアプローチ：

データがすっきりしたら、次の章でついにプロセスマイニングの本格出番！discovery、conformance、enhancementなどでレモネードスタンドの課題を特定し、地域一番の効率的な店舗に！

4. データのメイクオーバー（整形）

デトックス（不要データ除去）でスッキリした後、プロセスマイニングの力を最大化するには「データメイクオーバー」が不可欠です。例えばクシャクシャの紙幣も、そのまま受け取るよりキレイな方が管理やすい――データも同じです。

やるべきことはこちら：

Caseのひもづけ: プロセスは顧客の旅（Journey）のようなもの。始まりがあり、途中があり、終わりがあります。1人の顧客（case）のorder、待ち時間、受け取りをしっかり関連付け。1回の来店ごとにレシートを整理するイメージ。
プロセス言語で表現: データが必ずしもプロセスを表しているとは限りません。各アクティビティをcaseにおけるステータスの変化としてわかりやすく定義。「Customer Happy!」は曖昧なので、「Lemonade Delivered」のような明確なステータスを使いました。

この地道な作業で、ついに整ったデータセットが完成！プロセスマイニングでbottleneck特定と効率化を進め、レモネードスタンドを“業務効率モデル”へと変革できます。