統計分布の徹底ガイド(シミュレーション対応)
分布を使う理由
現実のプロセスにはバラつきがあります。例えば、お客様対応が5分で終わる場合もあれば、25分かかることもあります。一日の注文数も50件の日もあれば120件の日も。こうした自然なバリエーションはビジネスプロセスの本質的な特徴です。
Fixed値(「すべての作業がきっちり10分」など)は非現実的なシミュレーションになりがちですが、分布を使えば変動を数理的に表現し実際のプロセス挙動を再現できます。
ばらつきの影響
平均10分のタスクにおける2つのシナリオを比較:
| シナリオ | 分布 | シミュレーションへの影響 |
|---|---|---|
| 固定10分 | ばらつきなし | 非現実的なキュー、単調な流れ |
| Normal (mean=10, stdDev=3) | 現実的なばらつき | 自然なキュー、実際に近い遅延 |
後者の方が現実的です。タスクごとに時間は異なり、そのばらつきがキューや遅延を生み出します。
利用可能な分布
ProcessMind では、さまざまなばらつきを表現するために 8 種類の分布を提供しています。
| 分布 | 用途 | 主なパラメータ |
|---|---|---|
| 固定値 | 一定で変化しない値 | value |
| 正規分布 | 平均の周りで対称に変動 | mean, stdDev |
| 一様分布 | 指定範囲内で一様な確率 | min, max |
| 三角分布 | 範囲内に最も起こりやすい値がある場合 | min, mode, max |
| ポアソン分布 | ランダムな到着イベント | lambda, rateUnit |
| 対数正規分布 | 右に歪む(通常は短いが、ときどき長い) | mean, stdDev |
| ワイブル分布 | 信頼性・故障解析 | scale, shape |
| ベータ分布 | min と max の間で形状を柔軟に調整可能 | min, max, alpha, beta |
| ピアソンVI分布 | 複雑に偏ったパターン | alpha1, alpha2, beta |
Fixed分布
もっともシンプルな分布で、常に同じ値を返します。
パラメータ
| パラメータ | 説明 |
|---|---|
| value | 返される一定の値 |
特徴
- まったくバリエーションなし
- 毎回指定値を返す
- システム制御や自動stepのモデリングに便利
利用シーン
- 一定時間内に応答する自動システム
- 規制のタイムアウトや締切
- バリエーション追加前のシミュレーション初期設定
- SLAや契約上の納期をモデル化するとき
実践例:出荷遅延の分析
システム生成メールは必ず5秒で送信されます。
Normal(ガウス)分布
よく知られる「ベルカーブ」で、値は平均を中心に左右対称に分布し、中心から離れるにつれて確率が低下します。
パラメータ
| パラメータ | 説明 |
|---|---|
| mean | 平均値(曲線の中心) |
| stdDev | 標準偏差(値のばらつき度合い) |
特徴
- 平均値を中心に対称分布
- 全体の68%が1標準偏差内
- 95%が2標準偏差内
- 99.7%が3標準偏差内
- 理論上マイナス値も出る(シミュレーションで補正)
利用シーン
- 平均を中心におおよそ均等にばらつく処理時間
- ランダムエラーを含む測定値
- 多くの独立要素の影響を受ける量
実践例:出荷遅延の分析
データ入力taskの平均5分・標準偏差1分の場合:
- 68%は4~6分
- 95%は3~7分
- 2分未満または8分超はごくわずか
Uniform分布
指定範囲内は全ての値が等確率で発生するフラットな分布です。
パラメータ
| パラメータ | 説明 |
|---|---|
| min | 最小値 |
| max | 最大値 |
特徴
- すべての値が等確率
- minとmaxで明確に区切り
- 平均値は(min + max) / 2に等しい
利用シーン
- 範囲だけわかっていて代表値が不明な場合
- 一定範囲からランダム選択したい時
- scheduled eventの待ち時間
- 履歴データがなく不確実性をモデル化したい場合
実践例:出荷遅延の分析
承認作業は2~8分の範囲で発生し、全ての値が等確率です。典型値の情報はありません。
Triangular分布
最小・最大・最頻値(mode)の3点で構成されるシンプルな三角形状の分布です。
パラメータ
| パラメータ | 説明 |
|---|---|
| min | 最小値 |
| mode | 最頻値(三角形ピーク) |
| max | 最大値 |
特徴
- mode付近に値が集まりやすい
- minとmaxで明確に範囲が決まる(それ以上の外れは出ません)
- mode≠(min+max)/2なら非対称
- 現場感覚でも推定しやすい
利用シーン
- 「通常はXだが、YからZまで幅がある」場合
- 専門家による見積もりの場合
- Normal分布だと非現実的な負の値になるとき
実践例:出荷遅延の分析
請求書確認作業:
- ベストケース (min): 2分
- 標準的 (mode): 5分
- ワーストケース (max): 15分
多くは5分前後ですが、複雑な請求書ほど15分寄りになります。
【専門家の知見】
Triangular分布は現場の見積もりに最適です。「最短は?普通は?最長は?」と聞けばmin, mode, maxがすぐに得られます。
Poisson分布
一定期間で発生するevent数をモデル化します。到着プロセスのモデリングに最適です。
パラメータ
| パラメータ | 説明 |
|---|---|
| lambda | eventの平均発生率 |
| rateUnit | レートの時間単位(1時間ごと、1日ごと、1週間ごと、1ヶ月ごと、1年ごと) |
特徴
- 離散値(整数:0, 1, 2, 3…)
- 分散=平均
- eventは互いに独立
- ランダムな到着を正確にモデル化
利用シーン
- プロセスへのcase(事例)の流入
- 顧客到着のモデル化
- オーダー生成のタイミング
- 一定時間ごとに発生するeventのシナリオ
実践例:出荷遅延の分析
Lambda=20, rateUnit=perDayは1日あたり約20件のcase到着をモデル化します。日によって15件や25件の日もあり(自然なバラつきです)。
Lognormal分布
右側に裾が伸び、多くは小さい値ですが、ときどき大きな値が発生します。値の対数がNormal分布に従います。
パラメータ
| パラメータ | 説明 |
|---|---|
| mean | 基礎となるNormal分布の平均値 |
| stdDev | 基礎となるNormal分布の標準偏差 |
特徴
- 常に正の値(マイナスになりません)
- 右側に裾が伸びている(大きな値がまれに発生)
- 多くは下のほうに値が集中
- まれに非常に大きい値も出る
利用シーン
- ほとんど素早く完了するが、ごくたまに長時間かかるタスク
- 財務データや収入分布
- 時々遅れるレスポンスタイム
- バグ修正時間
実践例:出荷遅延の分析
テクニカルサポートのチケット:
- 多くは1~2時間で解決
- 一部は1日かかる
- まれに複雑なものは数日要す
Lognormal分布でこの「たいてい早いがたまに長い」ケースを表せます。
Weibull分布
信頼性工学や障害分析でよく使われる柔軟な分布です。
パラメータ
| パラメータ | 説明 |
|---|---|
| scale | スケールパラメータ(代表的寿命) |
| shape | 形状パラメータ(分布の形状の決定要素) |
形状パラメータの影響
| 形状値 | 分布の挙動 |
|---|---|
| shape below 1 | 故障率が低下(初期故障) |
| shape = 1 | 故障率が一定(指数分布) |
| shape above 1 | 故障率が上昇(摩耗故障) |
利用シーン
- 設備の故障時間シミュレーション
- eventまでの時間分析
- 信頼性モデリング
- 分布形状を柔軟にコントロールしたい場合
ベータ分布
最小値と最大値の間で値を生成し、2 つのパラメータで形状を調整できる柔軟な分布です。この実装は一般化ベータ分布(4 パラメータ)です。
パラメータ
| パラメータ | 説明 |
|---|---|
| min | 取りうる最小値 |
| max | 取りうる最大値 |
| alpha | 第1の形状パラメータ(α > 0) |
| beta | 第2の形状パラメータ(β > 0) |
特徴
- 値は常に min と max の間に収まります
- 形状は α と β により非常に柔軟に変わります
- α = β のとき、[min, max] の中点の周りで対称になります
- α < β のとき、値は min 側に寄ります(左に歪む)
- α > β のとき、値は max 側に寄ります(右に歪む)
- α = β = 1 のとき、[min, max] 上の一様分布になります
- 平均 = min + (max − min) × α / (α + β)
形状パラメータの影響
| パラメータ | 分布の挙動 |
|---|---|
| α = 1, β = 1 | [min, max] 上で一様(フラット) |
| α = β | 中点を中心に対称な山型 |
| α < β | 左に歪む(min 付近に集まる) |
| α > β | 右に歪む(max 付近に集まる) |
| α < 1, β < 1 | U字型(両端に集まる) |
利用シーン
- 範囲が決まっていて、形状も調整したい量
- 既知の範囲のどちらか一方に偏りやすいタスクの所要時間
- 確率や成功率のモデリング(min=0, max=1 を使用)
- 品質スコア、完了率、歩留まり
- 範囲が分かっており、値の偏りに関する知見がある専門家見積もり
実践例:出荷遅延の分析
レビュータスクの所要時間は 2〜15 分で、多くは短めで終わります。この場合は Beta(min=2, max=15, α=2, β=5) を使います。平均は 2 + 13 × 2/7 ≈ 5.7 分で、値は下限側に集まりやすく、2 を下回らず 15 を超えることもありません。
Pearson VI分布
単純なモデルでは表現できない複雑な歪みパターン向けの高度な分布です。
パラメータ
| パラメータ | 説明 |
|---|---|
| alpha1 | 第一の形状パラメータ |
| alpha2 | 第二の形状パラメータ |
| beta | スケールパラメータ |
利用シーン
- データ分析から得られた複雑な分布の適用
- シンプルな分布で合わない場合
- 高度な統計モデリングが必要なとき
適切な分布の選び方
クイックリファレンス:処理時間
| 状況 | 推奨する分布 |
|---|---|
| 平均の周りで対称に変動する | 正規分布 |
| 範囲(min〜max)のみ分かっている | 一様分布 |
| 最も起こりやすい値・最小・最大が分かっている | 三角分布 |
| たいていは速いが、ときどき非常に長い | 対数正規分布 |
| 時間が常に一定(まれ) | 固定値 |
| 比率や確率(0〜1) | ベータ分布 |
クイックリファレンス:到着率
| 状況 | 推奨分布 |
|---|---|
| ランダム・独立で到着 | Poisson |
| 一定間隔で到着 | Fixed |
ベストプラクティス
シンプルに始める
まずはNormal分布やTriangular分布から始めましょう。わかりやすく、パラメータ設定も簡単です。必要な場合のみ複雑な分布を使いましょう。
専門家の知見を活用
専門家の推定は非常に参考になります:
- 「最良の場合?」→ 最小値
- 「一般的な場合?」→ 平均またはモード
- 「最悪の場合?」→ 最大値
データで検証
履歴データがある場合:
- データに合う分布をあてはめる
- シミュレーションと実績を比較
- 分布パラメータを調整する
外れ値の考慮
現実のプロセスでは外れ値が発生することも多いです。LognormalやWeibull分布はNormalやTriangularより外れ値をうまく表現できます。
プロセスの挙動に合わせた選び方
- 対称的なばらつき → 正規分布
- 上下限が決まっている → 三角分布 または 一様分布
- 右に歪む → 対数正規分布
- 比率(0〜1) → ベータ分布
- 複雑なパターン → ワイブル分布 または ピアソンVI分布