Statistische Verteilungen
Warum Verteilungen nutzen?
In der Praxis zeigen Prozesse immer Schwankungen. Ein Kundentelefonat dauert 5 Minuten, das nächste 25 Minuten. An einem Tag werden 50 Bestellungen bearbeitet, am nächsten 120. Diese natürliche Variabilität ist grundlegend für Geschäftsprozesse.
Feste Werte (wie „jede Aktivität dauert exakt 10 Minuten“) führen zu unrealistischen Simulationen. Verteilungen fangen Variabilität mathematisch ein und ermöglichen Simulationen, die echten Prozessen ähneln.
Einfluss von Variation
Betrachten Sie zwei Szenarien für eine Aufgabe mit durchschnittlich 10 Minuten Laufzeit:
| Szenario | Verteilung | Effekt in der Simulation |
|---|---|---|
| Feste 10 Minuten | Keine Variation | Unrealistische Warteschlangen, vorhersehbare Muster |
| Normal (Mittelwert=10, StdAbw=3) | Realistische Variation | Natürliches Warteschlangenverhalten, realistische Verzögerungen |
Das zweite Szenario bildet die Realität besser ab – manche Tasks sind schnell, andere dauern länger; diese Variation sorgt für Warteschlangeneffekte wie in echten Prozessen.
Verfügbare Verteilungen
ProcessMind stellt acht Verteilungen bereit, um verschiedene Arten von Prozessvariation zu modellieren:
| Distribution | Geeignet für | Schlüssel-Parameter |
|---|---|---|
| Fixed | Feste, unveränderte Werte | value |
| Normal | Symmetrische Streuung um den Mittelwert | mean, stdDev |
| Uniform | Gleiche Wahrscheinlichkeit im Bereich | min, max |
| Triangular | Bereich mit wahrscheinlichstem Wert | min, mode, max |
| Poisson | Zufällige Event-Eingänge | lambda, rateUnit |
| Lognormal | Rechtsschiefe (meist schnelle, manchmal lange Werte) | mean, stdDev |
| Weibull | Zuverlässigkeit, Fehleranalyse | scale, shape |
| Pearson VI | Komplexe, schiefe Verteilungen | alpha1, alpha2, beta |
Fixed Distribution
Die einfachste Verteilung – liefert immer denselben Wert.
Parameter
| Parameter | Beschreibung |
|---|---|
| value | Der konstante Wert |
Eigenschaften
- Keine Variabilität
- Jeder Wert ist exakt der angegebene Wert
- Nützlich zur Modellierung von systemgesteuerten oder automatisierten Schritten
Anwendungsfälle
- Automatisierte Systemreaktionen mit konstanten Zeiten
- Regulierte Timeouts oder Deadlines
- Initiales Setup der Simulation ohne Variation
- Abbildung von SLAs oder vertraglichen Zeitlimits
Beispiel
Eine systemgenerierte E-Mail wird immer genau in 5 Sekunden gesendet.
Normalverteilung (Gaussian)
Die bekannte „Glockenkurve“ – Werte häufen sich symmetrisch um den Mittelwert, mit abnehmender Wahrscheinlichkeit zu den Rändern hin.
Parameter
| Parameter | Beschreibung |
|---|---|
| mean | Durchschnittswert (Kurvenmitte) |
| stdDev | Standardabweichung (Streuung der Werte) |
Eigenschaften
- Symmetrisch um den Mittelwert
- 68% der Werte liegen in 1 Standardabweichung
- 95% innerhalb von 2 Standardabweichungen
- 99,7% innerhalb von 3 Standardabweichungen
- Kann rechnerisch auch negative Werte liefern (Simulation berücksichtigt das)
Anwendungsfälle
- Prozesszeiten, die symmetrisch um einen Mittelwert schwanken
- Messungen mit zufälligen Fehlern
- Werte, die von vielen kleinen, unabhängigen Faktoren beeinflusst werden
Beispiel
Eine Dateneingabe dauert im Mittel 5 Minuten mit einer Standardabweichung von 1 Minute:
- 68% der Aufgaben dauern 4–6 Minuten
- 95% dauern 3–7 Minuten
- Sehr wenige benötigen weniger als 2 oder mehr als 8 Minuten
Uniform Distribution
Alle Werte eines Bereichs sind gleich wahrscheinlich – eine flache Wahrscheinlichkeitsverteilung.
Parameter
| Parameter | Beschreibung |
|---|---|
| min | Minimaler Wert |
| max | Maximaler Wert |
Eigenschaften
- Gleichmäßige Wahrscheinlichkeit: kein Wert ist wahrscheinlicher als ein anderer
- Klare Begrenzung bei min und max
- Mittelwert ist genau (min + max) / 2
Anwendungsfälle
- Wenn nur die Bandbreite bekannt ist, nicht der typische Wert
- Zufällige Auswahl innerhalb eines Bereichs
- Wartezeiten auf geplante Events
- Unsicherheitsmodellierung ohne historische Daten
Beispiel
Eine Freigabe dauert zwischen 2 und 8 Minuten, ohne bekannte typische Werte. Alle Zeiten in diesem Bereich sind gleich wahrscheinlich.
Triangular Distribution
Einfache Verteilung mit Minimum, Maximum und wahrscheinlichstem Wert (mode) – bildet eine Dreiecksform.
Parameter
| Parameter | Beschreibung |
|---|---|
| min | Minimaler Wert |
| mode | Wahrscheinlichster Wert (Spitze des Dreiecks) |
| max | Maximaler Wert |
Eigenschaften
- Werte häufen sich um mode
- Begrenzt durch min und max (keine Ausreißer darüber hinaus)
- Asymmetrisch, wenn mode ≠ (min + max) / 2
- Einfach aus Expertenwissen schätzbar
Anwendungsfälle
- Wenn Sie wissen: “Typischerweise X, aber möglich von Y bis Z”
- Szenarien mit Experteneinschätzung
- Wenn die Normalverteilung unrealistische negative Werte erzeugen könnte
Beispiel
Eine Rechnungsprüfung:
- Best Case (min): 2 Minuten
- Typisch (mode): 5 Minuten
- Worst Case (max): 15 Minuten
Die meisten Prüfungen dauern ca. 5 Minuten, bei komplexen Rechnungen kann es bis 15 Minuten dauern.
Expertenschätzung
Die Triangular-Verteilung passt ideal zu Schätzungen von Experten. Fragen Sie: „Best Case Zeit? Typische Zeit? Worst Case Zeit?“ So erhalten Sie min, mode und max direkt.
Poisson Distribution
Modelliert die Anzahl an Events in einem festen Zeitraum – ideal für Eingangsprozesse.
Parameter
| Parameter | Beschreibung |
|---|---|
| lambda | Durchschnittliche Eventrate |
| rateUnit | Zeiteinheit für die Rate (perHour, perDay, perWeek, perMonth, perYear) |
Eigenschaften
- Diskrete Werte (ganze Zahlen: 0, 1, 2, 3 …)
- Varianz entspricht dem Mittelwert
- Events sind unabhängig
- Modelliert „zufällige Eingänge“ sehr gut
Anwendungsfälle
- Case-Eingänge in einen Prozess
- Kundeneingänge
- Auftragserstellung
- Szenarien mit “events per time period”
Beispiel
Lambda=20, rateUnit=perDay modelliert ca. 20 Fälle pro Tag. An manchen Tagen sind es 15, an anderen 25 – so sieht natürliche Streuung zufälliger Eingänge aus.
Lognormal Distribution
Rechtsschiefe Verteilung, bei der die meisten Werte klein sind, aber gelegentlich hohe Ausreißer vorkommen. Der Logarithmus der Werte folgt einer Normalverteilung.
Parameter
| Parameter | Beschreibung |
|---|---|
| mean | Mittelwert der zugrunde liegenden Normalverteilung |
| stdDev | Standardabweichung der zugrunde liegenden Normalverteilung |
Eigenschaften
- Immer positiv (keine negativen Werte möglich)
- Rechtsschief: langer Ausreißerschwanz zu hohen Werten
- Die meisten Werte liegen am unteren Ende
- Gelegentlich sehr hohe Werte
Anwendungsfälle
- Aufgaben, die meist schnell abgeschlossen werden, aber manchmal viel länger dauern
- Finanzdaten, Einkommensverteilungen
- Antwortzeiten mit gelegentlichen Verzögerungen
- Zeiten zur Fehlerbehebung
Beispiel
Technical Support Tickets:
- Die meisten werden in 1–2 Stunden gelöst
- Manche dauern einen ganzen Tag
- Komplexe Tickets brauchen mehrere Tage
Die Lognormal-Verteilung fängt dieses „meist schnell, manchmal sehr lang“ sehr gut ein.
Weibull Distribution
Flexible Verteilung, häufig genutzt in Zuverlässigkeitstechnik und Fehleranalyse.
Parameter
| Parameter | Beschreibung |
|---|---|
| scale | Skalierungsparameter (charakteristische Lebensdauer) |
| shape | Formparameter (bestimmt Verteilungsform) |
Einfluss des Shape-Parameters
| Shape-Wert | Verhalten der Verteilung |
|---|---|
| shape unter 1 | Abnehmende Ausfallrate (Frühausfall) |
| shape = 1 | Konstante Ausfallrate (Exponentielle Verteilung) |
| shape über 1 | Steigende Ausfallrate (Verschleiß) |
Anwendungsfälle
- Ausfallzeiten von Maschinen
- Time-to-Event-Analysen
- Modellierung von Zuverlässigkeit
- Wenn flexible Steuerung der Verteilungsform gewünscht wird
Pearson VI Distribution
Eine fortgeschrittene Verteilung für komplexe, schiefe Muster, die sich mit einfachen Modellen nicht abbilden lassen.
Parameter
| Parameter | Beschreibung |
|---|---|
| alpha1 | Erster Formparameter |
| alpha2 | Zweiter Formparameter |
| beta | Skalierungsparameter |
Anwendungsfälle
- Komplexe Verteilungen aus Data-Analyse
- Wenn einfache Verteilungen nicht zu den historischen Daten passen
- Für fortgeschrittene Statistik- und Modellierungsszenarien
Die richtige Verteilung auswählen
Schnellübersicht: Bearbeitungszeiten
| Ihre Situation | Empfohlene Verteilung |
|---|---|
| Zeiten streuen symmetrisch um Durchschnitt | Normal |
| Sie kennen nur den Bereich (min bis max) | Uniform |
| Sie kennen typisch, Best Case und Worst Case | Triangular |
| Meistens schnell, manchmal viel länger | Lognormal |
| Zeit ist konstant (selten) | Fixed |
Schnellübersicht: Eingangsraten
| Ihre Situation | Empfohlene Verteilung |
|---|---|
| Zufällige, unabhängige Eingänge | Poisson |
| Feste Eingangsrate | Fixed |
Best Practices
Einfach beginnen
Starten Sie mit Normal- oder Dreiecksverteilungen. Diese sind leicht verständlich und zu parametrisieren und reichen oft aus. Fügen Sie Komplexität nur bei Bedarf hinzu.
Expertenwissen nutzen
Fachleute liefern oft gute Schätzwerte:
- “Best Case?” → Minimum
- ”Typisch?” → Mittelwert oder Modus
- ”Worst Case?” → Maximum
Mit Daten validieren
Wenn Sie historische Daten haben:
- Passen Sie die Verteilungen an Ihre Daten an
- Vergleichen Sie die Simulation mit den tatsächlichen Ergebnissen
- Optimieren Sie die Parameter der Verteilung
Ausreißer beachten
Echte Prozesse haben oft Ausreißer. Lognormal und Weibull bilden solche Werte besser ab als Normal- oder Triangular-Verteilungen.
Passend zum Prozessverhalten
- Symmetrische Streuung → Normal
- Begrenzte Streuung → Triangular oder Uniform
- Rechtsschief → Lognormal
- Komplexe Muster → Weibull oder Pearson VI