Statistische distributies
Waarom distributies gebruiken?
Processen in de praktijk laten altijd variatie zien. Een klantenservicegesprek duurt 5 minuten, een ander duurt 25 minuten. De ene dag zijn er 50 orders, de volgende dag 120. Deze natuurlijke variatie is kenmerkend voor business processen.
Fixed values (zoals “elke activiteit duurt precies 10 minuten”) geven onrealistische simulaties. Distributies vangen variatie wiskundig, waardoor simulaties realistischer zijn.
Het effect van variatie
Denk aan twee scenario’s voor een taak met gemiddeld 10 minuten doorlooptijd:
| Scenario | Distributie | Effect op simulatie |
|---|---|---|
| Vast 10 min | Geen variatie | Onrealistische wachtrijen, voorspelbare patronen |
| Normal (mean=10, stdDev=3) | Realistische variatie | Natuurlijke wachtrijen, realistische vertragingen |
Het tweede scenario geeft de werkelijkheid beter weer — sommige taken zijn snel, andere duren langer, en die variatie zorgt voor het gedrag dat je ziet in echte processen.
Beschikbare distributies
ProcessMind biedt acht distributietypen om verschillende soorten variatie te modelleren:
| Distributie | Beste toepassing | Belangrijkste parameters |
|---|---|---|
| Fixed | Constante, onveranderlijke waarde | value |
| Normal | Symmetrische variatie rond het gemiddelde | mean, stdDev |
| Uniform | Gelijke kans binnen een bereik | min, max |
| Triangular | Bereik met meest waarschijnlijke waarde | min, mode, max |
| Poisson | Willekeurige event aankomsten | lambda, rateUnit |
| Lognormal | Rechts-scheve verdeling (meestal snel, soms lang) | mean, stdDev |
| Weibull | Betrouwbaarheid en storingsanalyse | scale, shape |
| Pearson VI | Complexe scheve patronen | alpha1, alpha2, beta |
Fixed Distributie
De eenvoudigste distributie—geeft altijd dezelfde waarde terug.
Parameters
| Parameter | Omschrijving |
|---|---|
| value | De constante waarde die wordt teruggegeven |
Kenmerken
- Helemaal geen variatie
- Elke meting geeft exact de opgegeven waarde
- Handig voor het modelleren van geautomatiseerde of systeemgestuurde stappen
Wanneer gebruiken
- Geautomatiseerde systeemreacties met vaste timing
- Wettelijke deadlines of time-outs
- Eerste simulatie-setup zonder variatie
- Modelleren van SLAs of contractuele tijdslimieten
Voorbeeld
Een systeem-email wordt altijd precies binnen 5 seconden verstuurd.
Normal (Gaussische) Distributie
De bekende “bell curve”—waarden clusteren symmetrisch rond het gemiddelde, met afnemende kans verder van het midden.
Parameters
| Parameter | Omschrijving |
|---|---|
| mean | Het gemiddelde (het midden van de curve) |
| stdDev | Standaarddeviatie (spreiding van waarden) |
Kenmerken
- Symmetrisch rond het gemiddelde
- 68% van de waarden ligt binnen 1 standaarddeviatie
- 95% ligt binnen 2 standaarddeviaties
- 99,7% valt binnen 3 standaarddeviaties
- Kan theoretisch negatieve waarden opleveren (simulatie verwerkt dit correct)
Wanneer gebruiken
- Procestijden die symmetrisch rond het gemiddelde variëren
- Metingen met random fouten
- Elke grootheid die beïnvloed wordt door veel kleine, onafhankelijke factoren
Voorbeeld
Een data-entrytaak duurt gemiddeld 5 minuten met een standaarddeviatie van 1 minuut:
- 68% van de invoeren duurt 4-6 minuten
- 95% duurt 3-7 minuten
- Heel weinig duren korter dan 2 of langer dan 8 minuten
Uniform Distributie
Elke waarde binnen het bereik is even waarschijnlijk—een vlakke kansverdeling.
Parameters
| Parameter | Omschrijving |
|---|---|
| min | Minimale waarde |
| max | Maximale waarde |
Kenmerken
- Gelijke kans: elke waarde is even waarschijnlijk
- Duidelijke grenzen bij min en max
- Gemiddelde is precies (min + max) / 2
Wanneer gebruiken
- Als je alleen het bereik weet, niet de typische waarde
- Willekeurige keuze uit een bereik
- Wachttijd tot een gepland event
- Onzekerheid modelleren zonder historische data
Voorbeeld
Een goedkeuring duurt ergens tussen 2 en 8 minuten, zonder informatie over wat gebruikelijk is. Elke duur in dit bereik is even waarschijnlijk.
Triangular Distributie
Een eenvoudige distributie met minimum, maximum en meest waarschijnlijke (mode) waarde—geeft een driehoekige vorm.
Parameters
| Parameter | Omschrijving |
|---|---|
| min | Minimale waarde |
| mode | Meest waarschijnlijke waarde (top van de driehoek) |
| max | Maximale waarde |
Kenmerken
- Waarden clusteren rond de mode
- Begrensd door min en max (geen outliers daarbuiten)
- Asymmetrisch als mode ≠ (min + max) / 2
- Makkelijk te schatten op basis van expertkennis
Wanneer gebruiken
- Als je weet: “meestal X, maar het kan variëren van Y tot Z”
- Bij schattingen door experts
- Als Normal negatieve waarden kan geven
Voorbeeld
Een factuurcontrole:
- Best case (min): 2 minuten
- Typisch (mode): 5 minuten
- Worst case (max): 15 minuten
De meeste controles duren rond de 5 minuten, met een uitloper tot 15 voor complexe facturen.
Expert Estimation
De triangular distributie past perfect bij expertinschattingen. Vraag: “Wat is de best case? Typische tijd? Worst case?” Zo krijg je direct min, mode en max.
Poisson Distributie
Modelleert het aantal events in een vaste periode—ideaal voor aankomstprocessen.
Parameters
| Parameter | Omschrijving |
|---|---|
| lambda | Gemiddeld aantal events |
| rateUnit | Tijdsunit voor de rate (perHour, perDay, perWeek, perMonth, perYear) |
Kenmerken
- Discrete waarden (hele getallen: 0, 1, 2, 3…)
- Variantie gelijk aan het gemiddelde
- Events zijn onafhankelijk
- Modelleert “willekeurige aankomsten” goed
Wanneer gebruiken
- Instroom van cases in het proces
- Klanten die binnenkomen
- Aanmaken van orders
- Elk “events per tijdseenheid” scenario
Voorbeeld
Lambda=20, rateUnit=perDay modelleert ong. 20 cases per dag. Soms zijn het er 15, op andere dagen 25—de natuurlijke variatie van willekeurige aankomsten.
Lognormal Distributie
Rechts-scheve distributie waarbij de meeste waarden laag zijn, maar soms grote waarden voorkomen. Het logaritme van de waarden volgt een normale distributie.
Parameters
| Parameter | Omschrijving |
|---|---|
| mean | Gemiddelde van de onderliggende normale distributie |
| stdDev | Standaarddeviatie van de onderliggende normale distributie |
Kenmerken
- Altijd positief (geen negatieve waarden mogelijk)
- Rechts-scheef: lange staart naar hogere waarden
- Meeste waarden clusteren onderaan
- Af en toe zeer grote waarden
Wanneer gebruiken
- Taken die vaak snel klaar zijn, maar soms veel langer duren
- Financiële data, inkomensverdeling
- Responstijden met af en toe vertraging
- Tijd om bugs op te lossen
Voorbeeld
Supporttickets:
- Meestal opgelost binnen 1-2 uur
- Sommige kosten een hele dag
- Zeldzame complexe issues duren enkele dagen
De lognormal distributie vangt dit “meestal snel, soms erg lang” patroon goed.
Weibull Distributie
Een flexibele distributie, vaak gebruikt in reliability engineering en storingsanalyse.
Parameters
| Parameter | Omschrijving |
|---|---|
| scale | Schaalparameter (karakteristieke levensduur) |
| shape | Vormparameter (bepaalt de vorm van de distributie) |
Vormparameter-effecten
| Vormwaarde | Gedrag van de distributie |
|---|---|
| shape onder 1 | Afnemende faalkans (kinderziektes) |
| shape = 1 | Constante faalkans (exponentiële distributie) |
| shape boven 1 | Toenemende faalkans (slijtage) |
Wanneer gebruiken
- Uitvalmomenten van apparatuur
- Time-to-event analyse
- Betrouwbaarheid modelleren
- Als je flexibele controle over de distributievorm wilt
Pearson VI Distributie
Een geavanceerde distributie voor complexe scheve patronen die niet passen bij eenvoudige modellen.
Parameters
| Parameter | Omschrijving |
|---|---|
| alpha1 | Eerste vormparameter |
| alpha2 | Tweede vormparameter |
| beta | Schaalparameter |
Wanneer gebruiken
- Complexe distributies op basis van data analyse
- Als eenvoudige distributies niet bij je historische data passen
- Geavanceerde statistische modellering
De juiste distributie kiezen
Snel overzicht: Processing Times
| Jouw situatie | Aanbevolen distributie |
|---|---|
| Tijden variëren symmetrisch rond een gemiddelde | Normal |
| Je weet alleen het bereik (min tot max) | Uniform |
| Je weet typisch, best case en worst case | Triangular |
| Meestal snel, soms veel langer | Lognormal |
| Tijd is constant (zeldzaam) | Fixed |
Snel overzicht: Arrival Rates
| Jouw situatie | Aanbevolen distributie |
|---|---|
| Willekeurige, onafhankelijke aankomsten | Poisson |
| Aankomsten op een vast tempo | Fixed |
Best Practices
Begin simpel
Start met Normal of Triangular distributies. Deze zijn makkelijk te begrijpen en in te stellen, en werken meestal prima. Maak het pas complexer als dat nodig is.
Gebruik expertkennis
Business experts kunnen goed inschatten:
- “Best case?” → minimum
- ”Typical?” → gemiddelde of modus
- ”Worst case?” → maximum
Valideer met data
Als je historische data hebt:
- Pas distributies aan op je data
- Vergelijk simulatie-uitkomst met echte performance
- Stel parameters verder bij
Houd rekening met outliers
Echte processen hebben vaak outliers. Lognormal en Weibull vangen deze beter dan Normal of Triangular.
Kiezen op basis van procesgedrag
- Symmetrische variatie → Normal
- Grenzen bekend → Triangular of Uniform
- Rechts-scheef → Lognormal
- Complexe patronen → Weibull of Pearson VI