Statistische distributies
Waarom distributies gebruiken?
Processen in de praktijk laten altijd variatie zien. Een klantenservicegesprek duurt 5 minuten, een ander duurt 25 minuten. De ene dag zijn er 50 orders, de volgende dag 120. Deze natuurlijke variatie is kenmerkend voor bedrijfsprocessen.
Fixed values (zoals “elke activiteit duurt precies 10 minuten”) geven onrealistische simulaties. Distributies vangen variatie wiskundig, waardoor simulaties realistischer zijn.
Het effect van variatie
Denk aan twee scenario’s voor een taak met gemiddeld 10 minuten doorlooptijd:
| Scenario | Distributie | Effect op simulatie |
|---|---|---|
| Vast 10 min | Geen variatie | Onrealistische wachtrijen, voorspelbare patronen |
| Normal (mean=10, stdDev=3) | Realistische variatie | Natuurlijke wachtrijen, realistische vertragingen |
Het tweede scenario geeft de werkelijkheid beter weer, sommige taken zijn snel, andere duren langer, en die variatie zorgt voor het gedrag dat je ziet in echte processen.
Beschikbare verdelingen
ProcessMind biedt acht verdelingstypen om verschillende vormen van variatie te modelleren:
| Verdeling | Meest geschikt voor | Belangrijkste parameters |
|---|---|---|
| Vast | Constante, onveranderlijke waarden | value |
| Normaal | Symmetrische variatie rond het gemiddelde | mean, stdDev |
| Uniform | Gelijke kans binnen een bereik | min, max |
| Driehoeksverdeling | Bereik met een meest waarschijnlijke waarde | min, mode, max |
| Poisson | Willekeurige aankomsttijden van events | lambda, rateUnit |
| Lognormaal | Rechtsscheef (meestal snel, soms lang) | mean, stdDev |
| Weibull | Betrouwbaarheid en faalanalyse | scale, shape |
| Beta | Flexibele vorm tussen min en max | min, max, alpha, beta |
| Pearson VI | Complexe, scheve patronen | alpha1, alpha2, beta |
Fixed Distributie
De eenvoudigste distributie, geeft altijd dezelfde waarde terug.
Parameters
| Parameter | Omschrijving |
|---|---|
| value | De constante waarde die wordt teruggegeven |
Kenmerken
- Helemaal geen variatie
- Elke meting geeft exact de opgegeven waarde
- Handig voor het modelleren van geautomatiseerde of systeemgestuurde stappen
Wanneer gebruiken
- Geautomatiseerde systeemreacties met vaste timing
- Wettelijke deadlines of time-outs
- Eerste simulatie-setup zonder variatie
- Modelleren van SLAs of contractuele tijdslimieten
Voorbeeld
Een systeem-email wordt altijd precies binnen 5 seconden verstuurd.
Normal (Gaussische) Distributie
De bekende “bell curve”, waarden clusteren symmetrisch rond het gemiddelde, met afnemende kans verder van het midden.
Parameters
| Parameter | Omschrijving |
|---|---|
| mean | Het gemiddelde (het midden van de curve) |
| stdDev | Standaarddeviatie (spreiding van waarden) |
Kenmerken
- Symmetrisch rond het gemiddelde
- 68% van de waarden ligt binnen 1 standaarddeviatie
- 95% ligt binnen 2 standaarddeviaties
- 99,7% valt binnen 3 standaarddeviaties
- Kan theoretisch negatieve waarden opleveren (simulatie verwerkt dit correct)
Wanneer gebruiken
- Procestijden die symmetrisch rond het gemiddelde variëren
- Metingen met random fouten
- Elke grootheid die beïnvloed wordt door veel kleine, onafhankelijke factoren
Voorbeeld
Een data-entrytaak duurt gemiddeld 5 minuten met een standaarddeviatie van 1 minuut:
- 68% van de invoeren duurt 4-6 minuten
- 95% duurt 3-7 minuten
- Heel weinig duren korter dan 2 of langer dan 8 minuten
Uniform Distributie
Elke waarde binnen het bereik is even waarschijnlijk, een vlakke kansverdeling.
Parameters
| Parameter | Omschrijving |
|---|---|
| min | Minimale waarde |
| max | Maximale waarde |
Kenmerken
- Gelijke kans: elke waarde is even waarschijnlijk
- Duidelijke grenzen bij min en max
- Gemiddelde is precies (min + max) / 2
Wanneer gebruiken
- Als je alleen het bereik weet, niet de typische waarde
- Willekeurige keuze uit een bereik
- Wachttijd tot een gepland event
- Onzekerheid modelleren zonder historische data
Voorbeeld
Een goedkeuring duurt ergens tussen 2 en 8 minuten, zonder informatie over wat gebruikelijk is. Elke duur in dit bereik is even waarschijnlijk.
Triangular Distributie
Een eenvoudige distributie met minimum, maximum en meest waarschijnlijke (mode) waarde, geeft een driehoekige vorm.
Parameters
| Parameter | Omschrijving |
|---|---|
| min | Minimale waarde |
| mode | Meest waarschijnlijke waarde (top van de driehoek) |
| max | Maximale waarde |
Kenmerken
- Waarden clusteren rond de mode
- Begrensd door min en max (geen outliers daarbuiten)
- Asymmetrisch als mode ≠ (min + max) / 2
- Makkelijk te schatten op basis van expertkennis
Wanneer gebruiken
- Als je weet: “meestal X, maar het kan variëren van Y tot Z”
- Bij schattingen door experts
- Als Normal negatieve waarden kan geven
Voorbeeld
Een factuurcontrole:
- Best case (min): 2 minuten
- Typisch (mode): 5 minuten
- Worst case (max): 15 minuten
De meeste controles duren rond de 5 minuten, met een uitloper tot 15 voor complexe facturen.
Expert Estimation
De triangular distributie past perfect bij expertinschattingen. Vraag: “Wat is de best case? Typische tijd? Worst case?” Zo krijg je direct min, mode en max.
Poisson Distributie
Modelleert het aantal events in een vaste periode, ideaal voor aankomstprocessen.
Parameters
| Parameter | Omschrijving |
|---|---|
| lambda | Gemiddeld aantal events |
| rateUnit | Tijdsunit voor de rate (perHour, perDay, perWeek, perMonth, perYear) |
Kenmerken
- Discrete waarden (hele getallen: 0, 1, 2, 3…)
- Variantie gelijk aan het gemiddelde
- Events zijn onafhankelijk
- Modelleert “willekeurige aankomsten” goed
Wanneer gebruiken
- Instroom van cases in het proces
- Klanten die binnenkomen
- Aanmaken van orders
- Elk “events per tijdseenheid” scenario
Voorbeeld
Lambda=20, rateUnit=perDay modelleert ong. 20 cases per dag. Soms zijn het er 15, op andere dagen 25, de natuurlijke variatie van willekeurige aankomsten.
Lognormal Distributie
Rechts-scheve distributie waarbij de meeste waarden laag zijn, maar soms grote waarden voorkomen. Het logaritme van de waarden volgt een normale distributie.
Parameters
| Parameter | Omschrijving |
|---|---|
| mean | Gemiddelde van de onderliggende normale distributie |
| stdDev | Standaarddeviatie van de onderliggende normale distributie |
Kenmerken
- Altijd positief (geen negatieve waarden mogelijk)
- Rechts-scheef: lange staart naar hogere waarden
- Meeste waarden clusteren onderaan
- Af en toe zeer grote waarden
Wanneer gebruiken
- Taken die vaak snel klaar zijn, maar soms veel langer duren
- Financiële data, inkomensverdeling
- Responstijden met af en toe vertraging
- Tijd om bugs op te lossen
Voorbeeld
Supporttickets:
- Meestal opgelost binnen 1-2 uur
- Sommige kosten een hele dag
- Zeldzame complexe issues duren enkele dagen
De lognormal distributie vangt dit “meestal snel, soms erg lang” patroon goed.
Weibull Distributie
Een flexibele distributie, vaak gebruikt in reliability engineering en storingsanalyse.
Parameters
| Parameter | Omschrijving |
|---|---|
| scale | Schaalparameter (karakteristieke levensduur) |
| shape | Vormparameter (bepaalt de vorm van de distributie) |
Vormparameter-effecten
| Vormwaarde | Gedrag van de distributie |
|---|---|
| shape onder 1 | Afnemende faalkans (kinderziektes) |
| shape = 1 | Constante faalkans (exponentiële distributie) |
| shape boven 1 | Toenemende faalkans (slijtage) |
Wanneer gebruiken
- Uitvalmomenten van apparatuur
- Time-to-event analyse
- Betrouwbaarheid modelleren
- Als je flexibele controle over de distributievorm wilt
Betaverdeling
Een flexibele verdeling die waarden tussen een minimum en een maximum genereert; de vorm wordt bepaald door twee parameters. Dit is de gegeneraliseerde betaverdeling (4 parameters).
Parameters
| Parameter | Beschrijving |
|---|---|
| min | Minimale mogelijke waarde |
| max | Maximale mogelijke waarde |
| alpha | Eerste vormparameter (α > 0) |
| beta | Tweede vormparameter (β > 0) |
Kenmerken
- Waarden liggen altijd tussen min en max
- Zeer flexibele vorm, afhankelijk van α en β
- Als α = β, is de verdeling symmetrisch rond het midden van [min, max]
- Als α < β, clusteren de waarden richting min (linksscheef)
- Als α > β, clusteren de waarden richting max (rechtsscheef)
- Als α = β = 1, is de verdeling uniform op [min, max]
- Gemiddelde = min + (max − min) × α / (α + β)
Effecten van vormparameters
| Parameters | Gedrag van de verdeling |
|---|---|
| α = 1, β = 1 | Uniform (vlak) over [min, max] |
| α = β | Symmetrische klokvorm rond het midden |
| α < β | Linksscheef (waarden clusteren rond min) |
| α > β | Rechtsscheef (waarden clusteren rond max) |
| α < 1, β < 1 | U-vormig (waarden clusteren aan beide uiteinden) |
Wanneer gebruiken
- Afgebakende grootheden waarbij je het bereik kent en de vorm wilt bepalen
- Taakdoorlooptijden die aan een kant van een bekend bereik clusteren
- Modelleren van kansen of slagingspercentages (gebruik min=0, max=1)
- Kwaliteitsscores, voltooiingspercentages of opbrengstpercentages
- Expertinschattingen met een bekend bereik en een idee van waar de waarden meestal clusteren
Voorbeeld
Een reviewtaak duurt tussen 2 en 15 minuten, waarbij de meeste reviews aan de korte kant uitkomen: gebruik Beta(min=2, max=15, α=2, β=5). Het gemiddelde is ongeveer 2 + 13 × 2/7 ≈ 5,7 minuten; de waarden clusteren aan de onderkant, maar zijn nooit lager dan 2 of hoger dan 15.
Pearson VI Distributie
Een geavanceerde distributie voor complexe scheve patronen die niet passen bij eenvoudige modellen.
Parameters
| Parameter | Omschrijving |
|---|---|
| alpha1 | Eerste vormparameter |
| alpha2 | Tweede vormparameter |
| beta | Schaalparameter |
Wanneer gebruiken
- Complexe distributies op basis van data-analyse
- Als eenvoudige distributies niet bij je historische data passen
- Geavanceerde statistische modellering
De juiste distributie kiezen
Sneloverzicht: procestijden
| Je situatie | Aanbevolen verdeling |
|---|---|
| Tijden variëren symmetrisch rond een gemiddelde | Normaal |
| U kent alleen het bereik (van min tot max) | Uniform |
| U kent het meest waarschijnlijke, beste en slechtste scenario | Driehoeksverdeling |
| Meestal snel, soms veel langer | Lognormaal |
| Tijd is constant (zeldzaam) | Vast |
| Verhoudingen of kansen (0 tot 1) | Beta |
Snel overzicht: Arrival Rates
| Jouw situatie | Aanbevolen distributie |
|---|---|
| Willekeurige, onafhankelijke aankomsten | Poisson |
| Aankomsten op een vast tempo | Fixed |
Best Practices
Begin simpel
Start met Normal of Triangular distributies. Deze zijn makkelijk te begrijpen en in te stellen, en werken meestal prima. Maak het pas complexer als dat nodig is.
Gebruik expertkennis
Business experts kunnen goed inschatten:
- “Best case?” → minimum
- “Typical?” → gemiddelde of modus
- “Worst case?” → maximum
Valideer met data
Als je historische data hebt:
- Pas distributies aan op je data
- Vergelijk simulatie-uitkomst met echte performance
- Stel parameters verder bij
Houd rekening met outliers
Echte processen hebben vaak outliers. Lognormal en Weibull vangen deze beter dan Normal of Triangular.
Koppelen aan procesgedrag
- Symmetrische variatie → Normaal
- Afgebakende variatie → Driehoeksverdeling of Uniform
- Rechtsscheef → Lognormaal
- Proporties (0 tot 1) → Beta
- Complexe patronen → Weibull of Pearson VI