Op deze pagina

Statistische distributies

Waarom distributies gebruiken?

Processen in de praktijk laten altijd variatie zien. Een klantenservicegesprek duurt 5 minuten, een ander duurt 25 minuten. De ene dag zijn er 50 orders, de volgende dag 120. Deze natuurlijke variatie is kenmerkend voor bedrijfsprocessen.

Fixed values (zoals “elke activiteit duurt precies 10 minuten”) geven onrealistische simulaties. Distributies vangen variatie wiskundig, waardoor simulaties realistischer zijn.

Het effect van variatie

Denk aan twee scenario’s voor een taak met gemiddeld 10 minuten doorlooptijd:

ScenarioDistributieEffect op simulatie
Vast 10 minGeen variatieOnrealistische wachtrijen, voorspelbare patronen
Normal (mean=10, stdDev=3)Realistische variatieNatuurlijke wachtrijen, realistische vertragingen

Het tweede scenario geeft de werkelijkheid beter weer, sommige taken zijn snel, andere duren langer, en die variatie zorgt voor het gedrag dat je ziet in echte processen.


Beschikbare verdelingen

ProcessMind biedt acht verdelingstypen om verschillende vormen van variatie te modelleren:

VerdelingMeest geschikt voorBelangrijkste parameters
VastConstante, onveranderlijke waardenvalue
NormaalSymmetrische variatie rond het gemiddeldemean, stdDev
UniformGelijke kans binnen een bereikmin, max
DriehoeksverdelingBereik met een meest waarschijnlijke waardemin, mode, max
PoissonWillekeurige aankomsttijden van eventslambda, rateUnit
LognormaalRechtsscheef (meestal snel, soms lang)mean, stdDev
WeibullBetrouwbaarheid en faalanalysescale, shape
BetaFlexibele vorm tussen min en maxmin, max, alpha, beta
Pearson VIComplexe, scheve patronenalpha1, alpha2, beta

Fixed Distributie

De eenvoudigste distributie, geeft altijd dezelfde waarde terug.

Parameters

ParameterOmschrijving
valueDe constante waarde die wordt teruggegeven

Kenmerken

  • Helemaal geen variatie
  • Elke meting geeft exact de opgegeven waarde
  • Handig voor het modelleren van geautomatiseerde of systeemgestuurde stappen

Wanneer gebruiken

  • Geautomatiseerde systeemreacties met vaste timing
  • Wettelijke deadlines of time-outs
  • Eerste simulatie-setup zonder variatie
  • Modelleren van SLAs of contractuele tijdslimieten

Voorbeeld

Een systeem-email wordt altijd precies binnen 5 seconden verstuurd.


Normal (Gaussische) Distributie

De bekende “bell curve”, waarden clusteren symmetrisch rond het gemiddelde, met afnemende kans verder van het midden.

Parameters

ParameterOmschrijving
meanHet gemiddelde (het midden van de curve)
stdDevStandaarddeviatie (spreiding van waarden)

Kenmerken

  • Symmetrisch rond het gemiddelde
  • 68% van de waarden ligt binnen 1 standaarddeviatie
  • 95% ligt binnen 2 standaarddeviaties
  • 99,7% valt binnen 3 standaarddeviaties
  • Kan theoretisch negatieve waarden opleveren (simulatie verwerkt dit correct)

Wanneer gebruiken

  • Procestijden die symmetrisch rond het gemiddelde variëren
  • Metingen met random fouten
  • Elke grootheid die beïnvloed wordt door veel kleine, onafhankelijke factoren

Voorbeeld

Een data-entrytaak duurt gemiddeld 5 minuten met een standaarddeviatie van 1 minuut:

  • 68% van de invoeren duurt 4-6 minuten
  • 95% duurt 3-7 minuten
  • Heel weinig duren korter dan 2 of langer dan 8 minuten

Uniform Distributie

Elke waarde binnen het bereik is even waarschijnlijk, een vlakke kansverdeling.

Parameters

ParameterOmschrijving
minMinimale waarde
maxMaximale waarde

Kenmerken

  • Gelijke kans: elke waarde is even waarschijnlijk
  • Duidelijke grenzen bij min en max
  • Gemiddelde is precies (min + max) / 2

Wanneer gebruiken

  • Als je alleen het bereik weet, niet de typische waarde
  • Willekeurige keuze uit een bereik
  • Wachttijd tot een gepland event
  • Onzekerheid modelleren zonder historische data

Voorbeeld

Een goedkeuring duurt ergens tussen 2 en 8 minuten, zonder informatie over wat gebruikelijk is. Elke duur in dit bereik is even waarschijnlijk.


Triangular Distributie

Een eenvoudige distributie met minimum, maximum en meest waarschijnlijke (mode) waarde, geeft een driehoekige vorm.

Parameters

ParameterOmschrijving
minMinimale waarde
modeMeest waarschijnlijke waarde (top van de driehoek)
maxMaximale waarde

Kenmerken

  • Waarden clusteren rond de mode
  • Begrensd door min en max (geen outliers daarbuiten)
  • Asymmetrisch als mode ≠ (min + max) / 2
  • Makkelijk te schatten op basis van expertkennis

Wanneer gebruiken

  • Als je weet: “meestal X, maar het kan variëren van Y tot Z”
  • Bij schattingen door experts
  • Als Normal negatieve waarden kan geven

Voorbeeld

Een factuurcontrole:

  • Best case (min): 2 minuten
  • Typisch (mode): 5 minuten
  • Worst case (max): 15 minuten

De meeste controles duren rond de 5 minuten, met een uitloper tot 15 voor complexe facturen.

Expert Estimation

De triangular distributie past perfect bij expertinschattingen. Vraag: “Wat is de best case? Typische tijd? Worst case?” Zo krijg je direct min, mode en max.


Poisson Distributie

Modelleert het aantal events in een vaste periode, ideaal voor aankomstprocessen.

Parameters

ParameterOmschrijving
lambdaGemiddeld aantal events
rateUnitTijdsunit voor de rate (perHour, perDay, perWeek, perMonth, perYear)

Kenmerken

  • Discrete waarden (hele getallen: 0, 1, 2, 3…)
  • Variantie gelijk aan het gemiddelde
  • Events zijn onafhankelijk
  • Modelleert “willekeurige aankomsten” goed

Wanneer gebruiken

  • Instroom van cases in het proces
  • Klanten die binnenkomen
  • Aanmaken van orders
  • Elk “events per tijdseenheid” scenario

Voorbeeld

Lambda=20, rateUnit=perDay modelleert ong. 20 cases per dag. Soms zijn het er 15, op andere dagen 25, de natuurlijke variatie van willekeurige aankomsten.


Lognormal Distributie

Rechts-scheve distributie waarbij de meeste waarden laag zijn, maar soms grote waarden voorkomen. Het logaritme van de waarden volgt een normale distributie.

Parameters

ParameterOmschrijving
meanGemiddelde van de onderliggende normale distributie
stdDevStandaarddeviatie van de onderliggende normale distributie

Kenmerken

  • Altijd positief (geen negatieve waarden mogelijk)
  • Rechts-scheef: lange staart naar hogere waarden
  • Meeste waarden clusteren onderaan
  • Af en toe zeer grote waarden

Wanneer gebruiken

  • Taken die vaak snel klaar zijn, maar soms veel langer duren
  • Financiële data, inkomensverdeling
  • Responstijden met af en toe vertraging
  • Tijd om bugs op te lossen

Voorbeeld

Supporttickets:

  • Meestal opgelost binnen 1-2 uur
  • Sommige kosten een hele dag
  • Zeldzame complexe issues duren enkele dagen

De lognormal distributie vangt dit “meestal snel, soms erg lang” patroon goed.


Weibull Distributie

Een flexibele distributie, vaak gebruikt in reliability engineering en storingsanalyse.

Parameters

ParameterOmschrijving
scaleSchaalparameter (karakteristieke levensduur)
shapeVormparameter (bepaalt de vorm van de distributie)

Vormparameter-effecten

VormwaardeGedrag van de distributie
shape onder 1Afnemende faalkans (kinderziektes)
shape = 1Constante faalkans (exponentiële distributie)
shape boven 1Toenemende faalkans (slijtage)

Wanneer gebruiken

  • Uitvalmomenten van apparatuur
  • Time-to-event analyse
  • Betrouwbaarheid modelleren
  • Als je flexibele controle over de distributievorm wilt

Betaverdeling

Een flexibele verdeling die waarden tussen een minimum en een maximum genereert; de vorm wordt bepaald door twee parameters. Dit is de gegeneraliseerde betaverdeling (4 parameters).

Parameters

ParameterBeschrijving
minMinimale mogelijke waarde
maxMaximale mogelijke waarde
alphaEerste vormparameter (α > 0)
betaTweede vormparameter (β > 0)

Kenmerken

  • Waarden liggen altijd tussen min en max
  • Zeer flexibele vorm, afhankelijk van α en β
  • Als α = β, is de verdeling symmetrisch rond het midden van [min, max]
  • Als α < β, clusteren de waarden richting min (linksscheef)
  • Als α > β, clusteren de waarden richting max (rechtsscheef)
  • Als α = β = 1, is de verdeling uniform op [min, max]
  • Gemiddelde = min + (max − min) × α / (α + β)

Effecten van vormparameters

ParametersGedrag van de verdeling
α = 1, β = 1Uniform (vlak) over [min, max]
α = βSymmetrische klokvorm rond het midden
α < βLinksscheef (waarden clusteren rond min)
α > βRechtsscheef (waarden clusteren rond max)
α < 1, β < 1U-vormig (waarden clusteren aan beide uiteinden)

Wanneer gebruiken

  • Afgebakende grootheden waarbij je het bereik kent en de vorm wilt bepalen
  • Taakdoorlooptijden die aan een kant van een bekend bereik clusteren
  • Modelleren van kansen of slagingspercentages (gebruik min=0, max=1)
  • Kwaliteitsscores, voltooiingspercentages of opbrengstpercentages
  • Expertinschattingen met een bekend bereik en een idee van waar de waarden meestal clusteren

Voorbeeld

Een reviewtaak duurt tussen 2 en 15 minuten, waarbij de meeste reviews aan de korte kant uitkomen: gebruik Beta(min=2, max=15, α=2, β=5). Het gemiddelde is ongeveer 2 + 13 × 2/7 ≈ 5,7 minuten; de waarden clusteren aan de onderkant, maar zijn nooit lager dan 2 of hoger dan 15.


Pearson VI Distributie

Een geavanceerde distributie voor complexe scheve patronen die niet passen bij eenvoudige modellen.

Parameters

ParameterOmschrijving
alpha1Eerste vormparameter
alpha2Tweede vormparameter
betaSchaalparameter

Wanneer gebruiken

  • Complexe distributies op basis van data-analyse
  • Als eenvoudige distributies niet bij je historische data passen
  • Geavanceerde statistische modellering

De juiste distributie kiezen

Sneloverzicht: procestijden

Je situatieAanbevolen verdeling
Tijden variëren symmetrisch rond een gemiddeldeNormaal
U kent alleen het bereik (van min tot max)Uniform
U kent het meest waarschijnlijke, beste en slechtste scenarioDriehoeksverdeling
Meestal snel, soms veel langerLognormaal
Tijd is constant (zeldzaam)Vast
Verhoudingen of kansen (0 tot 1)Beta

Snel overzicht: Arrival Rates

Jouw situatieAanbevolen distributie
Willekeurige, onafhankelijke aankomstenPoisson
Aankomsten op een vast tempoFixed

Best Practices

Begin simpel

Start met Normal of Triangular distributies. Deze zijn makkelijk te begrijpen en in te stellen, en werken meestal prima. Maak het pas complexer als dat nodig is.

Gebruik expertkennis

Business experts kunnen goed inschatten:

  • “Best case?” → minimum
  • “Typical?” → gemiddelde of modus
  • “Worst case?” → maximum

Valideer met data

Als je historische data hebt:

  1. Pas distributies aan op je data
  2. Vergelijk simulatie-uitkomst met echte performance
  3. Stel parameters verder bij

Houd rekening met outliers

Echte processen hebben vaak outliers. Lognormal en Weibull vangen deze beter dan Normal of Triangular.

Koppelen aan procesgedrag

  • Symmetrische variatie → Normaal
  • Afgebakende variatie → Driehoeksverdeling of Uniform
  • Rechtsscheef → Lognormaal
  • Proporties (0 tot 1) → Beta
  • Complexe patronen → Weibull of Pearson VI

Volgende stappen

How It Works
Ontdek hoe de simulatie-engine distributies gebruikt.