Distribuzioni Statistiche
Perché Usare le Distribuzioni?
Nel mondo reale, i processi presentano variazioni. Una chiamata al customer service dura 5 minuti, un’altra 25. Un giorno ricevi 50 ordini, il giorno dopo 120. Questa variabilità naturale è una caratteristica fondamentale dei processi aziendali.
I valori fissi (come “ogni attività dura esattamente 10 minuti”) generano simulazioni poco realistiche. Le distribuzioni rappresentano matematicamente la variabilità, creando simulazioni più simili ai processi reali.
L’Impatto della Variazione
Considera due scenari per un’attività con media di 10 minuti:
| Scenario | Distribuzione | Effetto sulla Simulazione |
|---|---|---|
| 10 min fissi | Nessuna variazione | Code irrealistiche, pattern prevedibili |
| Normale (mean=10, stdDev=3) | Variazione realistica | Code naturali, ritardi realistici |
Il secondo scenario rappresenta meglio la realtà: alcune attività sono rapide, altre richiedono più tempo, e questa variazione genera i fenomeni di coda tipici dei processi reali.
Distribuzioni Disponibili
ProcessMind offre otto tipi di distribuzioni per modellare diversi tipi di variazione:
| Distribuzione | Migliore Utilizzo | Parametri Chiave |
|---|---|---|
| Fixed | Valori costanti e invariabili | value |
| Normal | Variazione simmetrica intorno alla media | mean, stdDev |
| Uniform | Uguale probabilità nell’intervallo | min, max |
| Triangular | Intervallo con valore più probabile | min, mode, max |
| Poisson | Arrivo di eventi casuali | lambda, rateUnit |
| Lognormal | Asimmetria verso destra (generalmente veloce, a volte lunga) | mean, stdDev |
| Weibull | Affidabilità e analisi dei guasti | scale, shape |
| Pearson VI | Pattern complessi e asimmetrici | alpha1, alpha2, beta |
Distribuzione Fixed
La distribuzione più semplice: restituisce sempre lo stesso valore.
Parametri
| Parametro | Descrizione |
|---|---|
| value | Valore costante da restituire |
Caratteristiche
- Nessuna variazione
- Ogni campione restituisce esattamente il valore impostato
- Utile per modellare passi controllati dal sistema o automatizzati
Quando Usare
- Risposte automatiche del sistema con tempi costanti
- Scadenze normative o deadline
- Setup iniziale della simulazione prima di aggiungere variazioni
- Modellazione di SLA o limiti temporali contrattuali
Esempio
Una email generata dal sistema viene inviata esattamente dopo 5 secondi.
Distribuzione Normale (Gaussiana)
La classica “curva a campana”: i valori si concentrano simmetricamente intorno alla media, con probabilità ridotta allontanandosi dal centro.
Parametri
| Parametro | Descrizione |
|---|---|
| mean | Valore medio (centro della curva) |
| stdDev | Deviazione standard (dispersione dei valori) |
Caratteristiche
- Simmetrica rispetto alla media
- Il 68% dei valori ricade entro 1 deviazione standard
- Il 95% ricade entro 2 deviazioni standard
- Il 99,7% ricade entro 3 deviazioni standard
- Può produrre valori negativi (gestiti dalla simulazione)
Quando Usare
- Tempi di processo che variano simmetricamente attorno alla media
- Misurazioni con errore casuale
- Qualsiasi quantità influenzata da molti fattori piccoli e indipendenti
Esempio
Una task di data entry dura in media 5 minuti con deviazione standard di 1 minuto:
- Il 68% delle attività richiede 4-6 minuti
- Il 95% richiede 3-7 minuti
- Pochissimi richiedono meno di 2 o più di 8 minuti
Distribuzione Uniform
Ogni valore nell’intervallo ha la stessa probabilità: una distribuzione piatta.
Parametri
| Parametro | Descrizione |
|---|---|
| min | Valore minimo possibile |
| max | Valore massimo possibile |
Caratteristiche
- Probabilità uniforme: nessun valore è più probabile di un altro
- Limiti netti su min e max
- Media esattamente pari a (min + max) / 2
Quando Usare
- Quando conosci solo l’intervallo ma non il valore tipico
- Selezione casuale da un range
- Tempo di attesa di un evento schedulato
- Modellazione dell’incertezza senza dati storici
Esempio
Un’approvazione richiede tra 2 e 8 minuti, senza sapere qual è il valore tipico. Tutte le durate in questo intervallo sono ugualmente probabili.
Distribuzione Triangular
Distribuzione semplice con valori minimo, massimo e più probabile (mode), dalla forma triangolare.
Parametri
| Parametro | Descrizione |
|---|---|
| min | Valore minimo possibile |
| mode | Valore più probabile (apice del triangolo) |
| max | Valore massimo possibile |
Caratteristiche
- I valori si concentrano intorno al mode
- Limitata tra min e max (nessun valore fuori da questi estremi)
- Asimmetrica se mode ≠ (min + max) / 2
- Facilmente stimabile tramite esperienza
Quando Usare
- Quando sai che “tipicamente è X, ma può variare da Y a Z”
- Scenari di stima tramite esperti
- Quando la Normale può produrre valori negativi irrealistici
Esempio
Revisione di una fattura:
- Best case (min): 2 minuti
- Typical (mode): 5 minuti
- Worst case (max): 15 minuti
La maggior parte delle revisioni si concentra su 5 minuti, con una coda fino a 15 per fatture complesse.
Expert Estimation
La distribuzione triangular si adatta bene alle stime degli esperti. Chiedi: “Tempo migliore? Tempo tipico? Tempo peggiore?” e ricavi direttamente min, mode e max.
Distribuzione Poisson
Modella il numero di eventi che si verificano in un intervallo di tempo fisso, perfetta per i processi di arrivo.
Parametri
| Parametro | Descrizione |
|---|---|
| lambda | Tasso medio di eventi |
| rateUnit | Unità di tempo per il tasso (perHour, perDay, perWeek, perMonth, perYear) |
Caratteristiche
- Valori discreti (numeri interi: 0, 1, 2, 3…)
- La varianza è uguale alla media
- Eventi indipendenti
- Modella bene gli “arrivi casuali”
Quando Usare
- Arrivo dei case nel processo
- Arrivo clienti
- Generazione ordini
- Qualsiasi scenario “eventi per periodo di tempo”
Esempio
Lambda=20, rateUnit=perDay modella circa 20 case in arrivo al giorno. Alcuni giorni ne arrivano 15, altri 25: variazione tipica degli arrivi casuali.
Distribuzione Lognormal
Distribuzione asimmetrica verso destra, dove la maggior parte dei valori è bassa, ma a volte si verificano valori elevati. Il logaritmo dei valori segue una distribuzione normale.
Parametri
| Parametro | Descrizione |
|---|---|
| mean | Media della distribuzione normale sottostante |
| stdDev | Deviazione standard della distribuzione normale sottostante |
Caratteristiche
- Sempre positivo (non possono esserci valori negativi)
- Asimmetria verso destra: lunga coda verso valori alti
- La maggior parte dei valori si concentra verso il minimo
- Ogni tanto si verificano valori molto elevati
Quando Usare
- Task che di solito si completano rapidamente ma a volte richiedono molto più tempo
- Financial data, distribuzioni dei redditi
- Tempi di risposta con ritardi occasionali
- Tempi di correzione bug
Esempio
Ticket per il supporto tecnico:
- Quasi tutti si risolvono in 1-2 ore
- Alcuni richiedono una giornata intera
- I casi rari e complessi impiegano più giorni
La lognormal riflette questo comportamento “di solito rapido, a volte molto lungo”.
Distribuzione Weibull
Distribuzione flessibile usata spesso per affidabilità e analisi dei guasti.
Parametri
| Parametro | Descrizione |
|---|---|
| scale | Parametro di scala (vita caratteristica) |
| shape | Parametro di forma (determina la forma della distribuzione) |
Effetto del Parametro Shape
| Valore Shape | Comportamento della Distribuzione |
|---|---|
| shape below 1 | Tasso di guasto decrescente (mortalità infantile) |
| shape = 1 | Tasso di guasto costante (distribuzione esponenziale) |
| shape above 1 | Tasso di guasto crescente (usura) |
Quando Usare
- Tempi di guasto delle attrezzature
- Analisi time-to-event
- Modellazione affidabilità
- Quando serve controllo flessibile sulla forma della distribuzione
Distribuzione Pearson VI
Distribuzione avanzata per pattern complessi e asimmetrici che non si adattano ai modelli semplici.
Parametri
| Parametro | Descrizione |
|---|---|
| alpha1 | Primo parametro di forma |
| alpha2 | Secondo parametro di forma |
| beta | Parametro di scala |
Quando Usare
- Distribuzioni complesse ricavate da analisi dei dati
- Quando le distribuzioni più semplici non si adattano ai dati storici
- Scenari di modellazione statistica avanzata
Scelta della Distribuzione Giusta
Riferimento Rapido: Tempi di Lavorazione
| Scenario | Distribuzione Consigliata |
|---|---|
| Tempi che variano simmetricamente sulla media | Normal |
| Conosci solo l’intervallo (min-max) | Uniform |
| Conosci tipico, migliore e peggiore dei casi | Triangular |
| Di solito veloce, a volte molto lungo | Lognormal |
| Tempo costante (raro) | Fixed |
Riferimento Rapido: Tassi di Arrivo
| Scenario | Distribuzione Consigliata |
|---|---|
| Arrivi casuali e indipendenti | Poisson |
| Arrivi a tasso costante | Fixed |
Best Practice
Inizia in modo semplice
Parti dalle distribuzioni Normale o Triangolare. Sono facili da capire e da impostare, e spesso sono più che sufficienti. Aggiungi complessità solo se necessario.
Usa le Competenze degli Esperti
Gli esperti possono fornire ottime stime:
- “Caso migliore?” → minimo
- ”Tipico?” → media o moda
- ”Caso peggiore?” → massimo
Valida con i Dati
Se hai dati storici:
- Adatta le distribuzioni ai tuoi dati
- Confronta i risultati simulati con le performance reali
- Raffina i parametri della distribuzione
Considera gli Outlier
I processi reali hanno spesso outlier. Le distribuzioni Lognormal e Weibull li rappresentano meglio rispetto a Normal o Triangular.
Collega al Comportamento del Processo
- Variazione simmetrica → Normal
- Variazione limitata → Triangular o Uniform
- Asimmetria verso destra → Lognormal
- Pattern complessi → Weibull o Pearson VI