Distribuzioni Statistiche
Perché Usare le Distribuzioni?
Nel mondo reale, i processi presentano variazioni. Una chiamata al customer service dura 5 minuti, un’altra 25. Un giorno ricevi 50 ordini, il giorno dopo 120. Questa variabilità naturale è una caratteristica fondamentale dei processi aziendali.
I valori fissi (come “ogni attività dura esattamente 10 minuti”) generano simulazioni poco realistiche. Le distribuzioni rappresentano matematicamente la variabilità, creando simulazioni più simili ai processi reali.
L’Impatto della Variazione
Considera due scenari per un’attività con media di 10 minuti:
| Scenario | Distribuzione | Effetto sulla Simulazione |
|---|---|---|
| 10 min fissi | Nessuna variazione | Code irrealistiche, pattern prevedibili |
| Normale (mean=10, stdDev=3) | Variazione realistica | Code naturali, ritardi realistici |
Il secondo scenario rappresenta meglio la realtà: alcune attività sono rapide, altre richiedono più tempo, e questa variazione genera i fenomeni di coda tipici dei processi reali.
Distribuzioni disponibili
ProcessMind offre otto tipi di distribuzione per modellare diversi tipi di variabilità:
| Distribuzione | Ideale per | Parametri principali |
|---|---|---|
| Fissa | Valori costanti | value |
| Normale | Variazione simmetrica attorno alla media | mean, stdDev |
| Uniforme | Probabilità uniforme entro un intervallo | min, max |
| Triangolare | Intervallo con un valore più probabile | min, mode, max |
| Poisson | Arrivi di eventi casuali | lambda, rateUnit |
| Lognormale | Asimmetria a destra (di solito rapidi, a volte molto lunghi) | mean, stdDev |
| Weibull | Affidabilità e analisi dei guasti | scale, shape |
| Beta | Forma flessibile tra min e max | min, max, alpha, beta |
| Pearson VI | Andamenti complessi e asimmetrici | alpha1, alpha2, beta |
Distribuzione Fixed
La distribuzione più semplice: restituisce sempre lo stesso valore.
Parametri
| Parametro | Descrizione |
|---|---|
| value | Valore costante da restituire |
Caratteristiche
- Nessuna variazione
- Ogni campione restituisce esattamente il valore impostato
- Utile per modellare passi controllati dal sistema o automatizzati
Quando Usare
- Risposte automatiche del sistema con tempi costanti
- Scadenze normative o deadline
- Setup iniziale della simulazione prima di aggiungere variazioni
- Modellazione di SLA o limiti temporali contrattuali
Esempio
Una email generata dal sistema viene inviata esattamente dopo 5 secondi.
Distribuzione Normale (Gaussiana)
La classica “curva a campana”: i valori si concentrano simmetricamente intorno alla media, con probabilità ridotta allontanandosi dal centro.
Parametri
| Parametro | Descrizione |
|---|---|
| mean | Valore medio (centro della curva) |
| stdDev | Deviazione standard (dispersione dei valori) |
Caratteristiche
- Simmetrica rispetto alla media
- Il 68% dei valori ricade entro 1 deviazione standard
- Il 95% ricade entro 2 deviazioni standard
- Il 99,7% ricade entro 3 deviazioni standard
- Può produrre valori negativi (gestiti dalla simulazione)
Quando Usare
- Tempi di processo che variano simmetricamente attorno alla media
- Misurazioni con errore casuale
- Qualsiasi quantità influenzata da molti fattori piccoli e indipendenti
Esempio
Una task di data entry dura in media 5 minuti con deviazione standard di 1 minuto:
- Il 68% delle attività richiede 4-6 minuti
- Il 95% richiede 3-7 minuti
- Pochissimi richiedono meno di 2 o più di 8 minuti
Distribuzione Uniform
Ogni valore nell’intervallo ha la stessa probabilità: una distribuzione piatta.
Parametri
| Parametro | Descrizione |
|---|---|
| min | Valore minimo possibile |
| max | Valore massimo possibile |
Caratteristiche
- Probabilità uniforme: nessun valore è più probabile di un altro
- Limiti netti su min e max
- Media esattamente pari a (min + max) / 2
Quando Usare
- Quando conosci solo l’intervallo ma non il valore tipico
- Selezione casuale da un range
- Tempo di attesa di un evento schedulato
- Modellazione dell’incertezza senza dati storici
Esempio
Un’approvazione richiede tra 2 e 8 minuti, senza sapere qual è il valore tipico. Tutte le durate in questo intervallo sono ugualmente probabili.
Distribuzione Triangular
Distribuzione semplice con valori minimo, massimo e più probabile (mode), dalla forma triangolare.
Parametri
| Parametro | Descrizione |
|---|---|
| min | Valore minimo possibile |
| mode | Valore più probabile (apice del triangolo) |
| max | Valore massimo possibile |
Caratteristiche
- I valori si concentrano intorno al mode
- Limitata tra min e max (nessun valore fuori da questi estremi)
- Asimmetrica se mode ≠ (min + max) / 2
- Facilmente stimabile tramite esperienza
Quando Usare
- Quando sai che “tipicamente è X, ma può variare da Y a Z”
- Scenari di stima tramite esperti
- Quando la Normale può produrre valori negativi irrealistici
Esempio
Revisione di una fattura:
- Best case (min): 2 minuti
- Typical (mode): 5 minuti
- Worst case (max): 15 minuti
La maggior parte delle revisioni si concentra su 5 minuti, con una coda fino a 15 per fatture complesse.
Expert Estimation
La distribuzione triangular si adatta bene alle stime degli esperti. Chiedi: “Tempo migliore? Tempo tipico? Tempo peggiore?” e ricavi direttamente min, mode e max.
Distribuzione Poisson
Modella il numero di eventi che si verificano in un intervallo di tempo fisso, perfetta per i processi di arrivo.
Parametri
| Parametro | Descrizione |
|---|---|
| lambda | Tasso medio di eventi |
| rateUnit | Unità di tempo per il tasso (perHour, perDay, perWeek, perMonth, perYear) |
Caratteristiche
- Valori discreti (numeri interi: 0, 1, 2, 3…)
- La varianza è uguale alla media
- Eventi indipendenti
- Modella bene gli “arrivi casuali”
Quando Usare
- Arrivo dei case nel processo
- Arrivo clienti
- Generazione ordini
- Qualsiasi scenario “eventi per periodo di tempo”
Esempio
Lambda=20, rateUnit=perDay modella circa 20 case in arrivo al giorno. Alcuni giorni ne arrivano 15, altri 25: variazione tipica degli arrivi casuali.
Distribuzione Lognormal
Distribuzione asimmetrica verso destra, dove la maggior parte dei valori è bassa, ma a volte si verificano valori elevati. Il logaritmo dei valori segue una distribuzione normale.
Parametri
| Parametro | Descrizione |
|---|---|
| mean | Media della distribuzione normale sottostante |
| stdDev | Deviazione standard della distribuzione normale sottostante |
Caratteristiche
- Sempre positivo (non possono esserci valori negativi)
- Asimmetria verso destra: lunga coda verso valori alti
- La maggior parte dei valori si concentra verso il minimo
- Ogni tanto si verificano valori molto elevati
Quando Usare
- Task che di solito si completano rapidamente ma a volte richiedono molto più tempo
- Financial data, distribuzioni dei redditi
- Tempi di risposta con ritardi occasionali
- Tempi di correzione bug
Esempio
Ticket per il supporto tecnico:
- Quasi tutti si risolvono in 1-2 ore
- Alcuni richiedono una giornata intera
- I casi rari e complessi impiegano più giorni
La lognormal riflette questo comportamento “di solito rapido, a volte molto lungo”.
Distribuzione Weibull
Distribuzione flessibile usata spesso per affidabilità e analisi dei guasti.
Parametri
| Parametro | Descrizione |
|---|---|
| scale | Parametro di scala (vita caratteristica) |
| shape | Parametro di forma (determina la forma della distribuzione) |
Effetti dei parametri di forma
| Valore Shape | Comportamento della Distribuzione |
|---|---|
| shape below 1 | Tasso di guasto decrescente (mortalità infantile) |
| shape = 1 | Tasso di guasto costante (distribuzione esponenziale) |
| shape above 1 | Tasso di guasto crescente (usura) |
Quando Usare
- Tempi di guasto delle attrezzature
- Analisi time-to-event
- Modellazione affidabilità
- Quando serve controllo flessibile sulla forma della distribuzione
Distribuzione Beta
Distribuzione flessibile che genera valori compresi tra un minimo e un massimo, la cui forma è controllata da due parametri. È la versione generalizzata (a 4 parametri) della Beta.
Parametri
| Parametro | Descrizione |
|---|---|
| min | Valore minimo possibile |
| max | Valore massimo possibile |
| alpha | Primo parametro di forma (α > 0) |
| beta | Secondo parametro di forma (β > 0) |
Caratteristiche
- I valori sono sempre compresi tra min e max
- Forma estremamente flessibile in funzione di α e β
- Quando α = β, la distribuzione è simmetrica attorno al punto medio di [min, max]
- Quando α < β, i valori si concentrano verso min (asimmetria a sinistra)
- Quando α > β, i valori si concentrano verso max (asimmetria a destra)
- Quando α = β = 1, diventa una distribuzione uniforme su [min, max]
- Media = min + (max − min) × α / (α + β)
Effetti dei parametri di forma
| Parametri | Comportamento della distribuzione |
|---|---|
| α = 1, β = 1 | Uniforme (piatta) su [min, max] |
| α = β | Campana simmetrica centrata al punto medio |
| α < β | Asimmetria a sinistra (valori vicini a min) |
| α > β | Asimmetria a destra (valori vicini a max) |
| α < 1, β < 1 | A forma di U (valori concentrati a entrambi gli estremi) |
Quando Usare
- Variabili con limiti noti quando desidera controllarne la forma
- Durate di attività che si addensano verso un estremo dell’intervallo
- Modellazione di probabilità o tassi di successo (usi min=0, max=1)
- Punteggi di qualità, percentuali di completamento o tassi di resa
- Stime esperte con intervallo noto e un’idea di dove tendono a concentrarsi i valori
Esempio
Un’attività di revisione richiede tra 2 e 15 minuti; la maggior parte si conclude verso il limite inferiore: usi Beta(min=2, max=15, α=2, β=5). La media è di circa 2 + 13 × 2/7 ≈ 5,7 minuti; i valori si addensano verso l’estremo inferiore ma non scendono sotto 2 né superano 15.
Distribuzione Pearson VI
Distribuzione avanzata per pattern complessi e asimmetrici che non si adattano ai modelli semplici.
Parametri
| Parametro | Descrizione |
|---|---|
| alpha1 | Primo parametro di forma |
| alpha2 | Secondo parametro di forma |
| beta | Parametro di scala |
Quando Usare
- Distribuzioni complesse ricavate da analisi dei dati
- Quando le distribuzioni più semplici non si adattano ai dati storici
- Scenari di modellazione statistica avanzata
Scelta della Distribuzione Giusta
Riferimento rapido: tempi di lavorazione
| La sua situazione | Distribuzione consigliata |
|---|---|
| I tempi variano in modo simmetrico attorno a una media | Normale |
| Conosce solo l’intervallo (min–max) | Uniforme |
| Conosce il tipico, il caso migliore e il caso peggiore | Triangolare |
| Di solito brevi, a volte molto più lunghi | Lognormale |
| Tempo costante (raro) | Fissa |
| Proporzioni o probabilità (0–1) | Beta |
Riferimento Rapido: Tassi di Arrivo
| Scenario | Distribuzione Consigliata |
|---|---|
| Arrivi casuali e indipendenti | Poisson |
| Arrivi a tasso costante | Fixed |
Best Practice
Inizia in modo semplice
Parti dalle distribuzioni Normale o Triangolare. Sono facili da capire e da impostare, e spesso sono più che sufficienti. Aggiungi complessità solo se necessario.
Usa le Competenze degli Esperti
Gli esperti possono fornire ottime stime:
- “Caso migliore?” → minimo
- “Tipico?” → media o moda
- “Caso peggiore?” → massimo
Valida con i Dati
Se hai dati storici:
- Adatta le distribuzioni ai tuoi dati
- Confronta i risultati simulati con le performance reali
- Raffina i parametri della distribuzione
Considera gli Outlier
I processi reali hanno spesso outlier. Le distribuzioni Lognormal e Weibull li rappresentano meglio rispetto a Normal o Triangular.
Scelga in base al comportamento del processo
- Variazione simmetrica → Normale
- Variazione con limiti noti → Triangolare o Uniforme
- Asimmetria a destra → Lognormale
- Proporzioni (0–1) → Beta
- Andamenti complessi → Weibull o Pearson VI