Distribuciones Estadísticas
¿Por qué usar distribuciones?
En la realidad, los procesos presentan variaciones. Una llamada de atención al cliente puede durar 5 minutos y otra 25 minutos. Un día hay 50 pedidos y al siguiente 120. Esta variabilidad es una característica esencial de los procesos de negocio.
Valores fixed (como “toda actividad dura exactamente 10 minutos”) generan simulaciones poco realistas. Las distribuciones capturan la variabilidad matemáticamente, simulando el comportamiento real de los procesos.
El Impacto de la Variación
Considera dos escenarios para una tarea que en promedio dura 10 minutos:
| Escenario | Distribución | Efecto en la Simulación |
|---|---|---|
| Fijo 10 min | Sin variación | Colas poco realistas, patrones predecibles |
| Normal (media=10, stdDev=3) | Variación realista | Comportamiento de cola natural, retrasos realistas |
El segundo escenario representa mejor la realidad: algunas tareas son rápidas, otras tardan más, y esa variación genera las colas que ves en los procesos reales.
Distribuciones disponibles
ProcessMind ofrece ocho tipos de distribuciones para modelar diferentes tipos de variación:
| Distribución | Mejor para | Parámetros clave |
|---|---|---|
| Fixed | Valores constantes, sin cambios | value |
| Normal | Variación simétrica alrededor del promedio | mean, stdDev |
| Uniform | Probabilidad igual dentro de un rango | min, max |
| Triangular | Rango con un valor más probable | min, mode, max |
| Poisson | Llegadas aleatorias de eventos | lambda, rateUnit |
| Lognormal | Distribución sesgada a la derecha (normalmente rápida, a veces larga) | mean, stdDev |
| Weibull | Análisis de fiabilidad y fallas | scale, shape |
| Pearson VI | Patrones complejos y asimétricos | alpha1, alpha2, beta |
Fixed Distribution
La distribución más simple: siempre devuelve el mismo valor.
Parámetros
| Parámetro | Descripción |
|---|---|
| value | Valor constante a devolver |
Características
- Sin ninguna variación
- Cada muestra devuelve exactamente el valor especificado
- Útil para modelar pasos controlados por el sistema o automatizados
Cuándo Utilizar
- Respuestas automáticas del sistema con tiempos consistentes
- Plazos regulatorios o deadlines
- Configuración inicial de simulación antes de agregar variación
- Modelar SLAs o límites de tiempo contractuales
Ejemplo
Un email generado por el sistema siempre se envía exactamente en 5 segundos.
Normal (Distribución gausiana)
La clásica “curva de campana”: los valores se agrupan de forma simétrica alrededor del promedio y la probabilidad disminuye conforme te alejas del centro.
Parámetros
| Parámetro | Descripción |
|---|---|
| mean | Valor medio (centro de la curva) |
| stdDev | Desviación estándar (dispersión) |
Características
- Simétrica respecto a la media
- El 68% de los valores está dentro de 1 desviación estándar
- 95% dentro de 2 desviaciones estándar
- 99.7% dentro de 3 desviaciones estándar
- Puede producir valores negativos (la simulación lo gestiona)
Cuándo Utilizar
- Tiempos de procesamiento con variación simétrica alrededor de un promedio
- Mediciones con error aleatorio
- Cualquier cantidad influenciada por muchos factores pequeños e independientes
Ejemplo
Una tarea de data entry tarda en promedio 5 minutos, con 1 minuto de desviación estándar:
- El 68% tarda entre 4 y 6 minutos
- El 95% entre 3 y 7 minutos
- Muy pocos menos de 2 o más de 8 minutos
Uniform Distribution
Todos los valores dentro del rango tienen la misma probabilidad, es una distribución plana.
Parámetros
| Parámetro | Descripción |
|---|---|
| min | Valor mínimo posible |
| max | Valor máximo posible |
Características
- Probabilidad uniforme: ningún valor es más probable que otro
- Cortes precisos en los valores min y max
- La media es exactamente (min + max) / 2
Cuándo Utilizar
- Cuando solo conoces el rango, no el valor típico
- Selección aleatoria de un rango
- Tiempo esperando por un event programado
- Modelar incertidumbre cuando no tienes data histórica
Ejemplo
Una aprobación tarda entre 2 y 8 minutos, sin información de cuál es el tiempo típico. Todas las duraciones en ese rango son igual de probables.
Triangular Distribution
Distribución sencilla con valores mínimo, máximo y más probable (mode), que forman una figura triangular.
Parámetros
| Parámetro | Descripción |
|---|---|
| min | Valor mínimo posible |
| mode | Valor más probable (pico) |
| max | Valor máximo posible |
Características
- Los valores se concentran alrededor del mode
- Limitada por los valores min y max (no hay outliers fuera de este rango)
- Es asimétrica si mode ≠ (min + max) / 2
- Fácil de estimar con experiencia experta
Cuándo Utilizar
- Cuando sabes que “lo típico es X, pero puede ir de Y a Z”
- Escenarios de estimación de expertos
- Cuando Normal puede producir valores negativos poco realistas
Ejemplo
Revisión de factura:
- Mejor caso (min): 2 minutos
- Típico (mode): 5 minutos
- Peor caso (max): 15 minutos
La mayoría de revisiones se agrupan cerca de los 5 minutos, aunque las complejas pueden llegar a 15.
Estimación experta
La distribución triangular se adapta perfectamente a las estimaciones de expertos. Pregunta: “¿Cuál es el mejor tiempo posible? ¿El típico? ¿El peor?” Así tendrás min, mode y max de forma directa.
Poisson Distribution
Modela el número de eventos que ocurren en un periodo fijo. Ideal para procesos de llegadas.
Parámetros
| Parámetro | Descripción |
|---|---|
| lambda | Tasa promedio de eventos |
| rateUnit | Unidad de tiempo para la tasa (perHour, perDay, perWeek, perMonth, perYear) |
Características
- Valores discretos (números enteros: 0, 1, 2, 3…)
- La varianza es igual a la media
- Los eventos son independientes
- Ideal para modelar “llegadas aleatorias”
Cuándo Utilizar
- Llegadas de casos al proceso
- Llegadas de clientes
- Generación de pedidos
- Cualquier escenario de “eventos por periodo de tiempo”
Ejemplo
Lambda=20, rateUnit=perDay modela ~20 cases llegando por día. Algunos días pueden ser 15, otros 25: es la variación natural en las llegadas aleatorias.
Lognormal Distribution
Distribución sesgada a la derecha donde la mayoría de los valores son pequeños, pero pueden aparecer valores grandes ocasionalmente. El logaritmo de los valores sigue una distribución normal.
Parámetros
| Parámetro | Descripción |
|---|---|
| mean | Media de la distribución normal subyacente |
| stdDev | Desviación estándar de la distribución normal subyacente |
Características
- Siempre positivos (no admite valores negativos)
- Sesgo a la derecha: cola larga hacia valores altos
- La mayoría de valores se concentran en el extremo bajo
- Ocasionalmente pueden darse valores muy altos
Cuándo Utilizar
- Tareas que normalmente son rápidas pero a veces tardan mucho más
- Data financiera, distribuciones de ingresos
- Tiempos de respuesta con retrasos ocasionales
- Tiempo de resolución de bugs
Ejemplo
Tickets de soporte técnico:
- La mayoría se resuelve en 1-2 horas
- Algunos tardan todo el día
- Problemas raros y complejos tardan varios días
La lognormal modela perfectamente este patrón de “normalmente rápido, a veces muy largo”.
Weibull Distribution
Distribución flexible usada frecuentemente en ingeniería de fiabilidad y análisis de fallas.
Parámetros
| Parámetro | Descripción |
|---|---|
| scale | Parámetro de escala (vida característica) |
| shape | Parámetro de forma (define distribución) |
Efectos del Parámetro Shape
| Valor de Shape | Comportamiento de la Distribución |
|---|---|
| shape por debajo de 1 | Tasa de fallo decreciente (fallos tempranos) |
| shape = 1 | Tasa de fallo constante (distribución exponencial) |
| shape por encima de 1 | Tasa de fallo creciente (desgaste) |
Cuándo Utilizar
- Tiempos de fallo de equipos
- Análisis de time-to-event
- Modelado de fiabilidad
- Cuando necesitas control flexible de la forma de la distribución
Pearson VI Distribution
Distribución avanzada para patrones asimétricos y complejos que no encajan en modelos más simples.
Parámetros
| Parámetro | Descripción |
|---|---|
| alpha1 | Primer parámetro de forma |
| alpha2 | Segundo parámetro de forma |
| beta | Parámetro de escala |
Cuándo Utilizar
- Distribuciones complejas derivadas del análisis de data
- Cuando las distribuciones simples no encajan con tus datos históricos
- Escenarios avanzados de modelado estadístico
Cómo elegir la distribución adecuada
Guía rápida: tiempos de procesamiento
| Tu situación | Distribución recomendada |
|---|---|
| Los tiempos varían simétricamente respecto a una media | Normal |
| Solo conoces el rango (min a max) | Uniform |
| Sabes el caso típico, mejor y peor | Triangular |
| Normalmente rápido, a veces mucho más largo | Lognormal |
| Tiempo constante (raro) | Fixed |
Guía rápida: tasas de llegada
| Tu situación | Distribución recomendada |
|---|---|
| Llegadas aleatorias e independientes | Poisson |
| Llegadas a tasa constante | Fixed |
Mejores prácticas
Empieza Simple
Comienza con distribuciones Normal o Triangular. Son fáciles de entender y parametrizar, y suelen funcionar bien. Agrega complejidad solo si es necesario.
Usa el Conocimiento Experto
Las personas expertas pueden dar estimaciones muy útiles:
- “¿Mejor caso?” → mínimo
- ”¿Típico?” → media o moda
- ”¿Peor caso?” → máximo
Valida con Data Histórica
Si tienes data histórica:
- Ajusta las distribuciones a tus datos
- Compara los resultados simulados con el desempeño real
- Refina los parámetros de la distribución
Considera los outliers
Los procesos reales a menudo tienen outliers. Lognormal y Weibull los capturan mejor que Normal o Triangular.
Relación con comportamiento de proceso
- Variación simétrica → Normal
- Variación acotada → Triangular o Uniform
- Sesgo a la derecha → Lognormal
- Patrones complejos → Weibull o Pearson VI