Distribuições Estatísticas
Por Que Usar Distribuições?
No mundo real, os processos variam. Um atendimento ao cliente leva 5 minutos, outro leva 25. Em um dia chegam 50 pedidos, no outro, 120. Essa variação natural é característica dos processos de negócio.
Valores Fixed (como “toda atividade leva exatamente 10 minutos”) geram simulações pouco realistas. As distribuições capturam a variabilidade de forma matemática, gerando simulações que se comportam como processos reais.
O Impacto da Variação
Considere dois cenários para uma tarefa com tempo médio de 10 minutos:
| Cenário | Distribuição | Efeito na Simulação |
|---|---|---|
| Fixo 10 min | Sem variação | Filas irreais, padrões previsíveis |
| Normal (média=10, desvio=3) | Variação realista | Comportamento natural de filas, atrasos reais |
O segundo cenário representa melhor a realidade—algumas tarefas são rápidas, outras levam mais tempo, e essa variação gera efeitos de fila como nos processos reais.
Distribuições Disponíveis
O ProcessMind oferece oito tipos de distribuição para modelar diferentes variações:
| Distribuição | Indicação | Parâmetros Principais |
|---|---|---|
| Fixed | Valores constantes e fixos | value |
| Normal | Variação simétrica em torno da média | mean, stdDev |
| Uniform | Probabilidades iguais dentro de um intervalo | min, max |
| Triangular | Intervalo com valor mais provável | min, mode, max |
| Poisson | Chegadas de eventos aleatórios | lambda, rateUnit |
| Lognormal | Mais rápido na maioria, às vezes longo | mean, stdDev |
| Weibull | Confiabilidade e análise de falhas | scale, shape |
| Pearson VI | Padrões complexos e assimétricos | alpha1, alpha2, beta |
Distribuição Fixed
A distribuição mais simples — sempre retorna o mesmo valor.
Parâmetros
| Parâmetro | Descrição |
|---|---|
| value | Valor constante retornado |
Características
- Sem variação
- Toda amostra retorna exatamente o valor definido
- Útil para modelar etapas automatizadas ou controladas pelo sistema
Quando Usar
- Respostas automáticas do sistema com tempo consistente
- Timeouts regulatórios ou prazos contratuais
- Setup inicial da simulação antes de adicionar variação
- Modelagem de SLAs ou limites contratuais de tempo
Exemplo
Um e-mail gerado pelo sistema sempre é enviado em exatamente 5 segundos.
Distribuição Normal (Gaussiana)
A famosa “curva em sino” — valores se concentram simetricamente em torno da média, com menor probabilidade conforme se afastam do centro.
Parâmetros
| Parâmetro | Descrição |
|---|---|
| mean | Valor médio (centro da curva) |
| stdDev | Desvio padrão (dispersão dos valores) |
Características
- Simétrica em torno da média
- 68% dos valores ficam entre 1 desvio padrão
- 95% dos valores entre 2 desvios padrões
- 99,7% entre 3 desvios padrões
- Pode gerar valores negativos (simulação trata esses casos)
Quando Usar
- Tempos de processamento que variam simetricamente em torno da média
- Medidas com erro aleatório
- Qualquer variável influenciada por vários fatores pequenos e independentes
Exemplo
Uma tarefa de digitação tem média de 5 minutos e desvio padrão de 1 minuto:
- 68% das entradas levam de 4 a 6 minutos
- 95% levam de 3 a 7 minutos
- Poucas levam menos de 2 ou mais de 8 minutos
Distribuição Uniforme
Todos os valores dentro de um intervalo têm a mesma probabilidade — distribuição plana.
Parâmetros
| Parâmetro | Descrição |
|---|---|
| min | Valor mínimo possível |
| max | Valor máximo possível |
Características
- Probabilidade uniforme: todos os valores têm a mesma chance
- Limites definidos em min e max
- Média é exatamente (min + max) / 2
Quando Usar
- Quando só se conhece o intervalo, não o valor típico
- Seleção aleatória em um intervalo
- Tempo de espera até um event agendado
- Modelagem da incerteza sem dados históricos
Exemplo
Uma aprovação demora entre 2 e 8 minutos, sem informação sobre o tempo típico. Todas as durações nesse intervalo têm a mesma probabilidade.
Distribuição Triangular
Distribuição simples com valores mínimo, máximo e mais provável (mode), formando um triângulo.
Parâmetros
| Parâmetro | Descrição |
|---|---|
| min | Valor mínimo possível |
| mode | Valor mais provável (pico do triângulo) |
| max | Valor máximo possível |
Características
- Valores reunidos ao redor do mode
- Limitada por min e max (sem outliers além desses)
- Assimétrica se mode ≠ (min + max) / 2
- Fácil de estimar por conhecimento de especialista
Quando Usar
- Quando sabe “tipicamente X, mas pode variar de Y a Z”
- Cenários de estimativa por especialistas
- Quando a distribuição Normal pode gerar valores negativos irreais
Exemplo
Revisão de fatura:
- Melhor caso (min): 2 minutos
- Típico (mode): 5 minutos
- Pior caso (max): 15 minutos
A maioria das revisões se concentra em 5 minutos, com cauda para 15 minutos em faturas complexas.
Estimativa de Especialista
A distribuição triangular se adapta perfeitamente a estimativas de especialistas. Pergunte: “Tempo no melhor caso? Tempo típico? Tempo no pior caso?” Você terá min, mode e max diretamente.
Distribuição Poisson
Modela a quantidade de eventos em um período fixo de tempo — ideal para processos de chegada.
Parâmetros
| Parâmetro | Descrição |
|---|---|
| lambda | Taxa média de eventos |
| rateUnit | Unidade de tempo da taxa (perHour, perDay, perWeek, perMonth, perYear) |
Características
- Valores discretos (números inteiros: 0, 1, 2, 3…)
- Variância igual à média
- Eventos independentes
- Modela bem “chegadas aleatórias”
Quando Usar
- Chegada de cases no processo
- Chegada de clientes
- Geração de pedidos
- Qualquer cenário de “eventos por período de tempo”
Exemplo
Lambda=20, rateUnit=perDay modela cerca de 20 cases chegando por dia. Alguns dias contam com 15, outros 25 — variação natural de chegadas aleatórias.
Distribuição Lognormal
Distribuição assimétrica, com maioria dos valores pequenos, mas valores grandes podem ocorrer. O logaritmo dos valores segue uma distribuição normal.
Parâmetros
| Parâmetro | Descrição |
|---|---|
| mean | Média da normal subjacente |
| stdDev | Desvio padrão da normal subjacente |
Características
- Sempre positivas (não existem valores negativos)
- Assimétrica: cauda longa para valores altos
- Maioria dos valores próxima do limite inferior
- Alguns valores muito altos ocorrem
Quando Usar
- Tarefas normalmente rápidas, mas que às vezes demoram muito mais
- Dados financeiros, distribuições de renda
- Tempos de resposta com atrasos ocasionais
- Tempos de correção de bugs
Exemplo
Tickets de suporte técnico:
- A maioria é resolvida em 1-2 horas
- Alguns levam o dia inteiro
- Raramente, casos complexos podem levar vários dias
A lognormal representa o padrão “geralmente rápido, às vezes bem demorado”.
Distribuição Weibull
Distribuição flexível, usada em engenharia de confiabilidade e análise de falhas.
Parâmetros
| Parâmetro | Descrição |
|---|---|
| scale | Parâmetro de escala (vida característica) |
| shape | Parâmetro de forma (define o formato da distribuição) |
Efeitos do Parâmetro de Forma
| Valor da Forma | Comportamento da Distribuição |
|---|---|
| shape below 1 | Taxa de falha decrescente (mortalidade infantil) |
| shape = 1 | Taxa de falha constante (distribuição exponencial) |
| shape above 1 | Taxa de falha crescente (desgaste) |
Quando Usar
- Tempos de falha de equipamento
- Análise do tempo até um event
- Modelagem de confiabilidade
- Quando precisa de controle flexível do formato da distribuição
Distribuição Pearson VI
Distribuição avançada para padrões complexos e assimétricos que não se encaixam em modelos mais simples.
Parâmetros
| Parâmetro | Descrição |
|---|---|
| alpha1 | Primeiro parâmetro de forma |
| alpha2 | Segundo parâmetro de forma |
| beta | Parâmetro de escala |
Quando Usar
- Distribuições complexas derivadas da análise de dados
- Quando distribuições simples não refletem seus dados históricos
- Cenários avançados de modelagem estatística
Como Escolher a Distribuição Ideal
Referência Rápida: Tempos de Processamento
| Situação | Distribuição Recomendada |
|---|---|
| Tempos variam de forma simétrica em torno da média | Normal |
| Só se sabe o intervalo (min a max) | Uniform |
| Conhece tempo típico, melhor e pior caso | Triangular |
| Costuma ser rápido, às vezes mais demorado | Lognormal |
| Tempo constante (raro) | Fixed |
Referência Rápida: Taxas de Chegada
| Situação | Distribuição Recomendada |
|---|---|
| Chegadas aleatórias e independentes | Poisson |
| Chegadas em taxa constante | Fixed |
Melhores Práticas
Comece Simples
Comece com distribuições Normal ou Triangular. Elas são fáceis de entender e configurar, e geralmente são suficientes. Só adicione complexidade se precisar.
Use o Conhecimento de Especialistas
Especialistas podem fornecer ótimas estimativas:
- “Melhor caso?” → mínimo
- ”Típico?” → média ou moda
- ”Pior caso?” → máximo
Valide com Dados
Se você tem dados históricos:
- Ajuste as distribuições aos seus dados
- Compare os resultados simulados com o desempenho real
- Refine os parâmetros das distribuições
Considere Outliers
Processos reais costumam ter outliers. As distribuições Lognormal e Weibull capturam melhor esses casos do que Normal ou Triangular.
Relacione ao Comportamento do Processo
- Variação simétrica → Normal
- Variação limitada → Triangular ou Uniforme
- Assimetria à direita → Lognormal
- Padrões complexos → Weibull ou Pearson VI