¿Qué se necesita para ejecutar Process Mining?

¿Tienes datos crudos? ¡Ese es solo el primer ingrediente! Process Mining adora los datos limpios, así que explora, prepara y sazona tus datos de eventos a la perfección. ¡Es la salsa secreta para crear poderosos insights de procesos!

Qué datos son necesarios para empezar

Imagina que tienes un puesto de limonada, ¡pero tienes una memoria terrible! Para entender qué tan bien está funcionando tu puesto, decides rastrear alguna información básica:

  • ID de Cliente (CaseID): Es como un número que das a cada cliente. Te permite saber que es la misma persona volviendo por más limonada (o quizás quejándose de un lote agrio!).
  • Acción Realizada (Activity): ¡Esto es lo que sucedió! ¿Tomaste el pedido, preparaste limonada, o tal vez resolviste la queja de un cliente molesto (esperemos que no muy seguido!).
  • Hora de la Acción (Timestamp): Este es el momento en que realizaste las acciones. ¡Conocer el orden de tus acciones es crucial!

Con solo estos tres datos, Process Mining puede ser como un pequeño espía en tu puesto. Puede ver el flujo básico de clientes, identificar cualquier cuello de botella (¡quizás eres lento haciendo la limonada!), e incluso decirte si algunos clientes están más gruñones que otros (¡hora de mejorar tu receta!).

Aquí tienes un ejemplo de cómo podrían verse los datos en una tabla:*

ID de Cliente (CaseID)Hora de la Acción (Timestamp)Acción Realizada (Activity)
110:00 AMTomar Pedido
110:02 AMPreparar Limonada
110:05 AMServir al Cliente
210:03 AMTomar Pedido
210:10 AMResolver Queja de Cliente Molesto (¡ay!)
210:12 AMPreparar Limonada
210:15 AMServir al Cliente (¡esperemos más feliz esta vez!)

Esto puede parecer muy poca información, ¡pero es suficiente para que Process Mining comience a hacer preguntas y descubrir algunos insights básicos sobre la eficiencia de tu puesto de limonada!

1. El caso de los registros de limonada desaparecidos

¡Nuestro puesto de limonada fue un gran éxito! A los clientes les encantaba nuestra receta secreta (mayormente) y el negocio estaba en auge. Pero con el éxito vino un nuevo desafío: estábamos ahogados de clientes. Las colas eran largas, los ánimos se encendían, y lo peor de todo, ¡no teníamos idea de por qué!

¿Recuerdas ese pequeño espía que contratamos (Process Mining)? Resulta que no puede hacer milagros. Necesita buena información, y lo único que teníamos eran unos garabatos en una servilleta. Aquí es donde las cosas se complicaron:

  • El Detective de Datos: Nuestro primer problema fue encontrar todos los detalles jugosos. Los pedidos de los clientes estaban esparcidos en notas adhesivas, recibos sueltos e incluso una servilleta arrugada en nuestro bolsillo (¡qué asco!). Era como una historia de detectives, recomponiendo información de todas estas fuentes aleatorias (bases de datos, archivos planos, registros de mensajes, ¡todo!).
  • Hablando el Mismo Idioma: Incluso cuando encontramos los datos, no siempre estaban claros. Algunas notas decían “Cliente Feliz!” mientras que otras solo tenían una cara triste. Necesitábamos un traductor (estandarización de datos) para asegurarnos de que el espía entendiera qué significaba cada garabato.
  • Haciendo las Preguntas Correctas: Finalmente, teníamos que averiguar qué queríamos saber realmente. ¿Las filas eran largas porque la gente tardaba en pedir, o tal vez nos estábamos tardando mucho en hacer la limonada? Hacer las preguntas correctas nos ayudó a enfocar nuestra recopilación de datos (diferentes vistas en los datos).
Registro de limonada

Resulta que limpiar este lío de datos fue una aventura completamente nueva. Pero en el próximo capítulo, verás cómo, con un poco de trabajo de detective y algo de ayuda de nuestro espía amante de los datos, pudimos optimizar nuestro puesto de limonada y convertirnos en la envidia del vecindario!

2: La Gran Excavación de Datos

¡Nuestro puesto de limonada fue un gran éxito, pero las filas eran una pesadilla! Sabíamos que necesitábamos que nuestro espía de datos (Process Mining) nos ayudara, pero primero teníamos que proporcionarle buena información. Eso significaba una inmersión profunda en el mundo de la extracción de datos, básicamente, encontrar todas las pistas ocultas sobre nuestros clientes y convertirlas en algo que nuestro espía pudiera entender.

Esto es lo que descubrimos:

  • Búsqueda del Tesoro: A veces, los datos eran como un tesoro enterrado, escondido en rincones polvorientos de nuestros sistemas (páginas web, correos electrónicos, PDFs). Tuvimos que convertirnos en arqueólogos de datos, desenterrando archivos viejos y usando herramientas sofisticadas (screen scraping) para descubrir la información que necesitábamos.
  • Perdidos en la Traducción: Incluso cuando encontramos los datos, no siempre estaban claros. Algunas pistas estaban garabateadas en servilletas (datos no estructurados) y otros estaban guardados en un código secreto (metadatos faltantes). Necesitábamos un traductor (estandarización de datos) para descifrarlo todo.
  • El Enfoque es Clave: Con tantas fuentes de datos (¡miles de tablas!), era tentador simplemente tomar todo. Pero al igual que no probarías todas las combinaciones de sabores en una heladería, necesitamos enfocarnos en las preguntas que queríamos responder. ¿Los clientes tardaban mucho en pedir, o éramos nosotros el cuello de botella haciendo limonada? Enfocarnos en estas preguntas clave nos ayudó a priorizar qué datos extraer.

No fue fácil, pero con un poco de esfuerzo y una dosis saludable de curiosidad, logramos desenterrar un tesoro de datos. En el próximo capítulo, veremos cómo limpiamos este desorden y finalmente a nuestro espía de datos trabajando para nosotros!

3: La Desintoxicación de Datos

Teníamos una montaña de datos, gracias a nuestros heroicos esfuerzos de extracción (ver Capítulo 3). Pero agárrense los sombreros, porque estos datos eran un revoltijo – algo de información útil de clientes, unos garabatos al azar, y un montón de cosas que simplemente no necesitábamos. ¡Era hora de una desintoxicación de datos!

El filtrado se convirtió en nuestro nuevo mejor amigo. Piensa en ello como ordenar una caja de herramientas desordenada. Comenzamos con lo básico (delimitación de amplio) cuando extraímos los datos. Ahora, era momento de adentrarnos en los detalles (delimitación de fino).

Así abordamos el reto de filtrado:

  • Enfocarse en las Estrellas: Imagina los pedidos de clientes más frecuentes como las nuevas herramientas relucientes en nuestra caja de herramientas. Decidimos enfocarnos en el top 10 actividades más comunes (ordenar, esperar, recibir limonada) para mantener las cosas manejables para nuestro espía de datos. El resto podía esperar en el fondo de la caja (por ahora).
  • La Iteración es Clave: El filtrado no fue algo único. Conforme nuestro espía de datos comenzaba a analizar los datos limpios, nos señalaba nuevas áreas en las que enfocarnos. Era como un detective siguiendo pistas, refinando constantemente nuestro filtro basado en nuevos insights.
Enfoque

Con los datos relucientes y limpios (bueno, mayormente limpios), finalmente era tiempo de desatar el verdadero poder de nuestro espía de datos (Process Mining) en el próximo capítulo! Exploraríamos diferentes técnicas como el descubrimiento, conformidad y mejora para diagnosticar los problemas de nuestro puesto de limonada y convertirnos en la operación de limonada más eficiente de la cuadra!

4: El Cambio de Imagen de Datos

Nuestra desintoxicación de datos (Capítulo 4) hizo maravillas, pero todavía había un paso crucial antes de liberar a nuestro espía de datos (Process Mining) – ¡el cambio de imagen de datos! Imagina un cliente entrando a nuestro puesto con un billete arrugado. No lo rechazaríamos, pero sería mucho más fácil manejarlo si el billete estuviera nítido y limpio. Esa es la idea detrás de la limpieza de datos.

Esto es lo que necesitábamos hacer:

  • Caso Cerrado: Un proceso es como el viaje del cliente: tiene un comienzo, medio y fin. Necesitábamos conectar todos los eventos relacionados con un solo cliente (case) - su pedido, tiempo de espera y finalmente recibir su limonada. Piensa en ello como organizar todos los recibos de una única visita del cliente.
  • Hablando en Proceso: Nuestros datos no siempre hablaban el lenguaje del proceso. Las actividades necesitaban estar definidas claramente como cambios de estado para el viaje de cada cliente (case). Por ejemplo, “Cliente Feliz!” no era lo suficientemente específico. Necesitábamos un estado claro como “Limonada Entregada.”

No fue la parte más glamorosa de la aventura, pero con un poco de manipulación de datos y un pensamiento claro, ¡finalmente tuvimos un conjunto de datos limpio! Con estos datos que nuestro espía de datos transformó, descubrimos los secretos detrás de nuestras largas filas y convertimos nuestro puesto de limonada en un faro burbujeante de eficiencia (¡y delicia)!