Formatos de Datos Soportados para Registros de Eventos
Soporte de Archivos para Carga de Datos
ProcessMind soporta los siguientes formatos de archivo para cargar registros de eventos:
- XLS: Formato Excel heredado, aún soportado por muchos sistemas.
- XLSX: El formato moderno y más usado para hojas de cálculo Excel.
- XLSB: Un formato binario de Excel que ofrece tiempos de carga más rápidos y tamaño de archivo reducido. Recomendamos usar XLSB para un procesamiento más rápido de registros de eventos grandes.
- CSV: Archivo de valores separados por comas, un formato de texto simple y comúnmente usado para almacenar datos tabulares.
- TSV: Archivo de valores separados por tabulaciones, un formato similar a CSV pero usa caracteres de tabulación para separar columnas.
- TXT: Archivo de texto plano, que puede usar varios delimitadores como comas, tabulaciones o puntos y comas para estructurar los datos.
Requisitos Generales de Estructura de Archivos
Para un correcto minado de procesos en ProcessMind, tus archivos cargados —ya sean en formatos de Excel (XLS, XLSX, XLSB) o en formatos basados en texto (CSV, TSV, TXT)— deben seguir ciertas pautas estructurales. Esto asegura que la aplicación pueda interpretar los datos correctamente y realizar análisis precisos.
1. Fila de Encabezado
- El archivo debe comenzar con una fila de encabezado que debe ubicarse en la primera línea (por ejemplo, celda A1 para archivos Excel o línea 1 para archivos CSV, TSV o TXT). El encabezado define los nombres de las columnas y debe indicar claramente el tipo de datos en cada columna (por ejemplo, “Case ID,” “Activity,” “Timestamp”).
- Para formatos CSV, TSV y TXT, los delimitadores y comillas serán detectados automáti camente, facilitando la carga de datos sin necesidad de especificar estas configuraciones manualmente.
2. Conjunto Mínimo de Atributos
Para soportar una estructura de registro de eventos de minería de procesos, tu archivo debe contener, como mínimo, los siguientes atributos (columnas):
- Case ID: Esta columna identifica de manera única cada instancia de proceso (o caso). Cada fila correspondiente a la misma instancia de proceso debe tener el mismo Case ID.
- Activity: Esta columna debe describir la actividad o evento específico que se está registrando (por ejemplo, “Orden Creada,” “Pago Procesado”).
- Timestamp: Cada actividad debe estar asociada a un timestamp que indique la fecha o tiempo exacto en que ocurrió el evento.
- Nota: El formato del timestamp será detectado automáticamente en la medida de lo posible. Formatos comunes como
yyyy-MM-dd HH:mm:ss
,MM/dd/yyyy
, y otros son reconocidos auto máticamente.
- Nota: El formato del timestamp será detectado automáticamente en la medida de lo posible. Formatos comunes como
- Atributos Opcionales: Puedes incluir columnas adicionales para mejorar tu análisis, tales como:
- Resource: Identifica quién realizó la actividad (por ejemplo, usuario, departamento).
- Cost: Cualquier costo asociado con la actividad.
- Otros Datos Personalizados: Puedes incluir campos personalizados que sean relevantes para tu proceso específico, siempre que las columnas requeridas estén presentes.
3. Formato de Datos
- Asegúrate de que tus datos estén formateados de manera consistente en todas las columnas:
- Los timestamps deben estar en un formato estándar y reconocible (por ejemplo,
yyyy-MM-dd HH:mm:ss
), aunque ProcessMind intentará detectar automáticamente el formato de fecha si es diferente. - Evita filas en blanco entre las entradas de datos, ya que esto puede interrumpir el proceso de importación.
- Asegúrate de que los datos numéricos (e.g., costos, duraciones) estén formateados como números en Excel, o correctamente formateados en archivos basados en texto (CSV, TSV, TXT).
- Los timestamps deben estar en un formato estándar y reconocible (por ejemplo,
- Para formatos CSV, TSV y TXT, ProcessMind detectará automáticamente los delimitadores (comas, tabulaciones, punto y coma, etc.) y manejará el texto entre comillas, facilitando la carga de archivos.
4. Selección de Hoja (Solo para Archivos de Excel)
- ProcessMind procesa automáticamente los datos de la primera hoja de tu archivo de Excel (XLS, XLSX o XLSB), independientemente de su nombre. Asegúrate de que los datos requeridos de registro de eventos estén ubicados en la primera hoja, ya que las hojas adicionales no se considerarán durante la importación.
5. Consejos
Consejo de Rendimiento: Usa el Formato XLSB para un Procesamiento Más Rápido
Aunque todos los formatos soportados pueden ser cargados y procesados por ProcessMind, recomendamos encarecidamente usar el formato XLSB para archivos de Excel. El formato XLSB almacena tu archivo de Excel en un formato binario, lo cual ofrece beneficios de rendimiento significativos, especialmente para conjuntos de datos grandes. Esto significa tiempos de carga más rápidos y un procesamiento más ágil en comparación con los formatos XLS o XLSX.