Informe de Resultados y Discusión

1. Resumen del Proyecto

El objetivo de este proyecto fue desarrollar un modelo de Machine Learning capaz de clasificar automáticamente la prioridad (Alta, Media, Baja) de los tickets de una mesa de ayuda. Se siguió un flujo de trabajo completo, desde la recolección y análisis de datos hasta el entrenamiento, evaluación y despliegue de un modelo funcional en una interfaz de usuario interactiva utilizando Streamlit.

El proyecto culminó con éxito, obteniendo un modelo de Regresión Logística que fue seleccionado por su rendimiento superior y desplegado en dos aplicaciones web funcionales.

2. Análisis Exploratorio de Datos (EDA) - Hallazgos Clave

El análisis inicial se realizó sobre un dataset consolidado de 1109 registros. Los hallazgos más importantes que guiaron el preprocesamiento y modelado fueron:

Visualizaciones Generadas

A continuación, se muestran los gráficos generados por el script 00_EDA.py:

Distribución de Prioridad Tiempo de Resolución vs Prioridad Distribución por Área Solicitante

3. Modelamiento y Evaluación

Comparación de Modelos

Se entrenaron y evaluaron tres modelos de clasificación distintos utilizando las características categóricas (Area_Solicitante, Grupo_Asignado, Categoria). A continuación se presenta la tabla comparativa de sus métricas de rendimiento en el conjunto de prueba:

Modelo Accuracy F1-score (Macro Avg) Precisión (Clase 'Alta') Recall (Clase 'Alta')
Regresión Logística 0.8159 0.7690 0.6207 0.7500
Random Forest 0.7545 0.6909 0.5222 0.6528
Gradient Boosting 0.7545 0.6909 0.5222 0.6528

Selección del Modelo

El modelo de Regresión Logística fue seleccionado como el modelo final. La justificación se basa en que obtuvo el mayor F1-score promedio (macro avg) de 0.7690, indicando el mejor balance entre precisión y recall a través de todas las clases, lo cual es fundamental para un dataset desbalanceado. Además, mostró el mejor rendimiento general en todas las métricas clave.

4. Resultados del Despliegue

El modelo seleccionado fue desplegado en dos aplicaciones web interactivas construidas con Streamlit.

Aplicación 1: Predictor de Tickets Individuales

Esta herramienta permite a un usuario ingresar las características de un nuevo ticket (Categoría, Grupo Asignado, Área Solicitante) y recibir una predicción de prioridad en tiempo real, junto con las probabilidades asociadas a cada clase.

Ejemplo de Predicción 1 Ejemplo de Predicción 2

Aplicación 2: Dashboard de Tickets por Grupo y Área

Esta aplicación ofrece una vista agregada, procesando todos los tickets del dataset para mostrar un resumen de las prioridades predichas por cada combinación de `Grupo_Asignado` y `Area_Solicitante`. La celda con la mayor cantidad de tickets por fila se resalta en verde para una fácil identificación de patrones.

Dashboard de Tickets

5. Discusión, Limitaciones y Futuras Mejoras

Discusión

El proyecto demuestra de manera exitosa la viabilidad de utilizar un modelo de Machine Learning para automatizar la priorización de tickets. El modelo de Regresión Logística, aunque simple, provee una base sólida y resultados interpretables que pueden ayudar a optimizar la asignación de recursos en una mesa de ayuda. Las aplicaciones de Streamlit validan que el modelo puede ser integrado en herramientas prácticas para usuarios finales.

Limitaciones del Modelo Actual

Posibles Mejoras Futuras