A newer version of the Streamlit SDK is available:
1.52.1
title: Mori Bot – Data Processing Q&A
emoji: 🤖
colorFrom: indigo
colorTo: purple
sdk: streamlit
app_file: app.py
pinned: false
short_description: Assistant based on fine-tuned FLAN-T5 and Qwen models.
Mori Bot 🤖
Mori es un asistente técnico especializado en ciencia de datos, estadística y aprendizaje automático. Utiliza dos modelos principales: un FLAN-T5 fine-tuned y un modelo Qwen sin ajuste adicional.
El modelo FLAN-T5 ajustado puede complementarse con RAG mediante una base vectorial FAISS generada a partir del propio dataset de entrenamiento, lo que permite recuperar ejemplos relevantes y ofrecer respuestas más precisas y coherentes.
El objetivo de Mori es demostrar la viabilidad de construir una herramienta complementaria, de fácil desarrollo y acceso, que ayude a resolver dudas relacionadas con temas del procesamiento de datos.
⚙️ Arquitectura del sistema
El usuario formula una pregunta que es procesada y enviada, según la selección del propio usuario, a uno de dos modelos que generarán una respuesta a partir del input recibido.
Cuando se selecciona el modelo FLAN-T5, la pregunta es enviada a un modelo FLAN-T5 fine-tuned para este proyecto. Por ahora, este modelo solo puede responder preguntas con estructuras específicas, tal como se indica en la interfaz.
Además, el usuario puede activar o desactivar el uso de RAG desde la barra lateral de la aplicación. Esta opción aplica únicamente cuando se está utilizando el modelo FLAN-T5. En este caso, el sistema recupera información relevante desde una base vectorial FAISS para construir una respuesta más precisa y contextual.
Por otro lado, si el usuario selecciona el modelo Qwen, el input se envía directamente a dicho modelo para la generación de texto, sin pasar por el módulo RAG.
En ambos modelos es posible elegir diferentes personalidades para la respuesta: exacto o creativo.
- La personalidad exacta produce respuestas concisas, directas y alineadas con la intención del usuario.
- La personalidad creativa permite respuestas más libres y expresivas, aunque con mayor riesgo de errores o menor precisión técnica.
📌 Puedes ver el diagrama del flujo a continuación:
🧠 Modelos
- Modelo técnico:
FLAN-T5 fine-tuned - Base de datos vectorial:
FAISS - Modelo Qwen:
Qwen 2-1.5B Instruct
🚀 Cómo usar
- Ingresa tu pregunta sobre procesamiento de datos.
- Elige el modelo con el que deseas obtener la respuesta.
- Recibirás una respuesta generada de acuerdo con tus selecciones.
✨ Hecho por
@tecuhtli con ayuda de GPT, conocido entre amigos como GTRzilla 🦖.