|
|
--- |
|
|
title: Mori Bot – Data Processing Q&A |
|
|
emoji: 🤖 |
|
|
colorFrom: indigo |
|
|
colorTo: purple |
|
|
sdk: streamlit |
|
|
app_file: app.py |
|
|
pinned: false |
|
|
short_description: Assistant based on fine-tuned FLAN-T5 and Qwen models. |
|
|
--- |
|
|
|
|
|
# Mori Bot 🤖 |
|
|
|
|
|
Mori es un asistente técnico especializado en ciencia de datos, estadística y aprendizaje automático. Utiliza dos modelos principales: un FLAN-T5 fine-tuned y un modelo Qwen sin ajuste adicional. |
|
|
|
|
|
El modelo FLAN-T5 ajustado puede complementarse con RAG mediante una base vectorial FAISS generada a partir del propio dataset de entrenamiento, lo que permite recuperar ejemplos relevantes y ofrecer respuestas más precisas y coherentes. |
|
|
|
|
|
El objetivo de Mori es demostrar la viabilidad de construir una herramienta complementaria, de fácil desarrollo y acceso, que ayude a resolver dudas relacionadas con temas del procesamiento de datos. |
|
|
|
|
|
## ⚙️ Arquitectura del sistema |
|
|
|
|
|
El usuario formula una pregunta que es procesada y enviada, según la selección del propio usuario, a uno de dos modelos que generarán una respuesta a partir del input recibido. |
|
|
|
|
|
Cuando se selecciona el modelo FLAN-T5, la pregunta es enviada a un modelo FLAN-T5 fine-tuned para este proyecto. Por ahora, este modelo solo puede responder preguntas con estructuras específicas, tal como se indica en la interfaz. |
|
|
|
|
|
Además, el usuario puede activar o desactivar el uso de RAG desde la barra lateral de la aplicación. Esta opción aplica únicamente cuando se está utilizando el modelo FLAN-T5. En este caso, el sistema recupera información relevante desde una base vectorial FAISS para construir una respuesta más precisa y contextual. |
|
|
|
|
|
Por otro lado, si el usuario selecciona el modelo Qwen, el input se envía directamente a dicho modelo para la generación de texto, sin pasar por el módulo RAG. |
|
|
|
|
|
En ambos modelos es posible elegir diferentes personalidades para la respuesta: exacto o creativo. |
|
|
|
|
|
- La personalidad **exacta** produce respuestas concisas, directas y alineadas con la intención del usuario. |
|
|
- La personalidad **creativa** permite respuestas más libres y expresivas, aunque con mayor riesgo de errores o menor precisión técnica. |
|
|
|
|
|
#### 📌 Puedes ver el diagrama del flujo a continuación: |
|
|
<!--  --> |
|
|
|
|
|
## 🧠 Modelos |
|
|
|
|
|
- Modelo técnico: [`FLAN-T5 fine-tuned`](https://huggingface.co/tecuhtli/mori-tecnico-model) |
|
|
- Base de datos vectorial: [`FAISS`](https://huggingface.co/datasets/tecuhtli/Mori_FAISS_Full) |
|
|
- Modelo Qwen: [`Qwen 2-1.5B Instruct`](https://huggingface.co/Qwen/Qwen2-1.5B-Instruct) |
|
|
|
|
|
## 🚀 Cómo usar |
|
|
|
|
|
1. Ingresa tu pregunta sobre procesamiento de datos. |
|
|
2. Elige el modelo con el que deseas obtener la respuesta. |
|
|
3. Recibirás una respuesta generada de acuerdo con tus selecciones. |
|
|
|
|
|
## ✨ Hecho por |
|
|
|
|
|
[**@tecuhtli**](https://huggingface.co/tecuhtli) con ayuda de GPT, conocido entre amigos como GTRzilla 🦖. |
|
|
|
|
|
 |
|
|
 |