File size: 3,111 Bytes
1da62df 1f56a97 1da62df 1f56a97 1da62df 9985125 1da62df 7931a15 9985125 7931a15 9985125 7931a15 9985125 7931a15 9985125 7931a15 9985125 7931a15 9985125 7931a15 9985125 98d715a 1da62df 7931a15 1da62df 7931a15 1da62df 9985125 1f56a97 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 |
---
title: Mori Bot – Data Processing Q&A
emoji: 🤖
colorFrom: indigo
colorTo: purple
sdk: streamlit
app_file: app.py
pinned: false
short_description: Assistant based on fine-tuned FLAN-T5 and Qwen models.
---
# Mori Bot 🤖
Mori es un asistente técnico especializado en ciencia de datos, estadística y aprendizaje automático. Utiliza dos modelos principales: un FLAN-T5 fine-tuned y un modelo Qwen sin ajuste adicional.
El modelo FLAN-T5 ajustado puede complementarse con RAG mediante una base vectorial FAISS generada a partir del propio dataset de entrenamiento, lo que permite recuperar ejemplos relevantes y ofrecer respuestas más precisas y coherentes.
El objetivo de Mori es demostrar la viabilidad de construir una herramienta complementaria, de fácil desarrollo y acceso, que ayude a resolver dudas relacionadas con temas del procesamiento de datos.
## ⚙️ Arquitectura del sistema
El usuario formula una pregunta que es procesada y enviada, según la selección del propio usuario, a uno de dos modelos que generarán una respuesta a partir del input recibido.
Cuando se selecciona el modelo FLAN-T5, la pregunta es enviada a un modelo FLAN-T5 fine-tuned para este proyecto. Por ahora, este modelo solo puede responder preguntas con estructuras específicas, tal como se indica en la interfaz.
Además, el usuario puede activar o desactivar el uso de RAG desde la barra lateral de la aplicación. Esta opción aplica únicamente cuando se está utilizando el modelo FLAN-T5. En este caso, el sistema recupera información relevante desde una base vectorial FAISS para construir una respuesta más precisa y contextual.
Por otro lado, si el usuario selecciona el modelo Qwen, el input se envía directamente a dicho modelo para la generación de texto, sin pasar por el módulo RAG.
En ambos modelos es posible elegir diferentes personalidades para la respuesta: exacto o creativo.
- La personalidad **exacta** produce respuestas concisas, directas y alineadas con la intención del usuario.
- La personalidad **creativa** permite respuestas más libres y expresivas, aunque con mayor riesgo de errores o menor precisión técnica.
#### 📌 Puedes ver el diagrama del flujo a continuación:
<!--  -->
## 🧠 Modelos
- Modelo técnico: [`FLAN-T5 fine-tuned`](https://huggingface.co/tecuhtli/mori-tecnico-model)
- Base de datos vectorial: [`FAISS`](https://huggingface.co/datasets/tecuhtli/Mori_FAISS_Full)
- Modelo Qwen: [`Qwen 2-1.5B Instruct`](https://huggingface.co/Qwen/Qwen2-1.5B-Instruct)
## 🚀 Cómo usar
1. Ingresa tu pregunta sobre procesamiento de datos.
2. Elige el modelo con el que deseas obtener la respuesta.
3. Recibirás una respuesta generada de acuerdo con tus selecciones.
## ✨ Hecho por
[**@tecuhtli**](https://huggingface.co/tecuhtli) con ayuda de GPT, conocido entre amigos como GTRzilla 🦖.

 |