updating README.md
Browse files
README.md
CHANGED
|
@@ -10,61 +10,45 @@ pinned: false
|
|
| 10 |
|
| 11 |
# Mori Bot 🤖
|
| 12 |
|
| 13 |
-
Mori es un asistente
|
| 14 |
-
|
|
|
|
|
|
|
|
|
|
| 15 |
|
| 16 |
## ⚙️ Arquitectura del sistema
|
| 17 |
|
| 18 |
-
|
| 19 |
|
| 20 |
-
|
| 21 |
|
| 22 |
-
|
| 23 |
|
| 24 |
-
|
| 25 |
|
| 26 |
-
|
| 27 |
|
| 28 |
-
|
|
|
|
| 29 |
|
| 30 |
#### 📌 Puedes ver el diagrama del flujo a continuación:
|
| 31 |
-
|
| 32 |
<!--  -->
|
| 33 |
|
| 34 |
## 🧠 Modelos
|
| 35 |
|
| 36 |
-
-
|
| 37 |
-
-
|
| 38 |
-
- Modelo
|
| 39 |
|
| 40 |
## 🚀 Cómo usar
|
| 41 |
|
| 42 |
-
1.
|
| 43 |
-
|
| 44 |
-
|
| 45 |
-
|
| 46 |
-
3. Obtendrás una respuesta adaptada al tipo de contexto.
|
| 47 |
-
|
| 48 |
-
## 🧪 Entrenamiento y datos
|
| 49 |
-
|
| 50 |
-
- Web scraping (fuentes técnicas y Wikipedia)
|
| 51 |
-
|
| 52 |
-
- Curación manual de conceptos y ejemplos
|
| 53 |
-
|
| 54 |
-
- Paráfrasis de preguntas para mejorar generalización
|
| 55 |
-
|
| 56 |
-
- Contextos temáticos para enriquecer las entradas técnicas
|
| 57 |
-
|
| 58 |
-
- Modelos fine-tuned con t5-base y bert-base-uncased
|
| 59 |
-
|
| 60 |
-
|
| 61 |
|
| 62 |
## ✨ Hecho por
|
| 63 |
|
| 64 |
-
|
| 65 |
[**@tecuhtli**](https://huggingface.co/tecuhtli) con ayuda de GPT, conocido entre amigos como GTRzilla 🦖.
|
| 66 |
|
| 67 |

|
| 68 |

|
| 69 |
-
|
| 70 |
-
|
|
|
|
| 10 |
|
| 11 |
# Mori Bot 🤖
|
| 12 |
|
| 13 |
+
Mori es un asistente técnico especializado en ciencia de datos, estadística y aprendizaje automático. Utiliza dos modelos principales: un FLAN-T5 fine-tuned y un modelo Qwen sin ajuste adicional.
|
| 14 |
+
|
| 15 |
+
El modelo FLAN-T5 ajustado puede complementarse con RAG mediante una base vectorial FAISS generada a partir del propio dataset de entrenamiento, lo que permite recuperar ejemplos relevantes y ofrecer respuestas más precisas y coherentes.
|
| 16 |
+
|
| 17 |
+
El objetivo de Mori es demostrar la viabilidad de construir una herramienta complementaria, de fácil desarrollo y acceso, que ayude a resolver dudas relacionadas con temas del procesamiento de datos.
|
| 18 |
|
| 19 |
## ⚙️ Arquitectura del sistema
|
| 20 |
|
| 21 |
+
El usuario formula una pregunta que es procesada y enviada, según la selección del propio usuario, a uno de dos modelos que generarán una respuesta a partir del input recibido.
|
| 22 |
|
| 23 |
+
Cuando se selecciona el modelo FLAN-T5, la pregunta es enviada a un modelo FLAN-T5 fine-tuned para este proyecto. Por ahora, este modelo solo puede responder preguntas con estructuras específicas, tal como se indica en la interfaz.
|
| 24 |
|
| 25 |
+
Además, el usuario puede activar o desactivar el uso de RAG desde la barra lateral de la aplicación. Esta opción aplica únicamente cuando se está utilizando el modelo FLAN-T5. En este caso, el sistema recupera información relevante desde una base vectorial FAISS para construir una respuesta más precisa y contextual.
|
| 26 |
|
| 27 |
+
Por otro lado, si el usuario selecciona el modelo Qwen, el input se envía directamente a dicho modelo para la generación de texto, sin pasar por el módulo RAG.
|
| 28 |
|
| 29 |
+
En ambos modelos es posible elegir diferentes personalidades para la respuesta: exacto o creativo.
|
| 30 |
|
| 31 |
+
- La personalidad **exacta** produce respuestas concisas, directas y alineadas con la intención del usuario.
|
| 32 |
+
- La personalidad **creativa** permite respuestas más libres y expresivas, aunque con mayor riesgo de errores o menor precisión técnica.
|
| 33 |
|
| 34 |
#### 📌 Puedes ver el diagrama del flujo a continuación:
|
|
|
|
| 35 |
<!--  -->
|
| 36 |
|
| 37 |
## 🧠 Modelos
|
| 38 |
|
| 39 |
+
- Modelo técnico: [`FLAN-T5 fine-tuned`](https://huggingface.co/tecuhtli/mori-tecnico-model)
|
| 40 |
+
- Base de datos vectorial: [`FAISS`](https://huggingface.co/datasets/tecuhtli/Mori_FAISS_Full)
|
| 41 |
+
- Modelo Qwen: [`Qwen 2-1.5B Instruct`](https://huggingface.co/Qwen/Qwen2-1.5B-Instruct)
|
| 42 |
|
| 43 |
## 🚀 Cómo usar
|
| 44 |
|
| 45 |
+
1. Ingresa tu pregunta sobre procesamiento de datos.
|
| 46 |
+
2. Elige el modelo con el que deseas obtener la respuesta.
|
| 47 |
+
3. Recibirás una respuesta generada de acuerdo con tus selecciones.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 48 |
|
| 49 |
## ✨ Hecho por
|
| 50 |
|
|
|
|
| 51 |
[**@tecuhtli**](https://huggingface.co/tecuhtli) con ayuda de GPT, conocido entre amigos como GTRzilla 🦖.
|
| 52 |
|
| 53 |

|
| 54 |

|
|
|
|
|
|