tecuhtli commited on
Commit
7931a15
·
1 Parent(s): 138fe6a

updating README.md

Browse files
Files changed (1) hide show
  1. README.md +18 -34
README.md CHANGED
@@ -10,61 +10,45 @@ pinned: false
10
 
11
  # Mori Bot 🤖
12
 
13
- Mori es un asistente conversacional especializado en ciencia de datos y aprendizaje automático, diseñado para responder preguntas técnicas o sociales de manera contextual.
14
- Integra un sistema de clasificación con BERT para enrutar preguntas hacia el modelo más adecuado según su intención.
 
 
 
15
 
16
  ## ⚙️ Arquitectura del sistema
17
 
18
- 1. El usuario formula una pregunta.
19
 
20
- 2. El clasificador BERT predice el contexto: técnico o social.
21
 
22
- 3. Según el resultado:
23
 
24
- - Técnico Se aplica prompt engineering con contexto temático, y se usa un modelo t5-base fine-tuned.
25
 
26
- - Social → Se envía directamente al modelo social.
27
 
28
- 4. Se genera una respuesta mediante el modelo correspondiente.
 
29
 
30
  #### 📌 Puedes ver el diagrama del flujo a continuación:
31
-
32
  <!-- ![Mori Workflow](./mori_workflow.png) -->
33
 
34
  ## 🧠 Modelos
35
 
36
- - Clasificador de contexto: [`tecuhtli/mori-context-model`](https://huggingface.co/tecuhtli/mori-context-model)
37
- - Modelo técnico: [`tecuhtli/mori-tecnico-model`](https://huggingface.co/tecuhtli/mori-tecnico-model)
38
- - Modelo social: [`tecuhtli/mori-social-model`](https://huggingface.co/tecuhtli/mori-social-model)
39
 
40
  ## 🚀 Cómo usar
41
 
42
- 1. Escribe una pregunta (puede ser técnica o informal).
43
-
44
- 2. Mori la clasificará automáticamente.
45
-
46
- 3. Obtendrás una respuesta adaptada al tipo de contexto.
47
-
48
- ## 🧪 Entrenamiento y datos
49
-
50
- - Web scraping (fuentes técnicas y Wikipedia)
51
-
52
- - Curación manual de conceptos y ejemplos
53
-
54
- - Paráfrasis de preguntas para mejorar generalización
55
-
56
- - Contextos temáticos para enriquecer las entradas técnicas
57
-
58
- - Modelos fine-tuned con t5-base y bert-base-uncased
59
-
60
-
61
 
62
  ## ✨ Hecho por
63
 
64
-
65
  [**@tecuhtli**](https://huggingface.co/tecuhtli) con ayuda de GPT, conocido entre amigos como GTRzilla 🦖.
66
 
67
  ![Made with Hugging Face](https://img.shields.io/badge/Made%20with-HuggingFace-orange?logo=huggingface)
68
  ![Built with Streamlit](https://img.shields.io/badge/Built%20with-Streamlit-FF4B4B?logo=streamlit)
69
-
70
-
 
10
 
11
  # Mori Bot 🤖
12
 
13
+ Mori es un asistente técnico especializado en ciencia de datos, estadística y aprendizaje automático. Utiliza dos modelos principales: un FLAN-T5 fine-tuned y un modelo Qwen sin ajuste adicional.
14
+
15
+ El modelo FLAN-T5 ajustado puede complementarse con RAG mediante una base vectorial FAISS generada a partir del propio dataset de entrenamiento, lo que permite recuperar ejemplos relevantes y ofrecer respuestas más precisas y coherentes.
16
+
17
+ El objetivo de Mori es demostrar la viabilidad de construir una herramienta complementaria, de fácil desarrollo y acceso, que ayude a resolver dudas relacionadas con temas del procesamiento de datos.
18
 
19
  ## ⚙️ Arquitectura del sistema
20
 
21
+ El usuario formula una pregunta que es procesada y enviada, según la selección del propio usuario, a uno de dos modelos que generarán una respuesta a partir del input recibido.
22
 
23
+ Cuando se selecciona el modelo FLAN-T5, la pregunta es enviada a un modelo FLAN-T5 fine-tuned para este proyecto. Por ahora, este modelo solo puede responder preguntas con estructuras específicas, tal como se indica en la interfaz.
24
 
25
+ Además, el usuario puede activar o desactivar el uso de RAG desde la barra lateral de la aplicación. Esta opción aplica únicamente cuando se está utilizando el modelo FLAN-T5. En este caso, el sistema recupera información relevante desde una base vectorial FAISS para construir una respuesta más precisa y contextual.
26
 
27
+ Por otro lado, si el usuario selecciona el modelo Qwen, el input se envía directamente a dicho modelo para la generación de texto, sin pasar por el módulo RAG.
28
 
29
+ En ambos modelos es posible elegir diferentes personalidades para la respuesta: exacto o creativo.
30
 
31
+ - La personalidad **exacta** produce respuestas concisas, directas y alineadas con la intención del usuario.
32
+ - La personalidad **creativa** permite respuestas más libres y expresivas, aunque con mayor riesgo de errores o menor precisión técnica.
33
 
34
  #### 📌 Puedes ver el diagrama del flujo a continuación:
 
35
  <!-- ![Mori Workflow](./mori_workflow.png) -->
36
 
37
  ## 🧠 Modelos
38
 
39
+ - Modelo técnico: [`FLAN-T5 fine-tuned`](https://huggingface.co/tecuhtli/mori-tecnico-model)
40
+ - Base de datos vectorial: [`FAISS`](https://huggingface.co/datasets/tecuhtli/Mori_FAISS_Full)
41
+ - Modelo Qwen: [`Qwen 2-1.5B Instruct`](https://huggingface.co/Qwen/Qwen2-1.5B-Instruct)
42
 
43
  ## 🚀 Cómo usar
44
 
45
+ 1. Ingresa tu pregunta sobre procesamiento de datos.
46
+ 2. Elige el modelo con el que deseas obtener la respuesta.
47
+ 3. Recibirás una respuesta generada de acuerdo con tus selecciones.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
48
 
49
  ## ✨ Hecho por
50
 
 
51
  [**@tecuhtli**](https://huggingface.co/tecuhtli) con ayuda de GPT, conocido entre amigos como GTRzilla 🦖.
52
 
53
  ![Made with Hugging Face](https://img.shields.io/badge/Made%20with-HuggingFace-orange?logo=huggingface)
54
  ![Built with Streamlit](https://img.shields.io/badge/Built%20with-Streamlit-FF4B4B?logo=streamlit)