perellorets commited on
Commit
c067523
·
verified ·
1 Parent(s): 4df2a30

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +92 -93
README.md CHANGED
@@ -1,93 +1,92 @@
1
- ---
2
- title: ALIA Turismo RAG
3
- emoji: 🏛️
4
- colorFrom: blue
5
- colorTo: green
6
- sdk: gradio
7
- sdk_version: 4.16.0
8
- app_file: app.py
9
- pinned: false
10
- license: apache-2.0
11
- python_version: 3.10
12
- ---
13
-
14
- # 🏛️ ALIA Turismo - Asistente de Planes Estratégicos
15
-
16
- Sistema RAG (Retrieval-Augmented Generation) para consultas sobre planes estratégicos de turismo de la Comunidad Valenciana.
17
-
18
- ## 🎯 Descripción
19
-
20
- ALIA es un asistente inteligente que combina:
21
- - **Salamandra 7B Instruct** - Modelo LLM open-source del Barcelona Supercomputing Center optimizado para español/catalán
22
- - **Qdrant** - Base de datos vectorial con 499 planes turísticos indexados
23
- - **Sentence Transformers** - Modelo de embeddings multilingüe
24
-
25
- ## ✨ Características
26
-
27
- - 🇪🇸 **Español Nativo**: Salamandra está específicamente entrenado para español y catalán
28
- - 📚 **499 Documentos**: Base de conocimiento de planes turísticos reales
29
- - 🔍 **Búsqueda Semántica**: Encuentra información relevante automáticamente
30
- - ⚡ **GPU Acelerado**: Respuestas en 6-11 segundos con GPU
31
-
32
- ## 🚀 Uso
33
-
34
- 1. Escribe tu pregunta sobre planes turísticos
35
- 2. ALIA buscará en 499 documentos la información relevante
36
- 3. Recibirás una respuesta fundamentada con fuentes
37
-
38
- ### Ejemplos de Preguntas
39
-
40
- - ¿Cuáles son las principales estrategias de turismo sostenible?
41
- - ¿Cómo se implementa la gobernanza en destinos turísticos inteligentes?
42
- - ¿Qué indicadores se usan para medir el éxito de los planes turísticos?
43
- - ¿Cuáles son las mejores prácticas de marketing digital para destinos?
44
-
45
- ## 🔧 Configuración
46
-
47
- El sistema permite ajustar:
48
- - **Documentos a recuperar**: Cuántos documentos consultar (1-10)
49
- - **Umbral de relevancia**: Puntuación mínima de similitud (0-1)
50
- - **Tokens máximos**: Longitud de la respuesta (256-2048)
51
- - **Temperature**: Creatividad del modelo (0-1)
52
-
53
- ## 📊 Arquitectura
54
-
55
- ```
56
- Usuario
57
-
58
- [Pregunta]
59
-
60
- [Sentence Transformers] → Embedding
61
-
62
- [Qdrant] → Búsqueda Semántica (top 5 docs)
63
-
64
- [Salamandra 7B] → Generación de Respuesta
65
-
66
- [Respuesta + Fuentes]
67
- ```
68
-
69
- ## 🏗️ Tecnologías
70
-
71
- - **LLM**: Salamandra 7B Instruct (BSC-LT)
72
- - **Vector DB**: Qdrant Cloud
73
- - **Embeddings**: paraphrase-multilingual-MiniLM-L12-v2
74
- - **Framework**: Gradio
75
- - **Hardware**: GPU (NVIDIA T4/A10G en Hugging Face Spaces)
76
-
77
- ## 📝 Licencia
78
-
79
- Apache 2.0
80
-
81
- ## 🔗 Enlaces
82
-
83
- - [Salamandra en Hugging Face](https://huggingface.co/BSC-LT/salamandra-7b-instruct)
84
- - [Barcelona Supercomputing Center](https://www.bsc.es/)
85
- - [Repositorio del Proyecto](https://github.com/tu-usuario/alia-turismo)
86
-
87
- ## 👥 Créditos
88
-
89
- Desarrollado por el Barcelona Supercomputing Center (BSC) para la Comunidad Valenciana.
90
-
91
- **Modelo LLM**: Salamandra 7B Instruct
92
- **Datos**: 499 planes estratégicos de turismo
93
- **Versión**: 1.1.0
 
1
+ ---
2
+ title: ALIA Turismo RAG
3
+ emoji: 🏛️
4
+ colorFrom: blue
5
+ colorTo: green
6
+ sdk: gradio
7
+ sdk_version: 4.16.0
8
+ app_file: app.py
9
+ pinned: false
10
+ license: apache-2.0
11
+ ---
12
+
13
+ # 🏛️ ALIA Turismo - Asistente de Planes Estratégicos
14
+
15
+ Sistema RAG (Retrieval-Augmented Generation) para consultas sobre planes estratégicos de turismo de la Comunidad Valenciana.
16
+
17
+ ## 🎯 Descripción
18
+
19
+ ALIA es un asistente inteligente que combina:
20
+ - **Salamandra 7B Instruct** - Modelo LLM open-source del Barcelona Supercomputing Center optimizado para español/catalán
21
+ - **Qdrant** - Base de datos vectorial con 499 planes turísticos indexados
22
+ - **Sentence Transformers** - Modelo de embeddings multilingüe
23
+
24
+ ## ✨ Características
25
+
26
+ - 🇪🇸 **Español Nativo**: Salamandra está específicamente entrenado para español y catalán
27
+ - 📚 **499 Documentos**: Base de conocimiento de planes turísticos reales
28
+ - 🔍 **Búsqueda Semántica**: Encuentra información relevante automáticamente
29
+ - **GPU Acelerado**: Respuestas en 6-11 segundos con GPU
30
+
31
+ ## 🚀 Uso
32
+
33
+ 1. Escribe tu pregunta sobre planes turísticos
34
+ 2. ALIA buscará en 499 documentos la información relevante
35
+ 3. Recibirás una respuesta fundamentada con fuentes
36
+
37
+ ### Ejemplos de Preguntas
38
+
39
+ - ¿Cuáles son las principales estrategias de turismo sostenible?
40
+ - ¿Cómo se implementa la gobernanza en destinos turísticos inteligentes?
41
+ - ¿Qué indicadores se usan para medir el éxito de los planes turísticos?
42
+ - ¿Cuáles son las mejores prácticas de marketing digital para destinos?
43
+
44
+ ## 🔧 Configuración
45
+
46
+ El sistema permite ajustar:
47
+ - **Documentos a recuperar**: Cuántos documentos consultar (1-10)
48
+ - **Umbral de relevancia**: Puntuación mínima de similitud (0-1)
49
+ - **Tokens máximos**: Longitud de la respuesta (256-2048)
50
+ - **Temperature**: Creatividad del modelo (0-1)
51
+
52
+ ## 📊 Arquitectura
53
+
54
+ ```
55
+ Usuario
56
+
57
+ [Pregunta]
58
+
59
+ [Sentence Transformers] → Embedding
60
+
61
+ [Qdrant] → Búsqueda Semántica (top 5 docs)
62
+
63
+ [Salamandra 7B] → Generación de Respuesta
64
+
65
+ [Respuesta + Fuentes]
66
+ ```
67
+
68
+ ## 🏗️ Tecnologías
69
+
70
+ - **LLM**: Salamandra 7B Instruct (BSC-LT)
71
+ - **Vector DB**: Qdrant Cloud
72
+ - **Embeddings**: paraphrase-multilingual-MiniLM-L12-v2
73
+ - **Framework**: Gradio
74
+ - **Hardware**: GPU (NVIDIA T4/A10G en Hugging Face Spaces)
75
+
76
+ ## 📝 Licencia
77
+
78
+ Apache 2.0
79
+
80
+ ## 🔗 Enlaces
81
+
82
+ - [Salamandra en Hugging Face](https://huggingface.co/BSC-LT/salamandra-7b-instruct)
83
+ - [Barcelona Supercomputing Center](https://www.bsc.es/)
84
+ - [Repositorio del Proyecto](https://github.com/tu-usuario/alia-turismo)
85
+
86
+ ## 👥 Créditos
87
+
88
+ Desarrollado por el Barcelona Supercomputing Center (BSC) para la Comunidad Valenciana.
89
+
90
+ **Modelo LLM**: Salamandra 7B Instruct
91
+ **Datos**: 499 planes estratégicos de turismo
92
+ **Versión**: 1.1.0