alia / README.md
perellorets's picture
Update README.md
c067523 verified
---
title: ALIA Turismo RAG
emoji: 🏛️
colorFrom: blue
colorTo: green
sdk: gradio
sdk_version: 4.16.0
app_file: app.py
pinned: false
license: apache-2.0
---
# 🏛️ ALIA Turismo - Asistente de Planes Estratégicos
Sistema RAG (Retrieval-Augmented Generation) para consultas sobre planes estratégicos de turismo de la Comunidad Valenciana.
## 🎯 Descripción
ALIA es un asistente inteligente que combina:
- **Salamandra 7B Instruct** - Modelo LLM open-source del Barcelona Supercomputing Center optimizado para español/catalán
- **Qdrant** - Base de datos vectorial con 499 planes turísticos indexados
- **Sentence Transformers** - Modelo de embeddings multilingüe
## ✨ Características
- 🇪🇸 **Español Nativo**: Salamandra está específicamente entrenado para español y catalán
- 📚 **499 Documentos**: Base de conocimiento de planes turísticos reales
- 🔍 **Búsqueda Semántica**: Encuentra información relevante automáticamente
-**GPU Acelerado**: Respuestas en 6-11 segundos con GPU
## 🚀 Uso
1. Escribe tu pregunta sobre planes turísticos
2. ALIA buscará en 499 documentos la información relevante
3. Recibirás una respuesta fundamentada con fuentes
### Ejemplos de Preguntas
- ¿Cuáles son las principales estrategias de turismo sostenible?
- ¿Cómo se implementa la gobernanza en destinos turísticos inteligentes?
- ¿Qué indicadores se usan para medir el éxito de los planes turísticos?
- ¿Cuáles son las mejores prácticas de marketing digital para destinos?
## 🔧 Configuración
El sistema permite ajustar:
- **Documentos a recuperar**: Cuántos documentos consultar (1-10)
- **Umbral de relevancia**: Puntuación mínima de similitud (0-1)
- **Tokens máximos**: Longitud de la respuesta (256-2048)
- **Temperature**: Creatividad del modelo (0-1)
## 📊 Arquitectura
```
Usuario
[Pregunta]
[Sentence Transformers] → Embedding
[Qdrant] → Búsqueda Semántica (top 5 docs)
[Salamandra 7B] → Generación de Respuesta
[Respuesta + Fuentes]
```
## 🏗️ Tecnologías
- **LLM**: Salamandra 7B Instruct (BSC-LT)
- **Vector DB**: Qdrant Cloud
- **Embeddings**: paraphrase-multilingual-MiniLM-L12-v2
- **Framework**: Gradio
- **Hardware**: GPU (NVIDIA T4/A10G en Hugging Face Spaces)
## 📝 Licencia
Apache 2.0
## 🔗 Enlaces
- [Salamandra en Hugging Face](https://huggingface.co/BSC-LT/salamandra-7b-instruct)
- [Barcelona Supercomputing Center](https://www.bsc.es/)
- [Repositorio del Proyecto](https://github.com/tu-usuario/alia-turismo)
## 👥 Créditos
Desarrollado por el Barcelona Supercomputing Center (BSC) para la Comunidad Valenciana.
**Modelo LLM**: Salamandra 7B Instruct
**Datos**: 499 planes estratégicos de turismo
**Versión**: 1.1.0