alia / README.md
perellorets's picture
Update README.md
c067523 verified

A newer version of the Gradio SDK is available: 6.6.0

Upgrade
metadata
title: ALIA Turismo RAG
emoji: 🏛️
colorFrom: blue
colorTo: green
sdk: gradio
sdk_version: 4.16.0
app_file: app.py
pinned: false
license: apache-2.0

🏛️ ALIA Turismo - Asistente de Planes Estratégicos

Sistema RAG (Retrieval-Augmented Generation) para consultas sobre planes estratégicos de turismo de la Comunidad Valenciana.

🎯 Descripción

ALIA es un asistente inteligente que combina:

  • Salamandra 7B Instruct - Modelo LLM open-source del Barcelona Supercomputing Center optimizado para español/catalán
  • Qdrant - Base de datos vectorial con 499 planes turísticos indexados
  • Sentence Transformers - Modelo de embeddings multilingüe

✨ Características

  • 🇪🇸 Español Nativo: Salamandra está específicamente entrenado para español y catalán
  • 📚 499 Documentos: Base de conocimiento de planes turísticos reales
  • 🔍 Búsqueda Semántica: Encuentra información relevante automáticamente
  • GPU Acelerado: Respuestas en 6-11 segundos con GPU

🚀 Uso

  1. Escribe tu pregunta sobre planes turísticos
  2. ALIA buscará en 499 documentos la información relevante
  3. Recibirás una respuesta fundamentada con fuentes

Ejemplos de Preguntas

  • ¿Cuáles son las principales estrategias de turismo sostenible?
  • ¿Cómo se implementa la gobernanza en destinos turísticos inteligentes?
  • ¿Qué indicadores se usan para medir el éxito de los planes turísticos?
  • ¿Cuáles son las mejores prácticas de marketing digital para destinos?

🔧 Configuración

El sistema permite ajustar:

  • Documentos a recuperar: Cuántos documentos consultar (1-10)
  • Umbral de relevancia: Puntuación mínima de similitud (0-1)
  • Tokens máximos: Longitud de la respuesta (256-2048)
  • Temperature: Creatividad del modelo (0-1)

📊 Arquitectura

Usuario
   ↓
[Pregunta]
   ↓
[Sentence Transformers] → Embedding
   ↓
[Qdrant] → Búsqueda Semántica (top 5 docs)
   ↓
[Salamandra 7B] → Generación de Respuesta
   ↓
[Respuesta + Fuentes]

🏗️ Tecnologías

  • LLM: Salamandra 7B Instruct (BSC-LT)
  • Vector DB: Qdrant Cloud
  • Embeddings: paraphrase-multilingual-MiniLM-L12-v2
  • Framework: Gradio
  • Hardware: GPU (NVIDIA T4/A10G en Hugging Face Spaces)

📝 Licencia

Apache 2.0

🔗 Enlaces

👥 Créditos

Desarrollado por el Barcelona Supercomputing Center (BSC) para la Comunidad Valenciana.

Modelo LLM: Salamandra 7B Instruct Datos: 499 planes estratégicos de turismo Versión: 1.1.0