Spaces:

VeuReu
/

svision

Running on Zero

App Files Files Community

VeuReu commited on Oct 15

Commit

1f62ddb

verified ·

1 Parent(s): 82a79d6

Upload README.md

Browse files

Files changed (1) hide show

README.md +57 -16

README.md CHANGED Viewed

@@ -1,21 +1,62 @@
-# Salamandra-Vision 7B · ZeroGPU Space (API + Clientes)
-Space Gradio (ZeroGPU) que sirve **UI + API** para `BSC-LT/salamandra-7b-vision`.
-Clientes incluidos: `clients/client_requests.py` (local/CLI) y `clients/streamlit_client_app.py` (Space Streamlit).
-## Despliegue del Space (ZeroGPU)
-1. Crea Space → SDK **Gradio**, Hardware **ZeroGPU**.
-2. Sube `app.py`, `requirements.txt`, `README.md`, carpeta `examples`.
-3. Opcional: `MODEL_ID=BSC-LT/salamandra-7b-vision`.
-## Endpoints
-- UI: interfaz Gradio.
-- **REST puro**: `POST /api/describe_raw` (multipart: `image`, `text`, `max_new_tokens`, `temperature`).
-- Gradio clásico: `POST /api/predict/describe` (recomendado con `gradio_client`).
-> ZeroGPU sólo con Gradio; exponemos API desde Gradio. Clients externos (requests/Streamlit) funcionan bien. Para cargas altas y fair-use del clúster, considera forwarding de token por usuario (más sencillo en apps Gradio). :contentReference[oaicite:8]{index=8}
-## Cliente local (sin Gradio UI)
-```bash
-python clients/client_requests.py --space-url "https://<usuario>-<space>.hf.space" \
-  --image examples/demo.jpg --text "Descríbela en catalán."

+---
+title: Salamandra-Vision 7B · ZeroGPU
+emoji: 🦎
+colorFrom: purple
+colorTo: indigo
+sdk: gradio
+sdk_version: "4.44.0"
+app_file: app.py
+pinned: false
+---
+# 🦎 Salamandra-Vision 7B · ZeroGPU
+Este Space despliega el modelo **[BSC-LT/salamandra-7b-vision](https://huggingface.co/BSC-LT/salamandra-7b-vision)** —una variante de **LLaVA-OneVision** entrenada por el *Barcelona Supercomputing Center*— utilizando **máquinas ZeroGPU**.
+Permite enviar una **imagen y un texto (prompt)** para recibir una **descripción generada automáticamente**.
+Funciona tanto desde la **interfaz web (Gradio)** como desde **clientes externos** (por ejemplo, otro Space con Streamlit o una app Python local).
+---
+## 🚀 Características
+- **ZeroGPU**: utiliza GPU bajo demanda, sin necesidad de hardware dedicado.
+- **Entrada multimodal**: imagen + texto.
+- **Salida**: texto descriptivo (en catalán o español).
+- **API REST directa** (`/api/describe_raw`) + **API Gradio** (`/api/predict/describe`).
+- Compatible con clientes HTTP (`requests`) o `gradio_client`.
+---
+## 🧠 Modelo
+- **Modelo:** `BSC-LT/salamandra-7b-vision`
+- **Arquitectura:** LLaVA-OneVision 7B
+- **Framework:** PyTorch + Transformers
+- **Capa de entrada:** `AutoProcessor`
+- **Generación:** `LlavaOnevisionForConditionalGeneration`
+El modelo combina visión y lenguaje para generar texto a partir de imágenes, siguiendo el esquema de conversación (“chat template”) oficial de OneVision.
+---
+## ⚙️ Configuración del Space
+**Hardware:** ZeroGPU
+**SDK:** Gradio
+**Archivo principal:** `app.py`
+**Requisitos:** `requirements.txt`
+Ejemplo del bloque de configuración YAML (este ya está en la cabecera del README):
+```yaml
+---
+title: Salamandra-Vision 7B · ZeroGPU
+emoji: 🦎
+colorFrom: purple
+colorTo: indigo
+sdk: gradio
+sdk_version: "4.44.0"
+app_file: app.py
+pinned: false
+---