Spaces:

rjzevallos
/

streaming

Runtime error

App Files Files Community

streaming / DEPLOY_STEP_BY_STEP.md

rjzevallos

Whisper Gradio

87071e6 about 2 months ago

preview code

raw

history blame contribute delete

6.75 kB

	# 🚀 Cómo Desplegar tu ASR en Hugging Face Spaces

	## ✅ Estado actual

	Todo está listo en: `/gpfs/projects/bsc88/speech/TTS/repos/Streaming_Mamba/SimulStreaming/space/`

	Archivos del Space:
	- `app.py` → FastAPI + Gradio UI
	- `server_wrapper.py` → Wrapper de SimulWhisper + threading
	- `requirements.txt` → Dependencias Python
	- `Dockerfile` → Configuración del contenedor
	- `.dockerignore` → Archivos a ignorar en Docker
	- `space.yaml` → Configuración metadata del Space
	- `README.md` → Documentación completa
	- `DEPLOYMENT.md` → Guía rápida

	---

	## 📋 Requisitos previos (⏱️ 5 min)

	Antes de empezar, necesitas:

	### 1. Cuenta en Hugging Face
	- Ve a https://huggingface.co y crea una cuenta (si no la tienes)
	- Confirma tu email

	### 2. Generar un token de acceso
	- Accede a https://huggingface.co/settings/tokens
	- Pulsa "New token" → Nombre: `simulstreaming-deploy`
	- Tipo: Write (para poder crear Spaces)
	- Crea el token y cópialo (no lo pierdes)

	### 3. Instalar herramientas en tu máquina local
	```bash
	# Git (si no lo tienes: https://git-scm.com)
	git --version

	# Git LFS (para manejar archivos grandes)
	git lfs install

	# Hugging Face CLI (instala desde pip)
	pip install --upgrade huggingface-hub

	# Verificar
	huggingface-cli --version
	```

	---

	## 🎯 Pasos del despliegue (⏱️ 10 min)

	### PASO 1: Login en Hugging Face desde tu máquina

	```bash
	huggingface-cli login
	```

	Cuando pida el token, pega el que copiaste arriba.

	```
	Token: [pega-tu-token-aquí]
	```

	✅ Verás: `Token is valid. Your credentials have been saved.`

	### PASO 2: Crea un nuevo Space en Hugging Face

	Abre https://huggingface.co/spaces en tu navegador:

	1. Pulsa "Create new Space" (arriba a la derecha)
	2. Rellena:
	- Space name: `simulstreaming-asr` (o tu nombre favorito)
	- License: MIT (cualquiera está bien)
	- SDK: Docker (importante)
	3. Pulsa "Create Space"

	Espera 5 segundos a que se cree. Se abrirá una página con tu Space vacío.

	### PASO 3: Clon el repositorio del Space a tu máquina

	Reemplaza `<tu-usuario>` con tu nombre de usuario en HF:

	```bash
	git clone https://huggingface.co/spaces/<tu-usuario>/simulstreaming-asr
	cd simulstreaming-asr
	```

	Ejemplo si tu usuario es `juan123`:
	```bash
	git clone https://huggingface.co/spaces/juan123/simulstreaming-asr
	cd simulstreaming-asr
	```

	### PASO 4: Copia los archivos del proyecto

	Ejecuta desde dentro del directorio del Space:

	```bash
	# Copiar todos los archivos de la carpeta space
	cp /gpfs/projects/bsc88/speech/TTS/repos/Streaming_Mamba/SimulStreaming/space/* .

	# Verificar que están todos
	ls -la
	```

	Deberías ver:
	```
	.dockerignore
	.gitattributes
	.gitignore
	Dockerfile
	README.md
	DEPLOYMENT.md
	app.py
	server_wrapper.py
	requirements.txt
	space.yaml
	```

	### PASO 5: Versionar en Git

	```bash
	# Dentro del directorio del Space
	git add .
	git commit -m "Initial commit: SimulStreaming ASR with Gradio UI"
	git push
	```

	Importante: Si durante `git push` pide login, usa:
	- Username: tu nombre de usuario en HF
	- Password: el token que copiaste (pégalo aquí)

	### PASO 6: ¡Esperar a que se despliegue!

	Una vez hiciste push, el Space empieza a construirse:

	1. Abre https://huggingface.co/spaces/<tu-usuario>/simulstreaming-asr en el navegador
	2. Verás el estado:
	- 🟡 Building → Construyendo Docker (~3 min)
	- 🟡 Running → Descargando modelo y inicializando (~5-10 min la primera vez)
	- 🟢 Running → ¡Listo! El Space está activo

	Monitorea los logs si hay errores:
	- En la página del Space, busca la sección "Logs" o "Console"
	- Ahí verás qué está pasando

	---

	## ✨ ¡Prueba tu Space!

	Cuando esté verde (Running), haz clic en el botón "Share" → copia la URL pública, o simplemente accede a:

	```
	https://huggingface.co/spaces/<tu-usuario>/simulstreaming-asr
	```

	### En la interfaz:

	1. "Start Recording" → Pulsa para empezar a grabar
	2. Habla cerca del micrófono (permite acceso al micro en tu navegador)
	3. Verás la transcripción en tiempo real en el panel de abajo
	4. "Stop Recording" → Pulsa para terminar

	---

	## 🔧 Personalización (Opcional)

	### Cambiar idioma (p. ej., a Español)

	Edita `space/server_wrapper.py` en tu máquina local:

	Busca la línea:
	```python
	'lan': 'en',
	```

	Cambia a:
	```python
	'lan': 'es', # Español
	```

	Otros idiomas: `'en'` (inglés), `'de'` (alemán), `'fr'` (francés), `'pt'` (portugués), etc.

	Luego:
	```bash
	git add server_wrapper.py
	git commit -m "Change language to Spanish"
	git push
	```

	El Space se actualizará automáticamente.

	### Usar un modelo más pequeño

	Si el Space se queda sin memoria, edita `space/server_wrapper.py`:

	```python
	model_path='./small.pt', # En vez de 'large-v3.pt'
	```

	Tamaños:
	- `tiny.pt` → ~39 MB (rápido, menos precisión)
	- `base.pt` → ~140 MB (buena balance)
	- `small.pt` → ~461 MB (mejor)
	- `medium.pt` → ~1.5 GB (muy bueno)
	- `large-v3.pt` → ~3 GB (mejor, pero pesado)

	---

	## 🐛 Troubleshooting

	\| Problema \| Solución \|
	\|----------\|----------\|
	\| "ImportError: No module named 'simul_whisper'" \| Asegúrate de que `server_wrapper.py` importa desde la ruta correcta. Si el código está en una carpeta diferente, actualiza el import. \|
	\| "Model download timeout" \| El modelo es grande (~3GB). Espera más o usa un modelo más pequeño (`small.pt`). \|
	\| "Out of memory" \| Usa `small.pt` o `tiny.pt` en vez de `large-v3.pt`. \|
	\| No se captura audio \| 1) Asegúrate HTTPS (HF Spaces usa HTTPS). 2) Permite acceso al micrófono en el navegador. 3) Revisa la consola del navegador (F12 → Console) para ver errores JS. \|
	\| "Connection refused" \| El Space está construyéndose o hay error en startup. Espera y revisa los Logs. \|
	\| Transcripción lenta \| Aumenta `min_chunk_size` en `server_wrapper.py` o reduce `audio_max_len`. \|

	---

	## 📚 URLs útiles

	- Tu Space: https://huggingface.co/spaces/<tu-usuario>/simulstreaming-asr
	- Docs de HF Spaces: https://huggingface.co/docs/hub/spaces-overview
	- Docs de Gradio: https://www.gradio.app
	- API referencia FastAPI: https://fastapi.tiangolo.com

	---

	## 🎓 Próximas mejoras (opcional)

	- Mostrar timestamps de cada palabra transcrita
	- Selector de idioma dinámico en la UI
	- Historial de transcripciones guardadas
	- Exportar a SRT o VTT
	- Soporte para traducción (no solo transcripción)

	---

	## 💬 Soporte

	Si tienes problemas:

	1. Revisa los Logs en la página del Space (sección Logs)
	2. Lee el archivo `README.md` para más detalles técnicos
	3. Abre un issue en el repo de `SimulStreaming` o `Whisper Streaming`

	---

	¡Éxito con tu ASR en Spaces! 🚀