arwin0727's picture
Upload folder using huggingface_hub
3303abf verified
# Servidor
Esta página cubre la inferencia del lado del servidor para Fish Audio S2, además de enlaces rápidos para la inferencia con WebUI y el despliegue con Docker.
## Inferencia del servidor API
Fish Speech proporciona un punto de entrada de servidor HTTP en `tools/api_server.py`.
### Iniciar el servidor localmente
```bash
python tools/api_server.py \
--llama-checkpoint-path checkpoints/s2-pro \
--decoder-checkpoint-path checkpoints/s2-pro/codec.pth \
--listen 0.0.0.0:8080
```
Opciones comunes:
* `--compile`: habilitar optimización con `torch.compile`
* `--half`: usar modo fp16
* `--api-key`: requerir autenticación mediante bearer token
* `--workers`: establecer la cantidad de procesos worker
### Verificación de estado (health check)
```bash
curl -X GET http://127.0.0.1:8080/v1/health
```
Respuesta esperada:
```json
{"status":"ok"}
```
### Endpoint principal de la API
* `POST /v1/tts` para generación de texto a voz (text-to-speech)
* `POST /v1/vqgan/encode` para codificación VQ
* `POST /v1/vqgan/decode` para decodificación VQ
### Ejemplo de cliente en Python
El modelo base de TTS se selecciona al iniciar el servidor. En el ejemplo anterior, el servidor se inicia con los pesos `checkpoints/s2-pro`, por lo que cada request enviada a `http://127.0.0.1:8080/v1/tts` usará **S2-Pro** automáticamente. No existe un campo `model` por request en `tools/api_client.py` para llamadas al servidor local.
```bash
python tools/api_client.py \
--url http://127.0.0.1:8080/v1/tts \
--text "Hello from Fish Speech" \
--output s2-pro-demo
```
Si quieres seleccionar una voz de referencia guardada, usa `--reference_id`. Esto elige la **referencia de voz**, no el modelo base TTS:
```bash
python tools/api_client.py \
--url http://127.0.0.1:8080/v1/tts \
--text "Hello from Fish Speech" \
--reference_id my-speaker \
--output s2-pro-demo
```
## Inferencia con WebUI
Para uso con WebUI, ver:
* [WebUI Inference](https://speech.fish.audio/inference/#webui-inference)
## Docker
Para despliegue del servidor o WebUI basado en Docker, ver:
* [Docker Setup](https://speech.fish.audio/install/#docker-setup)
También puedes iniciar directamente el perfil del servidor con Docker Compose:
```bash
docker compose --profile server up
```