YAML Metadata
Warning:
empty or missing yaml metadata in repo card
(https://huggingface.co/docs/hub/model-cards#model-card-metadata)
Kyutai TTS Handler pour Hugging Face Endpoints
Déploiement rapide
Créez un nouveau repo sur Hugging Face :
daiemon12/kyutai-tts-endpointUploadez ces fichiers :
handler.pyrequirements.txtREADME.md
Configuration de l'endpoint :
Model Repository: daiemon12/kyutai-tts-endpoint
Hardware: Intel Sapphire Rapids - 8 vCPUs · 16 GB
($0.268/h)
Ou mieux (recommandé pour production):
Hardware: NVIDIA T4 · 16GB VRAM
(~$0.60/h mais BEAUCOUP plus rapide)
Security: Protected ✅
Autoscaling: 0 to 2 replicas
Scale-to-zero: après 60 min ✅
Utilisation
import requests
response = requests.post(
"https://xxxxx.endpoints.huggingface.cloud",
headers={"Authorization": f"Bearer {HF_TOKEN}"},
json={
"inputs": "Bonjour, ceci est un test de synthèse vocale.",
"parameters": {
"language": "fr", # ou "en", ou "auto"
"speed": 1.0
}
}
)
audio_base64 = response.json()["audio"]
Performances attendues
- Latence première requête : ~10-15s (chargement modèle)
- Latence suivantes : 200-400ms
- Qualité : État de l'art pour FR/EN
- Streaming : 220ms du texte au premier audio
Alternative simple
Si vous voulez tester rapidement sans créer de repo :
- Allez sur https://huggingface.co/spaces
- Duplicate un Space TTS existant
- Modifiez pour utiliser Kyutai
Mais pour production, utilisez l'endpoint avec ce handler !
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support