YAML Metadata Warning: empty or missing yaml metadata in repo card (https://huggingface.co/docs/hub/model-cards#model-card-metadata)

Kyutai TTS Handler pour Hugging Face Endpoints

Déploiement rapide

  1. Créez un nouveau repo sur Hugging Face : daiemon12/kyutai-tts-endpoint

  2. Uploadez ces fichiers :

    • handler.py
    • requirements.txt
    • README.md
  3. Configuration de l'endpoint :

Model Repository: daiemon12/kyutai-tts-endpoint

Hardware: Intel Sapphire Rapids - 8 vCPUs · 16 GB
($0.268/h)

Ou mieux (recommandé pour production):
Hardware: NVIDIA T4 · 16GB VRAM
(~$0.60/h mais BEAUCOUP plus rapide)

Security: Protected ✅
Autoscaling: 0 to 2 replicas
Scale-to-zero: après 60 min ✅

Utilisation

import requests

response = requests.post(
    "https://xxxxx.endpoints.huggingface.cloud",
    headers={"Authorization": f"Bearer {HF_TOKEN}"},
    json={
        "inputs": "Bonjour, ceci est un test de synthèse vocale.",
        "parameters": {
            "language": "fr",  # ou "en", ou "auto"
            "speed": 1.0
        }
    }
)

audio_base64 = response.json()["audio"]

Performances attendues

  • Latence première requête : ~10-15s (chargement modèle)
  • Latence suivantes : 200-400ms
  • Qualité : État de l'art pour FR/EN
  • Streaming : 220ms du texte au premier audio

Alternative simple

Si vous voulez tester rapidement sans créer de repo :

  1. Allez sur https://huggingface.co/spaces
  2. Duplicate un Space TTS existant
  3. Modifiez pour utiliser Kyutai

Mais pour production, utilisez l'endpoint avec ce handler !

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support