Chatterbox-Multilingual-TTS-API

Running

rahul7star commited on Jan 11

Commit

17a0dd0

verified ·

1 Parent(s): d2e46d8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -102,7 +102,6 @@ class TTSPayload(BaseModel):
 # TTS ENDPOINT
 # ===============================
 @app.post("/tts")
 def generate_tts(payload: TTSPayload):
     model = get_or_load_model()
@@ -122,15 +121,20 @@ def generate_tts(payload: TTSPayload):
             final_text[:300],
             language_id=payload.language_id,
         )
-        sr = model.sr  # <-- sample rate from model property
     # Convert numpy -> WAV bytes
     buf = io.BytesIO()
     write_wav(buf, sr, wav.astype(np.float32))
     buf.seek(0)
     audio_bytes = buf.read()
     # Return as base64
     return {
         "sr": sr,
         "audio_base64": base64.b64encode(audio_bytes).decode("utf-8")

 # TTS ENDPOINT
 # ===============================
 @app.post("/tts")
 def generate_tts(payload: TTSPayload):
     model = get_or_load_model()
             final_text[:300],
             language_id=payload.language_id,
         )
+        # convert tensor → numpy
+        wav = wav.squeeze(0).detach().cpu().numpy()
+        sr = model.sr
     # Convert numpy -> WAV bytes
+    import io
+    from scipy.io.wavfile import write as write_wav
     buf = io.BytesIO()
     write_wav(buf, sr, wav.astype(np.float32))
     buf.seek(0)
     audio_bytes = buf.read()
     # Return as base64
+    import base64
     return {
         "sr": sr,
         "audio_base64": base64.b64encode(audio_bytes).decode("utf-8")