Spaces:

randusertry
/

TTS

Sleeping

App Files Files Community

randusertry commited on 29 days ago

Commit

ae4e7e6

verified ·

1 Parent(s): 3387383

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -19

app.py CHANGED Viewed

@@ -61,46 +61,42 @@ class TTSRequest(BaseModel):
     gender: str
 @app.post("/tts")
-async def tts_post(request: TTSRequest):
     try:
         lang_code = request.language.lower()
-        gender_req = request.gender.lower()
-        # 1. Get the language entry
         lang_entry = VOICE_MAP.get(lang_code)
         if not lang_entry:
             raise HTTPException(status_code=400, detail=f"Language '{lang_code}' not supported.")
-        # 2. Determine which model file to use
         if lang_entry["gendered"]:
-            # If gendered, try to get the requested gender
-            model_name = lang_entry.get(gender_req)
-            if not model_name:
-                # Fallback to male if requested gender isn't found in a gendered set
-                model_name = lang_entry["male"]
         else:
-            # If not gendered, use the default key
             model_name = lang_entry["default"]
-        # 3. Load and Synthesize
         voice = get_voice(model_name)
         wav_buffer = io.BytesIO()
         with wave.open(wav_buffer, "wb") as wav_file:
-            # Piper yields raw PCM; you must set these params manually
-            wav_file.setnchannels(1)  # Mono
             wav_file.setsampwidth(2)  # 16-bit
             wav_file.setframerate(voice.config.sample_rate)
-            # Synthesize returns an iterator of audio chunks
-            for audio_bytes in voice.synthesize(request.text):
-                wav_file.writeframes(audio_bytes)
         wav_buffer.seek(0)
         return Response(content=wav_buffer.getvalue(), media_type="audio/wav")
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
 @app.get("/health")
 def home():
     return {"status": "Piper TTS is running"}

     gender: str
 @app.post("/tts")
+def tts_post(request: TTSRequest): # Removed 'async' to prevent event loop blocking
     try:
         lang_code = request.language.lower()
         lang_entry = VOICE_MAP.get(lang_code)
         if not lang_entry:
             raise HTTPException(status_code=400, detail=f"Language '{lang_code}' not supported.")
+        # Determine model name
         if lang_entry["gendered"]:
+            model_name = lang_entry.get(request.gender.lower(), lang_entry["male"])
         else:
             model_name = lang_entry["default"]
         voice = get_voice(model_name)
+        # Create an in-memory buffer for the WAV file
         wav_buffer = io.BytesIO()
         with wave.open(wav_buffer, "wb") as wav_file:
+            wav_file.setnchannels(1)  # Piper is mono
             wav_file.setsampwidth(2)  # 16-bit
             wav_file.setframerate(voice.config.sample_rate)
+            # THE FIX: Access chunk.audio to get the bytes
+            for chunk in voice.synthesize(request.text):
+                wav_file.writeframes(chunk.audio)
         wav_buffer.seek(0)
         return Response(content=wav_buffer.getvalue(), media_type="audio/wav")
     except Exception as e:
+        # This will now catch and print the specific error to your logs
+        print(f"Error during TTS: {e}")
         raise HTTPException(status_code=500, detail=str(e))
 @app.get("/health")
 def home():
     return {"status": "Piper TTS is running"}