Spaces:

SohomToom
/

DocToAudioConverted

Sleeping

SohomToom commited on May 6, 2025

Commit

ec3daa0

verified ·

1 Parent(s): 74f2f02

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -33,13 +33,25 @@ def load_tts_model(model_key):
     MODEL_CACHE[model_key] = tts
     return tts
 def extract_speakers(model_key):
     info = VOICE_MODELS[model_key]
     if info["multi_speaker"]:
-        tts = load_tts_model(model_key)
-        return list(tts.speakers)
     return []
 def docx_to_wav(doc_file, selected_voice, selected_speaker=None):
     info = VOICE_MODELS[selected_voice]
     tts = load_tts_model(selected_voice)

     MODEL_CACHE[model_key] = tts
     return tts
+# def extract_speakers(model_key):
+#     info = VOICE_MODELS[model_key]
+#     if info["multi_speaker"]:
+#         tts = load_tts_model(model_key)
+#         return list(tts.speakers)
+#     return []
 def extract_speakers(model_key):
     info = VOICE_MODELS[model_key]
     if info["multi_speaker"]:
+        if info["model_name"] == "tts_models/en/vctk/vits":
+            # Common VCTK speakers
+            return ["p225", "p226", "p227", "p228", "p229", "p230", "p231", "p232", "p233", "p234"]
+        else:
+            tts = load_tts_model(model_key)
+            return getattr(tts, "speakers", [])
     return []
 def docx_to_wav(doc_file, selected_voice, selected_speaker=None):
     info = VOICE_MODELS[selected_voice]
     tts = load_tts_model(selected_voice)