Spaces:

asbgig
/

talkclone

Running

App Files Files Community

asbgig commited on Aug 22, 2025

Commit

1c8e78d

verified ·

1 Parent(s): a4b0424

Update app.py

Browse files

Files changed (1) hide show

app.py +29 -42

app.py CHANGED Viewed

@@ -10,55 +10,40 @@ os.environ.setdefault("COQUI_TOS_AGREED", "1")
 MODEL_NAME = "tts_models/multilingual/multi-dataset/xtts_v2"
-# Lazy-load TTS so the Space starts quickly and fails less often
 _tts = None
 def get_tts():
     global _tts
     if _tts is not None:
         return _tts
-    # Try GPU if torch+CUDA is present; otherwise fall back to CPU.
     try:
         import torch
         use_gpu = torch.cuda.is_available()
     except Exception:
         use_gpu = False
     from TTS.api import TTS
     try:
-        # Some versions accept gpu=…
         _tts = TTS(MODEL_NAME, gpu=use_gpu)
     except TypeError:
         _tts = TTS(MODEL_NAME)
     return _tts
 LANGS = [
-    ("English", "en"),
-    ("Urdu", "ur"),
-    ("Hindi", "hi"),
-    ("Arabic", "ar"),
-    ("French", "fr"),
-    ("German", "de"),
-    ("Spanish", "es"),
-    ("Italian", "it"),
-    ("Portuguese", "pt"),
-    ("Turkish", "tr"),
 ]
 def clean_text(t: str) -> str:
     return " ".join((t or "").strip().split())
 def synth_to_file_safe(tts, txt, out_path, wav_path, lang, speed):
-    # XTTS variants differ on "speed" support
     try:
-        tts.tts_to_file(
-            text=txt, file_path=out_path,
-            speaker_wav=wav_path, language=lang, speed=speed
-        )
     except TypeError:
-        tts.tts_to_file(
-            text=txt, file_path=out_path,
-            speaker_wav=wav_path, language=lang
-        )
 def tts_clone(text, ref_audio, language_code, speed, split_sentences, progress=gr.Progress(track_tqdm=True)):
     if ref_audio is None:
@@ -70,11 +55,9 @@ def tts_clone(text, ref_audio, language_code, speed, split_sentences, progress=g
     wav_path = ref_audio
     chunks = [text]
     if split_sentences:
-        # Split on sentence boundaries including Urdu/Arabic punctuation
         chunks = [s.strip() for s in re.split(r'(?<=[.!?؟۔])\s+', text) if s.strip()]
     tts = get_tts()
     out_wavs = []
     with tempfile.TemporaryDirectory() as td:
         for i, chunk in enumerate(chunks, 1):
@@ -94,14 +77,11 @@ def tts_clone(text, ref_audio, language_code, speed, split_sentences, progress=g
         sf.write(final_path, final_data, sr)
         return final_path
-# ---- Minimal CSS: one column + hide footer / badges / settings
 HIDE_CSS = """
-/* compact one-column center */
 .gradio-container { max-width: 880px !important; margin: 0 auto; }
-/* hide footer & badges & embed/info areas */
 footer, .footer, #footer, [data-testid="block-analytics"], [data-testid="embed-info"] { display:none !important; }
 a[href*="gradio.live"], a[href*="gradio.app"], a[href*="hf.space"] { display:none !important; }
-/* hide settings button in many themes */
 button[aria-label="Settings"] { display:none !important; }
 """
@@ -117,7 +97,8 @@ with gr.Blocks(
     )
     ref_audio = gr.Audio(label="Reference Voice (WAV/MP3)", type="filepath")
-    language = gr.Dropdown(choices=LANGS, value="en", label="Language")
     text = gr.Textbox(label="Text", lines=6, placeholder="Type or paste your text here…")
     speed = gr.Slider(0.7, 1.3, value=1.0, step=0.05, label="Speed")
     split = gr.Checkbox(value=True, label="Auto split long text by sentence")
@@ -130,18 +111,24 @@ with gr.Blocks(
         path = tts_clone(text, ref_audio, language, speed, split)
         return path, path
-    submit.click(
-        run_and_return,
-        inputs=[text, ref_audio, language, speed, split],
-        outputs=[output, download]
-    )
 if __name__ == "__main__":
-    # IMPORTANT on Spaces: bind to the port Spaces gives you
     port = int(os.environ.get("PORT", "7860"))
-    demo.queue(concurrency_count=1).launch(
-        server_name="0.0.0.0",
-        server_port=port,
-        show_error=True,
-        show_api=False,
-    )

 MODEL_NAME = "tts_models/multilingual/multi-dataset/xtts_v2"
 _tts = None
 def get_tts():
+    """Lazy-load TTS; try GPU if available, else CPU."""
     global _tts
     if _tts is not None:
         return _tts
     try:
         import torch
         use_gpu = torch.cuda.is_available()
     except Exception:
         use_gpu = False
     from TTS.api import TTS
     try:
         _tts = TTS(MODEL_NAME, gpu=use_gpu)
     except TypeError:
         _tts = TTS(MODEL_NAME)
     return _tts
 LANGS = [
+    ("English", "en"), ("Urdu", "ur"), ("Hindi", "hi"), ("Arabic", "ar"),
+    ("French", "fr"), ("German", "de"), ("Spanish", "es"), ("Italian", "it"),
+    ("Portuguese", "pt"), ("Turkish", "tr"),
 ]
 def clean_text(t: str) -> str:
     return " ".join((t or "").strip().split())
 def synth_to_file_safe(tts, txt, out_path, wav_path, lang, speed):
     try:
+        tts.tts_to_file(text=txt, file_path=out_path,
+                        speaker_wav=wav_path, language=lang, speed=speed)
     except TypeError:
+        tts.tts_to_file(text=txt, file_path=out_path,
+                        speaker_wav=wav_path, language=lang)
 def tts_clone(text, ref_audio, language_code, speed, split_sentences, progress=gr.Progress(track_tqdm=True)):
     if ref_audio is None:
     wav_path = ref_audio
     chunks = [text]
     if split_sentences:
         chunks = [s.strip() for s in re.split(r'(?<=[.!?؟۔])\s+', text) if s.strip()]
     tts = get_tts()
     out_wavs = []
     with tempfile.TemporaryDirectory() as td:
         for i, chunk in enumerate(chunks, 1):
         sf.write(final_path, final_data, sr)
         return final_path
+# One-column & hide footer/API/settings
 HIDE_CSS = """
 .gradio-container { max-width: 880px !important; margin: 0 auto; }
 footer, .footer, #footer, [data-testid="block-analytics"], [data-testid="embed-info"] { display:none !important; }
 a[href*="gradio.live"], a[href*="gradio.app"], a[href*="hf.space"] { display:none !important; }
 button[aria-label="Settings"] { display:none !important; }
 """
     )
     ref_audio = gr.Audio(label="Reference Voice (WAV/MP3)", type="filepath")
+    # Use codes to avoid tuple issues in some Gradio builds
+    language = gr.Dropdown(choices=[code for _, code in LANGS], value="en", label="Language")
     text = gr.Textbox(label="Text", lines=6, placeholder="Type or paste your text here…")
     speed = gr.Slider(0.7, 1.3, value=1.0, step=0.05, label="Speed")
     split = gr.Checkbox(value=True, label="Auto split long text by sentence")
         path = tts_clone(text, ref_audio, language, speed, split)
         return path, path
+    submit.click(run_and_return,
+                 inputs=[text, ref_audio, language, speed, split],
+                 outputs=[output, download])
 if __name__ == "__main__":
     port = int(os.environ.get("PORT", "7860"))
+    try:
+        demo.queue().launch(
+            server_name="0.0.0.0",
+            server_port=port,
+            show_error=True,
+            show_api=False,
+        )
+    except TypeError:
+        # For very old/new Gradio where queue() signature differs
+        demo.launch(
+            server_name="0.0.0.0",
+            server_port=port,
+            show_error=True,
+            show_api=False,
+        )