BexttsStream

Running on Zero

App Files Files Community

archivartaunik commited on Nov 14, 2025

Commit

1e2af94

verified ·

1 Parent(s): 3350e70

Update app.py

Browse files

Files changed (1) hide show

app.py +16 -20

app.py CHANGED Viewed

@@ -73,16 +73,15 @@ tokenizer = VoiceBpeTokenizer(vocab_file=vocab_file)
 XTTS_MODEL.tokenizer = tokenizer
 # ---------------------------------------------------------
-# 4) Патокавая TTS-функцыя (генератар)
 # ---------------------------------------------------------
 @spaces.GPU(duration=60)
 def text_to_speech(belarusian_story, speaker_audio_file=None):
     """
     STREAMING-выхад для gr.Audio:
-      - на кожным кроку yield (sample_rate, waveform_float32_cumulative)
       - у фінале yield шлях да temp-файла з поўным WAV (для загрузкі)
-    Gradio з autoplay=True пачынае прайграванне адразу пасля першага чанка.
-    Звярніце ўвагу: у некаторых браўзерах можа запатрабавацца 1-е ўзаемадзеянне карыстальніка (клік).
     """
     if not belarusian_story or str(belarusian_story).strip() == "":
         raise gr.Error("Увядзі хоць нейкі тэкст 🙂")
@@ -120,9 +119,8 @@ def text_to_speech(belarusian_story, speaker_audio_file=None):
     except Exception as e:
         raise gr.Error(f"Памылка пры падзеле тэксту на сказы: {e}")
-    running_total = None
-    # Важна хутка аддаць 1-ы чанк — гэта спрацуе autoplay
     for text in tqdm(tts_texts):
         try:
             with torch.no_grad():
@@ -138,25 +136,23 @@ def text_to_speech(belarusian_story, speaker_audio_file=None):
                     top_p=0.3,
                 )
             cur = wav_chunk["wav"].astype(np.float32)
-            if running_total is None:
-                running_total = cur
-            else:
-                running_total = np.concatenate([running_total, cur], axis=0)
-            # STREAM: вяртаем назапашаны аўдыя-сігнал
-            yield (sampling_rate, running_total)
         except Exception as e:
             raise gr.Error(f"Памылка пры генерырацыі аўдыя: {e}")
-    if running_total is None:
         raise gr.Error("Нічога не згенеравана. Праверце ўваходныя даныя.")
     # Фінальны WAV у temp-файл — каб можна было спампаваць
     try:
         temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".wav")
-        write(temp_file.name, sampling_rate, running_total)
         yield temp_file.name
     except Exception as e:
         raise gr.Error(f"Памылка пры запісе фінальнага WAV: {e}")
@@ -202,7 +198,7 @@ analytics_script = """
 """
 # ---------------------------------------------------------
-# 6) Gradio UI (autoplay у выхадным Audio)
 # ---------------------------------------------------------
 with gr.Blocks() as demo:
     gr.HTML(analytics_script)
@@ -217,13 +213,13 @@ with gr.Blocks() as demo:
             ),
         ],
         outputs=gr.Audio(
-            type="filepath",   # падтрымлівае і (sr, ndarray), і фінальны шлях
             label="Згенераванае аўдыя (патокава)",
-            autoplay=True,     # 🔊 аўтаматычнае прайграванне
         ),
-        title="Belarusian TTS Demo — Streaming (Autoplay)",
         description="""
-        <p>Увядзіце тэкст — і аўдыя будзе адлюстроўвацца <b>па меры сінтэзу</b> з аўтапрайграваннем.</p>
         <p>Калі браўзер блакуе autoplay, зрабіце адзін клік па старонцы/кнопцы — і далей будзе прайгравацца аўтаматычна.</p>
         """,
         examples=examples,

 XTTS_MODEL.tokenizer = tokenizer
 # ---------------------------------------------------------
+# 4) Патокавая TTS-функцыя: yield ТОЛЬКІ НОВЫ ЧАНК
 # ---------------------------------------------------------
 @spaces.GPU(duration=60)
 def text_to_speech(belarusian_story, speaker_audio_file=None):
     """
     STREAMING-выхад для gr.Audio:
+      - на кожным кроку yield (sample_rate, waveform_float32_chunk) — ТОЛЬКІ новы кавалак
+      - Gradio будзе прайграваць чаргой, як адно суцэльнае аўдыя
       - у фінале yield шлях да temp-файла з поўным WAV (для загрузкі)
     """
     if not belarusian_story or str(belarusian_story).strip() == "":
         raise gr.Error("Увядзі хоць нейкі тэкст 🙂")
     except Exception as e:
         raise gr.Error(f"Памылка пры падзеле тэксту на сказы: {e}")
+    all_chunks = []  # для фінальнага WAV
     for text in tqdm(tts_texts):
         try:
             with torch.no_grad():
                     top_p=0.3,
                 )
             cur = wav_chunk["wav"].astype(np.float32)
+            all_chunks.append(cur)
+            # STREAM: аддаём ТОЛЬКІ гэты чанк — франтэнд дадасць яго да плэйбэку
+            yield (sampling_rate, cur)
         except Exception as e:
             raise gr.Error(f"Памылка пры генерырацыі аўдыя: {e}")
+    if not all_chunks:
         raise gr.Error("Нічога не згенеравана. Праверце ўваходныя даныя.")
     # Фінальны WAV у temp-файл — каб можна было спампаваць
     try:
+        final_audio = np.concatenate(all_chunks, axis=0)
         temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".wav")
+        write(temp_file.name, sampling_rate, final_audio)
+        # Апошні yield — шлях да файла для загрузкі
         yield temp_file.name
     except Exception as e:
         raise gr.Error(f"Памылка пры запісе фінальнага WAV: {e}")
 """
 # ---------------------------------------------------------
+# 6) Gradio UI: autoplay = True (першы чанк запускае прайграванне)
 # ---------------------------------------------------------
 with gr.Blocks() as demo:
     gr.HTML(analytics_script)
             ),
         ],
         outputs=gr.Audio(
+            type="filepath",   # прымае як (sr, ndarray) для патоку, так і шлях да фінальнага файла
             label="Згенераванае аўдыя (патокава)",
+            autoplay=True,     # 🔊 аўтапрайграванне з 1-га чанка; наступныя чанкі дадаюцца без рэстарту
         ),
+        title="Belarusian TTS Demo — Streaming (No-Restart, Autoplay)",
         description="""
+        <p>Аўдыя ідзе <b>бесперапынна</b>: кожны новы чанк дадаецца ў канец, без перазапуску з пачатку.</p>
         <p>Калі браўзер блакуе autoplay, зрабіце адзін клік па старонцы/кнопцы — і далей будзе прайгравацца аўтаматычна.</p>
         """,
         examples=examples,