Spaces:

Ryanus
/

EdgeTTS

Sleeping

App Files Files Community

Ryanus commited on Jul 7, 2025

Commit

ebd5e0a

verified ·

1 Parent(s): 5cd4332

Update app.py

Browse files

Files changed (1) hide show

app.py +38 -48

app.py CHANGED Viewed

@@ -14,14 +14,12 @@ def generate_unique_filename(folder, prefix="audio", ext="mp3"):
     timestamp = datetime.now().strftime("%Y%m%d_%H%M%S_%f")
     return os.path.join(folder, f"{prefix}_{timestamp}.{ext}")
-# Edge TTS 語音合成
 async def generate_speech(text, voice, rate, pitch, folder=AUDIO_DIR):
     output_file = generate_unique_filename(folder)
     communicate = edge_tts.Communicate(text, voice, rate=rate, pitch=pitch)
     await communicate.save(output_file)
     return output_file
-# 取得 Edge TTS 可用語音
 async def get_voices():
     voices = await edge_tts.list_voices()
     return [voice["ShortName"] for voice in voices]
@@ -34,7 +32,6 @@ def list_saved_podcasts():
     files = sorted(os.listdir(PODCAST_DIR), reverse=True)
     return [os.path.join(PODCAST_DIR, f) for f in files if f.endswith(".mp3")]
-# 單段語音合成介面
 async def tts_interface(text, voice, rate_percentage, pitch_hz):
     rate = f"{'+' if rate_percentage >= 0 else ''}{rate_percentage}%"
     pitch = f"{'+' if pitch_hz >= 0 else ''}{pitch_hz}Hz"
@@ -44,7 +41,6 @@ async def tts_interface(text, voice, rate_percentage, pitch_hz):
 def play_saved_audio(audio_file):
     return audio_file
-# 播客製作：多段腳本合成並拼接、可插入背景音樂
 async def podcast_produce(script_list, voice, rate_percentage, pitch_hz, bgm_file, podcast_title, podcast_desc):
     rate = f"{'+' if rate_percentage >= 0 else ''}{rate_percentage}%"
     pitch = f"{'+' if pitch_hz >= 0 else ''}{pitch_hz}Hz"
@@ -59,21 +55,17 @@ async def podcast_produce(script_list, voice, rate_percentage, pitch_hz, bgm_fil
     if not audio_segments:
         return None
     podcast_audio = sum(audio_segments)
-    # 插入背景音樂（可選）
-    if bgm_file is not None and os.path.isfile(bgm_file):
         bgm = AudioSegment.from_file(bgm_file.name).apply_gain(-10)
         bgm = bgm[:len(podcast_audio)]
         podcast_audio = podcast_audio.overlay(bgm)
-    # 儲存播客音檔
     podcast_file = generate_unique_filename(PODCAST_DIR, prefix="podcast")
     podcast_audio.export(podcast_file, format="mp3")
-    # 儲存元資料
     meta_file = podcast_file.replace(".mp3", ".txt")
     with open(meta_file, "w", encoding="utf-8") as f:
         f.write(f"Title: {podcast_title}\nDescription: {podcast_desc}\n")
     return podcast_file
-# 動態段落管理函數
 def add_paragraph(paragraphs):
     paragraphs.append("")
     return paragraphs
@@ -89,6 +81,10 @@ def clear_paragraphs():
 def clear_textbox():
     return ""
 async def main():
     voices = await get_voices()
     with gr.Blocks(theme=gr.themes.Soft()) as demo:
@@ -117,24 +113,26 @@ async def main():
         with gr.Tab("播客製作"):
             gr.Markdown("### 📝 多段腳本輸入（可自由增減段落）")
-            # 用 state 儲存段落文字
             paragraphs_state = gr.State([""])
-            # 初始一個段落 Textbox
-            paragraph_boxes = []
-            def render_paragraphs(paragraphs):
-                # 回傳多個 Textbox，value 對應段落內容
-                return [gr.Textbox(value=p, label=f"段落{i+1}內容", lines=3, elem_id=f"para_{i}") for i, p in enumerate(paragraphs)]
-            # 初始渲染
-            paragraph_boxes = render_paragraphs(paragraphs_state.value)
             # 按鈕
             add_btn = gr.Button("新增段落")
             remove_btn = gr.Button("刪除段落")
             clear_all_btn = gr.Button("全部清空")
-            # 更新段落文字用
             def update_paragraphs(*texts):
                 return list(texts)
@@ -153,7 +151,6 @@ async def main():
             def on_clear():
                 return [""]
-            # 連結按鈕與狀態
             add_btn.click(on_add, inputs=paragraphs_state, outputs=paragraphs_state)
             remove_btn.click(on_remove, inputs=paragraphs_state, outputs=paragraphs_state)
             clear_all_btn.click(on_clear, outputs=paragraphs_state)
@@ -162,30 +159,9 @@ async def main():
             def on_text_change(*texts):
                 return list(texts)
-            # 這裡用一個 container 放段落 Textbox，之後會更新
-            paragraphs_container = gr.Column()
-            # 用函數渲染段落 Textbox
-            def render_paragraphs_ui(paragraphs):
-                # 清空 container
-                paragraphs_container.clear()
-                boxes = []
-                for i, p in enumerate(paragraphs):
-                    tb = gr.Textbox(value=p, label=f"段落{i+1}內容", lines=3)
-                    boxes.append(tb)
-                    paragraphs_container.append(tb)
-                return boxes
-            # 初始化
-            paragraph_boxes = render_paragraphs_ui(paragraphs_state.value)
-            # 當 paragraphs_state 改變時，重新渲染段落輸入框
-            def on_paragraphs_state_change(paragraphs):
-                # 重新渲染
-                nonlocal paragraph_boxes
-                paragraph_boxes = render_paragraphs_ui(paragraphs)
-                return paragraphs_state
-            paragraphs_state.change(on_paragraphs_state_change, inputs=paragraphs_state, outputs=paragraphs_state)
             # 播客參數輸入
             voice_input2 = gr.Dropdown(voices, label="選擇語音", value="zh-CN-XiaoxiaoNeural")
@@ -197,13 +173,27 @@ async def main():
             podcast_btn = gr.Button("生成播客")
             podcast_output = gr.Audio(type="filepath", label="生成的播客音檔")
-            # 合成播客按鈕事件
-            def gather_paragraph_texts(*args):
-                return list(args)
-            # podcast_btn 觸發時，先收集所有段落文字，再呼叫播客合成
             def on_podcast_btn_click(*args):
-                # args: 段落文字 + 參數
                 n = len(paragraph_boxes)
                 scripts = list(args[:n])
                 voice = args[n]

     timestamp = datetime.now().strftime("%Y%m%d_%H%M%S_%f")
     return os.path.join(folder, f"{prefix}_{timestamp}.{ext}")
 async def generate_speech(text, voice, rate, pitch, folder=AUDIO_DIR):
     output_file = generate_unique_filename(folder)
     communicate = edge_tts.Communicate(text, voice, rate=rate, pitch=pitch)
     await communicate.save(output_file)
     return output_file
 async def get_voices():
     voices = await edge_tts.list_voices()
     return [voice["ShortName"] for voice in voices]
     files = sorted(os.listdir(PODCAST_DIR), reverse=True)
     return [os.path.join(PODCAST_DIR, f) for f in files if f.endswith(".mp3")]
 async def tts_interface(text, voice, rate_percentage, pitch_hz):
     rate = f"{'+' if rate_percentage >= 0 else ''}{rate_percentage}%"
     pitch = f"{'+' if pitch_hz >= 0 else ''}{pitch_hz}Hz"
 def play_saved_audio(audio_file):
     return audio_file
 async def podcast_produce(script_list, voice, rate_percentage, pitch_hz, bgm_file, podcast_title, podcast_desc):
     rate = f"{'+' if rate_percentage >= 0 else ''}{rate_percentage}%"
     pitch = f"{'+' if pitch_hz >= 0 else ''}{pitch_hz}Hz"
     if not audio_segments:
         return None
     podcast_audio = sum(audio_segments)
+    if bgm_file is not None and os.path.isfile(bgm_file.name):
         bgm = AudioSegment.from_file(bgm_file.name).apply_gain(-10)
         bgm = bgm[:len(podcast_audio)]
         podcast_audio = podcast_audio.overlay(bgm)
     podcast_file = generate_unique_filename(PODCAST_DIR, prefix="podcast")
     podcast_audio.export(podcast_file, format="mp3")
     meta_file = podcast_file.replace(".mp3", ".txt")
     with open(meta_file, "w", encoding="utf-8") as f:
         f.write(f"Title: {podcast_title}\nDescription: {podcast_desc}\n")
     return podcast_file
 def add_paragraph(paragraphs):
     paragraphs.append("")
     return paragraphs
 def clear_textbox():
     return ""
+def render_paragraphs(paragraphs):
+    # 回傳一組 Textbox 的 dict，方便動態更新
+    return {f"para_{i}": p for i, p in enumerate(paragraphs)}
 async def main():
     voices = await get_voices()
     with gr.Blocks(theme=gr.themes.Soft()) as demo:
         with gr.Tab("播客製作"):
             gr.Markdown("### 📝 多段腳本輸入（可自由增減段落）")
             paragraphs_state = gr.State([""])
+            # 動態產生多個 Textbox，並用 dictionary 存放元件
+            paragraph_textboxes = {}
+            def render_paragraph_boxes(paragraphs):
+                boxes = {}
+                for i, p in enumerate(paragraphs):
+                    boxes[f"para_{i}"] = gr.Textbox(value=p, label=f"段落{i+1}內容", lines=3)
+                return boxes
+            paragraph_textboxes = render_paragraph_boxes(paragraphs_state.value)
             # 按鈕
             add_btn = gr.Button("新增段落")
             remove_btn = gr.Button("刪除段落")
             clear_all_btn = gr.Button("全部清空")
+            # 更新段落文字
             def update_paragraphs(*texts):
                 return list(texts)
             def on_clear():
                 return [""]
             add_btn.click(on_add, inputs=paragraphs_state, outputs=paragraphs_state)
             remove_btn.click(on_remove, inputs=paragraphs_state, outputs=paragraphs_state)
             clear_all_btn.click(on_clear, outputs=paragraphs_state)
             def on_text_change(*texts):
                 return list(texts)
+            # 將段落文字元件放入列表，方便傳入合成函數
+            def get_paragraph_values(*args):
+                return list(args)
             # 播客參數輸入
             voice_input2 = gr.Dropdown(voices, label="選擇語音", value="zh-CN-XiaoxiaoNeural")
             podcast_btn = gr.Button("生成播客")
             podcast_output = gr.Audio(type="filepath", label="生成的播客音檔")
+            # 動態建立段落輸入元件區塊
+            with gr.Column() as paragraphs_container:
+                def build_paragraph_boxes(paragraphs):
+                    boxes = []
+                    for i, p in enumerate(paragraphs):
+                        tb = gr.Textbox(value=p, label=f"段落{i+1}內容", lines=3)
+                        boxes.append(tb)
+                    return boxes
+                paragraph_boxes = build_paragraph_boxes(paragraphs_state.value)
+            # 重新渲染段落輸入框
+            def rerender_paragraph_boxes(paragraphs):
+                nonlocal paragraph_boxes
+                paragraph_boxes = build_paragraph_boxes(paragraphs)
+                return paragraph_boxes
+            paragraphs_state.change(rerender_paragraph_boxes, inputs=paragraphs_state, outputs=paragraph_boxes)
+            # 播客合成按鈕事件
             def on_podcast_btn_click(*args):
                 n = len(paragraph_boxes)
                 scripts = list(args[:n])
                 voice = args[n]