Spaces:

Ryanus
/

CoquiTTS

Sleeping

App Files Files Community

Ryanus commited on Jun 28, 2025

Commit

c06d1f2

verified ·

1 Parent(s): bb1a814

Update app.py

Browse files

Files changed (1) hide show

app.py +57 -26

app.py CHANGED Viewed

@@ -105,7 +105,7 @@ os.makedirs(SAVE_DIR, exist_ok=True)
 # --- 結束自動儲存設定 ---
-def generate_speech(text, language, uploaded_speaker_audio_path): # 參數名稱更清晰
     """
     根據輸入文字、語言和語音參考檔案生成語音。
     如果用戶上傳了檔案，則使用上傳的檔案；否則使用預設的 speaker.wav。
@@ -165,31 +165,62 @@ def generate_speech(text, language, uploaded_speaker_audio_path): # 參數名稱
             os.remove(output_file) # 清理臨時檔案
         return None, f"生成語音失敗: {e}"
-# Gradio 介面配置
-iface = gr.Interface(
-    fn=generate_speech,
-    inputs=[
-        gr.Textbox(lines=5, label="輸入文字", placeholder="請在這裡輸入你想要轉換成語音的文字..."),
-        gr.Dropdown(choices=SUPPORTED_LANGUAGES, label="選擇語言", value="en"),
-        # 重新加入 Audio 輸入組件，用於上傳語音參考檔案
-        gr.Audio(
-            type="filepath", # 接收檔案路徑
-            label="上傳語音參考檔案 (WAV) (可選)",
-            sources=["microphone", "upload"], # 允許從麥克風錄音或上傳檔案
-            # 移除 waveform_options 和 info 參數以避免 Gradio 版本兼容性問題
-            # waveform_options=gr.Audio.WaveformOptions(...)
-            # info="請上傳一個清晰的語音檔案 (建議 3-10 秒，WAV 格式) 來克隆語音。",
-        ),
-    ],
-    outputs=[
-        gr.Audio(label="生成的語音", type="filepath"),
-        gr.Textbox(label="狀態")
-    ],
-    title="Coqui TTS XTTS-v2 語音生成 (CPU - 語音克隆 & 預設語音 & 自動儲存)",
-    description="在 Hugging Face Space 上使用 Coqui TTS XTTS-v2 模型將文字轉換為語音。此演示使用 CPU 運行，請注意 XTTS-v2 在 CPU 上運行會非常慢。您可以上傳自己的語音，或使用預設語音。生成的語音將自動儲存到 Space 專案中。",
-    flagging_mode="never",
-)
 # 啟動 Gradio 應用
 if __name__ == "__main__":
-    iface.launch()

 # --- 結束自動儲存設定 ---
+def generate_speech(text, language, uploaded_speaker_audio_path):
     """
     根據輸入文字、語言和語音參考檔案生成語音。
     如果用戶上傳了檔案，則使用上傳的檔案；否則使用預設的 speaker.wav。
             os.remove(output_file) # 清理臨時檔案
         return None, f"生成語音失敗: {e}"
+# --- 新增：查看已儲存語音的功能 ---
+def list_saved_audio_files():
+    """掃描儲存資料夾，返回所有 .wav 檔案的完整路徑列表。"""
+    audio_files = []
+    if os.path.exists(SAVE_DIR) and os.path.isdir(SAVE_DIR):
+        for filename in os.listdir(SAVE_DIR):
+            if filename.lower().endswith(".wav"):
+                audio_files.append(os.path.join(SAVE_DIR, filename))
+    audio_files.sort(key=os.path.getmtime, reverse=True) # 按修改時間倒序排列，最新檔案在前
+    return audio_files
+# --- 結束新增 ---
+# Gradio 介面配置 (使用 gr.Blocks 實現多 Tab 介面)
+with gr.Blocks(title="Coqui TTS XTTS-v2 語音生成") as demo:
+    gr.Markdown("# Coqui TTS XTTS-v2 語音生成 (CPU)")
+    gr.Markdown("此演示使用 CPU 運行，請注意 XTTS-v2 在 CPU 上運行會非常慢。您可以上傳自己的語音，或使用預設語音。生成的語音將自動儲存到 Space 專案中。")
+    with gr.Tab("語音生成"):
+        with gr.Row():
+            with gr.Column():
+                text_input = gr.Textbox(lines=5, label="輸入文字", placeholder="請在這裡輸入你想要轉換成語音的文字...")
+                language_dropdown = gr.Dropdown(choices=SUPPORTED_LANGUAGES, label="選擇語言", value="en")
+                speaker_audio_upload = gr.Audio(
+                    type="filepath",
+                    label="上傳語音參考檔案 (WAV) (可選)",
+                    sources=["microphone", "upload"],
+                    # 移除 waveform_options 和 info 參數以避免 Gradio 版本兼容性問題
+                )
+                generate_button = gr.Button("生成語音")
+            with gr.Column():
+                output_audio = gr.Audio(label="生成的語音", type="filepath")
+                status_textbox = gr.Textbox(label="狀態")
+        # 將生成按鈕與 generate_speech 函數綁定
+        generate_button.click(
+            fn=generate_speech,
+            inputs=[text_input, language_dropdown, speaker_audio_upload],
+            outputs=[output_audio, status_textbox]
+        )
+    with gr.Tab("查看已儲存語音"):
+        gr.Markdown("### 已儲存的語音檔案")
+        gr.Markdown("請注意：每次生成語音並儲存後，Hugging Face Space 會自動重啟，因此您可能需要點擊刷新按鈕來查看最新檔案。")
+        saved_files_output = gr.File(
+            label="已儲存的語音檔案",
+            file_count="multiple", # 允許顯示多個檔案
+            interactive=False # 不允許用戶上傳，只用於顯示和下載
+        )
+        refresh_button = gr.Button("刷新檔案列表")
+        # 應用程式載入時，自動載入檔案列表
+        demo.load(list_saved_audio_files, outputs=[saved_files_output])
+        # 點擊刷新按鈕時，重新載入檔案列表
+        refresh_button.click(list_saved_audio_files, outputs=[saved_files_output])
 # 啟動 Gradio 應用
 if __name__ == "__main__":
+    demo.launch()