Spaces:

Ryanus
/

CoquiTTS

Sleeping

App Files Files Community

Ryanus commited on Jun 28, 2025

Commit

7702694

verified ·

1 Parent(s): 13b063e

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -6

app.py CHANGED Viewed

@@ -4,6 +4,10 @@ import gradio as gr
 import os
 import tempfile
 # --- 解決 Coqui TTS 授權同意問題 ---
 os.environ["COQUI_TOS_AGREED"] = "1"
@@ -15,7 +19,6 @@ from TTS.config.shared_configs import BaseDatasetConfig
 from TTS.tts.models.xtts import XttsArgs
 try:
-    # 將所有可能導致問題的類都加入白名單
     torch.serialization.add_safe_globals([XttsConfig, XttsAudioConfig, BaseDatasetConfig, XttsArgs])
     print("已將 XTTS 相關配置類加入 PyTorch 安全全局變數白名單。")
 except Exception as e:
@@ -104,7 +107,7 @@ def generate_speech(text, language, speaker_audio_path):
         return None, "請輸入一些文字！"
     if not language:
         return None, "請選擇一個語言！"
-    if not speaker_audio_path: # 檢查是否提供了語音參考檔案
         return None, "請上傳一個語音參考檔案 (WAV 格式) 來克隆語音！"
     output_file = None
@@ -113,7 +116,6 @@ def generate_speech(text, language, speaker_audio_path):
             output_file = fp.name
         print(f"正在為語言 '{language}' 生成語音，使用語音參考檔案: {speaker_audio_path}...")
-        # 將上傳的語音檔案路徑傳遞給 speaker_wav 參數
         tts.tts_to_file(text=text, language=language, speaker_wav=speaker_audio_path, file_path=output_file)
         print(f"語音已生成到：{output_file}")
@@ -130,11 +132,11 @@ iface = gr.Interface(
     inputs=[
         gr.Textbox(lines=5, label="輸入文字", placeholder="請在這裡輸入你想要轉換成語音的文字..."),
         gr.Dropdown(choices=SUPPORTED_LANGUAGES, label="選擇語言", value="en"),
-        # 新增一個 Audio 輸入組件，用於上傳語音參考檔案
         gr.Audio(
-            type="filepath", # 接收檔案路徑
             label="上傳語音參考檔案 (WAV)",
-            sources=["microphone", "upload"], # 允許從麥克風錄音或上傳檔案
             waveform_options=gr.Audio.WaveformOptions(
                 skip_length=True,
                 show_controls=False,

 import os
 import tempfile
+# --- 打印 Gradio 版本以供診斷 ---
+print(f"Gradio version at runtime: {gr.__version__}")
+# ---
 # --- 解決 Coqui TTS 授權同意問題 ---
 os.environ["COQUI_TOS_AGREED"] = "1"
 from TTS.tts.models.xtts import XttsArgs
 try:
     torch.serialization.add_safe_globals([XttsConfig, XttsAudioConfig, BaseDatasetConfig, XttsArgs])
     print("已將 XTTS 相關配置類加入 PyTorch 安全全局變數白名單。")
 except Exception as e:
         return None, "請輸入一些文字！"
     if not language:
         return None, "請選擇一個語言！"
+    if not speaker_audio_path:
         return None, "請上傳一個語音參考檔案 (WAV 格式) 來克隆語音！"
     output_file = None
             output_file = fp.name
         print(f"正在為語言 '{language}' 生成語音，使用語音參考檔案: {speaker_audio_path}...")
         tts.tts_to_file(text=text, language=language, speaker_wav=speaker_audio_path, file_path=output_file)
         print(f"語音已生成到：{output_file}")
     inputs=[
         gr.Textbox(lines=5, label="輸入文字", placeholder="請在這裡輸入你想要轉換成語音的文字..."),
         gr.Dropdown(choices=SUPPORTED_LANGUAGES, label="選擇語言", value="en"),
         gr.Audio(
+            type="filepath",
             label="上傳語音參考檔案 (WAV)",
+            sources=["microphone", "upload"],
+            # 這裡保留 WaveformOptions，因為我們需要確認 Gradio 版本
             waveform_options=gr.Audio.WaveformOptions(
                 skip_length=True,
                 show_controls=False,