Spaces:

Ryanus
/

CoquiTTS

Sleeping

App Files Files Community

Ryanus commited on Jun 28, 2025

Commit

277f96c

verified ·

1 Parent(s): a403eae

Update app.py

Browse files

Files changed (1) hide show

app.py +18 -11

app.py CHANGED Viewed

@@ -8,19 +8,16 @@ import tempfile
 os.environ["COQUI_TOS_AGREED"] = "1"
 # --- 解決 PyTorch 載入 XTTS-v2 模型時的 WeightsUnpickler 錯誤 ---
-# PyTorch 2.6+ 出於安全考慮，預設在載入模型時會啟用 `weights_only=True`。
-# XTTS-v2 模型檢查點中包含自定義的配置類，這會導致 PyTorch 拒絕載入。
-# 這裡我們將這些類加入 PyTorch 的安全全局變數白名單，告訴 PyTorch 信任它們。
 import torch.serialization
 from TTS.tts.configs.xtts_config import XttsConfig
 from TTS.tts.models.xtts import XttsAudioConfig
 from TTS.config.shared_configs import BaseDatasetConfig
-from TTS.tts.models.xtts import XttsArgs # 新增這行！
 try:
     # 將所有可能導致問題的類都加入白名單
-    torch.serialization.add_safe_globals([XttsConfig, XttsAudioConfig, BaseDatasetConfig, XttsArgs]) # 更新這行！
-    print("已將 XttsConfig, XttsAudioConfig, BaseDatasetConfig 和 XttsArgs 加入 PyTorch 安全全局變數白名單。")
 except Exception as e:
     print(f"警告：無法將安全全局變數加入 PyTorch 白名單: {e}")
     print("如果遇到模型載入錯誤，請檢查 PyTorch 和 TTS 庫版本。")
@@ -91,12 +88,15 @@ SUPPORTED_LANGUAGES = [
     "te",      # Telugu
 ]
 def generate_speech(text, language):
     """
     根據輸入文字和語言生成語音。
-    對於 XTTS-v2，需要指定語言。
-    此版本不包含語音克隆 (speaker_wav) 功能。
     """
     if model_load_error:
         return None, f"應用程式啟動錯誤：{model_load_error}"
@@ -109,13 +109,18 @@ def generate_speech(text, language):
     if not language:
         return None, "請選擇一個語言！"
     output_file = None
     try:
         with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as fp:
             output_file = fp.name
-        print(f"正在為語言 '{language}' 生成語音...")
-        tts.tts_to_file(text=text, language=language, file_path=output_file)
         print(f"語音已生成到：{output_file}")
         return output_file, "語音生成成功！"
@@ -138,9 +143,11 @@ iface = gr.Interface(
     ],
     title="Coqui TTS XTTS-v2 語音生成 (CPU)",
     description="在 Hugging Face Space 上使用 Coqui TTS XTTS-v2 模型將文字轉換為語音。此演示使用 CPU 運行，請注意 XTTS-v2 在 CPU 上運行會非常慢。首次運行時會下載模型。",
-    allow_flagging="never",
 )
 # 啟動 Gradio 應用
 if __name__ == "__main__":
     iface.launch()

 os.environ["COQUI_TOS_AGREED"] = "1"
 # --- 解決 PyTorch 載入 XTTS-v2 模型時的 WeightsUnpickler 錯誤 ---
 import torch.serialization
 from TTS.tts.configs.xtts_config import XttsConfig
 from TTS.tts.models.xtts import XttsAudioConfig
 from TTS.config.shared_configs import BaseDatasetConfig
+from TTS.tts.models.xtts import XttsArgs
 try:
     # 將所有可能導致問題的類都加入白名單
+    torch.serialization.add_safe_globals([XttsConfig, XttsAudioConfig, BaseDatasetConfig, XttsArgs])
+    print("已將 XTTS 相關配置類加入 PyTorch 安全全局變數白名單。")
 except Exception as e:
     print(f"警告：無法將安全全局變數加入 PyTorch 白名單: {e}")
     print("如果遇到模型載入錯誤，請檢查 PyTorch 和 TTS 庫版本。")
     "te",      # Telugu
 ]
+# 定義預設說話者音訊檔案的路徑
+# 請確保你已將 'speaker.wav' 檔案上傳到 Hugging Face Space 的根目錄
+DEFAULT_SPEAKER_WAV = "speaker.wav"
 def generate_speech(text, language):
     """
     根據輸入文字和語言生成語音。
+    對於 XTTS-v2，需要指定語言和 speaker_wav。
+    此版本使用預設的 speaker.wav 檔案。
     """
     if model_load_error:
         return None, f"應用程式啟動錯誤：{model_load_error}"
     if not language:
         return None, "請選擇一個語言！"
+    # 檢查預設說話者音訊檔案是否存在
+    if not os.path.exists(DEFAULT_SPEAKER_WAV):
+        return None, f"錯誤：預設語音參考檔案 ({DEFAULT_SPEAKER_WAV}) 未找到。請確保該檔案已上傳到您的 Hugging Face Space 的根目錄。"
     output_file = None
     try:
         with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as fp:
             output_file = fp.name
+        print(f"正在為語言 '{language}' 生成語音，使用預設語音參考檔案: {DEFAULT_SPEAKER_WAV}...")
+        # 將 DEFAULT_SPEAKER_WAV 作為 speaker_wav 參數傳遞
+        tts.tts_to_file(text=text, language=language, speaker_wav=DEFAULT_SPEAKER_WAV, file_path=output_file)
         print(f"語音已生成到：{output_file}")
         return output_file, "語音生成成功！"
     ],
     title="Coqui TTS XTTS-v2 語音生成 (CPU)",
     description="在 Hugging Face Space 上使用 Coqui TTS XTTS-v2 模型將文字轉換為語音。此演示使用 CPU 運行，請注意 XTTS-v2 在 CPU 上運行會非常慢。首次運行時會下載模型。",
+    # 將 allow_flagging 替換為 flagging_mode 以消除 Gradio 警告
+    flagging_mode="never",
 )
 # 啟動 Gradio 應用
 if __name__ == "__main__":
     iface.launch()