Spaces:

Ryanus
/

CoquiTTS

Sleeping

App Files Files Community

Ryanus commited on Jun 28, 2025

Commit

c3169a7

verified ·

1 Parent(s): bdb3c1a

Create app.py

Browse files

Files changed (1) hide show

app.py +120 -0

app.py ADDED Viewed

	@@ -0,0 +1,120 @@

+import torch
+from TTS.api import TTS
+import gradio as gr
+import os
+import tempfile
+# 檢查是否有 CUDA 可用，否則使用 CPU
+device = "cuda" if torch.cuda.is_available() else "cpu"
+print(f"使用設備: {device}")
+# 初始化 TTS 模型
+# 這裡我們使用 XTTS-v2 模型。
+# 首次運行時，模型會自動下載。
+# 請注意：XTTS-v2 在 CPU 上的推理速度會非常慢！
+try:
+    tts = TTS(model_name="tts_models/multilingual/multi-dataset/xtts_v2", progress_bar=True).to(device)
+    print("Coqui TTS XTTS-v2 模型已成功載入。")
+except Exception as e:
+    print(f"載入 Coqui TTS XTTS-v2 模型時發生錯誤: {e}")
+    print("請確保你的網路連接正常，並且模型名稱正確。")
+    exit()
+# XTTS-v2 支援的語言列表
+# 這些是模型訓練時支援的語言，你可以根據需要增減。
+# 這裡列出一些常見的語言代碼。
+SUPPORTED_LANGUAGES = [
+    "en",  # English
+    "zh-cn", # Chinese (Simplified)
+    "es",  # Spanish
+    "fr",  # French
+    "de",  # German
+    "it",  # Italian
+    "pt",  # Portuguese
+    "pl",  # Polish
+    "ru",  # Russian
+    "ja",  # Japanese
+    "ko",  # Korean
+    "ar",  # Arabic
+    "hi",  # Hindi
+    "tr",  # Turkish
+    "nl",  # Dutch
+    "sv",  # Swedish
+    "da",  # Danish
+    "fi",  # Finnish
+    "no",  # Norwegian
+    "cs",  # Czech
+    "hu",  # Hungarian
+    "el",  # Greek
+    "uk",  # Ukrainian
+    "vi",  # Vietnamese
+    "th",  # Thai
+    "id",  # Indonesian
+    "ms",  # Malay
+    "ro",  # Romanian
+    "sk",  # Slovak
+    "hr",  # Croatian
+    "bg",  # Bulgarian
+    "ca",  # Catalan
+    "fa",  # Persian
+    "he",  # Hebrew
+    "ur",  # Urdu
+    "bn",  # Bengali
+    "gu",  # Gujarati
+    "kn",  # Kannada
+    "ml",  # Malayalam
+    "mr",  # Marathi
+    "pa",  # Punjabi
+    "ta",  # Tamil
+    "te",  # Telugu
+]
+def generate_speech(text, language):
+    """
+    根據輸入文字和語言生成語音。
+    對於 XTTS-v2，需要指定語言。
+    此版本不包含語音克隆 (speaker_wav) 功能。
+    """
+    if not text:
+        return None, "請輸入一些文字！"
+    if not language:
+        return None, "請選擇一個語言！"
+    output_file = None
+    try:
+        # 創建一個臨時檔案來保存生成的音訊
+        with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as fp:
+            output_file = fp.name
+        # XTTS-v2 需要指定語言
+        # 如果沒有提供 speaker_wav，模型會使用其內建的預設語音來合成。
+        tts.tts_to_file(text=text, language=language, file_path=output_file)
+        return output_file, "語音生成成功！"
+    except Exception as e:
+        print(f"生成語音時發生錯誤: {e}")
+        if output_file and os.path.exists(output_file):
+            os.remove(output_file) # 清理臨時檔案
+        return None, f"生成語音失敗: {e}"
+# Gradio 介面
+iface = gr.Interface(
+    fn=generate_speech,
+    inputs=[
+        gr.Textbox(lines=5, label="輸入文字", placeholder="請在這裡輸入你想要轉換成語音的文字..."),
+        gr.Dropdown(choices=SUPPORTED_LANGUAGES, label="選擇語言", value="en"), # 預設為英文
+    ],
+    outputs=[
+        gr.Audio(label="生成的語音", type="filepath"),
+        gr.Textbox(label="狀態")
+    ],
+    title="Coqui TTS XTTS-v2 語音生成 (CPU)",
+    description="在 Hugging Face Space 上使用 Coqui TTS XTTS-v2 模型將文字轉換為語音。此演示使用 CPU 運行，請注意 XTTS-v2 在 CPU 上運行會非常慢。首次運行時會下載模型。",
+    allow_flagging="never",
+)
+# 啟動 Gradio 應用
+if __name__ == "__main__":
+    iface.launch()