Spaces:

johnwang2026
/

voice

Runtime error

App Files Files Community

johnwang2026 commited on Oct 29, 2025

Commit

4ce7c67

verified ·

1 Parent(s): f9dca05

Update app.py

Browse files

Files changed (1) hide show

app.py +20 -25

app.py CHANGED Viewed

@@ -1,45 +1,40 @@
 import gradio as gr
-from transformers import AutoModel, AutoTokenizer  # 彻底不用AutoModelForTextToSpeech
 import soundfile as sf
 import torch
 import os
-# 换用超轻量中文TTS模型（体积仅1.2GB，免费Space无压力）
-model_name = "yeyupiaoling/PP-TTS-v2"
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModel.from_pretrained(model_name)
-# 手动分配设备（CPU优先，避免任何依赖冲突）
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-model = model.to(device)
-# 语音生成函数（简化逻辑，确保稳定）
 def generate_speech(text):
     if not text.strip():
         return None, "错误：请输入有效文本！"
-    # 文本编码（适配模型要求）
-    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=512).to(device)
-    # 生成语音（关闭梯度计算，节省内存）
-    with torch.no_grad():
-        output = model.generate(**inputs)
-        audio_output = output["wav"].cpu().numpy()[0]  # 提取音频数据
-    # 保存音频（采样率24000Hz，适配模型输出）
     output_path = "output.wav"
     sf.write(output_path, audio_output, samplerate=24000)
-    return output_path, "语音生成成功！（超轻量模型，适配免费Space）"
-# 简洁界面（减少资源占用）
-with gr.Blocks(title="轻量中文TTS") as demo:
-    gr.Markdown("# 🎤 免费中文文本转语音")
-    gr.Markdown("基于PP-TTS-v2模型（体积1.2GB），适配免费Space，生成快速稳定")
     text_input = gr.Textbox(
-        label="输入中文文本",
-        placeholder="请输入中文文本（建议≤500字）...",
         lines=4
     )
     audio_output = gr.Audio(label="生成的语音", type="filepath")

 import gradio as gr
+from transformers import pipeline  # 用pipeline简化调用，避免模型加载冲突
 import soundfile as sf
 import torch
 import os
+# 初始化超轻量中文TTS管道（模型体积<800MB，无依赖冲突）
+device = 0 if torch.cuda.is_available() else -1  # CPU/GPU自动适配
+tts = pipeline(
+    "text-to-speech",
+    model="suno/bark-small",  # 超轻量模型，支持中英文，体积仅700MB
+    device=device
+)
+# 语音生成函数（极简逻辑，稳定无错）
 def generate_speech(text):
     if not text.strip():
         return None, "错误：请输入有效文本！"
+    # 生成语音（控制长度，避免内存溢出）
+    text = text[:300]  # 限制300字内，适配免费配置
+    audio_output = tts(text)["audio"]
+    # 保存音频（采样率24000Hz，通用格式）
     output_path = "output.wav"
     sf.write(output_path, audio_output, samplerate=24000)
+    return output_path, "语音生成成功！（无依赖冲突，稳定运行）"
+# 极简界面（减少资源占用）
+with gr.Blocks(title="无冲突TTS") as demo:
+    gr.Markdown("# 🎤 免费中英双语TTS（无冲突版）")
+    gr.Markdown("基于suno/bark-small模型（700MB），适配免费Space，无依赖冲突")
     text_input = gr.Textbox(
+        label="输入文本（中英双语）",
+        placeholder="请输入中文或英文文本（≤300字）...",
         lines=4
     )
     audio_output = gr.Audio(label="生成的语音", type="filepath")