jiangluohan

Runtime error

App Files Files Community

simler commited on 26 days ago

Commit

87bde7f

verified ·

1 Parent(s): 9ee61c3

Update app.py

Browse files

Files changed (1) hide show

app.py +90 -65

app.py CHANGED Viewed

@@ -2,49 +2,42 @@ import os
 import sys
 # ==========================================
-# 🛑 核心屏蔽补丁 (必须放在最最前面)
 # ==========================================
-# 1. 屏蔽 CUDA (显卡)
 os.environ["CUDA_VISIBLE_DEVICES"] = ""
-# 2. 屏蔽 Flash Attention (关键！防崩核心)
-# 我们直接把这个模块设为 None，假装没安装
-# 这样 GPT-SoVITS 就会回退到普通 CPU 模式
-sys.modules["flash_attn"] = None
 import torch
-# 3. 彻底欺骗 Torch
 torch.cuda.is_available = lambda: False
 torch.cuda.device_count = lambda: 0
 def no_op(self, *args, **kwargs): return self
 torch.Tensor.cuda = no_op
 torch.nn.Module.cuda = no_op
-print("💉 环境手术完成: CUDA已移除, FlashAttn已禁用。")
 # ==========================================
-# 🚀 业务逻辑
 # ==========================================
-sys.path.append(os.getcwd())
-# 导入推理核心
 try:
-    import inference_webui as core
-    print("✅ 成功导入 inference_webui")
-except ImportError:
-    print("❌ 找不到 inference_webui.py")
     sys.exit(1)
-# 自动寻找推理函数
-inference_func = None
-if hasattr(core, "get_tts_model"):
-    inference_func = core.get_tts_model
-elif hasattr(core, "get_tts_wav"):
-    inference_func = core.get_tts_wav
-# 自动寻找模型
 def find_real_model(pattern, search_path="."):
     candidates = []
     for root, dirs, files in os.walk(search_path):
@@ -52,84 +45,116 @@ def find_real_model(pattern, search_path="."):
             if pattern in file and not file.endswith(".lock") and not file.endswith(".metadata"):
                 path = os.path.join(root, file)
                 size_mb = os.path.getsize(path) / (1024 * 1024)
-                if size_mb > 10:
                     candidates.append((path, size_mb))
     if candidates:
         candidates.sort(key=lambda x: x[1], reverse=True)
-        print(f"✅ 选中模型: {candidates[0][0]}")
         return candidates[0][0]
     return None
-gpt_path = find_real_model("s1v3.ckpt")
-if not gpt_path: gpt_path = find_real_model("s1bert")
-sovits_path = find_real_model("s2Gv2ProPlus.pth")
-if not sovits_path: sovits_path = find_real_model("s2G")
-# 加载模型
 try:
-    if gpt_path and sovits_path:
-        # 强制设置 config 为非半精度 (CPU不支持 half)
-        # 这也是为了防止 Flash Attn 被错误触发
-        if hasattr(core, "is_half"): core.is_half = False
-        if hasattr(core, "change_gpt_weights"):
-            core.change_gpt_weights(gpt_path=gpt_path)
-        if hasattr(core, "change_sovits_weights"):
-            core.change_sovits_weights(sovits_path=sovits_path)
-        print("🎉 模型加载完成 (CPU模式)！")
 except Exception as e:
-    print(f"⚠️ 模型加载报错: {e}")
-# 推理逻辑
 import soundfile as sf
 import gradio as gr
 import numpy as np
 REF_AUDIO = "ref.wav"
 REF_TEXT = "你好"
-REF_LANG = "中文" # 必须是中文
 def run_predict(text):
     if not os.path.exists(REF_AUDIO):
-        return None, "❌ 错误：请上传 ref.wav"
     print(f"📥 任务: {text}")
     try:
-        # 核心推理
-        generator = inference_func(
-            ref_wav_path=REF_AUDIO,
-            prompt_text=REF_TEXT,
-            prompt_language=REF_LANG,
-            text=text,
-            text_language="中文",
-            how_to_cut="凑四句一切",
-            top_k=5, top_p=1, temperature=1, ref_free=False
-        )
         result_list = list(generator)
         if result_list:
             sr, data = result_list[0]
             out_path = f"out_{os.urandom(4).hex()}.wav"
             sf.write(out_path, data, sr)
-            print(f"✅ 生成完毕: {out_path}")
-            return out_path, "✅ 成功"
     except Exception as e:
         import traceback
         traceback.print_exc()
-        return None, f"💥 报错: {e}"
-# 界面
 with gr.Blocks() as app:
-    gr.Markdown(f"### GPT-SoVITS V2 (纯CPU版)")
     with gr.Row():
-        inp = gr.Textbox(label="文本", value="终于成功了，这次一定能响。")
         btn = gr.Button("生成")
     with gr.Row():
-        out = gr.Audio(label="音频")
         log = gr.Textbox(label="日志")
     btn.click(run_predict, [inp], [out, log], api_name="predict")

 import sys
 # ==========================================
+# 1. 净化环境 (防止 GPU 报错)
 # ==========================================
 os.environ["CUDA_VISIBLE_DEVICES"] = ""
 import torch
 torch.cuda.is_available = lambda: False
 torch.cuda.device_count = lambda: 0
 def no_op(self, *args, **kwargs): return self
 torch.Tensor.cuda = no_op
 torch.nn.Module.cuda = no_op
+print("💉 CUDA 已屏蔽，强制 CPU 模式")
 # ==========================================
+# 2. 导入核心引擎 (不再依赖 webui)
 # ==========================================
+cwd = os.getcwd()
+sys.path.append(cwd)
+sys.path.append(os.path.join(cwd, "GPT_SoVITS")) # 把子目录加入路径，防止找不到模块
+print("📂 正在尝试导入核心引擎...")
 try:
+    # 尝试多种路径导入，总有一个是对的
+    try:
+        from TTS_infer_pack.TTS import TTS, TTS_Config
+    except ImportError:
+        from GPT_SoVITS.TTS_infer_pack.TTS import TTS, TTS_Config
+    print("✅ 成功连接到底层 TTS 引擎！")
+except ImportError as e:
+    print(f"❌ 核心引擎导入失败: {e}")
+    # 如果这里失败了，打印一下目录帮我找原因
+    print("目录结构:", os.listdir("."))
     sys.exit(1)
+# ==========================================
+# 3. 自动寻找模型 (智能模式)
+# ==========================================
 def find_real_model(pattern, search_path="."):
     candidates = []
     for root, dirs, files in os.walk(search_path):
             if pattern in file and not file.endswith(".lock") and not file.endswith(".metadata"):
                 path = os.path.join(root, file)
                 size_mb = os.path.getsize(path) / (1024 * 1024)
+                if size_mb > 10: # 大于10MB才是真模型
                     candidates.append((path, size_mb))
     if candidates:
         candidates.sort(key=lambda x: x[1], reverse=True)
         return candidates[0][0]
     return None
+gpt_path = find_real_model("s1v3.ckpt") or find_real_model("s1bert")
+sovits_path = find_real_model("s2Gv2ProPlus.pth") or find_real_model("s2G")
+if not gpt_path or not sovits_path:
+    print("❌ 严重错误：没找到模型文件！请检查 Logs 下载进度。")
+    # 为了防止直接退出，这里不 sys.exit，让界面能显示出来报错
+# ==========================================
+# 4. 初始化引擎
+# ==========================================
+tts_pipeline = None
 try:
+    # 寻找配置文件
+    config_path = "GPT_SoVITS/configs/tts_infer.yaml"
+    if not os.path.exists(config_path):
+        config_path = "configs/tts_infer.yaml"
+    if os.path.exists(config_path):
+        print(f"⚙️ 加载配置: {config_path}")
+        tts_config = TTS_Config(config_path)
+        tts_config.device = "cpu"
+        tts_config.is_half = False
+        if gpt_path and sovits_path:
+            tts_config.t2s_weights_path = gpt_path
+            tts_config.vits_weights_path = sovits_path
+            # 启动引擎！
+            tts_pipeline = TTS(tts_config)
+            print("🚀 引擎启动成功！(Ready to Generate)")
+    else:
+        print("❌ 找不到 tts_infer.yaml 配置文件")
 except Exception as e:
+    print(f"⚠️ 引擎初始化异常: {e}")
+# ==========================================
+# 5. 定义接口
+# ==========================================
 import soundfile as sf
 import gradio as gr
 import numpy as np
 REF_AUDIO = "ref.wav"
 REF_TEXT = "你好"
+REF_LANG = "zh"
 def run_predict(text):
+    if tts_pipeline is None:
+        return None, "❌ 错误：引擎未启动 (模型或配置缺失)"
     if not os.path.exists(REF_AUDIO):
+        return None, "❌ 错误：根目录下没找到 ref.wav，请上传！"
     print(f"📥 任务: {text}")
     try:
+        # 手动构造请求参数
+        req = {
+            "text": text,
+            "text_lang": "zh",
+            "ref_audio_path": REF_AUDIO,
+            "prompt_text": REF_TEXT,
+            "prompt_lang": REF_LANG,
+            "top_k": 5, "top_p": 1, "temperature": 1,
+            "text_split_method": "cut4",
+            "batch_size": 1,
+            "speed_factor": 1.0,
+            "fragment_interval": 0.3,
+            "seed": -1,
+            "return_fragment": False,
+            "parallel_infer": True,
+            "repetition_penalty": 1.35
+        }
+        generator = tts_pipeline.run(req)
         result_list = list(generator)
         if result_list:
             sr, data = result_list[0]
             out_path = f"out_{os.urandom(4).hex()}.wav"
             sf.write(out_path, data, sr)
+            return out_path, "✅ 生成成功"
     except Exception as e:
         import traceback
         traceback.print_exc()
+        return None, f"💥 引擎报错: {e}"
+# ==========================================
+# 6. 启动界面
+# ==========================================
 with gr.Blocks() as app:
+    gr.Markdown("### GPT-SoVITS V2 (Direct Core)")
+    gr.Markdown(f"GPT: `{os.path.basename(gpt_path) if gpt_path else '❌'}`")
+    gr.Markdown(f"SoVITS: `{os.path.basename(sovits_path) if sovits_path else '❌'}`")
     with gr.Row():
+        inp = gr.Textbox(label="文本", value="这下总该可以了吧！")
         btn = gr.Button("生成")
     with gr.Row():
+        out = gr.Audio(label="结果")
         log = gr.Textbox(label="日志")
     btn.click(run_predict, [inp], [out, log], api_name="predict")