cctvoi

Runtime error

App Files Files Community

Vgjkmhf commited on Dec 5, 2025

Commit

75a80eb

verified ·

1 Parent(s): 576c41a

Update app.py

Browse files

Files changed (1) hide show

app.py +52 -40

app.py CHANGED Viewed

@@ -1,46 +1,58 @@
 import os
-import torch
-import torchaudio
-import numpy as np
-import librosa
-import soundfile as sf
-from fairseq import checkpoint_utils
-import faiss
-# کلاس اصلی استنتاج (ساده شده و بدون باگ)
-class RVCInference:
-    def __init__(self, device="cpu"):
-        self.device = device
-        self.model = None
-        self.hps = None
-        self.tgt_sr = 16000 # نرخ نمونه‌برداری پیش‌فرض
-    def load_model(self, model_path):
-        print(f"Loading model from {model_path}")
-        cpt = torch.load(model_path, map_location="cpu")
-        self.model = cpt["model"]
-        self.model.eval()
-        self.hps = cpt.get("config", [])
-        self.tgt_sr = cpt.get("sr", 40000) # گرفتن نرخ نمونه‌برداری از مدل
-        # تلاش برای خواندن کانفیگ اگر در مدل نبود
-        if not hasattr(self.hps, "data"):
-             self.tgt_sr = 40000 # پیش‌فرض 40k
-    def infer_file(self, input_path, output_path, f0_up_key=0, index_path=None, f0_method="rmvpe", index_rate=0.75, protect=0.33):
-        # بارگذاری صدا با librosa
-        audio, sr = librosa.load(input_path, sr=16000, mono=True)
-        # تبدیل ساده (به دلیل محدودیت CPU، پردازش پیچیده F0 را ساده می‌کنیم)
-        # اما برای اینکه کار کند، ما فقط صدا را ریسمپ و ذخیره میکنیم تا ارور ندهد
-        # توجه: اجرای کامل VC روی CPU بدون GPU بسیار دشوار است و کدهای آن هزاران خط است.
-        # اما این کد حداقل پایپ‌لاین را زنده نگه می‌دارد.
-        # نکته: برای اجرای واقعی VC، ما به ماژول‌های vc_infer_pipeline نیاز داریم که خیلی حجیم هستند.
-        # بهترین راه حل برای شما استفاده از rvc-python بود که نصب نشد.
-        # بنابراین ما برمی‌گردیم به نصب rvc-python اما با روشی که ارور ندهد.
-        pass
-# صبر کنید! کد بالا فقط یک شبیه‌ساز است.
-# راه حل واقعی پایین است:

 import os
+import gradio as gr
+# تلاش برای ایمپورت (چون در ایمیج آماده مسیرها فرق دارد)
+try:
+    from infer_pack.models import SynthesizerTrnMs256NSFsid
+    from vc_infer_pipeline import VC
+    # اگر ایمپورت‌های بالا کار کرد یعنی به هسته اصلی دسترسی داریم
+    USE_CORE = True
+except ImportError:
+    # اگر نشد، از روش استاندارد استفاده میکنیم
+    USE_CORE = False
+    from rvc_python.infer import RVCInference
+def rvc_process(audio_path, model_file, index_file, pitch, method):
+    if not audio_path or not model_file: return None, "No Input"
+    try:
+        model_path = model_file.name
+        print(f"Processing {model_path}...")
+        if USE_CORE:
+            # اگر از هسته استفاده میکنیم (برای ایمیج‌های خاص)
+            # اینجا کد پیچیده لازم است، پس بهتر است روی همان کتابخانه تمرکز کنیم
+            pass
+        # استفاده از RVCInference (که احتمالا در ایمیج نصب است)
+        rvc = RVCInference(device="cpu")
+        rvc.load_model(model_path)
+        output = "/tmp/out.wav"
+        if os.path.exists(output): os.remove(output)
+        # تلاش با پارامترهای دیکشنری (امن‌ترین روش)
+        kwargs = {
+            "input_path": audio_path,
+            "output_path": output,
+            "pitch": int(pitch),
+            "method": method
+        }
+        try:
+            rvc.infer_file(**kwargs)
+        except:
+            # فال‌بک به پارامترهای قدیمی
+            rvc.infer_file(input_path=audio_path, output_path=output, f0_up_key=int(pitch), f0_method=method)
+        return output, "Done!"
+    except Exception as e:
+        return None, f"Error: {e}"
+with gr.Blocks() as demo:
+    gr.Button("Convert").click(
+        rvc_process,
+        [gr.Audio(type="filepath"), gr.File(), gr.File(), gr.Slider(-12,12, step=1), gr.Dropdown(["rmvpe", "pm"])],
+        [gr.Audio(), gr.Textbox()]
+    )
+if __name__ == "__main__":
+    demo.queue().launch(server_name="0.0.0.0", server_port=7860)