SESA_Fast_Separation

Running

App Files Files Community

ASesYusuf1 commited on May 26, 2025

Commit

b2897dc

verified ·

1 Parent(s): 05553c4

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -7

app.py CHANGED Viewed

@@ -24,6 +24,14 @@ from threading import Lock
 import scipy.io.wavfile
 import spaces
 # Logging setup
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
@@ -55,6 +63,12 @@ device = "cuda" if torch.cuda.is_available() else "cpu"
 use_autocast = device == "cuda"
 logger.info(f"Using device: {device}")
 # ROFORMER_MODELS and OUTPUT_FORMATS
 ROFORMER_MODELS = {
     "Vocals": {
@@ -437,14 +451,8 @@ def roformer_separator(audio, model_key, seg_size, override_seg_size, overlap, p
 @spaces.GPU
 def auto_ensemble_process(audio, model_keys, seg_size=64, overlap=0.1, out_format="wav", use_tta="False", model_dir="/tmp/audio-separator-models/", output_dir="output", norm_thresh=0.9, amp_thresh=0.9, batch_size=1, ensemble_method="avg_wave", exclude_stems="", weights_str="", progress=gr.Progress(track_tqdm=True)):
-    global ensemble_state
     temp_audio_path = None
-    max_retries = 2
     start_time = time.time()
-    time_budget = 300  # ZeroGPU için işlem sınırı
-    max_models = 6
-    gpu_lock = Lock()
     try:
         if not audio:
             raise ValueError("No audio file provided.")
@@ -662,7 +670,7 @@ def auto_ensemble_process(audio, model_keys, seg_size=64, overlap=0.1, out_forma
         if torch.cuda.is_available():
             torch.cuda.empty_cache()
             logger.info("GPU memory cleared")
 def update_roformer_models(category):
     """Update Roformer model dropdown based on selected category."""
     choices = list(ROFORMER_MODELS.get(category, {}).keys()) or []

 import scipy.io.wavfile
 import spaces
+# Global state definition
+ensemble_state = {
+    "current_model_idx": 0,
+    "current_audio": None,
+    "processed_stems": [],
+    "model_outputs": {}  # Her modelin stem'lerini saklamak için
+}
 # Logging setup
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 use_autocast = device == "cuda"
 logger.info(f"Using device: {device}")
+# Constants
+max_models = 6
+max_retries = 2
+time_budget = 300  # ZeroGPU için işlem sınırı
+gpu_lock = Lock()
 # ROFORMER_MODELS and OUTPUT_FORMATS
 ROFORMER_MODELS = {
     "Vocals": {
 @spaces.GPU
 def auto_ensemble_process(audio, model_keys, seg_size=64, overlap=0.1, out_format="wav", use_tta="False", model_dir="/tmp/audio-separator-models/", output_dir="output", norm_thresh=0.9, amp_thresh=0.9, batch_size=1, ensemble_method="avg_wave", exclude_stems="", weights_str="", progress=gr.Progress(track_tqdm=True)):
     temp_audio_path = None
     start_time = time.time()
     try:
         if not audio:
             raise ValueError("No audio file provided.")
         if torch.cuda.is_available():
             torch.cuda.empty_cache()
             logger.info("GPU memory cleared")
 def update_roformer_models(category):
     """Update Roformer model dropdown based on selected category."""
     choices = list(ROFORMER_MODELS.get(category, {}).keys()) or []