Spaces:

jeysshon
/

DISBAND

Sleeping

App Files Files Community

jeysshon commited on Aug 15, 2025

Commit

8a83ccf

verified ·

1 Parent(s): 758b5b4

Update app.py

Browse files

Files changed (1) hide show

app.py +190 -1

app.py CHANGED Viewed

@@ -608,4 +608,193 @@ def setup_models():
         # Crear data.json con configuraciones
         create_data_json()
-        logger.info("✅

         # Crear data.json con configuraciones
         create_data_json()
+        logger.info("✅ Modelos configurados")
+        return True
+    except Exception as e:
+        logger.error(f"❌ Error configurando modelos: {e}")
+        return False
+def process_audio(audio_file, separation_mode, progress=gr.Progress()):
+    """Procesar audio con IA como r3gm"""
+    if audio_file is None:
+        return [], "⚠️ Sube un archivo de audio"
+    try:
+        # Verificar tamaño
+        file_size = os.path.getsize(audio_file) / (1024 * 1024)
+        if file_size > 100:
+            return [], f"❌ Archivo muy grande: {file_size:.1f}MB (máx 100MB)"
+        progress(0.1, desc="Configurando modelos de IA...")
+        # Crear directorios y configurar modelos
+        create_directories()
+        if not setup_models():
+            return [], "❌ Error configurando modelos"
+        progress(0.3, desc="Procesando con IA...")
+        # Seleccionar modelos según modo
+        if separation_mode == "vocals_ultra":
+            models = ["UVR-MDX-NET-Voc_FT.onnx"]
+        elif separation_mode == "complete_4stems":
+            models = ["UVR-MDX-NET-Voc_FT.onnx", "UVR-MDX-NET-Kag_2.onnx", "Kim_Bass_1.onnx", "UVR-MDX-NET-Inst_HQ_4.onnx"]
+        elif separation_mode == "piano_only":
+            models = ["Kim_Piano_1.onnx"]
+        elif separation_mode == "drums_only":
+            models = ["UVR-MDX-NET-Kag_2.onnx"]
+        elif separation_mode == "bass_only":
+            models = ["Kim_Bass_1.onnx"]
+        elif separation_mode == "guitar_only":
+            models = ["UVR-MDX-NET-Kag_3.onnx"]
+        elif separation_mode == "karaoke":
+            models = ["UVR_MDXNET_KARA_2.onnx"]
+        elif separation_mode == "dereverb":
+            models = ["Reverb_HQ_By_FoxJoy.onnx"]
+        elif separation_mode == "professional":
+            models = ["UVR-MDX-NET-Voc_FT.onnx", "UVR_MDXNET_KARA_2.onnx", "Reverb_HQ_By_FoxJoy.onnx"]
+        else:
+            models = ["UVR-MDX-NET-Voc_FT.onnx"]  # Default
+        progress(0.5, desc=f"Separando con {len(models)} modelo(s) de IA...")
+        # Procesar con modelos seleccionados
+        result_files = separate_multi_instrument(audio_file, models)
+        progress(1.0, desc="¡Completado!")
+        if result_files:
+            success_msg = f"✅ Separación con IA completada: {len(result_files)} archivo(s)"
+            return result_files, success_msg
+        else:
+            return [], "❌ No se generaron archivos"
+    except Exception as e:
+        error_msg = f"❌ Error: {str(e)}"
+        logger.error(error_msg)
+        return [], error_msg
+def create_interface():
+    """Crear interfaz - Estilo r3gm mejorado"""
+    with gr.Blocks(title="🎵 Multi-Instrument AI Separator", theme=gr.themes.Soft()) as app:
+        gr.Markdown(title)
+        gr.Markdown(description)
+        with gr.Row():
+            with gr.Column():
+                audio_input = gr.Audio(
+                    label="🎵 Subir archivo de audio (máx 100MB)",
+                    type="filepath"
+                )
+                separation_mode = gr.Radio(
+                    choices=[
+                        ("🎤 Voces Ultra HD (MDX-Net)", "vocals_ultra"),
+                        ("🎯 Completo 4-Stems (Multi-IA)", "complete_4stems"),
+                        ("🎹 Solo Piano (Kim Model)", "piano_only"),
+                        ("🥁 Solo Batería (Kag Model)", "drums_only"),
+                        ("🎸 Solo Bajo (Kim Model)", "bass_only"),
+                        ("🎸 Solo Guitarra (Kag Model)", "guitar_only"),
+                        ("🎤 Karaoke (KARA Model)", "karaoke"),
+                        ("🔄 Eliminar Reverb", "dereverb"),
+                        ("👑 Profesional (Multi-modelo)", "professional")
+                    ],
+                    value="complete_4stems",
+                    label="🤖 Modelos de IA",
+                    info="Cada opción usa redes neuronales especializadas"
+                )
+                process_btn = gr.Button(
+                    "🚀 Separar con IA",
+                    variant="primary",
+                    size="lg"
+                )
+            with gr.Column():
+                status_output = gr.Textbox(
+                    label="🤖 Estado de la IA",
+                    lines=8,
+                    interactive=False
+                )
+        output_files = gr.File(
+            label="📥 Archivos separados por IA",
+            file_count="multiple",
+            interactive=False
+        )
+        process_btn.click(
+            fn=process_audio,
+            inputs=[audio_input, separation_mode],
+            outputs=[output_files, status_output],
+            show_progress=True
+        )
+        gr.Markdown("""
+        ### 🤖 Tecnología de IA utilizada:
+        | **Modelo** | **Tecnología** | **Especialización** | **Calidad** |
+        |------------|----------------|---------------------|-------------|
+        | 🎤 **UVR-MDX-NET-Voc_FT** | MDX-Net híbrida | Voces de máxima calidad | ⭐⭐⭐⭐⭐ |
+        | 🥁 **UVR-MDX-NET-Kag_2** | MDX-Net percusiva | Batería y elementos rítmicos | ⭐⭐⭐⭐ |
+        | 🎸 **Kim_Bass_1** | Red especializada | Frecuencias graves y bajo | ⭐⭐⭐⭐ |
+        | 🎹 **Kim_Piano_1** | IA para teclas | Piano y elementos percusivos-melódicos | ⭐⭐⭐⭐ |
+        | 🎸 **UVR-MDX-NET-Kag_3** | MDX-Net armónica | Guitarra y componentes melódicos | ⭐⭐⭐⭐ |
+        | 🎤 **UVR_MDXNET_KARA_2** | Red KARA | Voces principales vs coros | ⭐⭐⭐⭐ |
+        | 🔄 **Reverb_HQ_By_FoxJoy** | Anti-reverb | Eliminar reverberación | ⭐⭐⭐⭐ |
+        | 🎛️ **UVR-MDX-NET-Inst_HQ_4** | MDX-Net instrumental | Elementos no vocales | ⭐⭐⭐⭐ |
+        ### ⚡ Arquitecturas de IA:
+        - **MDX-Net**: Red neuronal híbrida tiempo-frecuencia para separación de alta fidelidad
+        - **Kim Models**: Modelos especializados entrenados en instrumentos específicos
+        - **UVR Models**: Modelos de Ultimate Vocal Remover optimizados profesionalmente
+        - **KARA**: Arquitectura especializada en separación vocal avanzada
+        ### 🔧 Características técnicas:
+        - ✅ **Misma tecnología que r3gm** - Código base probado y funcional
+        - ✅ **ONNX Runtime optimizado** - Inferencia de IA de alta velocidad
+        - ✅ **Descarga automática** - Modelos se descargan según necesidad
+        - ✅ **Configuración por hash** - Sistema de configuración preciso como UVR
+        - ✅ **Multiples arquitecturas** - 8+ modelos especializados disponibles
+        - ✅ **Processing threads** - Optimizado para GPU y CPU
+        ### 📝 Instrucciones:
+        1. **Sube archivo de audio** (MP3, WAV, FLAC, M4A - máx 100MB)
+        2. **Selecciona modo de IA** según instrumentos que quieras separar
+        3. **Haz clic en "Separar con IA"** - Los modelos se descargan automáticamente
+        4. **Descarga los resultados** - Archivos separados por redes neuronales
+        > **Nota**: La primera vez que uses cada modelo, se descargará automáticamente (puede tomar unos minutos según tu conexión). Las siguientes veces será mucho más rápido.
+        """)
+    return app
+def main():
+    """Función principal - Exacta como r3gm"""
+    try:
+        logger.info("🤖 Iniciando Multi-Instrument AI Separator")
+        logger.info("🔧 Tecnología exacta de r3gm con múltiples instrumentos")
+        logger.info(f"🔧 PyTorch: {torch.__version__}")
+        logger.info(f"🔧 CUDA: {torch.cuda.is_available()}")
+        # Crear directorios base
+        create_directories()
+        # Crear y lanzar interfaz
+        app = create_interface()
+        app.queue(default_concurrency_limit=3)
+        app.launch(
+            server_name="0.0.0.0",
+            server_port=7860,
+            share=False,
+            show_error=True
+        )
+    except Exception as e:
+        logger.error(f"❌ Error: {e}")
+        traceback.print_exc()
+if __name__ == "__main__":
+    main()