Spaces:

Janiopi
/

Musical-Detector-FastAPI

Sleeping

App Files Files Community

Janiopi commited on Jul 10, 2025

Commit

6ff3237

verified ·

1 Parent(s): f3f11ba

Update app.py

Browse files

Better management of audio formats

Files changed (1) hide show

app.py +42 -21

app.py CHANGED Viewed

@@ -122,44 +122,59 @@ async def health_check():
 async def detect_instrument(audio: UploadFile = File(...)):
     """
     Detectar instrumentos musicales en archivo de audio
-    Args:
-        audio: Archivo de audio (WAV, MP3, etc.)
-    Returns:
-        JSON con resultados de detección
     """
     try:
-        # Verificar si el modelo está cargado
         if classifier is None:
             raise HTTPException(
                 status_code=503,
                 detail="Modelo no disponible. Intenta más tarde."
             )
-        # Verificar tipo de archivo
-        if not audio.content_type or not audio.content_type.startswith('audio/'):
-            raise HTTPException(
-                status_code=400,
-                detail=f"Tipo de archivo inválido: {audio.content_type}. Debe ser audio."
-            )
         print(f"📁 Procesando: {audio.filename} ({audio.content_type})")
-        # Leer y guardar archivo temporalmente
         content = await audio.read()
         print(f"📏 Tamaño: {len(content)} bytes")
-        with tempfile.NamedTemporaryFile(delete=False, suffix='.wav') as temp_file:
             temp_file.write(content)
             temp_path = temp_file.name
         try:
-            # Procesar con el modelo
             print("🤖 Ejecutando modelo...")
-            results = classifier(temp_path)
             print(f"🎯 Resultados raw: {results}")
             # Formatear resultados
             formatted_results = []
             for result in results:
@@ -168,7 +183,6 @@ async def detect_instrument(audio: UploadFile = File(...)):
                     "score": round(float(result["score"]), 4)
                 })
-            # Ordenar por score descendente
             formatted_results.sort(key=lambda x: x["score"], reverse=True)
             print(f"✅ Resultados formateados: {formatted_results}")
@@ -177,11 +191,16 @@ async def detect_instrument(audio: UploadFile = File(...)):
                 "success": True,
                 "results": formatted_results,
                 "filename": audio.filename,
-                "processed_size_bytes": len(content)
             }
         finally:
-            # Limpiar archivo temporal
             if os.path.exists(temp_path):
                 os.unlink(temp_path)
@@ -189,6 +208,8 @@ async def detect_instrument(audio: UploadFile = File(...)):
         raise
     except Exception as e:
         print(f"❌ Error inesperado: {e}")
         raise HTTPException(
             status_code=500,
             detail=f"Error procesando audio: {str(e)}"

 async def detect_instrument(audio: UploadFile = File(...)):
     """
     Detectar instrumentos musicales en archivo de audio
     """
     try:
         if classifier is None:
             raise HTTPException(
                 status_code=503,
                 detail="Modelo no disponible. Intenta más tarde."
             )
         print(f"📁 Procesando: {audio.filename} ({audio.content_type})")
+        # Leer contenido
         content = await audio.read()
         print(f"📏 Tamaño: {len(content)} bytes")
+        # Determinar extensión basada en content_type o filename
+        if audio.filename and audio.filename.endswith('.3gp'):
+            file_extension = '.3gp'
+        elif audio.filename and audio.filename.endswith('.wav'):
+            file_extension = '.wav'
+        elif audio.content_type and 'wav' in audio.content_type:
+            file_extension = '.wav'
+        else:
+            file_extension = '.wav'  # Por defecto
+        print(f"🎵 Usando extensión: {file_extension}")
+        with tempfile.NamedTemporaryFile(delete=False, suffix=file_extension) as temp_file:
             temp_file.write(content)
             temp_path = temp_file.name
         try:
             print("🤖 Ejecutando modelo...")
+            # Usar librosa para cargar el audio de manera más robusta
+            import librosa
+            # Cargar audio con librosa (maneja múltiples formatos)
+            audio_data, sample_rate = librosa.load(temp_path, sr=16000)  # Forzar 16kHz
+            print(f"🔊 Audio cargado: {len(audio_data)} samples a {sample_rate}Hz")
+            # Guardar como WAV temporal para el modelo
+            temp_wav_path = temp_path.replace(file_extension, '.wav')
+            import soundfile as sf
+            sf.write(temp_wav_path, audio_data, sample_rate)
+            # Procesar con el modelo usando el archivo WAV
+            results = classifier(temp_wav_path)
             print(f"🎯 Resultados raw: {results}")
+            # Limpiar archivos temporales
+            if os.path.exists(temp_wav_path):
+                os.unlink(temp_wav_path)
             # Formatear resultados
             formatted_results = []
             for result in results:
                     "score": round(float(result["score"]), 4)
                 })
             formatted_results.sort(key=lambda x: x["score"], reverse=True)
             print(f"✅ Resultados formateados: {formatted_results}")
                 "success": True,
                 "results": formatted_results,
                 "filename": audio.filename,
+                "processed_size_bytes": len(content),
+                "audio_info": {
+                    "samples": len(audio_data),
+                    "sample_rate": sample_rate,
+                    "duration_seconds": len(audio_data) / sample_rate
+                }
             }
         finally:
+            # Limpiar archivo temporal original
             if os.path.exists(temp_path):
                 os.unlink(temp_path)
         raise
     except Exception as e:
         print(f"❌ Error inesperado: {e}")
+        import traceback
+        traceback.print_exc()
         raise HTTPException(
             status_code=500,
             detail=f"Error procesando audio: {str(e)}"