Spaces:

gnosticdev
/

audio-a-video

Sleeping

App Files Files Community

gnosticdev commited on Mar 30, 2025

Commit

a474c04

verified ·

1 Parent(s): 000e078

Update app.py

Browse files

Files changed (1) hide show

app.py +40 -10

app.py CHANGED Viewed

@@ -7,28 +7,48 @@ from PIL import Image
 import tempfile
 import os
 import io
 def generate_waveform_video(audio_file, image_file):
     try:
         # 1. Cargar audio
         y, sr = librosa.load(audio_file)
         duration = librosa.get_duration(y=y, sr=sr)
-        # 2. Cargar imagen y asegurar formato RGB
-        img = Image.open(image_file).convert('RGB')  # Eliminar cualquier transparencia
         img_array = np.array(img)
         img_clip = mp.ImageClip(img_array).set_duration(duration)
         img_w, img_h = img_clip.size
         # 3. Crear efecto de waveform
         audio_envelope = np.abs(y)
         audio_envelope = (audio_envelope / np.max(audio_envelope)) * (img_h // 3)
         def make_frame(t):
             fig, ax = plt.subplots(figsize=(img_w/100, img_h/100), dpi=100)
-            fig.patch.set_facecolor('black')  # Fondo sólido
             ax.set_facecolor('black')
             ax.set_xlim(0, duration)
             ax.set_ylim(-img_h//2, img_h//2)
             ax.axis('off')
@@ -48,23 +68,32 @@ def generate_waveform_video(audio_file, image_file):
                        transparent=False, facecolor='black')
             plt.close(fig)
-            # Forzar conversión a RGB
             img_frame = Image.open(buf).convert('RGB')
             return np.array(img_frame)
-        # Crear video
         effect_clip = mp.VideoClip(make_frame, duration=duration).set_fps(24)
         final_clip = mp.CompositeVideoClip([img_clip, effect_clip.set_pos("center")])
         final_clip = final_clip.set_audio(mp.AudioFileClip(audio_file))
-        # Guardar en archivo temporal
         with tempfile.NamedTemporaryFile(suffix=".mp4", delete=False) as tmpfile:
-            final_clip.write_videofile(tmpfile.name, fps=24, codec="libx264",
-                                      audio_codec="aac", logger=None)
             return tmpfile.name
     except Exception as e:
-        raise Exception(f"Error: {str(e)}")
 # Interfaz Gradio
 iface = gr.Interface(
@@ -79,4 +108,5 @@ iface = gr.Interface(
 )
 if __name__ == "__main__":
     iface.queue().launch()

 import tempfile
 import os
 import io
+import logging
+# Configuración de logging
+logging.basicConfig(
+    level=logging.INFO,
+    format='%(asctime)s - %(levelname)s - %(message)s',
+    handlers=[
+        logging.FileHandler("app.log"),  # Guardar logs en archivo
+        logging.StreamHandler()  # Mostrar logs en consola
+    ]
+)
+logger = logging.getLogger("audio_to_video")
 def generate_waveform_video(audio_file, image_file):
     try:
+        logger.info("------ Nueva solicitud de generación ------")
+        logger.info(f"Archivo de audio recibido: {audio_file}")
+        logger.info(f"Archivo de imagen recibido: {image_file}")
         # 1. Cargar audio
+        logger.info("Cargando archivo de audio...")
         y, sr = librosa.load(audio_file)
         duration = librosa.get_duration(y=y, sr=sr)
+        logger.info(f"Duración del audio: {duration:.2f} segundos")
+        # 2. Procesar imagen
+        logger.info("Cargando imagen y preparando formato...")
+        img = Image.open(image_file).convert('RGB')
         img_array = np.array(img)
         img_clip = mp.ImageClip(img_array).set_duration(duration)
         img_w, img_h = img_clip.size
+        logger.info(f"Resolución de imagen: {img_w}x{img_h}")
         # 3. Crear efecto de waveform
+        logger.info("Generando efecto de onda de audio...")
         audio_envelope = np.abs(y)
         audio_envelope = (audio_envelope / np.max(audio_envelope)) * (img_h // 3)
         def make_frame(t):
             fig, ax = plt.subplots(figsize=(img_w/100, img_h/100), dpi=100)
+            fig.patch.set_facecolor('black')
             ax.set_facecolor('black')
             ax.set_xlim(0, duration)
             ax.set_ylim(-img_h//2, img_h//2)
             ax.axis('off')
                        transparent=False, facecolor='black')
             plt.close(fig)
             img_frame = Image.open(buf).convert('RGB')
             return np.array(img_frame)
+        # 4. Componer video
+        logger.info("Creando clip de video...")
         effect_clip = mp.VideoClip(make_frame, duration=duration).set_fps(24)
         final_clip = mp.CompositeVideoClip([img_clip, effect_clip.set_pos("center")])
         final_clip = final_clip.set_audio(mp.AudioFileClip(audio_file))
+        logger.info("Video compuesto exitosamente")
+        # 5. Guardar video
+        logger.info("Exportando video final...")
         with tempfile.NamedTemporaryFile(suffix=".mp4", delete=False) as tmpfile:
+            final_clip.write_videofile(
+                tmpfile.name,
+                fps=24,
+                codec="libx264",
+                audio_codec="aac",
+                logger=None
+            )
+            logger.info(f"Video guardado temporalmente en: {tmpfile.name}")
             return tmpfile.name
     except Exception as e:
+        logger.error(f"Error crítico durante la generación: {str(e)}", exc_info=True)
+        raise Exception(f"Error: {str(e)} - Consulta el archivo app.log para más detalles")
 # Interfaz Gradio
 iface = gr.Interface(
 )
 if __name__ == "__main__":
+    logger.info("Iniciando aplicación Gradio...")
     iface.queue().launch()