Spaces:

IES-Rafael-Alberti
/

AudioToImage

Build error

Bartusito commited on Oct 30, 2023

Commit

6fd1262

1 Parent(s): d0eea62

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,4 +1,31 @@
 import gradio as gr
-gr.Interface.load("models/jonatasgrosman/wav2vec2-large-xlsr-53-english").launch()

 import gradio as gr
+import torch
+from diffusers import StableDiffusionPipeline, DPMSolverMultistepScheduler
+# Cargar el modelo de procesamiento de audio
+def cargar_modelo_audio():
+    return gr.Interface.load("models/jonatasgrosman/wav2vec2-large-xlsr-53-english")
+# Procesar texto con el modelo de estabilidad
+def procesar_texto(texto, modelo_estabilidad):
+    # Aquí utilizamos el modelo de estabilidad para procesar el texto
+    image = modelo_estabilidad(texto).images[0]
+    return image
+if __name__ == "__main__":
+    # Crear una interfaz para cargar el modelo de audio
+    modelo_audio = cargar_modelo_audio()
+    modelo_estabilidad = StableDiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-2-1", torch_dtype=torch.float16)
+    modelo_estabilidad.scheduler = DPMSolverMultistepScheduler.from_config(modelo_estabilidad.scheduler.config)
+    modelo_estabilidad = modelo_estabilidad.to("cuda")
+    def chat(audio):
+        resultado_audio = modelo_audio(audio)
+        resultado_estabilidad = procesar_texto(resultado_audio, modelo_estabilidad)
+        return resultado_estabilidad
+    # Crear la interfaz Gradio
+    iface = gr.Interface(fn=chat, inputs="audio", outputs="image")
+    # Ejecutar la interfaz
+    iface.launch()