Spaces:

SandraCLV
/

injectModel1intoModel2

Sleeping

SandraCLV commited on Oct 29, 2023

Commit

57714f9

1 Parent(s): 32ccfff

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,6 +10,7 @@ import IPython.display as ipd
 # Cargar el modelo que convierte imagen a texto
 image_to_text_model = pipeline("image-classification")
 # Cargar el modelo que genera audio a partir de texto
 # Función para convertir texto a audio
@@ -17,13 +18,22 @@ def text_to_audio(text):
     tts = gTTS(text=text, lang='es')
     tts.save('output.mp3')
     return ipd.Audio('output.mp3')
 # Interfaz Gradio
 iface = gr.Interface(
-    fn=image_to_text_model,
     inputs=gr.Image(type='pil'),
-    outputs=[gr.Textbox(), gr.Audio(fn=text_to_audio)],
     live=True,
     interpretation="default",
     capture_session=True

 # Cargar el modelo que convierte imagen a texto
 image_to_text_model = pipeline("image-classification")
+text_to_audio_model = pipeline("text-to-speech")
 # Cargar el modelo que genera audio a partir de texto
 # Función para convertir texto a audio
     tts = gTTS(text=text, lang='es')
     tts.save('output.mp3')
     return ipd.Audio('output.mp3')
+# Función para la interfaz de Gradio
+def image_to_audio(input_image):
+    # Convertir la imagen a texto
+    text_output = image_to_text_model(input_image)[0]['label']
+    # Generar audio a partir del texto
+    audio_output = text_to_audio_model(text_output)[0]['audio']
+    return audio_output
 # Interfaz Gradio
 iface = gr.Interface(
+    fn=image_to_audio,
     inputs=gr.Image(type='pil'),
+    outputs=[gr.Textbox(), gr.Audio(fn=image_to_audio)],
     live=True,
     interpretation="default",
     capture_session=True