Spaces:

RP-Azul
/

P1

Sleeping

RP-Azul commited on Nov 4, 2024

Commit

e86611a

verified ·

1 Parent(s): 5d879ea

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,7 +6,7 @@ import torch
 pipe1 = pipeline("automatic-speech-recognition", model="openai/whisper-base")
-pipe2 = pipeline("summarization", model="facebook/bart-large-cnn")
 #pipe3 = DiffusionPipeline.from_pretrained("stable-diffusion-v1-5/stable-diffusion-v1-5")
 #pipe3.to("cuda" if torch.cuda.is_available() else "cpu")
@@ -16,18 +16,20 @@ def audio_to_image(audio):
         transcription_text = transcription['text']
-        summary = pipe2(transcription_text, max_length=50, min_length=10, do_sample=False)
-        summary_text = summary[0]['summary_text']
         #prompt = summary_text
         #image = pipe3(prompt).images[0]
         #return image
-        print("Transcription:", transcription_text)
-        print("Summary:", summary_text)
-        return transcription_text, summary_text
 #demo = gr.Interface(fn=audio_to_image, inputs=gr.Audio(), outputs="image")
-demo = gr.Interface(fn=audio_to_image, inputs=gr.Audio(), outputs=[gr.Textbox(label="Transcription"), gr.Textbox(label="Summary")])
 demo.launch(share=True)

 pipe1 = pipeline("automatic-speech-recognition", model="openai/whisper-base")
+#pipe2 = pipeline("summarization", model="facebook/bart-large-cnn")
 #pipe3 = DiffusionPipeline.from_pretrained("stable-diffusion-v1-5/stable-diffusion-v1-5")
 #pipe3.to("cuda" if torch.cuda.is_available() else "cpu")
         transcription_text = transcription['text']
+        #summary = pipe2(transcription_text, max_length=50, min_length=10, do_sample=False)
+        #summary_text = summary[0]['summary_text']
         #prompt = summary_text
         #image = pipe3(prompt).images[0]
         #return image
+        #print("Transcription:", transcription_text)
+        #print("Summary:", summary_text)
+        #return transcription_text, summary_text
+        return transcription_text
 #demo = gr.Interface(fn=audio_to_image, inputs=gr.Audio(), outputs="image")
+#demo = gr.Interface(fn=audio_to_image, inputs=gr.Audio(), outputs=[gr.Textbox(label="Transcription"), gr.Textbox(label="Summary")])
+demo = gr.Interface(fn=audio_to_image, inputs=gr.Audio(), outputs="text")
 demo.launch(share=True)