Spaces:

ANASAKHTAR
/

Object_Detector_with_Audio

Sleeping

Muhammad Anas Akhtar commited on Dec 8, 2024

Commit

918e20f

verified ·

1 Parent(s): d417be5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,8 +7,10 @@ import scipy.io.wavfile as wavfile
 from transformers import pipeline
 narrator = pipeline("text-to-speech",
-                    model="microsoft/speecht5_tts")
 object_detector = pipeline("object-detection",
                 model="facebook/detr-resnet-50")
@@ -130,7 +132,7 @@ def detect_object(image):
 demo = gr.Interface(fn=detect_object,
                     inputs=[gr.Image(label="Select Image",type="pil")],
                     outputs=[gr.Image(label="Processed Image", type="pil"), gr.Audio(label="Generated Audio")],
-                    title="Object Detector with Audio",
                     description="THIS APPLICATION WILL BE USED TO HIGHLIGHT OBJECTS AND GIVES AUDIO DESCRIPTION FOR THE PROVIDED INPUT IMAGE.")
 demo.launch()

 from transformers import pipeline
 narrator = pipeline("text-to-speech",
+                    model="kakao-enterprise/vits-ljs")
 object_detector = pipeline("object-detection",
                 model="facebook/detr-resnet-50")
 demo = gr.Interface(fn=detect_object,
                     inputs=[gr.Image(label="Select Image",type="pil")],
                     outputs=[gr.Image(label="Processed Image", type="pil"), gr.Audio(label="Generated Audio")],
+                    title="@GenAILearniverse Project 7: Object Detector with Audio",
                     description="THIS APPLICATION WILL BE USED TO HIGHLIGHT OBJECTS AND GIVES AUDIO DESCRIPTION FOR THE PROVIDED INPUT IMAGE.")
 demo.launch()