Spaces:

saa231
/

MutimodalVisionAssistant

Paused

App Files Files Community

saa231 commited on Apr 27, 2025

Commit

1057b7a

verified ·

1 Parent(s): 30f2e8e

Update app.py

Browse files

Files changed (1) hide show

app.py +50 -51

app.py CHANGED Viewed

@@ -1,62 +1,61 @@
 from PIL import Image
 import gradio as gr
 import os
 from project_model import process_inputs, session
 def handle_question(image, audio):
-    if image and audio:  # Handle the initial question with image and audio
-        message, answer_audio = process_inputs(session, image=image, audio_path=audio)
-        # Save images
-        original_path = "uploaded_image.png"
-        annotated_path = "annotated_image.png"
-        image.save(original_path)
-        if session.annotated_image:
-            session.annotated_image.save(annotated_path)
-        # Build markdown reply for initial question
-        markdown_reply = (
-            f"**{message}**\n\n"
-            #f"**Original Image:**\n\n"
-            #f"![Original Image](file/{original_path})\n\n"
-            #f"**Detected Objects:**\n\n"
-            #f"![Annotated Image](file/{annotated_path})\n\n"
-            #f"**🔊 Audio Response:**\n\n"
-            #f"<audio controls autoplay>\n"
-            #f"  <source src='file/{answer_audio}' type='audio/wav'>\n"
-            #f"Your browser does not support the audio element.\n"
-            #f"</audio>"
-        )
-    elif audio:  # Handle follow-up with just audio
-        if not session.current_image:
-            return "No initial image found for the follow-up question.", None
-        message, answer_audio = process_inputs(session, image=session.current_image, audio_path=audio)
-        # Save the current image if it exists
-        original_path = "uploaded_image.png"
-        annotated_path = "annotated_image.png"
-        if session.current_image:
-            session.current_image.save(original_path)
-        if session.annotated_image:
-            session.annotated_image.save(annotated_path)
-        # Build markdown reply for follow-up question
-        markdown_reply = (
-            f"**{message}**\n\n"
-            #f"**Original Image:**\n\n"
-            #f"![Original Image](file/{original_path})\n\n"
-            #f"**Detected Objects:**\n\n"
-            #f"![Annotated Image](file/{annotated_path})"
-        )
-    else:
-        return "Please upload an image and/or record an audio clip.", None
-    return markdown_reply, answer_audio
 # --- Gradio App ---

 from PIL import Image
 import gradio as gr
 import os
+import uuid
 from project_model import process_inputs, session
 def handle_question(image, audio):
+    try:
+        if image and audio:  # Handle the initial question with image and audio
+            message, answer_audio = process_inputs(session, image=image, audio_path=audio)
+            # Save images
+            unique_id = uuid.uuid4().hex
+            original_path = f"uploaded_image_{unique_id}.png"
+            annotated_path = f"annotated_image_{unique_id}.png"
+            image.save(original_path)
+            if session.annotated_image:
+                session.annotated_image.save(annotated_path)
+            # Build markdown reply for initial question
+            markdown_reply = (
+                f"**{message}**\n\n"
+                #f"**Original Image:**\n\n"
+                #f"![Original Image](file/{original_path})\n\n"
+                #f"**Detected Objects:**\n\n"
+                #f"![Annotated Image](file/{annotated_path})\n\n"
+                #f"**🔊 Audio Response:**\n\n"
+                #f"<audio controls autoplay>\n"
+                #f"  <source src='file/{answer_audio}' type='audio/wav'>\n"
+                #f"Your browser does not support the audio element.\n"
+                #f"</audio>"
+            )
+        elif audio:  # Handle follow-up with just audio
+            if not session.current_image:
+                return "No initial image found for the follow-up question.", None
+            message, answer_audio = process_inputs(session, image=session.current_image, audio_path=audio)
+            # Build markdown reply for follow-up question
+            markdown_reply = (
+                f"**{message}**\n\n"
+                #f"**Original Image:**\n\n"
+                #f"![Original Image](file/{original_path})\n\n"
+                #f"**Detected Objects:**\n\n"
+                #f"![Annotated Image](file/{annotated_path})"
+            )
+        else:
+            return "Please upload an image and/or record an audio clip.", None
+        return markdown_reply, answer_audio
+    except: ValueError as e:
+        return f"❗Error: {str(e)}", None
 # --- Gradio App ---