Spaces:

SumantBobade
/

Image_Caption_Generator

Runtime error

SumantBobade commited on Mar 5, 2025

Commit

e085fd8

verified ·

1 Parent(s): b6f210d

Upload 2 files

Files changed (2) hide show

app.py ADDED Viewed

+import gradio as gr
+from transformers import BlipProcessor, BlipForConditionalGeneration
+from PIL import Image
+# Load BLIP model and processor
+processor = BlipProcessor.from_pretrained("Salesforce/blip-vqa-base")
+model = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-vqa-base")
+def answer_question(image, question):
+    """
+    Generates an answer based on the given image and question.
+    """
+    try:
+        if not question.strip():
+            return "Please enter a question."
+        # Prepare inputs for the model
+        inputs = processor(images=image, text=question, return_tensors="pt")
+        # Generate answer
+        outputs = model.generate(**inputs)
+        answer = processor.decode(outputs[0], skip_special_tokens=True)
+        return answer
+    except Exception as e:
+        return f"An error occurred: {str(e)}"
+# Gradio Interface
+iface = gr.Interface(
+    fn=answer_question,  # Function to process image + question
+    inputs=[gr.Image(type="pil"), gr.Textbox(label="Ask a question about the image")],
+    outputs="text",
+    title="Visual Question Answering with BLIP",
+    description="Upload an image and ask a question about it. The model will generate an answer."
+)
+iface.launch()

requirement.txt ADDED Viewed

+gradio
+transformers
+pillow