Spaces:

TruongLeThanh
/

image_caption

Sleeping

TruongLeThanh commited on Apr 25, 2025

Commit

ac07ce7

1 Parent(s): 08dcaa5

update model

Files changed (5) hide show

.gradio/flagged/dataset1.csv ADDED Viewed

+image,output,timestamp
+.gradio\flagged\image\4b60174fa7b64d40f429\1984b509-acc2-47c0-8d72-5a4692938d80.jpg,,2025-04-25 16:08:27.527342
+.gradio\flagged\image\ac23ccb956d7b24e0154\1984b509-acc2-47c0-8d72-5a4692938d80.jpg,,2025-04-25 16:08:29.346974

.gradio/flagged/image/4b60174fa7b64d40f429/1984b509-acc2-47c0-8d72-5a4692938d80.jpg ADDED Viewed

.gradio/flagged/image/ac23ccb956d7b24e0154/1984b509-acc2-47c0-8d72-5a4692938d80.jpg ADDED Viewed

app.py CHANGED Viewed

@@ -1,7 +1,29 @@
 import gradio as gr
-def greet(name):
-    return "Hello " + name + "!!"
-demo = gr.Interface(fn=greet, inputs="text", outputs="text")
 demo.launch()

 import gradio as gr
+from transformers import BlipProcessor, BlipForConditionalGeneration
+from PIL import Image
+import torch
+# Load model
+processor = BlipProcessor.from_pretrained("Salesforce/blip-image-captioning-base")
+model = BlipForConditionalGeneration.from_pretrained("Salesforce/blip-image-captioning-base")
+device = "cuda" if torch.cuda.is_available() else "cpu"
+model.to(device)
+# Inference function
+def predict_caption(image):
+    if image.mode != "RGB":
+        image = image.convert("RGB")
+    inputs = processor(images=image, return_tensors="pt").to(device)
+    output = model.generate(**inputs, max_new_tokens=20)
+    caption = processor.decode(output[0], skip_special_tokens=True)
+    return caption
+# Gradio UI
+demo = gr.Interface(fn=predict_caption,
+                    inputs=gr.Image(type="pil"),
+                    outputs="text",
+                    title="📸 BLIP Image Captioning",
+                    description="Tải ảnh lên và nhận mô tả tự động bằng BLIP từ Salesforce.")
 demo.launch()

requirements.txt ADDED Viewed

+transformers
+torch
+gradio
+Pillow