Spaces:

sonukiller
/

cartoon-caption

Sleeping

App Files Files Community

sonu commited on Mar 22, 2025

Commit

ab1e39e

1 Parent(s): a3c06ef

Add application file

Browse files

Files changed (3) hide show

app.py +65 -0
examples/example1.jpg +0 -0
requirements.txt +5 -0

app.py ADDED Viewed

	@@ -0,0 +1,65 @@

+import gradio as gr
+import torch
+from PIL import Image
+from transformers import AutoProcessor, AutoModelForCausalLM
+# Load model and processor
+processor = AutoProcessor.from_pretrained("sonukiller/git-base-cartoon")
+model = AutoModelForCausalLM.from_pretrained("sonukiller/git-base-cartoon")
+# Move model to GPU if available
+device = "cuda" if torch.cuda.is_available() else "cpu"
+model = model.to(device)
+def generate_caption(image):
+    """
+    Generate a caption for the given image using the custom model
+    """
+    # Preprocess the image
+    inputs = processor(images=image, return_tensors="pt").to(device)
+    # Generate caption
+    with torch.no_grad():
+        generated_ids = model.generate(
+            pixel_values=inputs.pixel_values,
+            max_length=50,
+            num_beams=4,
+            early_stopping=True
+        )
+    # Decode the generated ids to text
+    generated_caption = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
+    return generated_caption
+# Create Gradio interface
+with gr.Blocks(title="Custom Image Captioning", css="footer {visibility: hidden}") as demo:
+    gr.Markdown("# Custom Image Captioning Model")
+    gr.Markdown("Upload an image and get a caption generated by a custom-trained model.")
+    with gr.Row():
+        with gr.Column():
+            input_image = gr.Image(type="pil", label="Input Image")
+            caption_button = gr.Button("Generate Caption")
+        with gr.Column():
+            output_text = gr.Textbox(label="Generated Caption")
+    caption_button.click(
+        fn=generate_caption,
+        inputs=input_image,
+        outputs=output_text
+    )
+    gr.Examples(
+        examples=[
+            "examples/example1.jpg",
+        ],
+        inputs=input_image,
+        outputs=output_text,
+        fn=generate_caption,
+        cache_examples=True,
+    )
+# Launch the app
+demo.launch()

examples/example1.jpg ADDED Viewed

requirements.txt ADDED Viewed

	@@ -0,0 +1,5 @@

+torch==2.0.1
+Pillow==9.5.0
+transformers==4.31.0
+gradio==3.38.0
+accelerate==0.21.0