Spaces:

Parth1503
/

vit-cat-dog

Sleeping

Parth1503 commited on Apr 8, 2025

Commit

12fcdf0

verified ·

1 Parent(s): 6c926f7

Upload 3 files

Files changed (3) hide show

app.py ADDED Viewed

+import gradio as gr
+import torch
+import timm
+from torchvision import transforms
+from PIL import Image
+model = timm.create_model('vit_base_patch16_224', pretrained=False, num_classes=2)
+model.load_state_dict(torch.load("vis_trans_cat_dog.pth", map_location='cpu'))
+model.eval()
+transform = transforms.Compose([
+    transforms.Resize((224, 224)),
+    transforms.ToTensor(),
+    transforms.Normalize([0.5], [0.5])
+])
+def predict(image):
+    image = Image.open(image).convert('RGB')
+    image = transform(image).unsqueeze(0)
+    with torch.no_grad():
+        outputs = model(image)
+        _, predicted = torch.max(outputs, 1)
+    return 'Cat' if predicted.item() == 0 else 'Dog'
+interface = gr.Interface(
+    fn=predict,
+    inputs=gr.Image(type="pil"),
+    outputs=gr.Label(),
+    title="ViT Cat vs Dog Classifier 🐱🐶",
+    description="Upload an image of a cat or dog and get a prediction from a Vision Transformer model."
+)
+if __name__ == "__main__":
+    interface.launch()

requirements.txt ADDED Viewed

+torch
+torchvision
+timm
+gradio

vis_trans_cat_dog.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:712ce36578d4c202598b2e65083634ad767c2020c76395c5cae820794a75b436
+size 343260442