tirthadagr8
/

CustomOCR

vision-encoder-decoder

Model card Files Files and versions

tirthadagr8 commited on Feb 2, 2025

Commit

c9c83eb

·

verified ·

1 Parent(s): c3fc56f

Update README.md

Files changed (1) hide show

README.md +20 -3

README.md CHANGED Viewed

@@ -1,3 +1,20 @@
----
-license: unknown
----

+```python
+from transformers import VisionEncoderDecoderModel, AutoTokenizer
+tokenizer = AutoTokenizer.from_pretrained('tirthadagr8/CustomOCR')
+model=VisionEncoderDecoderModel.from_pretrained('tirthadagr8/CustomOCR')
+import torch
+from torchvision import transforms as T
+simple_transforms=T.Compose([
+            T.Resize((224,224)),
+            T.ToTensor(),
+            T.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
+        ])
+from PIL import Image
+path="image.jpg"
+img=simple_transforms(Image.open(path))
+model.eval()
+with torch.no_grad():
+    print(tokenizer.batch_decode(model.cuda().generate(img.unsqueeze(0).cuda()),skip_special_tokens=True))
+import matplotlib.pyplot as plt
+plt.imshow(Image.open(path).resize((224,224)))
+```