microsoft
/

kosmos-2.5

Image-Text-to-Text

Model card Files Files and versions

ydshieh commited on Aug 21, 2025

Commit

6d11b0d

·

1 Parent(s): b9b6785

update after integration

Files changed (2) hide show

md.py +2 -2
ocr.py +2 -2

md.py CHANGED Viewed

@@ -11,7 +11,7 @@ model = Kosmos2_5ForConditionalGeneration.from_pretrained(repo, device_map=devic
 processor = AutoProcessor.from_pretrained(repo)
 # sample image
-url = "https://huggingface.co/microsoft/kosmos-2.5/blob/main/receipt_00008.png"
 image = Image.open(requests.get(url, stream=True).raw)
 prompt = "<md>"
@@ -30,4 +30,4 @@ generated_ids = model.generate(
 )
 generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)
-print(generated_text[0])

 processor = AutoProcessor.from_pretrained(repo)
 # sample image
+url = "https://huggingface.co/microsoft/kosmos-2.5/resolve/main/receipt_00008.png"
 image = Image.open(requests.get(url, stream=True).raw)
 prompt = "<md>"
 )
 generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)
+print(generated_text[0])

ocr.py CHANGED Viewed

@@ -11,7 +11,7 @@ model = Kosmos2_5ForConditionalGeneration.from_pretrained(repo, device_map=devic
 processor = AutoProcessor.from_pretrained(repo)
 # sample image
-url = "https://huggingface.co/microsoft/kosmos-2.5/blob/main/receipt_00008.png"
 image = Image.open(requests.get(url, stream=True).raw)
 # bs = 1
@@ -70,4 +70,4 @@ for line in lines:
         continue
     line = list(map(int, line[:8]))
     draw.polygon(line, outline="red")
-image.save("output.png")

 processor = AutoProcessor.from_pretrained(repo)
 # sample image
+url = "https://huggingface.co/microsoft/kosmos-2.5/resolve/main/receipt_00008.png"
 image = Image.open(requests.get(url, stream=True).raw)
 # bs = 1
         continue
     line = list(map(int, line[:8]))
     draw.polygon(line, outline="red")
+image.save("output.png")