Spaces:

valyx
/

layout-lm

Runtime error

anirudh-valyx commited on May 15, 2025

Commit

5bca57b

1 Parent(s): 5c6a451

requirements

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,18 +1,23 @@
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForDocumentQuestionAnswering
 from PIL import Image
-tokenizer = AutoTokenizer.from_pretrained("impira/layoutlm-invoices")
 model = AutoModelForDocumentQuestionAnswering.from_pretrained("impira/layoutlm-invoices")
 def answer_question(image, question):
-    inputs = tokenizer(image, question, return_tensors="pt")
     outputs = model(**inputs)
-    start_logits = outputs.start_logits
-    end_logits = outputs.end_logits
-    start = start_logits.argmax(-1).item()
-    end = end_logits.argmax(-1).item() + 1
-    answer = tokenizer.decode(inputs.input_ids[0][start:end])
     return answer
 iface = gr.Interface(

 import gradio as gr
+from transformers import AutoProcessor, AutoModelForDocumentQuestionAnswering
 from PIL import Image
+# Load processor and model
+processor = AutoProcessor.from_pretrained("impira/layoutlm-invoices")
 model = AutoModelForDocumentQuestionAnswering.from_pretrained("impira/layoutlm-invoices")
 def answer_question(image, question):
+    # Ensure RGB mode
+    if image.mode != "RGB":
+        image = image.convert("RGB")
+    inputs = processor(image, question, return_tensors="pt")
     outputs = model(**inputs)
+    start = outputs.start_logits.argmax(-1).item()
+    end = outputs.end_logits.argmax(-1).item() + 1
+    answer = processor.tokenizer.decode(inputs["input_ids"][0][start:end])
     return answer
 iface = gr.Interface(