Spaces:

ngupta2026
/

Gen_AI_Project

Sleeping

ngupta2026 commited on Apr 28

Commit

330791f

verified ·

1 Parent(s): 24caea8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,15 +8,11 @@ from transformers import LayoutLMTokenizerFast, LayoutLMForTokenClassification
 label2id = {"O":0, "COMPANY":1, "DATE":2, "TOTAL":3}
 id2label = {v:k for k,v in label2id.items()}
-# MODEL
-model = LayoutLMForTokenClassification.from_pretrained(
-    "microsoft/layoutlm-base-uncased",
-    num_labels=4
-)
-tokenizer = LayoutLMTokenizerFast.from_pretrained(
-    "microsoft/layoutlm-base-uncased"
-)
 # NORMALIZE
 def normalize(box, width, height):
@@ -53,7 +49,8 @@ def process(image):
         return_tensors="pt",
         padding="max_length",
         truncation=True,
-        is_split_into_words=True
     )
     with torch.no_grad():

 label2id = {"O":0, "COMPANY":1, "DATE":2, "TOTAL":3}
 id2label = {v:k for k,v in label2id.items()}
+# ✅ USE YOUR MODEL
+MODEL_NAME = "YOUR_USERNAME/sroie-layoutlm"
+model = LayoutLMForTokenClassification.from_pretrained(MODEL_NAME)
+tokenizer = LayoutLMTokenizerFast.from_pretrained(MODEL_NAME)
 # NORMALIZE
 def normalize(box, width, height):
         return_tensors="pt",
         padding="max_length",
         truncation=True,
+        is_split_into_words=True,
+        max_length=128
     )
     with torch.no_grad():