Spaces:

Shreyas094
/

Layout-LM-Table-Extractor

Sleeping

Shreyas094 commited on Sep 21, 2024

Commit

0169439

verified ·

1 Parent(s): 2af08ca

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,6 +3,7 @@ from transformers import AutoProcessor, AutoModel
 from PIL import Image
 from pdf2image import convert_from_path
 from PyPDF2 import PdfReader
 # Load the LayoutLMv3 model and processor
 processor = AutoProcessor.from_pretrained("microsoft/layoutlmv3-base")
@@ -31,9 +32,10 @@ def process_image(image):
 # Gradio interface function
 def extract_table(file, page_number):
-    if file.type == "application/pdf":
         return process_pdf(file, page_number)
-    elif file.type.startswith("image"):
         image = Image.open(file)
         return process_image(image)
     else:

 from PIL import Image
 from pdf2image import convert_from_path
 from PyPDF2 import PdfReader
+import os
 # Load the LayoutLMv3 model and processor
 processor = AutoProcessor.from_pretrained("microsoft/layoutlmv3-base")
 # Gradio interface function
 def extract_table(file, page_number):
+    file_ext = os.path.splitext(file.name)[1].lower()
+    if file_ext == ".pdf":
         return process_pdf(file, page_number)
+    elif file_ext in [".png", ".jpg", ".jpeg"]:
         image = Image.open(file)
         return process_image(image)
     else: