tatr-demo

Sleeping

nielsr HF Staff commited on Nov 19, 2023

Commit

f29cd95

1 Parent(s): 8dd7ef6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,6 +4,7 @@ from matplotlib.patches import Patch
 import io
 from PIL import Image, ImageDraw
 import numpy as np
 from transformers import TableTransformerImageProcessor, AutoModelForObjectDetection
 import torch
@@ -220,7 +221,17 @@ def apply_ocr(cell_coordinates, cropped_table):
           row_data = row_data + ["" for _ in range(max_num_columns - len(row_data))]
         data[row] = row_data
-    return data
 def process_pdf(image):
@@ -241,7 +252,7 @@ examples =[['image.png']]
 app = gr.Interface(fn=process_pdf,
                      inputs=gr.Image(type="pil"),
-                     outputs=[gr.Image(type="pil", label="Detected table"), "json"],
                      title=title,
                      description=description,
                      examples=examples)

 import io
 from PIL import Image, ImageDraw
 import numpy as np
+import csv
 from transformers import TableTransformerImageProcessor, AutoModelForObjectDetection
 import torch
           row_data = row_data + ["" for _ in range(max_num_columns - len(row_data))]
         data[row] = row_data
+    # write to csv
+    with open('output.csv','w') as result_file:
+        wr = csv.writer(result_file, dialect='excel')
+    for row, row_text in data.items():
+        wr.writerow(row_text)
+    # return as Pandas dataframe
+    df = pd.read_csv('output.csv')
+    return df
 def process_pdf(image):
 app = gr.Interface(fn=process_pdf,
                      inputs=gr.Image(type="pil"),
+                     outputs=[gr.Image(type="pil", label="Detected table"), "dataframe"],
                      title=title,
                      description=description,
                      examples=examples)