Spaces:

PirateXX
/

PdfToText

Runtime error

PirateXX commited on Apr 8, 2023

Commit

aa83d5b

1 Parent(s): b85c66d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

+from flask import Flask, request
+from transformers import RobertaForSequenceClassification, RobertaTokenizer, RobertaConfig
+from transformers import AutoTokenizer, AutoModelForSequenceClassification
+from transformers import RobertaConfig
+from torch import cuda
+import torch
+import gradio as gr
+import os
+import re
+import pdfplumber
+app = Flask(__name__)
+# function to break text into an array of sentences
+def upload_file(file):
+    if file:
+        pdf_file = file.name
+        text = ""
+        with pdfplumber.open(pdf_file) as pdf:
+            cnt = 0
+            for page in pdf.pages:
+                cnt+=1
+                text+=(page.extract_text(x_tolerance = 1))
+                if cnt>5:
+                    break
+            text = text.replace('\n', ' ')
+            return text
+    else:
+        return {"error":'No PDF file found in request'}
+demo = gr.Interface(
+        fn=upload_file,
+        inputs=gr.File(),
+         article = "Visit <a href = \"https://ai-content-detector.online/\">AI Content Detector</a> for better user experience!",
+        outputs=gr.outputs.JSON(),
+        interpretation="default",)
+demo.launch(show_api=False)