Spaces:

notabaka
/

ASRtest

Runtime error

notabaka commited on Feb 23, 2024

Commit

9bbbf26

1 Parent(s): 0ee4a85

lll

Files changed (1) hide show

app.py CHANGED Viewed

@@ -36,10 +36,13 @@ def extract_text(doc):
     if doc.type == 'text/plain':
         return doc.read().decode('utf-8')
-    if doc.name.endswith('.pdf'):
-        with pdfplumber.open(doc) as pdf:
             pages = [page.extract_text() for page in pdf.pages]
-            return '\n'.join(pages)
     if doc.name.endswith('.docx'):
         raw_text = doc.read()

     if doc.type == 'text/plain':
         return doc.read().decode('utf-8')
+    if doc.name.endswith(".pdf"):
+        raw = doc.read()
+        with pdfplumber.open(raw) as pdf:
+            pdf.set_doc(raw)
             pages = [page.extract_text() for page in pdf.pages]
+            return "\n".join(pages)
     if doc.name.endswith('.docx'):
         raw_text = doc.read()