Spaces:

kxx-kkk
/

pdf_reader_try

Sleeping

kxx-kkk commited on Feb 9, 2024

Commit

e530c33

verified ·

1 Parent(s): 358430f

Upload app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,12 +16,13 @@ def extract_text(file_path):
             st.write(f"Page {page_number + 1}")
             page = pdf_reader.pages[page_number]
             text = page.extract_text()
-            st.write(text)  # Display the extracted selectable text
     images = convert_from_path(file_path)  # Convert PDF pages to images
     for i, image in enumerate(images):
         st.write(f"Page {i + 1}")
-        text = pytesseract.image_to_string(image)
         st.write(text)  # Display the extracted text from the image
 def main():

             st.write(f"Page {page_number + 1}")
             page = pdf_reader.pages[page_number]
             text = page.extract_text()
     images = convert_from_path(file_path)  # Convert PDF pages to images
     for i, image in enumerate(images):
         st.write(f"Page {i + 1}")
+        image_text = pytesseract.image_to_string(image)
+        text += image_text
         st.write(text)  # Display the extracted text from the image
 def main():