Spaces:

chaaim123
/

demo09

Build error

chaaim123 commited on Apr 24, 2025

Commit

88f69f2

verified ·

1 Parent(s): 5fc613b

Create data/pdf_reader.py

Files changed (1) hide show

data/pdf_reader.py ADDED Viewed

+# pdf_reader.py
+import PyPDF2
+from typing import List
+class PDFReader:
+    def __init__(self):
+        self.page_list = []
+    def read_pdf(self, file_path: str) -> List[str]:
+        """
+        Read PDF content and return list of pages
+        Each element in the list is the text content of a page
+        """
+        try:
+            # Open and read the PDF file
+            with open(file_path, 'rb') as file:
+                pdf_reader = PyPDF2.PdfReader(file)
+                num_pages = len(pdf_reader.pages)
+                # Extract text from each page
+                self.page_list = []
+                for page_num in range(num_pages):
+                    page = pdf_reader.pages[page_num]
+                    text = page.extract_text()
+                    if text:  # Only add non-empty pages
+                        self.page_list.append(text.strip())
+                return self.page_list
+        except Exception as e:
+            raise Exception(f"Error reading PDF: {str(e)}")