Spaces:

Almaatla
/

Standard_Intelligence_Dev

Sleeping

heymenn commited on Apr 11, 2024

Commit

d6c994b

verified ·

1 Parent(s): 65c3135

Update scrape_3gpp.py

Files changed (1) hide show

scrape_3gpp.py CHANGED Viewed

@@ -424,11 +424,14 @@ def extractionPrincipale(url, excel_file=None, status_list=None, progress=gr.Pro
                             extracted_content.append(discussion_details)
                         elif category == "pdf":
                             tabLine = []
                             file = pdfReader
                             pdfNumberPages = len(file.pages)
                             for pdfPage in range(0, pdfNumberPages):
                                 load_page = file.get_page(pdfPage)
                                 text = load_page.extract_text()
                                 lines = text.split("\n")

                             extracted_content.append(discussion_details)
                         elif category == "pdf":
+                            print("Entered the PDF category")
                             tabLine = []
                             file = pdfReader
                             pdfNumberPages = len(file.pages)
+                            print(f"This is the number of pages : {pdfNumberPages}")
                             for pdfPage in range(0, pdfNumberPages):
                                 load_page = file.get_page(pdfPage)
                                 text = load_page.extract_text()
                                 lines = text.split("\n")