Spaces:

Zaious
/

LiveRAG_QA

Build error

Zaious commited on May 29, 2024

Commit

c164738

verified ·

1 Parent(s): 8f660bb

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,7 +3,7 @@ import os
 import openai
 from openai import OpenAI
 import logging
 import pdfminer.high_level
 import docx
 import numpy as np
@@ -29,9 +29,11 @@ def generate_answer(brand_name,question, files):
 # 函数：解析PDF文件
 def extract_text_from_pdf(file_path):
-    text = pdfminer.high_level.extract_text(file_path)
-    print("=======ppa=======")
-    print(text)
     return text
 # 函数：解析DOCX文件

 import openai
 from openai import OpenAI
 import logging
+import fitz  # PyMuPDF
 import pdfminer.high_level
 import docx
 import numpy as np
 # 函数：解析PDF文件
 def extract_text_from_pdf(file_path):
+    doc = fitz.open(file_path)
+    text = ""
+    for page_num in range(len(doc)):
+        page = doc.load_page(page_num)
+        text += page.get_text()
     return text
 # 函数：解析DOCX文件