Spaces:

wayne0603
/

space

Sleeping

wayne0603 commited on Sep 1, 2025

Commit

a67409b

verified ·

1 Parent(s): 0f0afda

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -32,22 +32,27 @@ index = None
 docs = []
 # ===== 文件解析函数 =====
 def load_file(file_obj):
     global index, docs
     docs = []
     text_data = ""
-    ext = os.path.splitext(file_obj.name)[1].lower()
     try:
         if ext == ".pdf":
-            reader = PdfReader(file_obj.name)
             for page in reader.pages:
                 page_text = page.extract_text()
                 if page_text:
                     text_data += page_text + "\n"
         elif ext == ".txt":
-            text_data = file_obj.read().decode("utf-8", errors="ignore")
         else:
             return "仅支持 PDF 或 TXT 文件", None
     except Exception as e:
@@ -66,6 +71,7 @@ def load_file(file_obj):
     index.add(doc_embeddings)
     return f"已加载 {len(docs)} 个文本块", None
 # ===== RAG 查询函数 =====
 def rag_query(query):
     if index is None:

 docs = []
 # ===== 文件解析函数 =====
 def load_file(file_obj):
     global index, docs
     docs = []
     text_data = ""
+    # 获取文件路径
+    file_path = file_obj.name if hasattr(file_obj, "name") else file_obj
+    ext = os.path.splitext(file_path)[1].lower()
     try:
         if ext == ".pdf":
+            reader = PdfReader(file_path)
             for page in reader.pages:
                 page_text = page.extract_text()
                 if page_text:
                     text_data += page_text + "\n"
         elif ext == ".txt":
+            with open(file_path, "r", encoding="utf-8", errors="ignore") as f:
+                text_data = f.read()
         else:
             return "仅支持 PDF 或 TXT 文件", None
     except Exception as e:
     index.add(doc_embeddings)
     return f"已加载 {len(docs)} 个文本块", None
 # ===== RAG 查询函数 =====
 def rag_query(query):
     if index is None: