Spaces:

ChienChung
/

SmartRAG_Multi-Agent_Assistant

Runtime error

App Files Files Community

ChienChung commited on Apr 6, 2025

Commit

01b87b4

verified ·

1 Parent(s): 7dab3fd

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -10

app.py CHANGED Viewed

@@ -1364,11 +1364,17 @@ from tempfile import mkdtemp
 import os
 from tempfile import mkdtemp
-# 如果需要專用於 Tab6 的 get_file_path（不影響其他 Tab），可以使用下面的版本：
 def get_file_path_tab6(file):
     if isinstance(file, str):
         return file
     elif isinstance(file, dict):
         if file.get("data"):
             temp_dir = mkdtemp()
             file_name = file.get("name", "uploaded_file")
@@ -1377,7 +1383,9 @@ def get_file_path_tab6(file):
                 f.write(file["data"])
             return file_path
         else:
             return file.get("name")
     elif hasattr(file, "save"):
         temp_dir = mkdtemp()
         file_path = os.path.join(temp_dir, file.name)
@@ -1386,18 +1394,20 @@ def get_file_path_tab6(file):
     else:
         return None
 def langgraph_tab6_main(query: str, file=None):
     try:
         files = file if isinstance(file, list) else [file] if file else []
         all_docs, file_names = [], []
         for f in files:
-            # 使用專用於 Tab6 的 get_file_path_tab6
-            path = get_file_path_tab6(f)
             if not path:
                 print("get_file_path_tab6 returned None for file:", f)
                 continue
             file_names.append(os.path.basename(path))
             print("Tab6 Processing file:", path)
             if path.lower().endswith(".pdf"):
                 loader = PyPDFLoader(path)
             elif path.lower().endswith(".docx"):
@@ -1407,22 +1417,25 @@ def langgraph_tab6_main(query: str, file=None):
             docs = loader.load()
             print("Docs loaded from", path, ":", docs)
             all_docs.extend(docs)
-        if not all_docs:
-            print("No document content read. file_names:", file_names)
-            retriever = None
-        else:
             chunks = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50).split_documents(all_docs)
             db = FAISS.from_documents(chunks, embeddings)
             retriever = db.as_retriever()
-            # 將建立好的 retriever 指派到全域變數 session_retriever，
-            # 以便 Summarise 與 Document QA 工具內部可以檢查到有上傳文件
             global session_retriever
             session_retriever = retriever
         graph = build_langgraph_pipeline()
         state = {"query": query, "file_names": file_names}
         if retriever is not None:
             state["retriever"] = retriever
         result = graph.invoke(state)
         if "answer" in result:
             return result["answer"]

 import os
 from tempfile import mkdtemp
+import os
+from tempfile import mkdtemp
+# 專用於 Tab6 的檔案路徑取得函式（僅用於 Tab6，不影響其他地方）
 def get_file_path_tab6(file):
+    # 如果檔案是字串，直接回傳
     if isinstance(file, str):
         return file
+    # 如果檔案是字典型態（Gradio 上傳後通常為此格式）
     elif isinstance(file, dict):
+        # 若有 "data" 欄位，表示有檔案內容（bytes），就寫入臨時檔案
         if file.get("data"):
             temp_dir = mkdtemp()
             file_name = file.get("name", "uploaded_file")
                 f.write(file["data"])
             return file_path
         else:
+            # 若無 "data"，則直接回傳 "name" 欄位
             return file.get("name")
+    # 如果是具備 save 方法的物件，則使用 save 儲存後回傳路徑
     elif hasattr(file, "save"):
         temp_dir = mkdtemp()
         file_path = os.path.join(temp_dir, file.name)
     else:
         return None
+# 修改後的 Tab6 主執行函式
 def langgraph_tab6_main(query: str, file=None):
     try:
+        # 先處理上傳檔案（支援多檔案上傳）
         files = file if isinstance(file, list) else [file] if file else []
         all_docs, file_names = [], []
         for f in files:
+            path = get_file_path_tab6(f)  # 使用專用於 Tab6 的函式
             if not path:
                 print("get_file_path_tab6 returned None for file:", f)
                 continue
             file_names.append(os.path.basename(path))
             print("Tab6 Processing file:", path)
+            # 根據副檔名選擇 Loader
             if path.lower().endswith(".pdf"):
                 loader = PyPDFLoader(path)
             elif path.lower().endswith(".docx"):
             docs = loader.load()
             print("Docs loaded from", path, ":", docs)
             all_docs.extend(docs)
+        # 若成功讀取到文件內容，建立檢索器
+        if all_docs:
             chunks = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50).split_documents(all_docs)
             db = FAISS.from_documents(chunks, embeddings)
             retriever = db.as_retriever()
+            # 將建立好的 retriever 指派到全域變數 session_retriever，供 Summarise/Document QA 工具使用
             global session_retriever
             session_retriever = retriever
+        else:
+            print("No document content read. file_names:", file_names)
+            retriever = None
+        # 建立 LangGraph 流程
         graph = build_langgraph_pipeline()
         state = {"query": query, "file_names": file_names}
+        # 若有 retriever，將其放入 state，讓下游工具（例如 Document QA 或 Summarise）能從 state 中取用
         if retriever is not None:
             state["retriever"] = retriever
         result = graph.invoke(state)
         if "answer" in result:
             return result["answer"]