Spaces:

Alexend
/

Stust

Sleeping

App Files Files Community

Alexend commited on Jun 26, 2025

Commit

9d3d109

verified ·

1 Parent(s): a20b0e3

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -52

app.py CHANGED Viewed

@@ -1,29 +1,33 @@
-# ✅ app.py - Qwen + QA + web_data + 指定網站爬蟲 txt 優先設定
 import json
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
-import requests
-from bs4 import BeautifulSoup
-# ✅ 使用 Qwen 小模型
-model_name = "Qwen/Qwen1.5-0.5B-Chat"
-tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
-model = AutoModelForCausalLM.from_pretrained(model_name, trust_remote_code=True).to("cuda" if torch.cuda.is_available() else "cpu")
-model.eval()
-# ✅ 載入 qa.json
-with open("qa.json", "r", encoding="utf-8") as f:
     qa_data = json.load(f)
-# ✅ 載入 web_data.txt
-with open("web_data.txt", "r", encoding="utf-8") as f:
-    web_data = f.read()
-# ✅ 載入指定網站清單（txt 檔，每行一個）
-with open("trusted_sites.txt", "r", encoding="utf-8") as f:
-    trusted_sites = [line.strip() for line in f if line.strip() and not line.startswith("#")]
 # ✅ QA 關鍵字比對
@@ -37,39 +41,27 @@ def retrieve_qa_context(user_input):
                 return item["response"]
     return None
-# ✅ 網路爬蟲（優先指定網站）
-def search_web(query):
-    headers = {"User-Agent": "Mozilla/5.0"}
-    for site in trusted_sites:
-        search_url = f"https://www.google.com/search?q=site:{site}+{query}"
-        res = requests.get(search_url, headers=headers)
-        soup = BeautifulSoup(res.text, 'html.parser')
-        for a in soup.find_all("a", href=True):
-            href = a["href"]
-            if "url?q=" in href and site in href:
-                url = href.split("url?q=")[-1].split("&")[0]
-                try:
-                    page = requests.get(url, headers=headers, timeout=5)
-                    page.encoding = page.apparent_encoding
-                    text = BeautifulSoup(page.text, "html.parser").get_text(separator=" ", strip=True)
-                    return text[:1000]
-                except:
-                    continue
-    return "目前無法從指定網站取得有效資料。"
-# ✅ 回答生成
-def generate_answer_from_context(user_input, context):
     prompt = f"""
-你是一位了解南臺科技大學的語音助理，請根據以下資料回答問題：
-[資料]
 {context}
 [問題]
 {user_input}
-請以繁體中文簡短自然回答，不超過 90 字，回答應明確有資訊，避免廢話與假設。
 """
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(**inputs, max_new_tokens=150)
@@ -79,23 +71,23 @@ def generate_answer_from_context(user_input, context):
             return line.strip()
     return response[-90:]
-# ✅ 主流程
 def answer(user_input):
-    context = retrieve_qa_context(user_input)
-    if context:
-        return context
     else:
-        fallback_context = search_web(user_input)
-        return generate_answer_from_context(user_input, fallback_context)
 # ✅ Gradio UI
 interface = gr.Interface(
     fn=answer,
-    inputs=gr.Textbox(lines=2, placeholder="請問有關南臺科技大學的問題..."),
     outputs="text",
-    title="南臺科技大學 問答機器人（Qwen + QA + 網路爬蟲）",
-    description="優先使用 QA 資料與本地知識，若無結果，從指定網站清單中搜尋資料自動回答。",
     theme="default"
 )

+# ✅ app.py - 向量式 RAG 主程式（整合 QA.json + FAISS 向量資料庫 + Qwen 生成）
 import json
 import gradio as gr
+import faiss
 import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM
+from sentence_transformers import SentenceTransformer
+# ✅ 檔案與模型設定
+QA_FILE = "qa.json"
+DOCS_FILE = "docs.json"
+VECTOR_FILE = "faiss_index.faiss"
+EMBED_MODEL = "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"
+GEN_MODEL = "Qwen/Qwen1.5-0.5B-Chat"
+# ✅ 載入 QA 資料
+with open(QA_FILE, "r", encoding="utf-8") as f:
     qa_data = json.load(f)
+# ✅ 載入文件對應段落
+with open(DOCS_FILE, "r", encoding="utf-8") as f:
+    docs = json.load(f)
+# ✅ 載入向量庫與模型
+index = faiss.read_index(VECTOR_FILE)
+embedder = SentenceTransformer(EMBED_MODEL)
+tokenizer = AutoTokenizer.from_pretrained(GEN_MODEL, trust_remote_code=True)
+model = AutoModelForCausalLM.from_pretrained(GEN_MODEL, trust_remote_code=True).to("cuda" if torch.cuda.is_available() else "cpu")
+model.eval()
 # ✅ QA 關鍵字比對
                 return item["response"]
     return None
+# ✅ FAISS 向量檢索（返回 top-k 最相關段落）
+def search_context_faiss(user_input, top_k=3):
+    vec = embedder.encode([user_input])
+    D, I = index.search(vec, top_k)
+    retrieved = [docs[i] for i in I[0] if i < len(docs)]
+    return "\n".join(retrieved)
+# ✅ 用 Qwen 生成自然語言回答
+def generate_answer(user_input, context):
     prompt = f"""
+你是一位了解南臺科技大學的親切語音助理，請根據以下資料回答使用者的問題：
+[相關資料]
 {context}
 [問題]
 {user_input}
+請用繁體中文簡短自然地回答，限制在 90 字內，回應應明確有資訊，不要含糊或重複問題。
 """
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(**inputs, max_new_tokens=150)
             return line.strip()
     return response[-90:]
+# ✅ 整合邏輯
 def answer(user_input):
+    direct = retrieve_qa_context(user_input)
+    if direct:
+        return direct
     else:
+        context = search_context_faiss(user_input)
+        return generate_answer(user_input, context)
 # ✅ Gradio UI
 interface = gr.Interface(
     fn=answer,
+    inputs=gr.Textbox(lines=2, placeholder="請輸入與南臺科技大學相關的問題..."),
     outputs="text",
+    title="南臺科技大學 問答機器人（向量式 RAG）",
+    description="結合 QA 關鍵字與語意向量檢索，提供自然繁體回答。",
     theme="default"
 )