Spaces:

Alexend
/

Stust

Sleeping

App Files Files Community

Alexend commited on Jun 26, 2025

Commit

631ee3c

verified ·

1 Parent(s): 52285f4

Update app.py

Browse files

Files changed (1) hide show

app.py +39 -13

app.py CHANGED Viewed

@@ -1,4 +1,4 @@
-# ✅ app.py - 自動建構向量庫版本（向量式 RAG） with 強化 prompt
 import json
 import os
@@ -8,7 +8,7 @@ import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from sentence_transformers import SentenceTransformer
-# ✅ 路徑與模型設定
 QA_FILE = "qa.json"
 TEXT_FILE = "web_data.txt"
 DOCS_FILE = "docs.json"
@@ -42,7 +42,7 @@ tokenizer = AutoTokenizer.from_pretrained(GEN_MODEL, trust_remote_code=True)
 model = AutoModelForCausalLM.from_pretrained(GEN_MODEL, trust_remote_code=True).to("cuda" if torch.cuda.is_available() else "cpu")
 model.eval()
-# ✅ QA 關鍵字回應優先
 def retrieve_qa_context(user_input):
     for item in qa_data:
@@ -54,26 +54,52 @@ def retrieve_qa_context(user_input):
                 return item["response"]
     return None
-# ✅ 向量搜尋段落
 def search_context_faiss(user_input, top_k=3):
     vec = embedder.encode([user_input])
     D, I = index.search(vec, top_k)
     return "\n".join([docs[i] for i in I[0] if i < len(docs)])
-# ✅ LLM 生成繁體中文回答（強化提示）
 def generate_answer(user_input, context):
     prompt = f"""
-你是一位熟悉南臺科技大學的智慧語音助理，根據下列資料，用繁體中文回答問題。
-[資料內容]
 {context}
 [問題]
 {user_input}
-請根據資料，用一至兩句話自然回答問題。不要重複問題本身、不要說你是誰，回答務必明確，約 90 字內。
 """
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(**inputs, max_new_tokens=150)
@@ -83,7 +109,7 @@ def generate_answer(user_input, context):
             return line.strip()
     return response[-90:]
-# ✅ 主問答流程
 def answer(user_input):
     direct = retrieve_qa_context(user_input)
@@ -93,13 +119,13 @@ def answer(user_input):
         context = search_context_faiss(user_input)
         return generate_answer(user_input, context)
-# ✅ 啟動 Gradio 介面
 interface = gr.Interface(
     fn=answer,
     inputs=gr.Textbox(lines=2, placeholder="請輸入與南臺科技大學相關的問題..."),
     outputs="text",
-    title="南臺科技大學 問答機器人（向量式 RAG 自動建構）",
-    description="首次啟動會自動建立向量資料庫，支援 QA 關鍵字與語意檢索，繁體中文回答。",
     theme="default"
 )

+# ✅ app.py - 向量式 RAG + 強化 Few-shot Prompt（完整版）
 import json
 import os
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from sentence_transformers import SentenceTransformer
+# ✅ 檔案與模型設定
 QA_FILE = "qa.json"
 TEXT_FILE = "web_data.txt"
 DOCS_FILE = "docs.json"
 model = AutoModelForCausalLM.from_pretrained(GEN_MODEL, trust_remote_code=True).to("cuda" if torch.cuda.is_available() else "cpu")
 model.eval()
+# ✅ QA 快速匹配
 def retrieve_qa_context(user_input):
     for item in qa_data:
                 return item["response"]
     return None
+# ✅ 向量檢索 top-k 段落
 def search_context_faiss(user_input, top_k=3):
     vec = embedder.encode([user_input])
     D, I = index.search(vec, top_k)
     return "\n".join([docs[i] for i in I[0] if i < len(docs)])
+# ✅ 使用 Few-shot Prompt 生成答案
 def generate_answer(user_input, context):
     prompt = f"""
+你是一位了解南臺科技大學的智慧語音助理。請根據以下資料回答問題，僅用一至兩句話，以繁體中文表達，回答需清楚具體，不重複問題，不加入身份說明。
+[範例格式]
+問題：學校地址在哪裡？
+回答：南臺科技大學位於台南市永康區南台街一號。
+問題：學校電話是多少？
+回答：總機電話是 06-2533131，電機工程系分機為 3301。
+問題：電機工程系辦公室在哪？
+回答：電機工程系辦公室位於 B 棟 B101。
+問題：電機工程系有哪些組別？
+回答：電機系設有控制組、生醫電子系統組與電能資訊組三個方向。
+問題：學生社團活動如何？
+回答：南臺有超過 80 個學生社團，涵蓋學術、康樂、服務、體育與藝術領域。
+問題：圖書館提供哪些服務？
+回答：圖書館提供借書、自修空間、期刊查詢與電子資源服務。
+問題：師資如何？
+回答：本校師資陣容堅強，擁有 30 多位教授、副教授與助理教授。
+問題：悠活館是做什麼的？
+回答：悠活館是學生休閒與運動中心，設有羽球場、健身房、桌球室等設施。
+問題：怎麼到南臺科技大學？
+回答：可從台南火車站搭乘公車，或經永康交流道開車約 10 分鐘抵達。
+[資料]
 {context}
 [問題]
 {user_input}
 """
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(**inputs, max_new_tokens=150)
             return line.strip()
     return response[-90:]
+# ✅ 問答主流程
 def answer(user_input):
     direct = retrieve_qa_context(user_input)
         context = search_context_faiss(user_input)
         return generate_answer(user_input, context)
+# ✅ Gradio 介面
 interface = gr.Interface(
     fn=answer,
     inputs=gr.Textbox(lines=2, placeholder="請輸入與南臺科技大學相關的問題..."),
     outputs="text",
+    title="南臺科技大學 問答機器人（向量式 RAG 自動建構 + Few-shot）",
+    description="支援 QA 關鍵字與語意檢索，自動建立嵌入庫，輸出繁體中文自然回答。",
     theme="default"
 )