LINE-ROBOT

Sleeping

cwadayi commited on Aug 16, 2025

Commit

eef0d6d

verified ·

1 Parent(s): 285d51d

Update ai_service.py

Files changed (1) hide show

ai_service.py CHANGED Viewed

@@ -16,22 +16,15 @@ def _ensure_llm():
     _LLM["loaded"] = True
     try:
-        # [修改] 採用更穩健的載入方式
-        # 1. 決定裝置 (GPU or CPU)
         device = "cuda" if torch.cuda.is_available() else "cpu"
-        # 2. 分別載入 tokenizer 和 model
         tokenizer = AutoTokenizer.from_pretrained(LLM_MODEL)
         model = AutoModelForCausalLM.from_pretrained(LLM_MODEL).to(device)
-        # 3. 將載入好的 tokenizer 和 model 傳入 pipeline
         pipe = pipeline(
             "text-generation",
             model=model,
             tokenizer=tokenizer,
             device=device
         )
         _LLM.update({"ok": True, "model": pipe})
         return True, None
     except Exception as e:
@@ -46,7 +39,9 @@ def generate_ai_text(user_prompt: str) -> str:
         return f"🤖 AI 模型無法使用。\n詳細錯誤：{err}"
     pipe = _LLM["model"]
-    prompt = user_prompt
     try:
         outputs = pipe(
@@ -56,10 +51,8 @@ def generate_ai_text(user_prompt: str) -> str:
             temperature=LLM_TEMPERATURE,
             top_k=LLM_TOP_K,
         )
-        # 從 pipeline 的輸出中解析出模型生成的部分
         response = outputs[0]["generated_text"]
-        # 移除原始 prompt 以獲得乾淨的回應
         if prompt in response:
             response = response.split(prompt, 1)[-1]

     _LLM["loaded"] = True
     try:
         device = "cuda" if torch.cuda.is_available() else "cpu"
         tokenizer = AutoTokenizer.from_pretrained(LLM_MODEL)
         model = AutoModelForCausalLM.from_pretrained(LLM_MODEL).to(device)
         pipe = pipeline(
             "text-generation",
             model=model,
             tokenizer=tokenizer,
             device=device
         )
         _LLM.update({"ok": True, "model": pipe})
         return True, None
     except Exception as e:
         return f"🤖 AI 模型無法使用。\n詳細錯誤：{err}"
     pipe = _LLM["model"]
+    # [修改] 給予 bloomz 模型一個更清晰的指令
+    prompt = f"你是一個多功能的台灣在地LINE助理，請用繁體中文簡潔有力地回答以下問題。\n問題：{user_prompt}\n回答："
     try:
         outputs = pipe(
             temperature=LLM_TEMPERATURE,
             top_k=LLM_TOP_K,
         )
         response = outputs[0]["generated_text"]
         if prompt in response:
             response = response.split(prompt, 1)[-1]