Spaces:

howard9963
/

testComplianceLocal

Sleeping

howard9963 commited on Aug 14, 2025

Commit

a674033

verified ·

1 Parent(s): 622282a

Upload app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -184,7 +184,31 @@ def safe_parse_json(text: str) -> dict:
     if "'" in repaired and '"' not in repaired:
         repaired = repaired.replace("'", '"')
     return _json.loads(repaired)
 def call_llm(messages: List[dict], model: str, logs: List[str]) -> dict:
     """
     保留原名稱 call_llm，但改為本地 LLaMA。
@@ -220,7 +244,7 @@ def call_llm(messages: List[dict], model: str, logs: List[str]) -> dict:
         print("torch.no_grad")
         # 解碼生成內容後
         full_text = _hf_tok.decode(out_ids[0], skip_special_tokens=True)
-        gen_text = full_text.replace(prompt,"",1).strip()
         logs.append(f"[LOCAL LLM] raw_len={len(gen_text)}")
         logs.append(f"[LOCAL LLM] gen_text={gen_text}")
         logs.append(f"[LOCAL LLM] prompt={prompt}")

     if "'" in repaired and '"' not in repaired:
         repaired = repaired.replace("'", '"')
     return _json.loads(repaired)
+def extract_model_reply(full_text, prompt):
+    """
+    從模型完整輸出中，移除 prompt 和任何 system、assistant 等前置內容
+    """
+    try:
+        # 如果模型有把 prompt 或 system 一起回顯，先找最後一次 user 提問位置
+        markers = ["user", "User", "使用者", prompt.strip()]
+        last_pos = -1
+        for m in markers:
+            pos = full_text.rfind(m)
+            if pos > last_pos:
+                last_pos = pos
+        # 從最後 marker 後面開始取內容
+        if last_pos != -1:
+            reply = full_text[last_pos + len(markers[-1]):]
+        else:
+            reply = full_text
+        # 移除多餘空白與換行
+        return reply.strip()
+    except Exception as e:
+        print(f"[extract_model_reply 錯誤] {e}")
+        return full_text.strip()
 def call_llm(messages: List[dict], model: str, logs: List[str]) -> dict:
     """
     保留原名稱 call_llm，但改為本地 LLaMA。
         print("torch.no_grad")
         # 解碼生成內容後
         full_text = _hf_tok.decode(out_ids[0], skip_special_tokens=True)
+        gen_text = extract_model_reply(full_text, prompt)
         logs.append(f"[LOCAL LLM] raw_len={len(gen_text)}")
         logs.append(f"[LOCAL LLM] gen_text={gen_text}")
         logs.append(f"[LOCAL LLM] prompt={prompt}")