Spaces:

Estazz
/

PokerGameDesigner

Sleeping

App Files Files Community

Estazz commited on Sep 8, 2025

Commit

52f33d3

verified ·

1 Parent(s): f16af1f

Update ai_service.py

Browse files

Files changed (1) hide show

ai_service.py +169 -65

ai_service.py CHANGED Viewed

@@ -1,5 +1,5 @@
 """
-AI 服务模块 - 处理与 AI 模型的交互
 """
 import dashscope
 from dashscope import Generation
@@ -9,34 +9,13 @@ from cache_manager import request_cache
 from security import input_validator
-def design_poker_game(message, history, uploaded_files, custom_prompt_text, prompt_mode):
     """
-    设计扑克游戏的主要函数
-    Args:
-        message: 用户输入的消息
-        history: 对话历史
-        uploaded_files: 上传的文件
-        custom_prompt_text: 自定义提示词
-        prompt_mode: 提示词模式
-    Returns:
-        str: AI 的回复内容
     """
-    # 输入验证
-    is_valid, error_msg = input_validator.validate_message(message)
-    if not is_valid:
-        return f"❌ 输入验证失败：{error_msg}"
-    is_valid, error_msg = input_validator.validate_custom_prompt(custom_prompt_text)
-    if not is_valid:
-        return f"❌ 自定义提示词验证失败：{error_msg}"
-    is_valid, error_msg = input_validator.validate_file_list(uploaded_files)
-    if not is_valid:
-        return f"❌ 文件验证失败：{error_msg}"
     # 1) 选择 System Prompt
-    base_sys = SYSTEM_PROMPT.strip()
     user_sys = (custom_prompt_text or "").strip()
     mode = (prompt_mode or "覆盖默认SYSTEM_PROMPT").strip()
@@ -46,10 +25,9 @@ def design_poker_game(message, history, uploaded_files, custom_prompt_text, prom
     else:
         system_to_use = base_sys
-    # 2) 基础 system
     messages = [{"role": "system", "content": system_to_use}]
-    # 3) 注入上传的 GDL（作为第二条 system）
     gdl_spec = load_gdl_text(uploaded_files)
     if gdl_spec:
         messages.append({
@@ -58,39 +36,94 @@ def design_poker_game(message, history, uploaded_files, custom_prompt_text, prom
                        + gdl_spec + "\n</GDL_SPEC>"
         })
-    # 4) 追加历史对话
-    for human, assistant in history:
-        messages.append({"role": "user", "content": human})
-        messages.append({"role": "assistant", "content": assistant})
-    # 5) 当前输入
     messages.append({"role": "user", "content": message})
-    # 6) 检查缓存并调用模型
-    # 注意：对于包含历史对话的请求，我们只缓存没有历史对话的请求
-    if len(history) == 0:
         cached_response = request_cache.get(messages)
         if cached_response:
             return cached_response
     response = _call_ai_model(messages)
-    # 缓存没有历史对话的响应
-    if len(history) == 0 and response and not response.startswith("❌") and not response.startswith("💥"):
         request_cache.set(messages, response)
     return response
 def _call_ai_model(messages):
     """
-    调用 AI 模型
-    Args:
-        messages: 消息列表
-    Returns:
-        str: AI 回复内容
     """
     try:
         response = Generation.call(
@@ -99,10 +132,10 @@ def _call_ai_model(messages):
             temperature=TEMPERATURE,
             top_p=TOP_P,
             max_tokens=MAX_TOKENS,
-            result_format='message',
-            enable_thinking=False
         )
         if response.status_code == 200:
             content = response.output.choices[0].message.content
             if not content or content.strip() == "":
@@ -110,7 +143,7 @@ def _call_ai_model(messages):
             return content
         else:
             return _handle_api_error(response)
     except ConnectionError as e:
         return f"🌐 网络连接错误：{str(e)}\n\n请检查网络连接是否正常。"
     except TimeoutError as e:
@@ -123,17 +156,10 @@ def _call_ai_model(messages):
 def _handle_api_error(response):
     """
     处理 API 错误
-    Args:
-        response: API 响应对象
-    Returns:
-        str: 错误信息
     """
-    # 兼容不同类型的 code/status_code（有些为字符串，有些为整型）
-    status_code = getattr(response, 'status_code', None)
-    code_raw = getattr(response, 'code', None)
-    message = getattr(response, 'message', '')
     error_msg = f"❌ API 错误：{code_raw} - {message}"
@@ -145,13 +171,91 @@ def _handle_api_error(response):
     code_int = _as_int(code_raw)
-    if (status_code == 401) or (code_int == 401) or (str(code_raw) == '401'):
         error_msg += "\n\n💡 提示：请检查 API Key 是否正确设置。"
-    elif (status_code == 429) or (code_int == 429) or (str(code_raw) == '429'):
         error_msg += "\n\n💡 提示：请求过于频繁，请稍后再试。"
     else:
-        # 服务器错误（5xx）判定：优先使用 status_code，其次尝试解析 code
         if (isinstance(status_code, int) and status_code >= 500) or (code_int is not None and code_int >= 500):
             error_msg += "\n\n💡 提示：服务器错误，请稍后重试。"
     return error_msg

 """
+AI 服务模块 - 处理与 AI 模型的交互（支持原生流式输出）
 """
 import dashscope
 from dashscope import Generation
 from security import input_validator
+# ========== 公共小工具 ==========
+def _prepare_messages(message, history, uploaded_files, custom_prompt_text, prompt_mode):
     """
+    组装 messages，保证与非流式/流式两条路径的提示词一致
     """
     # 1) 选择 System Prompt
+    base_sys = (SYSTEM_PROMPT or "").strip()
     user_sys = (custom_prompt_text or "").strip()
     mode = (prompt_mode or "覆盖默认SYSTEM_PROMPT").strip()
     else:
         system_to_use = base_sys
     messages = [{"role": "system", "content": system_to_use}]
+    # 2) 注入上传的 GDL（作为第二条 system）
     gdl_spec = load_gdl_text(uploaded_files)
     if gdl_spec:
         messages.append({
                        + gdl_spec + "\n</GDL_SPEC>"
         })
+    # 3) 追加历史对话
+    for human, assistant in (history or []):
+        if human:
+            messages.append({"role": "user", "content": human})
+        if assistant:
+            messages.append({"role": "assistant", "content": assistant})
+    # 4) 当前输入
     messages.append({"role": "user", "content": message})
+    return messages
+def _yield_chunks(text, step=40):
+    """把整段文本切成小块，伪流式输出。"""
+    s = str(text or "")
+    for i in range(0, len(s), step):
+        yield s[i:i + step]
+def _extract_stream_delta(resp):
+    """
+    尽量兼容不同 dashscope 小版本的流式返回结构，提取“增量文本”
+    常见字段：resp.output_text 或 resp.output.choices[0].delta/message/content
+    """
+    delta = None
+    # 优先简单字段
+    if hasattr(resp, "output_text") and resp.output_text:
+        return resp.output_text
+    out = getattr(resp, "output", None)
+    if isinstance(out, dict):
+        choices = out.get("choices") or []
+        if choices:
+            c0 = choices[0] or {}
+            # 1) delta 路径
+            d = c0.get("delta")
+            if isinstance(d, dict):
+                delta = d.get("content") or d.get("text") or None
+            elif d:
+                delta = str(d)
+            # 2) message 路径（有些版本直接不断给 message.content）
+            if not delta and isinstance(c0.get("message"), dict):
+                delta = c0["message"].get("content")
+            # 3) content 直给
+            if not delta:
+                delta = c0.get("content")
+    return delta
+# ========== 非流式（保留你原实现，便于兼容） ==========
+def design_poker_game(message, history, uploaded_files, custom_prompt_text, prompt_mode):
+    """
+    设计扑克游戏的主要函数（非流式）
+    """
+    # 输入验证
+    is_valid, error_msg = input_validator.validate_message(message)
+    if not is_valid:
+        return f"❌ 输入验证失败：{error_msg}"
+    is_valid, error_msg = input_validator.validate_custom_prompt(custom_prompt_text)
+    if not is_valid:
+        return f"❌ 自定义提示词验证失败：{error_msg}"
+    is_valid, error_msg = input_validator.validate_file_list(uploaded_files)
+    if not is_valid:
+        return f"❌ 文件验证失败：{error_msg}"
+    messages = _prepare_messages(message, history, uploaded_files, custom_prompt_text, prompt_mode)
+    # 仅在“无历史”时启用缓存（沿用你的策略）
+    if len(history or []) == 0:
         cached_response = request_cache.get(messages)
         if cached_response:
             return cached_response
     response = _call_ai_model(messages)
+    if len(history or []) == 0 and response and not response.startswith(("❌", "💥")):
         request_cache.set(messages, response)
     return response
 def _call_ai_model(messages):
     """
+    调用 AI 模型（非流式）
     """
     try:
         response = Generation.call(
             temperature=TEMPERATURE,
             top_p=TOP_P,
             max_tokens=MAX_TOKENS,
+            result_format="message",
+            enable_thinking=False,
         )
         if response.status_code == 200:
             content = response.output.choices[0].message.content
             if not content or content.strip() == "":
             return content
         else:
             return _handle_api_error(response)
     except ConnectionError as e:
         return f"🌐 网络连接错误：{str(e)}\n\n请检查网络连接是否正常。"
     except TimeoutError as e:
 def _handle_api_error(response):
     """
     处理 API 错误
     """
+    status_code = getattr(response, "status_code", None)
+    code_raw = getattr(response, "code", None)
+    message = getattr(response, "message", "")
     error_msg = f"❌ API 错误：{code_raw} - {message}"
     code_int = _as_int(code_raw)
+    if (status_code == 401) or (code_int == 401) or (str(code_raw) == "401"):
         error_msg += "\n\n💡 提示：请检查 API Key 是否正确设置。"
+    elif (status_code == 429) or (code_int == 429) or (str(code_raw) == "429"):
         error_msg += "\n\n💡 提示：请求过于频繁，请稍后再试。"
     else:
         if (isinstance(status_code, int) and status_code >= 500) or (code_int is not None and code_int >= 500):
             error_msg += "\n\n💡 提示：服务器错误，请稍后重试。"
     return error_msg
+# ========== 新增：原生流式 ==========
+def design_poker_game_stream(message, history, uploaded_files, custom_prompt_text, prompt_mode):
+    """
+    原生流式：逐段 yield 文本片段（字符串）
+    - 与 design_poker_game 的提示与参数保持一致
+    - app.py 会优先调用本函数实现“边生成边显示”
+    """
+    # 1) 输入验证（与非流式一致）
+    is_valid, error_msg = input_validator.validate_message(message)
+    if not is_valid:
+        yield f"❌ 输入验证失败：{error_msg}"
+        return
+    is_valid, error_msg = input_validator.validate_custom_prompt(custom_prompt_text)
+    if not is_valid:
+        yield f"❌ 自定义提示词验证失败：{error_msg}"
+        return
+    is_valid, error_msg = input_validator.validate_file_list(uploaded_files)
+    if not is_valid:
+        yield f"❌ 文件验证失败：{error_msg}"
+        return
+    # 2) 组装 messages
+    messages = _prepare_messages(message, history, uploaded_files, custom_prompt_text, prompt_mode)
+    # 3) 缓存命中（仅无历史时）
+    no_hist = len(history or []) == 0
+    if no_hist:
+        cached = request_cache.get(messages)
+        if cached:
+            for piece in _yield_chunks(cached, step=48):  # 比非流式略大些片段，体感更顺
+                yield piece
+            return
+    # 4) 原生流式调用
+    buf = []
+    try:
+        resp_iter = Generation.call(
+            model=MODEL_NAME,
+            messages=messages,
+            temperature=TEMPERATURE,
+            top_p=TOP_P,
+            max_tokens=MAX_TOKENS,
+            result_format="message",     # 与非流式保持一致
+            enable_thinking=False,
+            stream=True,
+            incremental_output=True,     # 关键：��量输出
+        )
+        for resp in resp_iter:
+            # 有些帧可能是控制帧/心跳，直接跳过
+            delta = _extract_stream_delta(resp)
+            if not delta:
+                # 也可能是错误帧
+                status_code = getattr(resp, "status_code", 200)
+                if status_code and status_code != 200:
+                    # 尽量提取错误信息并终止
+                    err = _handle_api_error(resp)
+                    yield f"\n{err}"
+                    return
+                continue
+            buf.append(delta)
+            yield delta  # 每拿到一段就吐出去
+        # 5) 结束：写入缓存（仅无历史时 & 有内容 & 无错误提示）
+        full = "".join(buf).strip()
+        if no_hist and full and not full.startswith(("❌", "💥")):
+            request_cache.set(messages, full)
+    except ConnectionError as e:
+        yield f"\n🌐 网络连接错误：{str(e)}"
+    except TimeoutError as e:
+        yield f"\n⏰ 请求超时：{str(e)}"
+    except Exception as e:
+        yield f"\n💥 流式调用失败：{type(e).__name__}: {e}"