Spaces:

JC321
/

EasyFinancialAgent-Test

Sleeping

App Files Files Community

JC321 commited on Nov 28, 2025

Commit

5c7ef4d

verified ·

1 Parent(s): a4e55d3

Upload app.py

Browse files

Files changed (1) hide show

app.py +30 -24

app.py CHANGED Viewed

@@ -48,11 +48,11 @@ print(f"📊 MCP Services: {len(MCP_SERVICES)} services, {len(MCP_TOOLS)} tools"
 # HuggingFace Inference API 实际限制约 8000-16000 tokens
 # 为了安全，设置更低的限制
 MAX_TOTAL_TOKENS = 6000  # 总上下文限制
-MAX_TOOL_RESULT_CHARS = 800  # 工具返回最大字符数 (约400 tokens)
 MAX_HISTORY_CHARS = 500  # 单条历史消息最大字符数
 MAX_HISTORY_TURNS = 2  # 最大历史轮数
-MAX_TOOL_ITERATIONS = 2  # 最大工具调用轮数
-MAX_OUTPUT_TOKENS = 1000  # 最大输出 tokens
 def estimate_tokens(text):
     """估算文本 token 数量（粗略：1 token ≈ 2 字符）"""
@@ -193,7 +193,8 @@ def chatbot_response(message, history):
         tool_calls_log = []
-        # LLM 调用循环(最多2轮工具调用) - 严格控制迭代次数
         for iteration in range(MAX_TOOL_ITERATIONS):
             response = client.chat.completions.create(
                 model="Qwen/Qwen3-32B:groq",
@@ -217,21 +218,18 @@ def chatbot_response(message, history):
                     # 调用 MCP 工具
                     tool_result = call_mcp_tool(tool_name, tool_args)
-                    # 严格限制返回结果大小，避免超长内容导致500错误
                     result_str = json.dumps(tool_result, ensure_ascii=False)
-                    # 截断到安全长度 (800字符 ≈ 400 tokens)
                     if len(result_str) > MAX_TOOL_RESULT_CHARS:
                         if isinstance(tool_result, dict) and "text" in tool_result:
-                            # 如果是文本格式
                             truncated_text = truncate_text(tool_result["text"], MAX_TOOL_RESULT_CHARS - 50)
                             tool_result_truncated = {"text": truncated_text, "_truncated": True}
                         elif isinstance(tool_result, dict):
-                            # JSON 格式，保留关键字段
                             truncated = {}
                             char_count = 0
-                            for k, v in list(tool_result.items())[:5]:  # 只保留前5个字段
-                                v_str = str(v)[:200]  # 每个值最多200字符
                                 truncated[k] = v_str
                                 char_count += len(k) + len(v_str)
                                 if char_count > MAX_TOOL_RESULT_CHARS:
@@ -255,6 +253,8 @@ def chatbot_response(message, history):
                 continue
             else:
                 break
         # 构建响应前缀（简化版）
@@ -299,20 +299,26 @@ def chatbot_response(message, history):
         # 流式输出最终答案
         yield response_prefix
-        stream = client.chat.completions.create(
-            model="Qwen/Qwen3-32B:groq",
-            messages=messages,
-            tools=MCP_TOOLS,
-            max_tokens=MAX_OUTPUT_TOKENS,
-            temperature=0.5,
-            stream=True
-        )
-        accumulated_text = ""
-        for chunk in stream:
-            if chunk.choices and len(chunk.choices) > 0 and chunk.choices[0].delta.content:
-                accumulated_text += chunk.choices[0].delta.content
-                yield response_prefix + accumulated_text
     except Exception as e:
         import traceback

 # HuggingFace Inference API 实际限制约 8000-16000 tokens
 # 为了安全，设置更低的限制
 MAX_TOTAL_TOKENS = 6000  # 总上下文限制
+MAX_TOOL_RESULT_CHARS = 1500  # 工具返回最大字符数 (增加到1500)
 MAX_HISTORY_CHARS = 500  # 单条历史消息最大字符数
 MAX_HISTORY_TURNS = 2  # 最大历史轮数
+MAX_TOOL_ITERATIONS = 6  # 最大工具调用轮数 (增加到6，支持多工具调用)
+MAX_OUTPUT_TOKENS = 2000  # 最大输出 tokens (增加到2000)
 def estimate_tokens(text):
     """估算文本 token 数量（粗略：1 token ≈ 2 字符）"""
         tool_calls_log = []
+        # LLM 调用循环(支持多轮工具调用)
+        final_response_content = None
         for iteration in range(MAX_TOOL_ITERATIONS):
             response = client.chat.completions.create(
                 model="Qwen/Qwen3-32B:groq",
                     # 调用 MCP 工具
                     tool_result = call_mcp_tool(tool_name, tool_args)
+                    # 限制返回结果大小
                     result_str = json.dumps(tool_result, ensure_ascii=False)
                     if len(result_str) > MAX_TOOL_RESULT_CHARS:
                         if isinstance(tool_result, dict) and "text" in tool_result:
                             truncated_text = truncate_text(tool_result["text"], MAX_TOOL_RESULT_CHARS - 50)
                             tool_result_truncated = {"text": truncated_text, "_truncated": True}
                         elif isinstance(tool_result, dict):
                             truncated = {}
                             char_count = 0
+                            for k, v in list(tool_result.items())[:8]:  # 保留前8个字段
+                                v_str = str(v)[:300]  # 每个值最多300字符
                                 truncated[k] = v_str
                                 char_count += len(k) + len(v_str)
                                 if char_count > MAX_TOOL_RESULT_CHARS:
                 continue
             else:
+                # 没有更多工具调用，保存最终答案
+                final_response_content = choice.message.content
                 break
         # 构建响应前缀（简化版）
         # 流式输出最终答案
         yield response_prefix
+        # 如果已经有最终答案，直接流式输出
+        if final_response_content:
+            # 已经从循环中获得了最终答案，直接输出
+            yield response_prefix + final_response_content
+        else:
+            # 如果循环结束但没有最终答案（达到最大迭代次数），需要再调用一次让模型总结
+            stream = client.chat.completions.create(
+                model="Qwen/Qwen3-32B:groq",
+                messages=messages,
+                tools=None,  # 不再允许调用工具
+                max_tokens=MAX_OUTPUT_TOKENS,
+                temperature=0.5,
+                stream=True
+            )
+            accumulated_text = ""
+            for chunk in stream:
+                if chunk.choices and len(chunk.choices) > 0 and chunk.choices[0].delta.content:
+                    accumulated_text += chunk.choices[0].delta.content
+                    yield response_prefix + accumulated_text
     except Exception as e:
         import traceback