Spaces:

aixo
/

k2thinkService

Sleeping

App Files Files Community

youbiaokachi commited on Sep 13, 2025

Commit

1a06196

verified ·

1 Parent(s): 34e5fa0

Upload 10 files

Browse files

Files changed (10) hide show

k2think_proxy.py +63 -1094
requirements.txt +2 -1
src/__init__.py +3 -0
src/api_handler.py +347 -0
src/config.py +83 -0
src/constants.py +151 -0
src/exceptions.py +47 -0
src/models.py +48 -0
src/response_processor.py +446 -0
src/tool_handler.py +368 -0

k2think_proxy.py CHANGED Viewed

@@ -1,592 +1,56 @@
-from fastapi import FastAPI, HTTPException, Request, Response
-from fastapi.responses import StreamingResponse, JSONResponse, HTMLResponse
-from fastapi.middleware.cors import CORSMiddleware
-from pydantic import BaseModel
-from typing import List, Dict, Optional, Union, AsyncGenerator
-import httpx
-import json
-import asyncio
 import time
-import os
 import logging
-import re
 from contextlib import asynccontextmanager
-from dotenv import load_dotenv
-# 加载环境变量
-load_dotenv()
-# 配置
-VALID_API_KEY = os.getenv("VALID_API_KEY")
-if not VALID_API_KEY:
-    raise ValueError("错误：VALID_API_KEY 环境变量未设置。请在 .env 文件中提供一个安全的API密钥。")
-K2THINK_API_URL = os.getenv("K2THINK_API_URL", "https://www.k2think.ai/api/chat/completions")
-K2THINK_TOKEN = os.getenv("K2THINK_TOKEN")
-OUTPUT_THINKING = os.getenv("OUTPUT_THINKING", "true").lower() == "true"
-TOOL_SUPPORT = os.getenv("TOOL_SUPPORT", "true").lower() == "true"
-SCAN_LIMIT = int(os.getenv("SCAN_LIMIT", "200000"))
-SYSTEM_MESSAGE_LENTH = int(os.getenv("SYSTEM_MESSAGE_LENTH", "200000"))
-# 高级配置
-REQUEST_TIMEOUT = float(os.getenv("REQUEST_TIMEOUT", "60"))
-MAX_KEEPALIVE_CONNECTIONS = int(os.getenv("MAX_KEEPALIVE_CONNECTIONS", "20"))
-MAX_CONNECTIONS = int(os.getenv("MAX_CONNECTIONS", "100"))
-DEBUG_LOGGING = os.getenv("DEBUG_LOGGING", "false").lower() == "true"
-STREAM_DELAY = float(os.getenv("STREAM_DELAY", "0.05"))
-STREAM_CHUNK_SIZE = int(os.getenv("STREAM_CHUNK_SIZE", "50"))
-MAX_STREAM_TIME = float(os.getenv("MAX_STREAM_TIME", "10.0"))  # 最大流式输出时间（秒）
-ENABLE_ACCESS_LOG = os.getenv("ENABLE_ACCESS_LOG", "true").lower() == "true"
-CORS_ORIGINS = os.getenv("CORS_ORIGINS", "*").split(",") if os.getenv("CORS_ORIGINS", "*") != "*" else ["*"]
-# 设置日志
-LOG_LEVEL = os.getenv("LOG_LEVEL", "INFO").upper()
-if LOG_LEVEL == "DEBUG":
-    logging.basicConfig(level=logging.DEBUG)
-elif LOG_LEVEL == "WARNING":
-    logging.basicConfig(level=logging.WARNING)
-elif LOG_LEVEL == "ERROR":
-    logging.basicConfig(level=logging.ERROR)
-else:
-    logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
-# 数据模型
-class ContentPart(BaseModel):
-    """Content part model for OpenAI's new content format"""
-    type: str
-    text: Optional[str] = None
-class Message(BaseModel):
-    role: str
-    content: Optional[Union[str, List[ContentPart]]] = None
-    tool_calls: Optional[List[Dict]] = None
-class ChatCompletionRequest(BaseModel):
-    model: str = "MBZUAI-IFM/K2-Think"
-    messages: List[Message]
-    stream: bool = False
-    temperature: float = 0.7
-    max_tokens: Optional[int] = None
-    top_p: Optional[float] = None
-    frequency_penalty: Optional[float] = None
-    presence_penalty: Optional[float] = None
-    stop: Optional[Union[str, List[str]]] = None
-    tools: Optional[List[Dict]] = None
-    tool_choice: Optional[Union[str, Dict]] = None
-class ModelInfo(BaseModel):
-    id: str
-    object: str = "model"
-    created: int
-    owned_by: str
-    permission: List[Dict] = []
-    root: str
-    parent: Optional[str] = None
-class ModelsResponse(BaseModel):
-    object: str = "list"
-    data: List[ModelInfo]
-# HTTP客户端工厂函数
-def create_http_client() -> httpx.AsyncClient:
-    """创建HTTP客户端"""
-    base_kwargs = {
-        "timeout": httpx.Timeout(timeout=None, connect=10.0),
-        "limits": httpx.Limits(
-            max_keepalive_connections=MAX_KEEPALIVE_CONNECTIONS,
-            max_connections=MAX_CONNECTIONS
-        ),
-        "follow_redirects": True
-    }
-    try:
-        return httpx.AsyncClient(**base_kwargs)
-    except Exception as e:
-        logger.error(f"创建客户端失败: {e}")
-        raise e
 # 全局HTTP客户端管理
 @asynccontextmanager
 async def lifespan(app: FastAPI):
     yield
 # 创建FastAPI应用
-app = FastAPI(title="K2Think API Proxy", lifespan=lifespan)
 # CORS配置
 app.add_middleware(
     CORSMiddleware,
-    allow_origins=CORS_ORIGINS,
     allow_credentials=True,
     allow_methods=["*"],
     allow_headers=["*"],
 )
-def validate_api_key(authorization: str) -> bool:
-    """验证API密钥"""
-    if not authorization or not authorization.startswith("Bearer "):
-        return False
-    api_key = authorization[7:]  # 移除 "Bearer " 前缀
-    return api_key == VALID_API_KEY
-def generate_session_id() -> str:
-    """生成会话ID"""
-    import uuid
-    return str(uuid.uuid4())
-def generate_chat_id() -> str:
-    """生成聊天ID"""
-    import uuid
-    return str(uuid.uuid4())
-def get_current_datetime_info():
-    """获取当前时间信息"""
-    from datetime import datetime
-    import pytz
-    # 设置时区为上海
-    tz = pytz.timezone('Asia/Shanghai')
-    now = datetime.now(tz)
-    return {
-        "{{USER_NAME}}": "User",
-        "{{USER_LOCATION}}": "Unknown",
-        "{{CURRENT_DATETIME}}": now.strftime("%Y-%m-%d %H:%M:%S"),
-        "{{CURRENT_DATE}}": now.strftime("%Y-%m-%d"),
-        "{{CURRENT_TIME}}": now.strftime("%H:%M:%S"),
-        "{{CURRENT_WEEKDAY}}": now.strftime("%A"),
-        "{{CURRENT_TIMEZONE}}": "Asia/Shanghai",
-        "{{USER_LANGUAGE}}": "en-US"
-    }
-def extract_answer_content(full_content: str) -> str:
-    """删除第一个<answer>标签和最后一个</answer>标签，保留内容"""
-    if not full_content:
-        return full_content
-    if OUTPUT_THINKING:
-        # 删除第一个<answer>
-        answer_start = full_content.find('<answer>')
-        if answer_start != -1:
-            full_content = full_content[:answer_start] + full_content[answer_start + 8:]
-        # 删除最后一个</answer>
-        answer_end = full_content.rfind('</answer>')
-        if answer_end != -1:
-            full_content = full_content[:answer_end] + full_content[answer_end + 9:]
-        return full_content.strip()
-    else:
-        # 删除<think>部分（包括标签）
-        think_start = full_content.find('<think>')
-        think_end = full_content.find('</think>')
-        if think_start != -1 and think_end != -1:
-            full_content = full_content[:think_start] + full_content[think_end + 8:]
-        # 删除<answer>标签及其内容之外的部分
-        answer_start = full_content.find('<answer>')
-        answer_end = full_content.rfind('</answer>')
-        if answer_start != -1 and answer_end != -1:
-            content = full_content[answer_start + 8:answer_end]
-            return content.strip()
-        return full_content.strip()
-def calculate_dynamic_chunk_size(content_length: int) -> int:
-    """
-    动态计算流式输出的chunk大小
-    确保总输出时间不超过MAX_STREAM_TIME秒
-    Args:
-        content_length: 待输出内容的总长度
-    Returns:
-        int: 动态计算的chunk大小，最小为50
-    """
-    if content_length <= 0:
-        return STREAM_CHUNK_SIZE
-    # 计算需要的总chunk数量以满足时间限制
-    # 总时间 = chunk数量 * STREAM_DELAY
-    # chunk数量 = content_length / chunk_size
-    # 所以：总时间 = (content_length / chunk_size) * STREAM_DELAY
-    # 解出：chunk_size = (content_length * STREAM_DELAY) / MAX_STREAM_TIME
-    calculated_chunk_size = int((content_length * STREAM_DELAY) / MAX_STREAM_TIME)
-    # 确保chunk_size不小于最小值50
-    min_chunk_size = 50
-    dynamic_chunk_size = max(calculated_chunk_size, min_chunk_size)
-    # 如果计算出的chunk_size太大（比如内容很短），使用默认值
-    if dynamic_chunk_size > content_length:
-        dynamic_chunk_size = min(STREAM_CHUNK_SIZE, content_length)
-    logger.debug(f"动态chunk_size计算: 内容长度={content_length}, 计算值={calculated_chunk_size}, 最终值={dynamic_chunk_size}")
-    return dynamic_chunk_size
-def content_to_string(content) -> str:
-    """Convert content from various formats to string"""
-    if content is None:
-        return ""
-    if isinstance(content, str):
-        return content
-    if isinstance(content, list):
-        parts = []
-        for p in content:
-            if hasattr(p, 'text'):  # ContentPart object
-                parts.append(getattr(p, 'text', ''))
-            elif isinstance(p, dict) and p.get("type") == "text":
-                parts.append(p.get("text", ""))
-            elif isinstance(p, str):
-                parts.append(p)
-            else:
-                # 处理其他类型的对象
-                try:
-                    if hasattr(p, '__dict__'):
-                        # 如果是对象，尝试获取text属性或转换为字符串
-                        parts.append(str(getattr(p, 'text', str(p))))
-                    else:
-                        parts.append(str(p))
-                except:
-                    continue
-        return " ".join(parts)
-    # ��理其他类型
-    try:
-        return str(content)
-    except:
-        return ""
-def generate_tool_prompt(tools: List[Dict]) -> str:
-    """Generate concise tool injection prompt"""
-    if not tools:
-        return ""
-    tool_definitions = []
-    for tool in tools:
-        if tool.get("type") != "function":
-            continue
-        function_spec = tool.get("function", {}) or {}
-        function_name = function_spec.get("name", "unknown")
-        function_description = function_spec.get("description", "")
-        parameters = function_spec.get("parameters", {}) or {}
-        # Create concise tool definition
-        tool_info = f"{function_name}: {function_description}"
-        # Add simplified parameter info
-        parameter_properties = parameters.get("properties", {}) or {}
-        required_parameters = set(parameters.get("required", []) or [])
-        if parameter_properties:
-            param_list = []
-            for param_name, param_details in parameter_properties.items():
-                param_desc = (param_details or {}).get("description", "")
-                is_required = param_name in required_parameters
-                param_list.append(f"{param_name}{'*' if is_required else ''}: {param_desc}")
-            tool_info += f" Parameters: {', '.join(param_list)}"
-        tool_definitions.append(tool_info)
-    if not tool_definitions:
-        return ""
-    # Build concise tool prompt
-    prompt_template = (
-        f"\n\nAvailable tools: {'; '.join(tool_definitions)}. "
-        "To use a tool, respond with JSON: "
-        '{"tool_calls":[{"id":"call_xxx","type":"function","function":{"name":"tool_name","arguments":"{\\"param\\":\\"value\\"}"}}]}'
-    )
-    return prompt_template
-def process_messages_with_tools(messages: List[Dict], tools: Optional[List[Dict]] = None, tool_choice: Optional[Union[str, Dict]] = None) -> List[Dict]:
-    """Process messages and inject tool prompts"""
-    if not tools or not TOOL_SUPPORT or (tool_choice == "none"):
-        # 如果没有工具或禁用工具，直接返回原消息
-        return [dict(m) for m in messages]
-    tools_prompt = generate_tool_prompt(tools)
-    # 限制工具提示长度，避免过长导致上游API拒绝
-    if len(tools_prompt) > 1000:
-        logger.warning(f"工具提示过长 ({len(tools_prompt)} 字符)，将截断")
-        tools_prompt = tools_prompt[:1000] + "..."
-    processed = []
-    has_system = any(m.get("role") == "system" for m in messages)
-    if has_system:
-        # 如果已有系统消息，在第一个系统消息中添加工具提示
-        for m in messages:
-            if m.get("role") == "system":
-                mm = dict(m)
-                content = content_to_string(mm.get("content", ""))
-                # 确保系统消息不会过长
-                new_content = content + tools_prompt
-                if len(new_content) > SYSTEM_MESSAGE_LENTH:
-                    logger.warning(f"系统消息过长 ({len(new_content)} 字符)，使用简化版本")
-                    mm["content"] = "你是一个有用的助手。" + tools_prompt
-                else:
-                    mm["content"] = new_content
-                processed.append(mm)
-                # 只在第一个系统消息中添加工具提示
-                tools_prompt = ""
-            else:
-                processed.append(dict(m))
-    else:
-        # 如果没有系统消息，需要添加一个，但只有当确实需要工具时
-        if tools_prompt.strip():
-            processed = [{"role": "system", "content": "你是一个有用的助手。" + tools_prompt}]
-            processed.extend([dict(m) for m in messages])
-        else:
-            processed = [dict(m) for m in messages]
-    # Add simplified tool choice hints
-    if tool_choice == "required":
-        if processed and processed[-1].get("role") == "user":
-            last = processed[-1]
-            content = content_to_string(last.get("content", ""))
-            last["content"] = content + "\n请使用工具来处理这个请求。"
-    elif isinstance(tool_choice, dict) and tool_choice.get("type") == "function":
-        fname = (tool_choice.get("function") or {}).get("name")
-        if fname and processed and processed[-1].get("role") == "user":
-            last = processed[-1]
-            content = content_to_string(last.get("content", ""))
-            last["content"] = content + f"\n请使用 {fname} 工具。"
-    # Handle tool/function messages
-    final_msgs = []
-    for m in processed:
-        role = m.get("role")
-        if role in ("tool", "function"):
-            tool_name = m.get("name", "unknown")
-            tool_content = content_to_string(m.get("content", ""))
-            if isinstance(tool_content, dict):
-                tool_content = json.dumps(tool_content, ensure_ascii=False)
-            # 简化工具结果���息
-            content = f"工具 {tool_name} 结果: {tool_content}"
-            if not content.strip():
-                content = f"工具 {tool_name} 执行完成"
-            final_msgs.append({
-                "role": "assistant",
-                "content": content,
-            })
-        else:
-            # For regular messages, ensure content is string format
-            final_msg = dict(m)
-            content = content_to_string(final_msg.get("content", ""))
-            final_msg["content"] = content
-            final_msgs.append(final_msg)
-    return final_msgs
-# Tool Extraction Patterns
-TOOL_CALL_FENCE_PATTERN = re.compile(r"```json\s*(\{.*?\})\s*```", re.DOTALL)
-FUNCTION_CALL_PATTERN = re.compile(r"调用函数\s*[：:]\s*([\w\-\.]+)\s*(?:参数|arguments)[：:]\s*(\{.*?\})", re.DOTALL)
-def extract_tool_invocations(text: str) -> Optional[List[Dict]]:
-    """Extract tool invocations from response text"""
-    if not text:
-        return None
-    # Limit scan size for performance
-    scannable_text = text[:SCAN_LIMIT]
-    # Attempt 1: Extract from JSON code blocks
-    json_blocks = TOOL_CALL_FENCE_PATTERN.findall(scannable_text)
-    for json_block in json_blocks:
-        try:
-            parsed_data = json.loads(json_block)
-            tool_calls = parsed_data.get("tool_calls")
-            if tool_calls and isinstance(tool_calls, list):
-                # Ensure arguments field is a string
-                for tc in tool_calls:
-                    if "function" in tc:
-                        func = tc["function"]
-                        if "arguments" in func:
-                            if isinstance(func["arguments"], dict):
-                                # Convert dict to JSON string
-                                func["arguments"] = json.dumps(func["arguments"], ensure_ascii=False)
-                            elif not isinstance(func["arguments"], str):
-                                func["arguments"] = json.dumps(func["arguments"], ensure_ascii=False)
-                return tool_calls
-        except (json.JSONDecodeError, AttributeError):
-            continue
-    # Attempt 2: Extract inline JSON objects using bracket balance method
-    i = 0
-    while i < len(scannable_text):
-        if scannable_text[i] == '{':
-            # 尝试找到匹配的右括号
-            brace_count = 1
-            j = i + 1
-            in_string = False
-            escape_next = False
-            while j < len(scannable_text) and brace_count > 0:
-                if escape_next:
-                    escape_next = False
-                elif scannable_text[j] == '\\':
-                    escape_next = True
-                elif scannable_text[j] == '"' and not escape_next:
-                    in_string = not in_string
-                elif not in_string:
-                    if scannable_text[j] == '{':
-                        brace_count += 1
-                    elif scannable_text[j] == '}':
-                        brace_count -= 1
-                j += 1
-            if brace_count == 0:
-                # 找到了完整的 JSON 对象
-                json_str = scannable_text[i:j]
-                try:
-                    parsed_data = json.loads(json_str)
-                    tool_calls = parsed_data.get("tool_calls")
-                    if tool_calls and isinstance(tool_calls, list):
-                        # Ensure arguments field is a string
-                        for tc in tool_calls:
-                            if "function" in tc:
-                                func = tc["function"]
-                                if "arguments" in func:
-                                    if isinstance(func["arguments"], dict):
-                                        # Convert dict to JSON string
-                                        func["arguments"] = json.dumps(func["arguments"], ensure_ascii=False)
-                                    elif not isinstance(func["arguments"], str):
-                                        func["arguments"] = json.dumps(func["arguments"], ensure_ascii=False)
-                        return tool_calls
-                except (json.JSONDecodeError, AttributeError):
-                    pass
-            i += 1
-        else:
-            i += 1
-    # Attempt 3: Parse natural language function calls
-    natural_lang_match = FUNCTION_CALL_PATTERN.search(scannable_text)
-    if natural_lang_match:
-        function_name = natural_lang_match.group(1).strip()
-        arguments_str = natural_lang_match.group(2).strip()
-        try:
-            # Validate JSON format
-            json.loads(arguments_str)
-            return [
-                {
-                    "id": f"call_{int(time.time() * 1000000)}",
-                    "type": "function",
-                    "function": {"name": function_name, "arguments": arguments_str},
-                }
-            ]
-        except json.JSONDecodeError:
-            return None
-    return None
-def remove_tool_json_content(text: str) -> str:
-    """Remove tool JSON content from response text - using bracket balance method"""
-    def remove_tool_call_block(match: re.Match) -> str:
-        json_content = match.group(1)
-        try:
-            parsed_data = json.loads(json_content)
-            if "tool_calls" in parsed_data:
-                return ""
-        except (json.JSONDecodeError, AttributeError):
-            pass
-        return match.group(0)
-    # Step 1: Remove fenced tool JSON blocks
-    cleaned_text = TOOL_CALL_FENCE_PATTERN.sub(remove_tool_call_block, text)
-    # Step 2: Remove inline tool JSON - 使用基于括号平衡的智能方法
-    result = []
-    i = 0
-    while i < len(cleaned_text):
-        if cleaned_text[i] == '{':
-            # 尝试找到匹配的右括号
-            brace_count = 1
-            j = i + 1
-            in_string = False
-            escape_next = False
-            while j < len(cleaned_text) and brace_count > 0:
-                if escape_next:
-                    escape_next = False
-                elif cleaned_text[j] == '\\':
-                    escape_next = True
-                elif cleaned_text[j] == '"' and not escape_next:
-                    in_string = not in_string
-                elif not in_string:
-                    if cleaned_text[j] == '{':
-                        brace_count += 1
-                    elif cleaned_text[j] == '}':
-                        brace_count -= 1
-                j += 1
-            if brace_count == 0:
-                # 找到了完整的 JSON 对象
-                json_str = cleaned_text[i:j]
-                try:
-                    parsed = json.loads(json_str)
-                    if "tool_calls" in parsed:
-                        # 这是一个工具调用，跳过它
-                        i = j
-                        continue
-                except:
-                    pass
-            # 不是工具调用或无法解析，保留这个字符
-            result.append(cleaned_text[i])
-            i += 1
-        else:
-            result.append(cleaned_text[i])
-            i += 1
-    return ''.join(result).strip()
-async def make_request(method: str, url: str, headers: dict, json_data: dict = None,
-                      stream: bool = False) -> httpx.Response:
-    """发送HTTP请求"""
-    client = None
-    try:
-        client = create_http_client()
-        if stream:
-            # 流式请求返回context manager
-            return client.stream(method, url, headers=headers, json=json_data, timeout=None)
-        else:
-            response = await client.request(method, url, headers=headers, json=json_data, timeout=REQUEST_TIMEOUT)
-            # 详细记录非200响应
-            if response.status_code != 200:
-                logger.error(f"上游API返回错误状态码: {response.status_code}")
-                logger.error(f"响应头: {dict(response.headers)}")
-                try:
-                    error_body = response.text
-                    logger.error(f"错误响应体: {error_body}")
-                except:
-                    logger.error("无法读取错误响应体")
-            response.raise_for_status()
-            return response
-    except httpx.HTTPStatusError as e:
-        logger.error(f"HTTP状态错误: {e.response.status_code} - {e.response.text}")
-        if client and not stream:
-            await client.aclose()
-        raise e
-    except Exception as e:
-        logger.error(f"请求异常: {e}")
-        if client and not stream:
-            await client.aclose()
-        raise e
 @app.get("/")
 async def homepage():
@@ -595,8 +59,8 @@ async def homepage():
         "status": "success",
         "message": "K2Think API Proxy is running",
         "service": "K2Think API Gateway",
-        "model": "MBZUAI-IFM/K2-Think",
-        "version": "1.0.0",
         "endpoints": {
             "chat": "/v1/chat/completions",
             "models": "/v1/models"
@@ -608,7 +72,12 @@ async def health_check():
     """健康检查"""
     return JSONResponse(content={
         "status": "healthy",
-        "timestamp": int(time.time())
     })
 @app.get("/favicon.ico")
@@ -617,533 +86,31 @@ async def favicon():
     return Response(content="", media_type="image/x-icon")
 @app.get("/v1/models")
-async def get_models() -> ModelsResponse:
     """获取模型列表"""
-    model_info = ModelInfo(
-        id="MBZUAI-IFM/K2-Think",
-        created=int(time.time()),
-        owned_by="MBZUAI",
-        root="mbzuai-k2-think-2508"
-    )
-    return ModelsResponse(data=[model_info])
-async def process_non_stream_response(k2think_payload: dict, headers: dict) -> tuple[str, dict]:
-    """处理非流式响应"""
-    try:
-        response = await make_request(
-            "POST",
-            K2THINK_API_URL,
-            headers,
-            k2think_payload,
-            stream=False
-        )
-        # K2Think 非流式请求返回标准JSON格式
-        result = response.json()
-        # 提取内容
-        full_content = ""
-        if result.get('choices') and len(result['choices']) > 0:
-            choice = result['choices'][0]
-            if choice.get('message') and choice['message'].get('content'):
-                raw_content = choice['message']['content']
-                # 提取<answer>标签中的内容，去除标签
-                full_content = extract_answer_content(raw_content)
-        # 提取token信息
-        token_info = result.get('usage', {
-            "prompt_tokens": 0,
-            "completion_tokens": 0,
-            "total_tokens": 0
-        })
-        await response.aclose()
-        return full_content, token_info
-    except Exception as e:
-        logger.error(f"处理非流式响应错误: {e}")
-        raise
-async def process_stream_response(k2think_payload: dict, headers: dict) -> AsyncGenerator[str, None]:
-    """处理流式响应 - 使用模拟流式输出"""
-    try:
-        # 将流式请求转换为非流式请求
-        k2think_payload_copy = k2think_payload.copy()
-        k2think_payload_copy["stream"] = False
-        # 修改headers为非流式
-        headers_copy = headers.copy()
-        headers_copy["accept"] = "application/json"
-        # 获取完整响应
-        full_content, token_info = await process_non_stream_response(k2think_payload_copy, headers_copy)
-        if not full_content:
-            yield "data: [DONE]\n\n"
-            return
-        # 开始流式输出 - 发送开始chunk
-        start_chunk = {
-            "id": f"chatcmpl-{int(time.time() * 1000)}",
-            "object": "chat.completion.chunk",
-            "created": int(time.time()),
-            "model": "MBZUAI-IFM/K2-Think",
-            "choices": [{
-                "index": 0,
-                "delta": {
-                    "role": "assistant",
-                    "content": ""
-                },
-                "finish_reason": None
-            }]
-        }
-        yield f"data: {json.dumps(start_chunk)}\n\n"
-        # 模拟流式输出 - 按字符分块发送，使用动态chunk_size
-        chunk_size = calculate_dynamic_chunk_size(len(full_content))  # 动态计算每次发送的字符数
-        for i in range(0, len(full_content), chunk_size):
-            chunk_content = full_content[i:i + chunk_size]
-            chunk = {
-                "id": f"chatcmpl-{int(time.time() * 1000)}",
-                "object": "chat.completion.chunk",
-                "created": int(time.time()),
-                "model": "MBZUAI-IFM/K2-Think",
-                "choices": [{
-                    "index": 0,
-                    "delta": {
-                        "content": chunk_content
-                    },
-                    "finish_reason": None
-                }]
-            }
-            yield f"data: {json.dumps(chunk)}\n\n"
-            # 添加小延迟模拟真实流式效果
-            await asyncio.sleep(STREAM_DELAY)
-        # 发送结束chunk
-        end_chunk = {
-            "id": f"chatcmpl-{int(time.time() * 1000)}",
-            "object": "chat.completion.chunk",
-            "created": int(time.time()),
-            "model": "MBZUAI-IFM/K2-Think",
-            "choices": [{
-                "index": 0,
-                "delta": {},
-                "finish_reason": "stop"
-            }]
-        }
-        yield f"data: {json.dumps(end_chunk)}\n\n"
-        yield "data: [DONE]\n\n"
-    except Exception as e:
-        logger.error(f"流式请求失败: {e}")
-        # 发送错误信息
-        error_chunk = {
-            "id": f"chatcmpl-{int(time.time() * 1000)}",
-            "object": "chat.completion.chunk",
-            "created": int(time.time()),
-            "model": "MBZUAI-IFM/K2-Think",
-            "choices": [{
-                "index": 0,
-                "delta": {
-                    "content": f"Error: {str(e)}"
-                },
-                "finish_reason": "stop"
-            }]
-        }
-        yield f"data: {json.dumps(error_chunk)}\n\n"
-        yield "data: [DONE]\n\n"
-async def process_stream_response_with_tools(k2think_payload: dict, headers: dict, has_tools: bool = False) -> AsyncGenerator[str, None]:
-    """处理流式响应 - 支持工具调用，优化性能"""
-    try:
-        # 发送开始chunk
-        start_chunk = {
-            "id": f"chatcmpl-{int(time.time() * 1000)}",
-            "object": "chat.completion.chunk",
-            "created": int(time.time()),
-            "model": "MBZUAI-IFM/K2-Think",
-            "choices": [{
-                "index": 0,
-                "delta": {
-                    "role": "assistant",
-                    "content": ""
-                },
-                "finish_reason": None
-            }]
-        }
-        yield f"data: {json.dumps(start_chunk)}\n\n"
-        # 优化的模拟流式输出 - 立即开始获取响应并流式发送
-        k2think_payload_copy = k2think_payload.copy()
-        k2think_payload_copy["stream"] = False
-        headers_copy = headers.copy()
-        headers_copy["accept"] = "application/json"
-        # 获取完整响应
-        full_content, token_info = await process_non_stream_response(k2think_payload_copy, headers_copy)
-        if not full_content:
-            yield "data: [DONE]\n\n"
-            return
-        # Handle tool calls for streaming
-        finish_reason = "stop"
-        if has_tools:
-            tool_calls = extract_tool_invocations(full_content)
-            if tool_calls:
-                # Send tool calls with proper format
-                for i, tc in enumerate(tool_calls):
-                    tool_call_delta = {
-                        "index": i,
-                        "id": tc.get("id"),
-                        "type": tc.get("type", "function"),
-                        "function": tc.get("function", {}),
-                    }
-                    tool_chunk = {
-                        "id": f"chatcmpl-{int(time.time() * 1000)}",
-                        "object": "chat.completion.chunk",
-                        "created": int(time.time()),
-                        "model": "MBZUAI-IFM/K2-Think",
-                        "choices": [{
-                            "index": 0,
-                            "delta": {
-                                "tool_calls": [tool_call_delta]
-                            },
-                            "finish_reason": None
-                        }]
-                    }
-                    yield f"data: {json.dumps(tool_chunk)}\n\n"
-                finish_reason = "tool_calls"
-            else:
-                # Send regular content with true streaming feel
-                trimmed_content = remove_tool_json_content(full_content)
-                if trimmed_content:
-                    # 快速流式输出 - 动态计算块大小
-                    chunk_size = calculate_dynamic_chunk_size(len(trimmed_content))  # 动态计算每次发送的字符数
-                    for i in range(0, len(trimmed_content), chunk_size):
-                        chunk_content = trimmed_content[i:i + chunk_size]
-                        chunk = {
-                            "id": f"chatcmpl-{int(time.time() * 1000)}",
-                            "object": "chat.completion.chunk",
-                            "created": int(time.time()),
-                            "model": "MBZUAI-IFM/K2-Think",
-                            "choices": [{
-                                "index": 0,
-                                "delta": {
-                                    "content": chunk_content
-                                },
-                                "finish_reason": None
-                            }]
-                        }
-                        yield f"data: {json.dumps(chunk)}\n\n"
-                        # 添加极小延迟确保块分别发送
-                        await asyncio.sleep(STREAM_DELAY)  # 毫秒延迟
-        else:
-            # No tools - send regular content with fast streaming
-            chunk_size = calculate_dynamic_chunk_size(len(full_content))  # 动态计算每次发送的字符数
-            for i in range(0, len(full_content), chunk_size):
-                chunk_content = full_content[i:i + chunk_size]
-                chunk = {
-                    "id": f"chatcmpl-{int(time.time() * 1000)}",
-                    "object": "chat.completion.chunk",
-                    "created": int(time.time()),
-                    "model": "MBZUAI-IFM/K2-Think",
-                    "choices": [{
-                        "index": 0,
-                        "delta": {
-                            "content": chunk_content
-                        },
-                        "finish_reason": None
-                    }]
-                }
-                yield f"data: {json.dumps(chunk)}\n\n"
-                # 添加极小延迟确保块分别发送
-                await asyncio.sleep(STREAM_DELAY)  # 毫秒延迟
-        # 发送结束chunk
-        end_chunk = {
-            "id": f"chatcmpl-{int(time.time() * 1000)}",
-            "object": "chat.completion.chunk",
-            "created": int(time.time()),
-            "model": "MBZUAI-IFM/K2-Think",
-            "choices": [{
-                "index": 0,
-                "delta": {},
-                "finish_reason": finish_reason
-            }]
-        }
-        yield f"data: {json.dumps(end_chunk)}\n\n"
-        yield "data: [DONE]\n\n"
-    except Exception as e:
-        logger.error(f"流式响应处理错误: {e}")
-        error_chunk = {
-            "id": f"chatcmpl-{int(time.time() * 1000)}",
-            "object": "chat.completion.chunk",
-            "created": int(time.time()),
-            "model": "MBZUAI-IFM/K2-Think",
-            "choices": [{
-                "index": 0,
-                "delta": {},
-                "finish_reason": "error"
-            }]
-        }
-        yield f"data: {json.dumps(error_chunk)}\n\n"
-        yield "data: [DONE]\n\n"
 @app.post("/v1/chat/completions")
 async def chat_completions(request: ChatCompletionRequest, auth_request: Request):
     """处理聊天补全请求"""
-    # 验证API密钥
-    authorization = auth_request.headers.get("Authorization", "")
-    if not validate_api_key(authorization):
-        raise HTTPException(
-            status_code=401,
-            detail={
-                "error": {
-                    "message": "Invalid API key provided",
-                    "type": "authentication_error"
-                }
             }
-        )
-    try:
-        # Process messages with tools - 确保内容被正确转换为字符串
-        raw_messages = []
-        for msg in request.messages:
-            try:
-                content = content_to_string(msg.content)
-                raw_messages.append({
-                    "role": msg.role,
-                    "content": content,
-                    "tool_calls": msg.tool_calls
-                })
-            except Exception as e:
-                logger.error(f"处理消息时出错: {e}, 消息: {msg}")
-                # 使用默认值
-                raw_messages.append({
-                    "role": msg.role,
-                    "content": str(msg.content) if msg.content else "",
-                    "tool_calls": msg.tool_calls
-                })
-        # Check if tools are enabled and present
-        has_tools = (TOOL_SUPPORT and
-                    request.tools and
-                    len(request.tools) > 0 and
-                    request.tool_choice != "none")
-        logger.info(f"🔧 工具调用状态: has_tools={has_tools}, tools_count={len(request.tools) if request.tools else 0}")
-        logger.info(f"📥 接收到的原始消息数: {len(raw_messages)}")
-        # 记录原始消息的角色分布
-        role_count = {}
-        for msg in raw_messages:
-            role = msg.get("role", "unknown")
-            role_count[role] = role_count.get(role, 0) + 1
-        logger.info(f"📊 原始消息角色分布: {role_count}")
-        if has_tools:
-            processed_messages = process_messages_with_tools(
-                raw_messages,
-                request.tools,
-                request.tool_choice
-            )
-            logger.info(f"🔄 消息处理完成，原始消息数: {len(raw_messages)}, 处理后消息数: {len(processed_messages)}")
-            # 记录处理后消息的角色分布
-            processed_role_count = {}
-            for msg in processed_messages:
-                role = msg.get("role", "unknown")
-                processed_role_count[role] = processed_role_count.get(role, 0) + 1
-            logger.info(f"📊 处理后消息角色分布: {processed_role_count}")
-        else:
-            processed_messages = raw_messages
-            logger.info("⏭️  无工具调用，直接使用原始消息")
-        # 构建 K2Think 格式的请求体 - 确保所有内容可JSON序列化
-        k2think_messages = []
-        for msg in processed_messages:
-            try:
-                # 确保消息内容是字符串
-                content = content_to_string(msg.get("content", ""))
-                k2think_messages.append({
-                    "role": msg["role"],
-                    "content": content
-                })
-            except Exception as e:
-                logger.error(f"构建K2Think消息时出错: {e}, 消息: {msg}")
-                # 使用安全的默认值
-                k2think_messages.append({
-                    "role": msg.get("role", "user"),
-                    "content": str(msg.get("content", ""))
-                })
-        k2think_payload = {
-            "stream": request.stream,
-            "model": "MBZUAI-IFM/K2-Think",
-            "messages": k2think_messages,
-            "params": {},
-            "tool_servers": [],
-            "features": {
-                "image_generation": False,
-                "code_interpreter": False,
-                "web_search": False
-            },
-            "variables": get_current_datetime_info(),
-            "model_item": {
-                "id": "MBZUAI-IFM/K2-Think",
-                "object": "model",
-                "owned_by": "MBZUAI",
-                "root": "mbzuai-k2-think-2508",
-                "parent": None,
-                "status": "active",
-                "connection_type": "external",
-                "name": "MBZUAI-IFM/K2-Think"
-            },
-            "background_tasks": {
-                "title_generation": True,
-                "tags_generation": True
-            },
-            "chat_id": generate_chat_id(),
-            "id": generate_session_id(),
-            "session_id": generate_session_id()
-        }
-        # 验证JSON序列化并记录发送到上游的请求
-        try:
-            # 测试JSON序列化
-            json.dumps(k2think_payload, ensure_ascii=False)
-            logger.info(f"✅ K2Think请求体JSON序列化验证通过")
-        except Exception as e:
-            logger.error(f"❌ K2Think请求体JSON序列化失败: {e}")
-            # 尝试修复序列化问题
-            try:
-                k2think_payload = json.loads(json.dumps(k2think_payload, default=str, ensure_ascii=False))
-                logger.info("🔧 使用default=str修复了序列化问题")
-            except Exception as fix_error:
-                logger.error(f"无法修复序列化问题: {fix_error}")
-                raise HTTPException(status_code=500, detail="请求数据序列化失败")
-        logger.info(f"发送到 K2Think 的消息数量: {len(k2think_payload['messages'])}")
-        if DEBUG_LOGGING or logger.level <= logging.DEBUG:
-            for i, msg in enumerate(k2think_payload['messages']):
-                content_preview = msg['content'][:200] + "..." if len(msg['content']) > 200 else msg['content']
-                logger.debug(f"消息 {i+1} ({msg['role']}): {content_preview}")
-        # 设置请求头
-        headers = {
-            "accept": "text/event-stream,application/json" if request.stream else "application/json",
-            "content-type": "application/json",
-            "authorization": f"Bearer {K2THINK_TOKEN}",
-            "origin": "https://www.k2think.ai",
-            "referer": "https://www.k2think.ai/c/" + k2think_payload["chat_id"],
-            "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/140.0.0.0 Safari/537.36 Edg/140.0.0.0"
         }
-        if request.stream:
-            # 流式响应
-            return StreamingResponse(
-                process_stream_response_with_tools(k2think_payload, headers, has_tools),
-                media_type="text/event-stream",
-                headers={
-                    "Cache-Control": "no-cache",
-                    "Connection": "keep-alive",
-                    "X-Accel-Buffering": "no"
-                }
-            )
-        else:
-            # 非流式响应
-            full_content, token_info = await process_non_stream_response(k2think_payload, headers)
-            # Handle tool calls for non-streaming
-            tool_calls = None
-            finish_reason = "stop"
-            message_content = full_content
-            if has_tools:
-                tool_calls = extract_tool_invocations(full_content)
-                if tool_calls:
-                    # Content must be null when tool_calls are present (OpenAI spec)
-                    message_content = None
-                    finish_reason = "tool_calls"
-                    logger.info(f"提取到工具调用: {json.dumps(tool_calls, ensure_ascii=False)}")
-                else:
-                    # Remove tool JSON from content
-                    message_content = remove_tool_json_content(full_content)
-                    if not message_content:
-                        message_content = full_content  # 保留原内容如果清理后为空
-            openai_response = {
-                "id": f"chatcmpl-{int(time.time())}",
-                "object": "chat.completion",
-                "created": int(time.time()),
-                "model": "MBZUAI-IFM/K2-Think",
-                "choices": [{
-                    "index": 0,
-                    "message": {
-                        "role": "assistant",
-                        "content": message_content,
-                        **({"tool_calls": tool_calls} if tool_calls else {})
-                    },
-                    "finish_reason": finish_reason
-                }],
-                "usage": token_info
-            }
-            return JSONResponse(content=openai_response)
-    except httpx.HTTPStatusError as e:
-        logger.error(f"HTTP错误: {e.response.status_code}")
-        raise HTTPException(
-            status_code=e.response.status_code,
-            detail={
-                "error": {
-                    "message": f"上游服务错误: {e.response.status_code}",
-                    "type": "upstream_error"
-                }
-            }
-        )
-    except httpx.TimeoutException:
-        logger.error("请求超时")
-        raise HTTPException(
-            status_code=504,
-            detail={
-                "error": {
-                    "message": "请求超时",
-                    "type": "timeout_error"
-                }
-            }
-        )
-    except Exception as e:
-        logger.error(f"API转发错误: {e}")
-        raise HTTPException(
-            status_code=500,
-            detail={
-                "error": {
-                    "message": str(e),
-                    "type": "api_error"
-                }
-            }
-        )
 @app.exception_handler(404)
 async def not_found_handler(request: Request, exc):
     return JSONResponse(
         status_code=404,
         content={"error": "Not Found"}
@@ -1151,16 +118,18 @@ async def not_found_handler(request: Request, exc):
 if __name__ == "__main__":
     import uvicorn
-    host = os.getenv("HOST", "0.0.0.0")
-    port = int(os.getenv("PORT", "8001"))
     # 配置日志级别
-    log_level = "debug" if DEBUG_LOGGING else "info"
     uvicorn.run(
         app,
-        host=host,
-        port=port,
-        access_log=ENABLE_ACCESS_LOG,
         log_level=log_level
     )

+"""
+K2Think API 代理服务 - 重构版本
+提供OpenAI兼容的API接口，代理到K2Think服务
+"""
 import time
 import logging
 from contextlib import asynccontextmanager
+from fastapi import FastAPI, Request
+from fastapi.middleware.cors import CORSMiddleware
+from fastapi.responses import JSONResponse, Response
+from src.config import Config
+from src.constants import APIConstants
+from src.exceptions import K2ThinkProxyError
+from src.models import ChatCompletionRequest
+from src.api_handler import APIHandler
+# 初始化配置
+try:
+    Config.validate()
+    Config.setup_logging()
+except Exception as e:
+    print(f"配置错误: {e}")
+    exit(1)
 logger = logging.getLogger(__name__)
 # 全局HTTP客户端管理
 @asynccontextmanager
 async def lifespan(app: FastAPI):
+    logger.info("K2Think API Proxy 启动中...")
     yield
+    logger.info("K2Think API Proxy 关闭中...")
 # 创建FastAPI应用
+app = FastAPI(
+    title="K2Think API Proxy",
+    description="OpenAI兼容的K2Think API代理服务",
+    version="2.0.0",
+    lifespan=lifespan
+)
 # CORS配置
 app.add_middleware(
     CORSMiddleware,
+    allow_origins=Config.CORS_ORIGINS,
     allow_credentials=True,
     allow_methods=["*"],
     allow_headers=["*"],
 )
+# 初始化API处理器
+api_handler = APIHandler(Config)
 @app.get("/")
 async def homepage():
         "status": "success",
         "message": "K2Think API Proxy is running",
         "service": "K2Think API Gateway",
+        "model": APIConstants.MODEL_ID,
+        "version": "2.0.0",
         "endpoints": {
             "chat": "/v1/chat/completions",
             "models": "/v1/models"
     """健康检查"""
     return JSONResponse(content={
         "status": "healthy",
+        "timestamp": int(time.time()),
+        "config": {
+            "tool_support": Config.TOOL_SUPPORT,
+            "debug_logging": Config.DEBUG_LOGGING,
+            "note": "思考内容输出现在通过模型名控制"
+        }
     })
 @app.get("/favicon.ico")
     return Response(content="", media_type="image/x-icon")
 @app.get("/v1/models")
+async def get_models():
     """获取模型列表"""
+    return await api_handler.get_models()
 @app.post("/v1/chat/completions")
 async def chat_completions(request: ChatCompletionRequest, auth_request: Request):
     """处理聊天补全请求"""
+    return await api_handler.chat_completions(request, auth_request)
+@app.exception_handler(K2ThinkProxyError)
+async def proxy_exception_handler(request: Request, exc: K2ThinkProxyError):
+    """处理自定义代理异常"""
+    return JSONResponse(
+        status_code=exc.status_code,
+        content={
+            "error": {
+                "message": exc.message,
+                "type": exc.error_type
             }
         }
+    )
 @app.exception_handler(404)
 async def not_found_handler(request: Request, exc):
+    """处理404错误"""
     return JSONResponse(
         status_code=404,
         content={"error": "Not Found"}
 if __name__ == "__main__":
     import uvicorn
     # 配置日志级别
+    log_level = "debug" if Config.DEBUG_LOGGING else "info"
+    logger.info(f"启动服务器: {Config.HOST}:{Config.PORT}")
+    logger.info(f"工具支持: {Config.TOOL_SUPPORT}")
+    logger.info("思考内容输出: 通过模型名控制 (MBZUAI-IFM/K2-Think vs MBZUAI-IFM/K2-Think-nothink)")
     uvicorn.run(
         app,
+        host=Config.HOST,
+        port=Config.PORT,
+        access_log=Config.ENABLE_ACCESS_LOG,
         log_level=log_level
     )

requirements.txt CHANGED Viewed

@@ -3,4 +3,5 @@ uvicorn[standard]
 httpx
 pydantic
 python-dotenv
-pytz

 httpx
 pydantic
 python-dotenv
+pytz
+requests

src/__init__.py ADDED Viewed

	@@ -0,0 +1,3 @@

+"""
+K2Think API Proxy 源代码包
+"""

src/api_handler.py ADDED Viewed

	@@ -0,0 +1,347 @@

+"""
+API处理模块
+处理主要的API路由逻辑
+"""
+import json
+import time
+import logging
+from typing import Dict, List
+from fastapi import HTTPException, Request
+from fastapi.responses import StreamingResponse, JSONResponse
+from src.config import Config
+from src.constants import (
+    APIConstants, ResponseConstants, LogMessages,
+    ErrorMessages, HeaderConstants
+)
+from src.exceptions import (
+    AuthenticationError, SerializationError,
+    K2ThinkProxyError
+)
+from src.models import ChatCompletionRequest, ModelsResponse, ModelInfo
+from src.tool_handler import ToolHandler
+from src.response_processor import ResponseProcessor
+logger = logging.getLogger(__name__)
+class APIHandler:
+    """API处理器"""
+    def __init__(self, config: Config):
+        self.config = config
+        self.tool_handler = ToolHandler(config)
+        self.response_processor = ResponseProcessor(config, self.tool_handler)
+    def validate_api_key(self, authorization: str) -> bool:
+        """验证API密钥"""
+        if not authorization or not authorization.startswith(APIConstants.BEARER_PREFIX):
+            return False
+        api_key = authorization[APIConstants.BEARER_PREFIX_LENGTH:]  # 移除 "Bearer " 前缀
+        return api_key == self.config.VALID_API_KEY
+    def should_output_thinking(self, model_name: str) -> bool:
+        """根据模型名判断是否应该输出思考内容"""
+        return model_name != APIConstants.MODEL_ID_NOTHINK
+    def get_actual_model_id(self, model_name: str) -> str:
+        """获取实际的模型ID（将nothink版本映射回原始模型）"""
+        if model_name == APIConstants.MODEL_ID_NOTHINK:
+            return APIConstants.MODEL_ID
+        return model_name
+    async def get_models(self) -> ModelsResponse:
+        """获取模型列表"""
+        model_info_standard = ModelInfo(
+            id=APIConstants.MODEL_ID,
+            created=int(time.time()),
+            owned_by=APIConstants.MODEL_OWNER,
+            root=APIConstants.MODEL_ROOT
+        )
+        model_info_nothink = ModelInfo(
+            id=APIConstants.MODEL_ID_NOTHINK,
+            created=int(time.time()),
+            owned_by=APIConstants.MODEL_OWNER,
+            root=APIConstants.MODEL_ROOT
+        )
+        return ModelsResponse(data=[model_info_standard, model_info_nothink])
+    async def chat_completions(self, request: ChatCompletionRequest, auth_request: Request):
+        """处理聊天补全请求"""
+        # 验证API密钥
+        authorization = auth_request.headers.get(HeaderConstants.AUTHORIZATION, "")
+        if not self.validate_api_key(authorization):
+            raise AuthenticationError()
+        # 判断是否应该输出思考内容
+        output_thinking = self.should_output_thinking(request.model)
+        actual_model_id = self.get_actual_model_id(request.model)
+        try:
+            # 处理消息
+            raw_messages = self._process_raw_messages(request.messages)
+            # 检查工具是否启用和存在
+            has_tools = self._check_tools_enabled(request)
+            self._log_request_info(raw_messages, has_tools, request.tools)
+            # 处理工具相关消息
+            processed_messages = self._process_messages_with_tools(
+                raw_messages, request, has_tools
+            )
+            # 构建K2Think请求
+            k2think_payload = self._build_k2think_payload(
+                request, processed_messages, actual_model_id
+            )
+            # 验证JSON序列化
+            self._validate_json_serialization(k2think_payload)
+            # 设置请求头
+            headers = self._build_request_headers(request, k2think_payload)
+            # 处理响应
+            if request.stream:
+                return await self._handle_stream_response(
+                    k2think_payload, headers, has_tools, output_thinking, request.model
+                )
+            else:
+                return await self._handle_non_stream_response(
+                    k2think_payload, headers, has_tools, output_thinking, request.model
+                )
+        except K2ThinkProxyError:
+            # 重新抛出自定义异常
+            raise
+        except Exception as e:
+            logger.error(f"API转发错误: {e}")
+            raise HTTPException(
+                status_code=APIConstants.HTTP_INTERNAL_ERROR,
+                detail={
+                    "error": {
+                        "message": str(e),
+                        "type": ErrorMessages.API_ERROR
+                    }
+                }
+            )
+    def _process_raw_messages(self, messages: List) -> List[Dict]:
+        """处理原始消息"""
+        raw_messages = []
+        for msg in messages:
+            try:
+                raw_messages.append({
+                    "role": msg.role,
+                    "content": msg.content,  # 保持原始格式，稍后再转换
+                    "tool_calls": msg.tool_calls
+                })
+            except Exception as e:
+                logger.error(f"处理消息时出错: {e}, 消息: {msg}")
+                # 使用默认值
+                raw_messages.append({
+                    "role": msg.role,
+                    "content": str(msg.content) if msg.content else "",
+                    "tool_calls": msg.tool_calls
+                })
+        return raw_messages
+    def _check_tools_enabled(self, request: ChatCompletionRequest) -> bool:
+        """检查工具是否启用"""
+        return (
+            self.config.TOOL_SUPPORT and
+            request.tools is not None and
+            len(request.tools) > 0 and
+            request.tool_choice != "none"
+        )
+    def _log_request_info(self, raw_messages: List[Dict], has_tools: bool, tools: List):
+        """记录请求信息"""
+        logger.info(LogMessages.TOOL_STATUS.format(
+            has_tools, len(tools) if tools else 0
+        ))
+        logger.info(LogMessages.MESSAGE_RECEIVED.format(len(raw_messages)))
+        # 记录原始消息的角色分布
+        role_count = {}
+        for msg in raw_messages:
+            role = msg.get("role", "unknown")
+            role_count[role] = role_count.get(role, 0) + 1
+        logger.info(LogMessages.ROLE_DISTRIBUTION.format("原始", role_count))
+    def _process_messages_with_tools(
+        self,
+        raw_messages: List[Dict],
+        request: ChatCompletionRequest,
+        has_tools: bool
+    ) -> List[Dict]:
+        """处理工具相关消息"""
+        if has_tools:
+            processed_messages = self.tool_handler.process_messages_with_tools(
+                raw_messages,
+                request.tools,
+                request.tool_choice
+            )
+            logger.info(LogMessages.MESSAGE_PROCESSED.format(
+                len(raw_messages), len(processed_messages)
+            ))
+            # 记录处理后消息的角色分布
+            processed_role_count = {}
+            for msg in processed_messages:
+                role = msg.get("role", "unknown")
+                processed_role_count[role] = processed_role_count.get(role, 0) + 1
+            logger.info(LogMessages.ROLE_DISTRIBUTION.format("处理后", processed_role_count))
+        else:
+            processed_messages = raw_messages
+            logger.info(LogMessages.NO_TOOLS)
+        return processed_messages
+    def _build_k2think_payload(
+        self,
+        request: ChatCompletionRequest,
+        processed_messages: List[Dict],
+        actual_model_id: str = None
+    ) -> Dict:
+        """构建K2Think请求负载"""
+        # 构建K2Think格式的请求体 - 支持多模态内容
+        k2think_messages = []
+        for msg in processed_messages:
+            try:
+                # 使用多模态内容转换函数
+                content = self.response_processor.content_to_multimodal(msg.get("content", ""))
+                k2think_messages.append({
+                    "role": msg["role"],
+                    "content": content
+                })
+            except Exception as e:
+                logger.error(f"构建K2Think消息时出错: {e}, 消息: {msg}")
+                # 使用安全的默认值
+                fallback_content = self.tool_handler._content_to_string(msg.get("content", ""))
+                k2think_messages.append({
+                    "role": msg.get("role", "user"),
+                    "content": fallback_content
+                })
+        # 使用实际的模型ID
+        model_id = actual_model_id or APIConstants.MODEL_ID
+        return {
+            "stream": request.stream,
+            "model": model_id,
+            "messages": k2think_messages,
+            "params": {},
+            "tool_servers": [],
+            "features": {
+                "image_generation": False,
+                "code_interpreter": False,
+                "web_search": False
+            },
+            "variables": self.response_processor.get_current_datetime_info(),
+            "model_item": {
+                "id": model_id,
+                "object": ResponseConstants.MODEL_OBJECT,
+                "owned_by": APIConstants.MODEL_OWNER,
+                "root": APIConstants.MODEL_ROOT,
+                "parent": None,
+                "status": "active",
+                "connection_type": "external",
+                "name": model_id
+            },
+            "background_tasks": {
+                "title_generation": True,
+                "tags_generation": True
+            },
+            "chat_id": self.response_processor.generate_chat_id(),
+            "id": self.response_processor.generate_session_id(),
+            "session_id": self.response_processor.generate_session_id()
+        }
+    def _validate_json_serialization(self, k2think_payload: Dict):
+        """验证JSON序列化"""
+        try:
+            # 测试JSON序列化
+            json.dumps(k2think_payload, ensure_ascii=False)
+            logger.info(LogMessages.JSON_VALIDATION_SUCCESS)
+        except Exception as e:
+            logger.error(LogMessages.JSON_VALIDATION_FAILED.format(e))
+            # 尝试修复序列化问题
+            try:
+                k2think_payload = json.loads(json.dumps(k2think_payload, default=str, ensure_ascii=False))
+                logger.info(LogMessages.JSON_FIXED)
+            except Exception as fix_error:
+                logger.error(f"无法修复序列化问题: {fix_error}")
+                raise SerializationError()
+    def _build_request_headers(self, request: ChatCompletionRequest, k2think_payload: Dict) -> Dict[str, str]:
+        """构建请求头"""
+        return {
+            HeaderConstants.ACCEPT: (
+                HeaderConstants.EVENT_STREAM_JSON if request.stream
+                else HeaderConstants.APPLICATION_JSON
+            ),
+            HeaderConstants.CONTENT_TYPE: HeaderConstants.APPLICATION_JSON,
+            HeaderConstants.AUTHORIZATION: f"{APIConstants.BEARER_PREFIX}{self.config.K2THINK_TOKEN}",
+            HeaderConstants.ORIGIN: "https://www.k2think.ai",
+            HeaderConstants.REFERER: "https://www.k2think.ai/c/" + k2think_payload["chat_id"],
+            HeaderConstants.USER_AGENT: HeaderConstants.DEFAULT_USER_AGENT
+        }
+    async def _handle_stream_response(
+        self,
+        k2think_payload: Dict,
+        headers: Dict[str, str],
+        has_tools: bool,
+        output_thinking: bool = True,
+        original_model: str = None
+    ) -> StreamingResponse:
+        """处理流式响应"""
+        return StreamingResponse(
+            self.response_processor.process_stream_response_with_tools(
+                k2think_payload, headers, has_tools, output_thinking, original_model
+            ),
+            media_type=HeaderConstants.TEXT_EVENT_STREAM,
+            headers={
+                HeaderConstants.CACHE_CONTROL: HeaderConstants.NO_CACHE,
+                HeaderConstants.CONNECTION: HeaderConstants.KEEP_ALIVE,
+                HeaderConstants.X_ACCEL_BUFFERING: HeaderConstants.NO_BUFFERING
+            }
+        )
+    async def _handle_non_stream_response(
+        self,
+        k2think_payload: Dict,
+        headers: Dict[str, str],
+        has_tools: bool,
+        output_thinking: bool = True,
+        original_model: str = None
+    ) -> JSONResponse:
+        """处理非流式响应"""
+        full_content, token_info = await self.response_processor.process_non_stream_response(
+            k2think_payload, headers, output_thinking
+        )
+        # 处理工具调用
+        tool_calls = None
+        message_content = full_content
+        if has_tools:
+            tool_calls = self.tool_handler.extract_tool_invocations(full_content)
+            if tool_calls:
+                # 当存在工具调用时，内容必须为null（OpenAI规范）
+                message_content = None
+                logger.info(LogMessages.TOOL_CALLS_EXTRACTED.format(
+                    json.dumps(tool_calls, ensure_ascii=False)
+                ))
+            else:
+                # 从内容中移除工具JSON
+                message_content = self.tool_handler.remove_tool_json_content(full_content)
+                if not message_content:
+                    message_content = full_content  # 保留原内容如果清理后为空
+        openai_response = self.response_processor.create_completion_response(
+            message_content, tool_calls, token_info, original_model
+        )
+        return JSONResponse(content=openai_response)

src/config.py ADDED Viewed

	@@ -0,0 +1,83 @@

+"""
+配置管理模块
+统一管理所有环境变量和配置项
+"""
+import os
+import logging
+from typing import List
+from dotenv import load_dotenv
+# 加载环境变量
+load_dotenv()
+class Config:
+    """应用配置类"""
+    # API认证配置
+    VALID_API_KEY: str = os.getenv("VALID_API_KEY", "")
+    K2THINK_TOKEN: str = os.getenv("K2THINK_TOKEN", "")
+    K2THINK_API_URL: str = os.getenv("K2THINK_API_URL", "https://www.k2think.ai/api/chat/completions")
+    # 服务器配置
+    HOST: str = os.getenv("HOST", "0.0.0.0")
+    PORT: int = int(os.getenv("PORT", "8001"))
+    # 功能开关
+    TOOL_SUPPORT: bool = os.getenv("TOOL_SUPPORT", "true").lower() == "true"
+    DEBUG_LOGGING: bool = os.getenv("DEBUG_LOGGING", "false").lower() == "true"
+    ENABLE_ACCESS_LOG: bool = os.getenv("ENABLE_ACCESS_LOG", "true").lower() == "true"
+    # 性能配置
+    SCAN_LIMIT: int = int(os.getenv("SCAN_LIMIT", "200000"))
+    SYSTEM_MESSAGE_LENGTH: int = int(os.getenv("SYSTEM_MESSAGE_LENTH", "200000"))
+    REQUEST_TIMEOUT: float = float(os.getenv("REQUEST_TIMEOUT", "60"))
+    MAX_KEEPALIVE_CONNECTIONS: int = int(os.getenv("MAX_KEEPALIVE_CONNECTIONS", "20"))
+    MAX_CONNECTIONS: int = int(os.getenv("MAX_CONNECTIONS", "100"))
+    STREAM_DELAY: float = float(os.getenv("STREAM_DELAY", "0.05"))
+    STREAM_CHUNK_SIZE: int = int(os.getenv("STREAM_CHUNK_SIZE", "50"))
+    MAX_STREAM_TIME: float = float(os.getenv("MAX_STREAM_TIME", "10.0"))
+    # 日志配置
+    LOG_LEVEL: str = os.getenv("LOG_LEVEL", "INFO").upper()
+    # CORS配置
+    CORS_ORIGINS: List[str] = (
+        os.getenv("CORS_ORIGINS", "*").split(",")
+        if os.getenv("CORS_ORIGINS", "*") != "*"
+        else ["*"]
+    )
+    @classmethod
+    def validate(cls) -> None:
+        """验证必需的配置项"""
+        if not cls.VALID_API_KEY:
+            raise ValueError("错误：VALID_API_KEY 环境变量未设置。请在 .env 文件中提供一个安全的API密钥。")
+        if not cls.K2THINK_TOKEN:
+            raise ValueError("错误：K2THINK_TOKEN 环境变量未设置。请在 .env 文件中提供有效的K2Think JWT Token。")
+        # 验证数值范围
+        if cls.PORT < 1 or cls.PORT > 65535:
+            raise ValueError(f"错误：PORT 值 {cls.PORT} 不在有效范围内 (1-65535)")
+        if cls.REQUEST_TIMEOUT <= 0:
+            raise ValueError(f"错误：REQUEST_TIMEOUT 必须大于0，当前值: {cls.REQUEST_TIMEOUT}")
+        if cls.STREAM_DELAY < 0:
+            raise ValueError(f"错误：STREAM_DELAY 不能为负数，当前值: {cls.STREAM_DELAY}")
+    @classmethod
+    def setup_logging(cls) -> None:
+        """设置日志配置"""
+        level_map = {
+            "DEBUG": logging.DEBUG,
+            "INFO": logging.INFO,
+            "WARNING": logging.WARNING,
+            "ERROR": logging.ERROR
+        }
+        log_level = level_map.get(cls.LOG_LEVEL, logging.INFO)
+        logging.basicConfig(
+            level=log_level,
+            format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
+        )

src/constants.py ADDED Viewed

	@@ -0,0 +1,151 @@

+"""
+常量定义模块
+统一管理所有魔法数字和硬编码字符串
+"""
+# API相关常量
+class APIConstants:
+    MODEL_ID = "MBZUAI-IFM/K2-Think"
+    MODEL_ID_NOTHINK = "MBZUAI-IFM/K2-Think-nothink"
+    MODEL_OWNER = "MBZUAI"
+    MODEL_ROOT = "mbzuai-k2-think-2508"
+    # HTTP状态码
+    HTTP_OK = 200
+    HTTP_UNAUTHORIZED = 401
+    HTTP_NOT_FOUND = 404
+    HTTP_INTERNAL_ERROR = 500
+    HTTP_GATEWAY_TIMEOUT = 504
+    # 认证相关
+    BEARER_PREFIX = "Bearer "
+    BEARER_PREFIX_LENGTH = 7
+# 响应相关常量
+class ResponseConstants:
+    CHAT_COMPLETION_OBJECT = "chat.completion"
+    CHAT_COMPLETION_CHUNK_OBJECT = "chat.completion.chunk"
+    MODEL_OBJECT = "model"
+    LIST_OBJECT = "list"
+    # 完成原因
+    FINISH_REASON_STOP = "stop"
+    FINISH_REASON_TOOL_CALLS = "tool_calls"
+    FINISH_REASON_ERROR = "error"
+    # 流式响应标记
+    STREAM_DONE_MARKER = "data: [DONE]\n\n"
+    STREAM_DATA_PREFIX = "data: "
+# 工具调用相关常量
+class ToolConstants:
+    FUNCTION_TYPE = "function"
+    TOOL_TYPE = "function"
+    # 工具调用ID前缀
+    CALL_ID_PREFIX = "call_"
+    # 工具提示长度限制
+    MAX_TOOL_PROMPT_LENGTH = 1000
+    TOOL_PROMPT_TRUNCATE_SUFFIX = "..."
+# 内容处理相关常量
+class ContentConstants:
+    # XML标签
+    THINK_START_TAG = "<think>"
+    THINK_END_TAG = "</think>"
+    ANSWER_START_TAG = "<answer>"
+    ANSWER_END_TAG = "</answer>"
+    # 内容类型
+    TEXT_TYPE = "text"
+    IMAGE_URL_TYPE = "image_url"
+    # 图像占位符
+    IMAGE_PLACEHOLDER = "[图像内容]"
+    # 默认值
+    DEFAULT_USER_NAME = "User"
+    DEFAULT_USER_LOCATION = "Unknown"
+    DEFAULT_USER_LANGUAGE = "en-US"
+    DEFAULT_TIMEZONE = "Asia/Shanghai"
+# 错误消息常量
+class ErrorMessages:
+    INVALID_API_KEY = "Invalid API key provided"
+    AUTHENTICATION_ERROR = "authentication_error"
+    UPSTREAM_ERROR = "upstream_error"
+    TIMEOUT_ERROR = "timeout_error"
+    API_ERROR = "api_error"
+    # 中文错误消息
+    REQUEST_TIMEOUT = "请求超时"
+    SERIALIZATION_FAILED = "请求数据序列化失败"
+    UPSTREAM_SERVICE_ERROR = "上游服务错误"
+# 日志消息常量
+class LogMessages:
+    TOOL_STATUS = "🔧 工具调用状态: has_tools={}, tools_count={}"
+    MESSAGE_RECEIVED = "📥 接收到的原始消息数: {}"
+    ROLE_DISTRIBUTION = "📊 {}消息角色分布: {}"
+    MESSAGE_PROCESSED = "🔄 消息处理完成，原始消息数: {}, 处理后消息数: {}"
+    NO_TOOLS = "⏭️  无工具调用，直接使用原始消息"
+    JSON_VALIDATION_SUCCESS = "✅ K2Think请求体JSON序列化验证通过"
+    JSON_VALIDATION_FAILED = "❌ K2Think请求体JSON序列化失败: {}"
+    JSON_FIXED = "🔧 使用default=str修复了序列化问题"
+    # 动态chunk计算日志
+    DYNAMIC_CHUNK_CALC = "动态chunk_size计算: 内容长度={}, 计算值={}, 最终值={}"
+    # 工具相关日志
+    TOOL_PROMPT_TOO_LONG = "工具提示过长 ({} 字符)，将截断"
+    SYSTEM_MESSAGE_TOO_LONG = "系统消息过长 ({} 字符)，使用简化版本"
+    TOOL_CALLS_EXTRACTED = "提取到工具调用: {}"
+# HTTP头常量
+class HeaderConstants:
+    AUTHORIZATION = "Authorization"
+    CONTENT_TYPE = "Content-Type"
+    ACCEPT = "Accept"
+    ORIGIN = "Origin"
+    REFERER = "Referer"
+    USER_AGENT = "User-Agent"
+    CACHE_CONTROL = "Cache-Control"
+    CONNECTION = "Connection"
+    X_ACCEL_BUFFERING = "X-Accel-Buffering"
+    # 值
+    APPLICATION_JSON = "application/json"
+    TEXT_EVENT_STREAM = "text/event-stream"
+    EVENT_STREAM_JSON = "text/event-stream,application/json"
+    NO_CACHE = "no-cache"
+    KEEP_ALIVE = "keep-alive"
+    NO_BUFFERING = "no"
+    # User-Agent值
+    DEFAULT_USER_AGENT = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/140.0.0.0 Safari/537.36 Edg/140.0.0.0"
+# 时间相关常量
+class TimeConstants:
+    # 时间格式
+    DATETIME_FORMAT = "%Y-%m-%d %H:%M:%S"
+    DATE_FORMAT = "%Y-%m-%d"
+    TIME_FORMAT = "%H:%M:%S"
+    WEEKDAY_FORMAT = "%A"
+    # 微秒转换
+    MICROSECONDS_MULTIPLIER = 1000000
+# 数值常量
+class NumericConstants:
+    # chunk大小限制
+    MIN_CHUNK_SIZE = 50
+    # 内容预览长度
+    CONTENT_PREVIEW_LENGTH = 200
+    CONTENT_PREVIEW_SUFFIX = "..."
+    # 默认token使用量
+    DEFAULT_PROMPT_TOKENS = 0
+    DEFAULT_COMPLETION_TOKENS = 0
+    DEFAULT_TOTAL_TOKENS = 0

src/exceptions.py ADDED Viewed

	@@ -0,0 +1,47 @@

+"""
+自定义异常类模块
+统一管理所有自定义异常
+"""
+class K2ThinkProxyError(Exception):
+    """K2Think代理服务基础异常类"""
+    def __init__(self, message: str, error_type: str = "api_error", status_code: int = 500):
+        self.message = message
+        self.error_type = error_type
+        self.status_code = status_code
+        super().__init__(self.message)
+class ConfigurationError(K2ThinkProxyError):
+    """配置错误异常"""
+    def __init__(self, message: str):
+        super().__init__(message, "configuration_error", 500)
+class AuthenticationError(K2ThinkProxyError):
+    """认证错误异常"""
+    def __init__(self, message: str = "Invalid API key provided"):
+        super().__init__(message, "authentication_error", 401)
+class UpstreamError(K2ThinkProxyError):
+    """上游服务错误异常"""
+    def __init__(self, message: str, status_code: int = 502):
+        super().__init__(message, "upstream_error", status_code)
+class TimeoutError(K2ThinkProxyError):
+    """超时错误异常"""
+    def __init__(self, message: str = "请求超时"):
+        super().__init__(message, "timeout_error", 504)
+class SerializationError(K2ThinkProxyError):
+    """序列化错误异常"""
+    def __init__(self, message: str = "请求数据序列化失败"):
+        super().__init__(message, "serialization_error", 400)
+class ToolProcessingError(K2ThinkProxyError):
+    """工具处理错误异常"""
+    def __init__(self, message: str):
+        super().__init__(message, "tool_processing_error", 400)
+class ContentProcessingError(K2ThinkProxyError):
+    """内容处理错误异常"""
+    def __init__(self, message: str):
+        super().__init__(message, "content_processing_error", 400)

src/models.py ADDED Viewed

	@@ -0,0 +1,48 @@

+"""
+数据模型定义
+定义所有API请求和响应的数据模型
+"""
+from pydantic import BaseModel
+from typing import List, Dict, Optional, Union
+class ImageUrl(BaseModel):
+    """Image URL model for vision content"""
+    url: str
+    detail: Optional[str] = "auto"
+class ContentPart(BaseModel):
+    """Content part model for OpenAI's new content format"""
+    type: str
+    text: Optional[str] = None
+    image_url: Optional[ImageUrl] = None
+class Message(BaseModel):
+    role: str
+    content: Optional[Union[str, List[ContentPart]]] = None
+    tool_calls: Optional[List[Dict]] = None
+class ChatCompletionRequest(BaseModel):
+    model: str = "MBZUAI-IFM/K2-Think"
+    messages: List[Message]
+    stream: bool = False
+    temperature: float = 0.7
+    max_tokens: Optional[int] = None
+    top_p: Optional[float] = None
+    frequency_penalty: Optional[float] = None
+    presence_penalty: Optional[float] = None
+    stop: Optional[Union[str, List[str]]] = None
+    tools: Optional[List[Dict]] = None
+    tool_choice: Optional[Union[str, Dict]] = None
+class ModelInfo(BaseModel):
+    id: str
+    object: str = "model"
+    created: int
+    owned_by: str
+    permission: List[Dict] = []
+    root: str
+    parent: Optional[str] = None
+class ModelsResponse(BaseModel):
+    object: str = "list"
+    data: List[ModelInfo]

src/response_processor.py ADDED Viewed

	@@ -0,0 +1,446 @@

+"""
+响应处理模块
+处理流式和非流式响应的所有逻辑
+"""
+import json
+import time
+import asyncio
+import logging
+import uuid
+from datetime import datetime
+from typing import Dict, AsyncGenerator, Tuple, Optional
+import pytz
+import httpx
+from src.constants import (
+    ToolConstants,APIConstants, ResponseConstants, ContentConstants,
+    NumericConstants, TimeConstants, HeaderConstants
+)
+from src.exceptions import UpstreamError, TimeoutError as ProxyTimeoutError
+from src.tool_handler import ToolHandler
+logger = logging.getLogger(__name__)
+class ResponseProcessor:
+    """响应处理器"""
+    def __init__(self, config, tool_handler: ToolHandler):
+        self.config = config
+        self.tool_handler = tool_handler
+    def extract_answer_content(self, full_content: str, output_thinking: bool = True) -> str:
+        """删除第一个<answer>标签和最后一个</answer>标签，保留内容"""
+        if not full_content:
+            return full_content
+        # 完全通过模型名控制思考内容输出，默认显示思考内容
+        should_output_thinking = output_thinking
+        if should_output_thinking:
+            # 删除第一个<answer>
+            answer_start = full_content.find(ContentConstants.ANSWER_START_TAG)
+            if answer_start != -1:
+                full_content = full_content[:answer_start] + full_content[answer_start + len(ContentConstants.ANSWER_START_TAG):]
+            # 删除最后一个</answer>
+            answer_end = full_content.rfind(ContentConstants.ANSWER_END_TAG)
+            if answer_end != -1:
+                full_content = full_content[:answer_end] + full_content[answer_end + len(ContentConstants.ANSWER_END_TAG):]
+            return full_content.strip()
+        else:
+            # 删除<think>部分（包括标签）
+            think_start = full_content.find(ContentConstants.THINK_START_TAG)
+            think_end = full_content.find(ContentConstants.THINK_END_TAG)
+            if think_start != -1 and think_end != -1:
+                full_content = full_content[:think_start] + full_content[think_end + len(ContentConstants.THINK_END_TAG):]
+            # 删除<answer>标签及其内容之外的部分
+            answer_start = full_content.find(ContentConstants.ANSWER_START_TAG)
+            answer_end = full_content.rfind(ContentConstants.ANSWER_END_TAG)
+            if answer_start != -1 and answer_end != -1:
+                content = full_content[answer_start + len(ContentConstants.ANSWER_START_TAG):answer_end]
+                return content.strip()
+            return full_content.strip()
+    def calculate_dynamic_chunk_size(self, content_length: int) -> int:
+        """
+        动态计算流式输出的chunk大小
+        确保总输出时间不超过MAX_STREAM_TIME秒
+        Args:
+            content_length: 待输出内容的总长度
+        Returns:
+            int: 动态计算的chunk大小，最小为50
+        """
+        if content_length <= 0:
+            return self.config.STREAM_CHUNK_SIZE
+        # 计算需要的总chunk数量以满足时间限制
+        # 总时间 = chunk数量 * STREAM_DELAY
+        # chunk数量 = content_length / chunk_size
+        # 所以：总时间 = (content_length / chunk_size) * STREAM_DELAY
+        # 解出：chunk_size = (content_length * STREAM_DELAY) / MAX_STREAM_TIME
+        calculated_chunk_size = int((content_length * self.config.STREAM_DELAY) / self.config.MAX_STREAM_TIME)
+        # 确保chunk_size不小于最小值
+        dynamic_chunk_size = max(calculated_chunk_size, NumericConstants.MIN_CHUNK_SIZE)
+        # 如果计算出的chunk_size太大（比如内容很短），使用默认值
+        if dynamic_chunk_size > content_length:
+            dynamic_chunk_size = min(self.config.STREAM_CHUNK_SIZE, content_length)
+        logger.debug(f"动态chunk_size计算: 内容长度={content_length}, 计算值={calculated_chunk_size}, 最终值={dynamic_chunk_size}")
+        return dynamic_chunk_size
+    def content_to_multimodal(self, content) -> str | list[dict]:
+        """将内容转换为多模态格式用于K2Think API"""
+        if content is None:
+            return ""
+        if isinstance(content, str):
+            return content
+        if isinstance(content, list):
+            # 检查是否包含图像内容
+            has_image = False
+            result_parts = []
+            for p in content:
+                if hasattr(p, 'type'):  # ContentPart object
+                    if getattr(p, 'type') == ContentConstants.TEXT_TYPE and getattr(p, 'text', None):
+                        result_parts.append({
+                            "type": ContentConstants.TEXT_TYPE,
+                            "text": getattr(p, 'text')
+                        })
+                    elif getattr(p, 'type') == ContentConstants.IMAGE_URL_TYPE and getattr(p, 'image_url', None):
+                        has_image = True
+                        image_url_obj = getattr(p, 'image_url')
+                        if hasattr(image_url_obj, 'url'):
+                            url = getattr(image_url_obj, 'url')
+                        else:
+                            url = image_url_obj.get('url') if isinstance(image_url_obj, dict) else str(image_url_obj)
+                        result_parts.append({
+                            "type": ContentConstants.IMAGE_URL_TYPE,
+                            "image_url": {
+                                "url": url
+                            }
+                        })
+                elif isinstance(p, dict):
+                    if p.get("type") == ContentConstants.TEXT_TYPE and p.get("text"):
+                        result_parts.append({
+                            "type": ContentConstants.TEXT_TYPE,
+                            "text": p.get("text")
+                        })
+                    elif p.get("type") == ContentConstants.IMAGE_URL_TYPE and p.get("image_url"):
+                        has_image = True
+                        result_parts.append({
+                            "type": ContentConstants.IMAGE_URL_TYPE,
+                            "image_url": p.get("image_url")
+                        })
+                elif isinstance(p, str):
+                    result_parts.append({
+                        "type": ContentConstants.TEXT_TYPE,
+                        "text": p
+                    })
+            # 如果包含图像，返回多模态格式；否则返回纯文本
+            if has_image and result_parts:
+                return result_parts
+            else:
+                # 提取所有文本内容
+                text_parts = []
+                for part in result_parts:
+                    if part.get("type") == ContentConstants.TEXT_TYPE:
+                        text_parts.append(part.get("text", ""))
+                return " ".join(text_parts)
+        # 处理其他类型
+        try:
+            return str(content)
+        except:
+            return ""
+    def get_current_datetime_info(self) -> Dict[str, str]:
+        """获取当前时间信息"""
+        # 设置时区为上海
+        tz = pytz.timezone(ContentConstants.DEFAULT_TIMEZONE)
+        now = datetime.now(tz)
+        return {
+            "{{USER_NAME}}": ContentConstants.DEFAULT_USER_NAME,
+            "{{USER_LOCATION}}": ContentConstants.DEFAULT_USER_LOCATION,
+            "{{CURRENT_DATETIME}}": now.strftime(TimeConstants.DATETIME_FORMAT),
+            "{{CURRENT_DATE}}": now.strftime(TimeConstants.DATE_FORMAT),
+            "{{CURRENT_TIME}}": now.strftime(TimeConstants.TIME_FORMAT),
+            "{{CURRENT_WEEKDAY}}": now.strftime(TimeConstants.WEEKDAY_FORMAT),
+            "{{CURRENT_TIMEZONE}}": ContentConstants.DEFAULT_TIMEZONE,
+            "{{USER_LANGUAGE}}": ContentConstants.DEFAULT_USER_LANGUAGE
+        }
+    def generate_session_id(self) -> str:
+        """生成会话ID"""
+        return str(uuid.uuid4())
+    def generate_chat_id(self) -> str:
+        """生成聊天ID"""
+        return str(uuid.uuid4())
+    async def create_http_client(self) -> httpx.AsyncClient:
+        """创建HTTP客户端"""
+        base_kwargs = {
+            "timeout": httpx.Timeout(timeout=None, connect=10.0),
+            "limits": httpx.Limits(
+                max_keepalive_connections=self.config.MAX_KEEPALIVE_CONNECTIONS,
+                max_connections=self.config.MAX_CONNECTIONS
+            ),
+            "follow_redirects": True
+        }
+        try:
+            return httpx.AsyncClient(**base_kwargs)
+        except Exception as e:
+            logger.error(f"创建客户端失败: {e}")
+            raise e
+    async def make_request(
+        self,
+        method: str,
+        url: str,
+        headers: dict,
+        json_data: dict = None,
+        stream: bool = False
+    ) -> httpx.Response:
+        """发送HTTP请求"""
+        client = None
+        try:
+            client = await self.create_http_client()
+            if stream:
+                # 流式请求返回context manager
+                return client.stream(method, url, headers=headers, json=json_data, timeout=None)
+            else:
+                response = await client.request(
+                    method, url, headers=headers, json=json_data,
+                    timeout=self.config.REQUEST_TIMEOUT
+                )
+                # 详细记录非200响应
+                if response.status_code != APIConstants.HTTP_OK:
+                    logger.error(f"上游API返回错误状态码: {response.status_code}")
+                    logger.error(f"响应头: {dict(response.headers)}")
+                    try:
+                        error_body = response.text
+                        logger.error(f"错误响应体: {error_body}")
+                    except:
+                        logger.error("无法读取错误响应体")
+                response.raise_for_status()
+                return response
+        except httpx.HTTPStatusError as e:
+            logger.error(f"HTTP状态错误: {e.response.status_code} - {e.response.text}")
+            if client and not stream:
+                await client.aclose()
+            raise UpstreamError(f"上游服务错误: {e.response.status_code}", e.response.status_code)
+        except httpx.TimeoutException as e:
+            logger.error(f"请求超时: {e}")
+            if client and not stream:
+                await client.aclose()
+            raise ProxyTimeoutError("请求超时")
+        except Exception as e:
+            logger.error(f"请求异常: {e}")
+            if client and not stream:
+                await client.aclose()
+            raise e
+    async def process_non_stream_response(self, k2think_payload: dict, headers: dict, output_thinking: bool = None) -> Tuple[str, dict]:
+        """处理非流式响应"""
+        try:
+            response = await self.make_request(
+                "POST",
+                self.config.K2THINK_API_URL,
+                headers,
+                k2think_payload,
+                stream=False
+            )
+            # K2Think 非流式请求返回标准JSON格式
+            result = response.json()
+            # 提取内容
+            full_content = ""
+            if result.get('choices') and len(result['choices']) > 0:
+                choice = result['choices'][0]
+                if choice.get('message') and choice['message'].get('content'):
+                    raw_content = choice['message']['content']
+                    # 提取<answer>标签中的内容，去除标签
+                    full_content = self.extract_answer_content(raw_content, output_thinking)
+            # 提取token信息
+            token_info = result.get('usage', {
+                "prompt_tokens": NumericConstants.DEFAULT_PROMPT_TOKENS,
+                "completion_tokens": NumericConstants.DEFAULT_COMPLETION_TOKENS,
+                "total_tokens": NumericConstants.DEFAULT_TOTAL_TOKENS
+            })
+            await response.aclose()
+            return full_content, token_info
+        except Exception as e:
+            logger.error(f"处理非流式响应错误: {e}")
+            raise
+    async def process_stream_response_with_tools(
+        self,
+        k2think_payload: dict,
+        headers: dict,
+        has_tools: bool = False,
+        output_thinking: bool = None,
+        original_model: str = None
+    ) -> AsyncGenerator[str, None]:
+        """处理流式响应 - 支持工具调用，优化性能"""
+        try:
+            # 发送开始chunk
+            start_chunk = self._create_chunk_data(
+                delta={"role": "assistant", "content": ""},
+                finish_reason=None,
+                model=original_model
+            )
+            yield f"{ResponseConstants.STREAM_DATA_PREFIX}{json.dumps(start_chunk)}\n\n"
+            # 优化的模拟流式输出 - 立即开始获取响应并流式发送
+            k2think_payload_copy = k2think_payload.copy()
+            k2think_payload_copy["stream"] = False
+            headers_copy = headers.copy()
+            headers_copy[HeaderConstants.ACCEPT] = HeaderConstants.APPLICATION_JSON
+            # 获取完整响应
+            full_content, token_info = await self.process_non_stream_response(k2think_payload_copy, headers_copy, output_thinking)
+            if not full_content:
+                yield ResponseConstants.STREAM_DONE_MARKER
+                return
+            # 处理工具调用的流式响应
+            finish_reason = ResponseConstants.FINISH_REASON_STOP
+            if has_tools:
+                tool_calls = self.tool_handler.extract_tool_invocations(full_content)
+                if tool_calls:
+                    # 发送工具调用
+                    for i, tc in enumerate(tool_calls):
+                        tool_call_delta = {
+                            "index": i,
+                            "id": tc.get("id"),
+                            "type": tc.get("type", ToolConstants.FUNCTION_TYPE),
+                            "function": tc.get("function", {}),
+                        }
+                        tool_chunk = self._create_chunk_data(
+                            delta={"tool_calls": [tool_call_delta]},
+                            finish_reason=None,
+                            model=original_model
+                        )
+                        yield f"{ResponseConstants.STREAM_DATA_PREFIX}{json.dumps(tool_chunk)}\n\n"
+                    finish_reason = ResponseConstants.FINISH_REASON_TOOL_CALLS
+                else:
+                    # 发送常规内容
+                    trimmed_content = self.tool_handler.remove_tool_json_content(full_content)
+                    if trimmed_content:
+                        async for chunk in self._stream_content(trimmed_content, original_model):
+                            yield chunk
+            else:
+                # 无工具 - 发送常规内容
+                async for chunk in self._stream_content(full_content, original_model):
+                    yield chunk
+            # 发送结束chunk
+            end_chunk = self._create_chunk_data(
+                delta={},
+                finish_reason=finish_reason,
+                model=original_model
+            )
+            yield f"{ResponseConstants.STREAM_DATA_PREFIX}{json.dumps(end_chunk)}\n\n"
+            yield ResponseConstants.STREAM_DONE_MARKER
+        except Exception as e:
+            logger.error(f"流式响应处理错误: {e}")
+            error_chunk = self._create_chunk_data(
+                delta={},
+                finish_reason=ResponseConstants.FINISH_REASON_ERROR,
+                model=original_model
+            )
+            yield f"{ResponseConstants.STREAM_DATA_PREFIX}{json.dumps(error_chunk)}\n\n"
+            yield ResponseConstants.STREAM_DONE_MARKER
+    async def _stream_content(self, content: str, model: str = None) -> AsyncGenerator[str, None]:
+        """流式发送内容"""
+        chunk_size = self.calculate_dynamic_chunk_size(len(content))
+        for i in range(0, len(content), chunk_size):
+            chunk_content = content[i:i + chunk_size]
+            chunk = self._create_chunk_data(
+                delta={"content": chunk_content},
+                finish_reason=None,
+                model=model
+            )
+            yield f"{ResponseConstants.STREAM_DATA_PREFIX}{json.dumps(chunk)}\n\n"
+            # 添加延迟模拟真实流式效果
+            await asyncio.sleep(self.config.STREAM_DELAY)
+    def _create_chunk_data(self, delta: dict, finish_reason: Optional[str], model: str = None) -> dict:
+        """创建流式响应chunk数据"""
+        return {
+            "id": f"chatcmpl-{int(time.time() * 1000)}",
+            "object": ResponseConstants.CHAT_COMPLETION_CHUNK_OBJECT,
+            "created": int(time.time()),
+            "model": model or APIConstants.MODEL_ID,
+            "choices": [{
+                "index": 0,
+                "delta": delta,
+                "finish_reason": finish_reason
+            }]
+        }
+    def create_completion_response(
+        self,
+        content: Optional[str],
+        tool_calls: Optional[list] = None,
+        token_info: Optional[dict] = None,
+        model: str = None
+    ) -> dict:
+        """创建完整的聊天补全响应"""
+        finish_reason = ResponseConstants.FINISH_REASON_TOOL_CALLS if tool_calls else ResponseConstants.FINISH_REASON_STOP
+        message = {
+            "role": "assistant",
+            "content": content,
+        }
+        if tool_calls:
+            message["tool_calls"] = tool_calls
+        return {
+            "id": f"chatcmpl-{int(time.time())}",
+            "object": ResponseConstants.CHAT_COMPLETION_OBJECT,
+            "created": int(time.time()),
+            "model": model or APIConstants.MODEL_ID,
+            "choices": [{
+                "index": 0,
+                "message": message,
+                "finish_reason": finish_reason
+            }],
+            "usage": token_info or {
+                "prompt_tokens": NumericConstants.DEFAULT_PROMPT_TOKENS,
+                "completion_tokens": NumericConstants.DEFAULT_COMPLETION_TOKENS,
+                "total_tokens": NumericConstants.DEFAULT_TOTAL_TOKENS
+            }
+        }

src/tool_handler.py ADDED Viewed

	@@ -0,0 +1,368 @@

+"""
+工具处理模块
+处理工具调用相关的所有逻辑
+"""
+import json
+import re
+import time
+import logging
+from typing import List, Dict, Optional, Union
+from src.constants import (
+    ToolConstants, ContentConstants, LogMessages,
+    TimeConstants
+)
+from src.exceptions import ToolProcessingError
+logger = logging.getLogger(__name__)
+class ToolHandler:
+    """工具调用处理器"""
+    # 工具调用提取模式
+    TOOL_CALL_FENCE_PATTERN = re.compile(r"```json\s*(\{.*?\})\s*```", re.DOTALL)
+    FUNCTION_CALL_PATTERN = re.compile(
+        r"调用函数\s*[：:]\s*([\w\-\.]+)\s*(?:参数|arguments)[：:]\s*(\{.*?\})",
+        re.DOTALL
+    )
+    def __init__(self, config):
+        self.config = config
+        self.scan_limit = config.SCAN_LIMIT
+        self.system_message_length = config.SYSTEM_MESSAGE_LENGTH
+        self.tool_support = config.TOOL_SUPPORT
+    def generate_tool_prompt(self, tools: List[Dict]) -> str:
+        """生成简洁的工具注入提示"""
+        if not tools:
+            return ""
+        tool_definitions = []
+        for tool in tools:
+            if tool.get("type") != ToolConstants.FUNCTION_TYPE:
+                continue
+            function_spec = tool.get("function", {}) or {}
+            function_name = function_spec.get("name", "unknown")
+            function_description = function_spec.get("description", "")
+            parameters = function_spec.get("parameters", {}) or {}
+            # 创建简洁的工具定义
+            tool_info = f"{function_name}: {function_description}"
+            # 添加简化的参数信息
+            parameter_properties = parameters.get("properties", {}) or {}
+            required_parameters = set(parameters.get("required", []) or [])
+            if parameter_properties:
+                param_list = []
+                for param_name, param_details in parameter_properties.items():
+                    param_desc = (param_details or {}).get("description", "")
+                    is_required = param_name in required_parameters
+                    param_list.append(f"{param_name}{'*' if is_required else ''}: {param_desc}")
+                tool_info += f" Parameters: {', '.join(param_list)}"
+            tool_definitions.append(tool_info)
+        if not tool_definitions:
+            return ""
+        # 构建简洁的工具提示
+        prompt_template = (
+            f"\n\nAvailable tools: {'; '.join(tool_definitions)}. "
+            "To use a tool, respond with JSON: "
+            '{"tool_calls":[{"id":"call_xxx","type":"function","function":{"name":"tool_name","arguments":"{\\"param\\":\\"value\\"}"}}]}'
+        )
+        return prompt_template
+    def process_messages_with_tools(
+        self,
+        messages: List[Dict],
+        tools: Optional[List[Dict]] = None,
+        tool_choice: Optional[Union[str, Dict]] = None
+    ) -> List[Dict]:
+        """处理消息并注入工具提示"""
+        if not tools or not self.tool_support or (tool_choice == "none"):
+            # 如果没有工具或禁用工具，直接返回原消息
+            return [dict(m) for m in messages]
+        tools_prompt = self.generate_tool_prompt(tools)
+        # 限制工具提示长度，避免过长导致上游API拒绝
+        if len(tools_prompt) > ToolConstants.MAX_TOOL_PROMPT_LENGTH:
+            logger.warning(LogMessages.TOOL_PROMPT_TOO_LONG.format(len(tools_prompt)))
+            tools_prompt = tools_prompt[:ToolConstants.MAX_TOOL_PROMPT_LENGTH] + ToolConstants.TOOL_PROMPT_TRUNCATE_SUFFIX
+        processed = []
+        has_system = any(m.get("role") == "system" for m in messages)
+        if has_system:
+            # 如果已有系统消息，在第一个系统消息中添加工具提示
+            for m in messages:
+                if m.get("role") == "system":
+                    mm = dict(m)
+                    content = self._content_to_string(mm.get("content", ""))
+                    # 确保系统消息不会过长
+                    new_content = content + tools_prompt
+                    if len(new_content) > self.system_message_length:
+                        logger.warning(LogMessages.SYSTEM_MESSAGE_TOO_LONG.format(len(new_content)))
+                        mm["content"] = "你是一个有用的助手。" + tools_prompt
+                    else:
+                        mm["content"] = new_content
+                    processed.append(mm)
+                    # 只在第一个系统消息中添加工具提示
+                    tools_prompt = ""
+                else:
+                    processed.append(dict(m))
+        else:
+            # 如果没有系统消息，需要添加一个，但只有当确实需要工具时
+            if tools_prompt.strip():
+                processed = [{"role": "system", "content": "你���一个有用的助手。" + tools_prompt}]
+                processed.extend([dict(m) for m in messages])
+            else:
+                processed = [dict(m) for m in messages]
+        # 添加简化的工具选择提示
+        if tool_choice == "required":
+            if processed and processed[-1].get("role") == "user":
+                last = processed[-1]
+                content = self._content_to_string(last.get("content", ""))
+                last["content"] = content + "\n请使用工具来处理这个请求。"
+        elif isinstance(tool_choice, dict) and tool_choice.get("type") == ToolConstants.FUNCTION_TYPE:
+            fname = (tool_choice.get("function") or {}).get("name")
+            if fname and processed and processed[-1].get("role") == "user":
+                last = processed[-1]
+                content = self._content_to_string(last.get("content", ""))
+                last["content"] = content + f"\n请使用 {fname} 工具。"
+        # 处理工具/函数消息
+        final_msgs = []
+        for m in processed:
+            role = m.get("role")
+            if role in ("tool", "function"):
+                tool_name = m.get("name", "unknown")
+                tool_content = self._content_to_string(m.get("content", ""))
+                if isinstance(tool_content, dict):
+                    tool_content = json.dumps(tool_content, ensure_ascii=False)
+                # 简化工具结果消息
+                content = f"工具 {tool_name} 结果: {tool_content}"
+                if not content.strip():
+                    content = f"工具 {tool_name} 执行完成"
+                final_msgs.append({
+                    "role": "assistant",
+                    "content": content,
+                })
+            else:
+                # 对于常规消息，确保内容是字符串格式
+                final_msg = dict(m)
+                content = self._content_to_string(final_msg.get("content", ""))
+                final_msg["content"] = content
+                final_msgs.append(final_msg)
+        return final_msgs
+    def extract_tool_invocations(self, text: str) -> Optional[List[Dict]]:
+        """从响应文本中提取工具调用"""
+        if not text:
+            return None
+        # 限制扫描大小以提高性能
+        scannable_text = text[:self.scan_limit]
+        # 尝试1：从JSON代码块中提取
+        json_blocks = self.TOOL_CALL_FENCE_PATTERN.findall(scannable_text)
+        for json_block in json_blocks:
+            try:
+                parsed_data = json.loads(json_block)
+                tool_calls = parsed_data.get("tool_calls")
+                if tool_calls and isinstance(tool_calls, list):
+                    # 确保arguments字段是字符串
+                    self._normalize_tool_calls(tool_calls)
+                    return tool_calls
+            except (json.JSONDecodeError, AttributeError):
+                continue
+        # 尝试2：使用括号平衡方法提取内联JSON对象
+        tool_calls = self._extract_inline_json_tool_calls(scannable_text)
+        if tool_calls:
+            return tool_calls
+        # 尝试3：解析自然语言函数调用
+        natural_lang_match = self.FUNCTION_CALL_PATTERN.search(scannable_text)
+        if natural_lang_match:
+            function_name = natural_lang_match.group(1).strip()
+            arguments_str = natural_lang_match.group(2).strip()
+            try:
+                # 验证JSON格式
+                json.loads(arguments_str)
+                return [
+                    {
+                        "id": f"{ToolConstants.CALL_ID_PREFIX}{int(time.time() * TimeConstants.MICROSECONDS_MULTIPLIER)}",
+                        "type": ToolConstants.FUNCTION_TYPE,
+                        "function": {"name": function_name, "arguments": arguments_str},
+                    }
+                ]
+            except json.JSONDecodeError:
+                return None
+        return None
+    def remove_tool_json_content(self, text: str) -> str:
+        """从响应文本中移除工具JSON内容 - 使用括号平衡方法"""
+        def remove_tool_call_block(match: re.Match) -> str:
+            json_content = match.group(1)
+            try:
+                parsed_data = json.loads(json_content)
+                if "tool_calls" in parsed_data:
+                    return ""
+            except (json.JSONDecodeError, AttributeError):
+                pass
+            return match.group(0)
+        # 步骤1：移除围栏工具JSON块
+        cleaned_text = self.TOOL_CALL_FENCE_PATTERN.sub(remove_tool_call_block, text)
+        # 步骤2：移除内联工具JSON - 使用基于括号平衡的智能方法
+        result = []
+        i = 0
+        while i < len(cleaned_text):
+            if cleaned_text[i] == '{':
+                # 尝试找到匹配的右括号
+                brace_count = 1
+                j = i + 1
+                in_string = False
+                escape_next = False
+                while j < len(cleaned_text) and brace_count > 0:
+                    if escape_next:
+                        escape_next = False
+                    elif cleaned_text[j] == '\\':
+                        escape_next = True
+                    elif cleaned_text[j] == '"' and not escape_next:
+                        in_string = not in_string
+                    elif not in_string:
+                        if cleaned_text[j] == '{':
+                            brace_count += 1
+                        elif cleaned_text[j] == '}':
+                            brace_count -= 1
+                    j += 1
+                if brace_count == 0:
+                    # 找到了完整的JSON对象
+                    json_str = cleaned_text[i:j]
+                    try:
+                        parsed = json.loads(json_str)
+                        if "tool_calls" in parsed:
+                            # 这是一个工具调用，跳过它
+                            i = j
+                            continue
+                    except:
+                        pass
+                # 不是工具调用或无法解析，保留这个字符
+                result.append(cleaned_text[i])
+                i += 1
+            else:
+                result.append(cleaned_text[i])
+                i += 1
+        return ''.join(result).strip()
+    def _extract_inline_json_tool_calls(self, text: str) -> Optional[List[Dict]]:
+        """使用括号平衡方法提取内联JSON工具调用"""
+        i = 0
+        while i < len(text):
+            if text[i] == '{':
+                # 尝试找到匹配的右括号
+                brace_count = 1
+                j = i + 1
+                in_string = False
+                escape_next = False
+                while j < len(text) and brace_count > 0:
+                    if escape_next:
+                        escape_next = False
+                    elif text[j] == '\\':
+                        escape_next = True
+                    elif text[j] == '"' and not escape_next:
+                        in_string = not in_string
+                    elif not in_string:
+                        if text[j] == '{':
+                            brace_count += 1
+                        elif text[j] == '}':
+                            brace_count -= 1
+                    j += 1
+                if brace_count == 0:
+                    # 找到了完整的JSON对象
+                    json_str = text[i:j]
+                    try:
+                        parsed_data = json.loads(json_str)
+                        tool_calls = parsed_data.get("tool_calls")
+                        if tool_calls and isinstance(tool_calls, list):
+                            # 确保arguments字段是字符串
+                            self._normalize_tool_calls(tool_calls)
+                            return tool_calls
+                    except (json.JSONDecodeError, AttributeError):
+                        pass
+                i += 1
+            else:
+                i += 1
+        return None
+    def _normalize_tool_calls(self, tool_calls: List[Dict]) -> None:
+        """标准化工具调用，确保arguments字段是字符串"""
+        for tc in tool_calls:
+            if "function" in tc:
+                func = tc["function"]
+                if "arguments" in func:
+                    if isinstance(func["arguments"], dict):
+                        # 将字典转换为JSON字符串
+                        func["arguments"] = json.dumps(func["arguments"], ensure_ascii=False)
+                    elif not isinstance(func["arguments"], str):
+                        func["arguments"] = json.dumps(func["arguments"], ensure_ascii=False)
+    def _content_to_string(self, content) -> str:
+        """将各种格式的内容转换为字符串"""
+        if content is None:
+            return ""
+        if isinstance(content, str):
+            return content
+        if isinstance(content, list):
+            parts = []
+            for p in content:
+                if hasattr(p, 'text'):  # ContentPart object
+                    if getattr(p, 'text', None):
+                        parts.append(getattr(p, 'text', ''))
+                elif isinstance(p, dict):
+                    if p.get("type") == ContentConstants.TEXT_TYPE:
+                        parts.append(p.get("text", ""))
+                    elif p.get("type") == ContentConstants.IMAGE_URL_TYPE:
+                        # 处理图像内容，添加描述性文本
+                        parts.append(ContentConstants.IMAGE_PLACEHOLDER)
+                elif isinstance(p, str):
+                    parts.append(p)
+                else:
+                    # 处理其他类型的对象
+                    try:
+                        if hasattr(p, '__dict__'):
+                            # 如果是对象，尝试获取text属性或转换为字符串
+                            text_attr = getattr(p, 'text', None)
+                            if text_attr:
+                                parts.append(str(text_attr))
+                        else:
+                            parts.append(str(p))
+                    except:
+                        continue
+            return " ".join(parts)
+        # 处理其他类型
+        try:
+            return str(content)
+        except:
+            return ""