Spaces:

misonL
/

GAP

Paused

App Files Files Community

GAP / app /core /processing /utils.py

misonL

Upload 52 files

e82bac2 verified about 1 year ago

Raw

History Blame Contribute Delete

26.7 kB

	# -- coding: utf-8 --
	"""
	请求处理相关的工具函数，包括 Token 估算、上下文截断、速率限制检查和计数更新、上下文保存等。
	"""
	import json # 导入 JSON 处理模块
	import logging # 导入日志模块
	import time # 导入时间模块
	from typing import List, Dict, Any, Optional, Tuple # 导入类型提示
	from collections import Counter, defaultdict # 导入集合类型

	# 导入核心模块
	from app.core.database import utils as db_utils # 导入数据库工具模块
	from app.core.context import store as context_store # 导入上下文存储模块
	# 导入配置
	from app import config as app_config # 导入应用配置
	# 导入跟踪相关的数据结构和常量
	from app.core.tracking import (
	ip_daily_input_token_counts, ip_input_token_counts_lock, # IP 每日输入 Token 计数及锁
	usage_data, usage_lock, RPM_WINDOW_SECONDS, TPM_WINDOW_SECONDS # 使用数据、锁及时间窗口常量
	)

	# 导入日志记录器
	logger = logging.getLogger('my_logger') # 获取日志记录器实例

	# --- Token 估算与上下文截断 (来自 token_utils.py) ---

	def estimate_token_count(contents: List[Dict[str, Any]]) -> int:
	"""
	估算 Gemini contents 列表的 Token 数量。
	使用简单的字符数估算方法 (1 个 token 大约等于 4 个字符)。
	注意：这是一个非常粗略的估算，实际 Token 数可能因模型和内容而异。

	Args:
	contents (List[Dict[str, Any]]): Gemini 格式的内容列表。

	Returns:
	int: 估算的 Token 数量。
	"""
	if not contents: # 检查列表是否为空
	return 0 # 如果为空，返回 0
	try:
	# 计算 JSON 序列化后的字符数
	# ensure_ascii=False 确保中文字符等非 ASCII 字符按实际字符数计算，而不是转义序列
	char_count = len(json.dumps(contents, ensure_ascii=False)) # 序列化为 JSON 字符串并获取长度
	# 使用 1 token ≈ 4 chars 的简化规则进行估算
	return char_count // 4 # 返回估算的 Token 数
	except TypeError as e:
	# 捕获并记录序列化过程中可能发生的类型错误
	logger.error(f"序列化 contents 进行 Token 估算时出错: {e}", exc_info=True) # 记录错误日志
	return 0 # 如果序列化失败，返回 0

	async def truncate_context( # 改为 async 函数，因为内部可能调用 async 函数 (如 estimate_token_count 未来可能改为调用 API)
	contents: List[Dict[str, Any]],
	model_name: str,
	dynamic_max_tokens_limit: Optional[int] = None # 新增可选参数，表示基于 Key 实时容量的动态限制
	) -> Tuple[List[Dict[str, Any]], bool]:
	"""
	根据模型限制和可选的动态限制截断对话历史 (contents)。
	采用从开头成对移除消息（通常是 user/model 对）的策略，
	直到估算的 Token 数量满足限制要求。

	Args:
	contents (List[Dict[str, Any]]): 完整的对话历史列表 (Gemini 格式)。
	model_name (str): 当前请求使用的模型名称，用于查找其 Token 限制。
	dynamic_max_tokens_limit (Optional[int]): 可选的动态 Token 限制，
	通常基于 API Key 的实时可用容量。如果提供，将使用此限制与模型静态限制中的较小值。

	Returns:
	Tuple[List[Dict[str, Any]], bool]:
	- 第一个元素是截断后的对话历史列表。
	- 第二个元素是一个布尔值，指示截断后是否仍然超限
	(True 表示超限，False 表示未超限或无需截断)。
	如果返回 True，调用者通常不应保存此上下文，因为它可能仍然过长。
	"""
	if not contents: # 检查输入列表是否为空
	return [], False # 如果为空，直接返回空列表和 False (未超限)

	# --- 确定最大 Token 限制 ---
	# 1. 获取配置中的默认值和安全边际
	# 使用 getattr 提供默认值，增加配置的灵活性
	default_max_tokens = getattr(app_config, 'DEFAULT_MAX_CONTEXT_TOKENS', 30000) # 获取默认最大上下文 Token 数，默认为 30000
	safety_margin = getattr(app_config, 'CONTEXT_TOKEN_SAFETY_MARGIN', 200) # 获取 Token 安全边际，默认为 200

	# 2. 获取模型的静态输入 Token 限制
	model_limits = getattr(app_config, 'MODEL_LIMITS', {}) # 从配置加载模型限制字典
	limit_info = model_limits.get(model_name) # 查找当前模型的限制信息
	static_max_tokens = default_max_tokens # 默认使用全局默认值
	if limit_info and isinstance(limit_info, dict) and limit_info.get("input_token_limit"): # 检查是否存在有效的模型特定限制
	try:
	limit_value = limit_info["input_token_limit"] # 获取模型限制值
	if limit_value is not None: # 确保值不是 JSON null
	static_max_tokens = int(limit_value) # 转换为整数
	else:
	# 如果模型限制值为 null，记录警告并使用默认值
	logger.warning(f"模型 '{model_name}' 的 input_token_limit 值为 null，使用默认值 {default_max_tokens}") # 记录警告：模型限制值为 null
	except (ValueError, TypeError):
	# 如果模型限制值无效（无法转换为整数），记录警告并使用默认值
	logger.warning(f"模型 '{model_name}' 的 input_token_limit 值无效 ('{limit_info.get('input_token_limit')}')，使用默认值 {default_max_tokens}") # 记录警告：模型限制值无效
	else:
	# 如果模型或其限制未定义，记录警告并使用默认值
	logger.warning(f"模型 '{model_name}' 或其 input_token_limit 未在 model_limits.json 中定义，使用默认值 {default_max_tokens}") # 记录警告：模型限制未定义

	# 3. 结合动态限制确定最终使用的最大 Token 限制
	actual_max_tokens = static_max_tokens # 默认使用模型的静态限制
	if dynamic_max_tokens_limit is not None and dynamic_max_tokens_limit >= 0: # 如果提供了有效的动态限制（非 None 且非负）
	# 取静态限制和动态限制中的较小者作为实际限制
	actual_max_tokens = min(static_max_tokens, dynamic_max_tokens_limit)
	# 记录日志，说明使用了哪个限制
	logger.debug(f"使用动态限制 {dynamic_max_tokens_limit} 和静态限制 {static_max_tokens}，最终最大 Token 限制为 {actual_max_tokens}") # 记录使用的限制值

	# 4. 计算截断阈值（实际限制减去安全边际）
	# 确保阈值不小于 0
	truncation_threshold = max(0, actual_max_tokens - safety_margin) # 计算最终的截断目标 Token 数

	# --- 执行截断 ---
	# 估算当前内容的 Token 数量
	estimated_tokens = estimate_token_count(contents) # 调用 Token 估算函数

	# 判断是否需要截断
	if estimated_tokens > truncation_threshold: # 如果估算 Token 数超过了阈值
	logger.info(f"上下文估算 Token ({estimated_tokens}) 超出阈值 ({truncation_threshold} for model {model_name}, actual max tokens {actual_max_tokens})，开始截断...") # 记录开始截断的日志
	# 创建内容的副本进行操作，避免修改原始列表
	truncated_contents = list(contents) # 复制列表
	# 循环移除消息对，直到满足 Token 限制或无法再移除
	while estimate_token_count(truncated_contents) > truncation_threshold and len(truncated_contents) >= 2:
	# 从列表开头移除两个元素（假设是 user/model 对）
	removed_first = truncated_contents.pop(0) # 移除第一个元素 (通常是 user)
	removed_second = truncated_contents.pop(0) # 移除第二个元素 (通常是 model)
	# 记录被移除的消息的角色，用于调试
	logger.debug(f"移除旧消息对: roles={removed_first.get('role')}, {removed_second.get('role')}") # 记录移除的消息角色

	# 重新估算截断后的 Token 数量
	final_estimated_tokens = estimate_token_count(truncated_contents) # 估算最终 Token 数

	# 检查截断后是否仍然超限
	if final_estimated_tokens > truncation_threshold: # 如果截断后仍然超过阈值
	# 这种情况可能发生在即使只剩下一条消息，其 Token 数也超过阈值
	logger.error(f"截断后上下文估算 Token ({final_estimated_tokens}) 仍然超过阈值 ({truncation_threshold})。本次交互的上下文不应被保存。") # 记录错误：截断后仍超限
	# 返回截断后的内容，并标记为超限 (True)
	return truncated_contents, True
	else:
	# 截断成功，且最终 Token 数在阈值内
	logger.info(f"上下文截断完成，剩余消息数: {len(truncated_contents)}, 最终估算 Token: {final_estimated_tokens}") # 记录截断成功信息
	# 返回截断后的内容，并标记为未超限 (False)
	return truncated_contents, False
	else:
	# 如果原始 Token 数未超过阈值，无需截断
	return contents, False # 返回原始内容，并标记为未超限 (False)

	# --- 速率限制检查与计数更新 (来自 rate_limit_utils.py) ---

	def check_rate_limits_and_update_counts(
	api_key: str,
	model_name: str,
	limits: Optional[Dict[str, Any]]
	) -> bool:
	"""
	检查给定 API Key 和模型的速率限制 (RPD, TPD_Input, RPM, TPM_Input)。
	此函数在选择 Key 之前调用，用于预检查 Key 是否已达到已知限制。
	如果未达到限制，则更新 RPM 和 RPD 计数（假设本次请求会发生），并返回 True。
	如果达到任何限制，则记录警告并返回 False，表示不应选择此 Key。

	Args:
	api_key (str): 当前尝试使用的 API Key。
	model_name (str): 请求的模型名称。
	limits (Optional[Dict[str, Any]]): 从配置中获取的该模型的限制字典。

	Returns:
	bool: 如果根据已知计数判断可以继续进行 API 调用则返回 True，否则返回 False。
	"""
	if not limits: # 检查是否有该模型的限制配置
	logger.warning(f"模型 '{model_name}' 不在 model_limits.json 中，跳过本地速率限制检查。") # 记录警告：模型不在限制配置中
	return True # 没有限制信息，默认允许调用

	now = time.time() # 获取当前时间戳，用于 RPM 和 TPM 检查
	perform_api_call = True # 初始化标志：假设可以执行 API 调用

	with usage_lock: # 获取使用数据锁，保证对共享数据 usage_data 的访问是线程安全的
	# 使用 setdefault 确保 key 和 model 的条目存在于 usage_data 中，避免 KeyError
	# 如果键不存在，会使用 defaultdict 的默认工厂（这里是另一个 defaultdict）创建新条目
	key_usage = usage_data.setdefault(api_key, defaultdict(lambda: defaultdict(int)))[model_name] # 获取或创建 Key 和模型的用法数据字典

	# --- 检查并更新 RPM (每分钟请求数) ---
	rpm_limit = limits.get("rpm") # 从模型限制中获取 RPM 限制值
	if rpm_limit is not None: # 如果配置了 RPM 限制
	current_rpm_count = key_usage.get("rpm_count", 0) # 获取当前 RPM 计数，默认为 0
	rpm_timestamp = key_usage.get("rpm_timestamp", 0) # 获取上次 RPM 窗口开始时间戳，默认为 0

	if now - rpm_timestamp >= RPM_WINDOW_SECONDS: # 检查当前时间是否已经超过了 RPM 窗口时长
	# RPM 窗口已过期，重置计数并将当前请求计为 1
	key_usage["rpm_count"] = 1 # 新窗口的第一个请求
	key_usage["rpm_timestamp"] = now # 更新窗口开始时间戳为当前时间
	logger.debug(f"RPM 窗口过期，重置计数并增加 (Key: {api_key[:8]}, Model: {model_name}): 新 RPM=1") # 记录 RPM 窗口过期和重置
	else:
	# RPM 窗口未过期，检查加上当前这个预期的请求是否会超限
	if current_rpm_count + 1 > rpm_limit: # 如果当前计数加 1 超过限制
	logger.warning(f"速率限制预检查失败 (Key: {api_key[:8]}, Model: {model_name}): RPM 达到限制 ({current_rpm_count}/{rpm_limit})。跳过此 Key。") # 记录 RPM 超限警告
	perform_api_call = False # 设置标志为 False，表示不能选择此 Key
	else:
	# 未达到限制，预先增加计数（假设此 Key 会被选中并使用）
	key_usage["rpm_count"] = current_rpm_count + 1 # RPM 计数加 1
	# 时间戳保持不变，因为仍在当前窗口内
	logger.debug(f"RPM 计数增加 (Key: {api_key[:8]}, Model: {model_name}): 新 RPM={key_usage['rpm_count']}") # 记录 RPM 计数增加

	# --- 检查并更新 RPD (每日请求数) ---
	# 仅在之前的检查（RPM）通过时才进行 RPD 检查
	if perform_api_call:
	rpd_limit = limits.get("rpd") # 获取 RPD 限制值
	if rpd_limit is not None: # 如果配置了 RPD 限制
	current_rpd_count = key_usage.get("rpd_count", 0) # 获取当前 RPD 计数，默认为 0
	# RPD 是每日计数，不需要时间窗口检查，直接判断是否超限
	if current_rpd_count + 1 > rpd_limit: # 如果当前计数加 1 超过限制
	logger.warning(f"速率限制预检查失败 (Key: {api_key[:8]}, Model: {model_name}): RPD 达到限制 ({current_rpd_count}/{rpd_limit})。跳过此 Key。") # 记录 RPD 超限警告
	perform_api_call = False # 设置标志为 False
	else:
	# 未达到限制，预先增加计数
	key_usage["rpd_count"] = current_rpd_count + 1 # RPD 计数加 1
	logger.debug(f"RPD 计数增加 (Key: {api_key[:8]}, Model: {model_name}): 新 RPD={key_usage['rpd_count']}") # 记录 RPD 计数增加

	# --- 检查 TPD_Input (每日输入 Token 数) ---
	# 仅检查，不在此处增加计数，因为此时还不知道实际的输入 Token 数。
	# 计数更新在 API 调用成功后的 update_token_counts 函数中进行。
	if perform_api_call:
	tpd_input_limit = limits.get("tpd_input") # 获取 TPD_Input 限制值
	if tpd_input_limit is not None and key_usage.get("tpd_input_count", 0) >= tpd_input_limit: # 如果设置了限制且当前计数已达到或超过限制
	logger.warning(f"速率限制预检查失败 (Key: {api_key[:8]}, Model: {model_name}): TPD_Input 达到限制 ({key_usage.get('tpd_input_count', 0)}/{tpd_input_limit})。跳过此 Key。") # 记录 TPD_Input 超限警告
	perform_api_call = False # 设置标志为 False

	# --- 检查 TPM_Input (每分钟输入 Token 数) ---
	# 同样仅检查，不在此处增加计数。
	if perform_api_call:
	tpm_input_limit = limits.get("tpm_input") # 获取 TPM_Input 限制值
	if tpm_input_limit is not None: # 如果设置了 TPM_Input 限制
	# 检查是否仍在当前 TPM 窗口内
	if now - key_usage.get("tpm_input_timestamp", 0) < TPM_WINDOW_SECONDS:
	# 如果在窗口内，检查当前 Token 计数是否已达到或超过限制
	if key_usage.get("tpm_input_count", 0) >= tpm_input_limit:
	logger.warning(f"速率限制预检查失败 (Key: {api_key[:8]}, Model: {model_name}): TPM_Input 达到限制 ({key_usage.get('tpm_input_count', 0)}/{tpm_input_limit})。跳过此 Key。") # 记录 TPM_Input 超限警告
	perform_api_call = False # 设置标志为 False
	# 注意：这里没有 else 块来在窗口过期时重置 TPM_Input 计数/时间戳，
	# 因为 update_token_counts 函数会处理 TPM_Input 的重置和增加。

	# 如果所有检查都通过，更新此 Key 的最后请求时间戳（用于 Key 选择策略）
	if perform_api_call:
	key_usage["last_request_timestamp"] = now # 更新最后请求时间戳

	return perform_api_call # 返回最终的检查结果

	def update_token_counts(
	api_key: str,
	model_name: str,
	limits: Optional[Dict[str, Any]],
	prompt_tokens: Optional[int],
	client_ip: str,
	today_date_str_pt: str
	) -> None:
	"""
	在 API 调用成功之后更新给定 API Key 和模型的 TPD_Input 和 TPM_Input 计数。
	同时记录基于 IP 的每日输入 Token 消耗。

	Args:
	api_key (str): 当前成功使用的 API Key。
	model_name (str): 请求的模型名称。
	limits (Optional[Dict[str, Any]]): 从配置中获取的该模型的限制字典。
	prompt_tokens (Optional[int]): 从 API 响应中获取的实际输入 Token 数量。
	client_ip (str): 客户端 IP 地址。
	today_date_str_pt (str): 当前的太平洋时区日期字符串 (YYYY-MM-DD)，用于 IP 每日计数。
	"""
	# 检查输入有效性：需要有效的限制信息和大于 0 的 prompt_tokens
	if not limits or not prompt_tokens or prompt_tokens <= 0:
	if limits and (not prompt_tokens or prompt_tokens <= 0): # 如果有限制但 prompt_tokens 无效
	logger.warning(f"Token 计数更新跳过 (Key: {api_key[:8]}, Model: {model_name}): 无效的 prompt_tokens ({prompt_tokens})。") # 记录警告：无效的 prompt_tokens
	# 如果没有限制信息或 prompt_tokens 无效，则不执行更新
	return # 直接返回

	with usage_lock: # 获取使用数据锁，保证线程安全
	# 确保 key 和 model 的条目存在
	key_usage = usage_data.setdefault(api_key, defaultdict(lambda: defaultdict(int)))[model_name] # 获取或创建 Key 和模型的用法数据字典

	# --- 更新 TPD_Input (每日输入 Token 数) ---
	# 直接累加本次请求的 prompt_tokens
	key_usage["tpd_input_count"] = key_usage.get("tpd_input_count", 0) + prompt_tokens # 累加 TPD_Input 计数

	# --- 更新 TPM_Input (每分钟输入 Token 数) ---
	tpm_input_limit = limits.get("tpm_input") # 获取 TPM_Input 限制值
	if tpm_input_limit is not None: # 只有在配置了 TPM 限制时才更新
	now_tpm = time.time() # 获取当前时间戳
	# 检查 TPM 窗口是否已过期
	if now_tpm - key_usage.get("tpm_input_timestamp", 0) >= TPM_WINDOW_SECONDS:
	# 窗口已过期，重置计数为当前请求的 Token 数，并更新时间戳
	key_usage["tpm_input_count"] = prompt_tokens # 新窗口的第一个请求的 Token 数
	key_usage["tpm_input_timestamp"] = now_tpm # 更新窗口开始时间戳
	else:
	# 窗口未过期，累加 Token 数
	key_usage["tpm_input_count"] = key_usage.get("tpm_input_count", 0) + prompt_tokens # 累加 TPM_Input 计数
	# 记录详细的 Token 更新日志
	logger.debug(f"输入 Token 计数更新 (Key: {api_key[:8]}, Model: {model_name}): Added TPD_Input={prompt_tokens}, TPM_Input={key_usage['tpm_input_count']}") # 记录 Token 计数更新详情

	# --- 记录 IP 输入 Token 消耗 (独立于 Key 的限制) ---
	# 使用单独的锁来保护 IP 计数数据
	with ip_input_token_counts_lock: # 获取 IP 输入 token 计数锁
	# 使用 setdefault 确保日期条目存在，并使用 Counter 方便地增加 IP 计数
	# 结构: { 'YYYY-MM-DD': Counter({'ip1': count1, 'ip2': count2}) }
	ip_daily_input_token_counts.setdefault(today_date_str_pt, Counter())[client_ip] += prompt_tokens # 增加指定 IP 在当天的输入 Token 计数

	# --- 上下文保存逻辑 (来自 utils.py 原始版本) ---
	async def save_context_after_success(
	proxy_key: str,
	contents_to_send: List[Dict[str, Any]],
	model_reply_content: str,
	model_name: str,
	enable_context: bool,
	final_tool_calls: Optional[List[Dict[str, Any]]] = None
	):
	"""
	在 API 调用成功后保存上下文（如果启用）。

	Args:
	proxy_key (str): 用于存储上下文的键 (通常是 user_id)。
	contents_to_send (List[Dict[str, Any]]): 发送给模型的最终内容列表 (包含历史)。
	model_reply_content (str): 模型返回的文本回复。
	model_name (str): 使用的模型名称。
	enable_context (bool): 是否启用上下文保存功能。
	final_tool_calls (Optional[List[Dict[str, Any]]]): 模型返回的工具调用信息（目前暂未处理）。
	"""
	if not enable_context: # 如果未启用上下文保存
	logger.debug(f"Key {proxy_key[:8]}... 的上下文补全已禁用，跳过上下文保存。") # 记录跳过信息
	return # 直接返回

	# 记录准备保存上下文的日志，并指明当前的数据库模式
	logger.debug(f"准备为 Key '{proxy_key[:8]}...' 保存上下文 (内存模式: {db_utils.IS_MEMORY_DB})") # 记录准备保存日志

	# 构造模型的回复部分，格式应符合 Gemini contents 结构
	model_reply_part = {"role": "model", "parts": [{"text": model_reply_content}]}
	if final_tool_calls: # 如果存在工具调用信息
	# TODO: 处理工具调用的上下文保存。
	# Gemini API 的工具调用响应格式与 OpenAI 不同，通常包含 functionCall 和 functionResponse。
	# 需要确定如何将这些信息整合到对话历史中以便后续使用。
	# 目前仅记录警告，表示暂未处理。
	logger.warning("上下文保存：暂未处理工具调用 (tool_calls) 的保存。") # 记录警告：未处理工具调用
	pass # 暂时忽略工具调用


	# 将模型的回复追加到发送给模型的内容之后，形成完整的对话历史用于保存
	final_contents_to_save = contents_to_send + [model_reply_part] # 组合最终要保存的内容

	# --- 对最终要保存的内容进行截断 ---
	# 保存上下文时，通常只使用模型的静态限制进行截断，
	# 因为保存的目的是维护历史记录，而不是适配某个 Key 的实时容量。
	# 注意：这里调用了 truncate_context 函数，它会根据 model_name 查找静态限制。
	# 第二个返回参数 still_over_limit_final 指示即使截断后是否仍然超限。
	truncated_contents_to_save, still_over_limit_final = await truncate_context(final_contents_to_save, model_name) # 对最终内容进行截断

	if not still_over_limit_final: # 如果截断后内容没有超限
	try:
	# 调用 context_store 模块的 save_context 函数保存截断后的上下文
	await context_store.save_context(proxy_key, truncated_contents_to_save) # 保存上下文
	logger.info(f"上下文保存成功 for Key {proxy_key[:8]}...") # 记录保存成功日志
	except Exception as e:
	# 捕获并记录保存过程中可能发生的任何异常
	logger.error(f"保存上下文失败 (Key: {proxy_key[:8]}...): {str(e)}", exc_info=True) # 记录保存失败错误
	else:
	# 如果截断后仍然超限，记录错误，不进行保存
	logger.error(f"上下文在添加回复并再次截断后仍然超限 (Key: {proxy_key[:8]}...). 上下文未保存。") # 记录错误：截断后仍超限

	# --- 工具调用处理 (来自 tool_call_utils.py) ---
	def process_tool_calls(gemini_tool_calls: Any) -> Optional[List[Dict[str, Any]]]:
	"""
	将 Gemini 返回的 functionCall 列表转换为 OpenAI 兼容的 tool_calls 格式。
	Gemini: [{'functionCall': {'name': 'func_name', 'args': {...}}}]
	OpenAI: [{'id': 'call_...', 'type': 'function', 'function': {'name': 'func_name', 'arguments': '{...}'}}]
	"""
	if not isinstance(gemini_tool_calls, list): # 检查输入是否为列表
	logger.warning(f"期望 gemini_tool_calls 是列表，但得到 {type(gemini_tool_calls)}") # 记录警告
	return None # 返回 None

	openai_tool_calls = [] # 初始化 OpenAI 格式工具调用列表
	# 遍历 Gemini 工具调用列表
	for i, call in enumerate(gemini_tool_calls):
	# 简化条件判断，逐步检查元素的格式和必要字段
	if not isinstance(call, dict): # 检查元素是否为字典
	logger.warning(f"工具调用列表中的元素不是字典: {call}") # 记录警告
	continue # 跳过格式不正确的元素

	# 检查 'functionCall' 键是否存在且其值是字典
	function_call_data = call.get('functionCall')
	if not isinstance(function_call_data, dict):
	logger.warning(f"工具调用元素缺少有效的 'functionCall' 字典: {call}") # 记录警告
	continue # 跳过格式不正确的元素

	# 检查 'name' 字段是否存在且有效
	func_name = function_call_data.get('name')
	if not isinstance(func_name, str) or not func_name:
	logger.warning(f"工具调用元素缺少有效的 'name' 字段: {call}") # 记录警告
	continue # 跳过格式不正确的元素

	# 检查 'args' 字段是否存在且是字典
	func_args = function_call_data.get('args')
	if not isinstance(func_args, dict):
	logger.warning(f"工具调用元素缺少有效的 'args' 字典: {call}") # 记录警告
	continue # 跳过格式不正确的元素

	try:
	# OpenAI 需要 arguments 是 JSON 字符串
	arguments_str = json.dumps(func_args, ensure_ascii=False) # 将参数序列化为 JSON 字符串
	except TypeError as e:
	logger.error(f"序列化工具调用参数失败 (Name: {func_name}): {e}", exc_info=True) # 记录序列化失败错误
	continue # 跳过这个调用

	# 添加到 OpenAI 格式列表
	openai_tool_calls.append({
	"id": f"call_{int(time.time()*1000)}_{i}", # 生成唯一 ID (基于时间戳和索引)
	"type": "function", # 类型固定为 function
	"function": {
	"name": func_name, # 函数名称
	"arguments": arguments_str, # 参数 JSON 字符串
	}
	})

	return openai_tool_calls if openai_tool_calls else None # 返回 OpenAI 格式列表或 None