Spaces:

keungliang
/

zai2api-py

Paused

App Files Files Community

zai2api-py / app /utils /token_pool.py

keungliang

Upload 31 files

fd21f34 verified 3 months ago

raw

history blame contribute delete

16.9 kB

	#!/usr/bin/env python
	# -- coding: utf-8 --

	"""
	Token池管理器
	实现AUTH_TOKEN的轮询机制，提供负载均衡和容错功能
	"""

	import asyncio
	import time
	from typing import Dict, List, Optional, Tuple
	from dataclasses import dataclass, field
	from threading import Lock
	import httpx

	from app.utils.logger import logger


	@dataclass
	class TokenStatus:
	"""Token状态信息"""
	token: str
	is_available: bool = True
	failure_count: int = 0
	last_failure_time: float = 0.0
	last_success_time: float = 0.0
	total_requests: int = 0
	successful_requests: int = 0
	token_type: str = "unknown" # "user", "guest", "unknown"

	@property
	def success_rate(self) -> float:
	"""成功率"""
	if self.total_requests == 0:
	return 1.0
	return self.successful_requests / self.total_requests

	@property
	def is_healthy(self) -> bool:
	"""
	是否健康

	健康的定义：
	1. 必须是认证用户token (token_type = "user")
	2. 当前可用 (is_available = True)
	3. 成功率 >= 50% 或者总请求数 <= 3（新token容错）

	注意：guest token不应该在AUTH_TOKENS中
	"""
	# guest token永远不健康
	if self.token_type == "guest":
	return False

	# 未知类型token不健康
	if self.token_type != "user":
	return False

	# 不可用的token不健康
	if not self.is_available:
	return False

	# 对于认证用户token，基于成功率判断
	# 新token或请求数很少时，给予容错
	if self.total_requests <= 3:
	return self.failure_count == 0

	# 基于成功率判断健康状态
	return self.success_rate >= 0.5


	class TokenPool:
	"""Token池管理器"""

	def __init__(self, tokens: List[str], failure_threshold: int = 3, recovery_timeout: int = 1800):
	"""
	初始化Token池

	Args:
	tokens: token列表
	failure_threshold: 失败阈值，超过此次数将标记为不可用
	recovery_timeout: 恢复超时时间（秒），失败token在此时间后重新尝试
	"""
	self.failure_threshold = failure_threshold
	self.recovery_timeout = recovery_timeout
	self._lock = Lock()
	self._current_index = 0

	# 初始化token状态
	self.token_statuses: Dict[str, TokenStatus] = {}
	original_count = len(tokens)
	unique_tokens = []

	# 去重处理
	for token in tokens:
	if token and token not in self.token_statuses: # 过滤空token和重复token
	# 预设为认证用户token，因为这些是用户手动配置的token
	self.token_statuses[token] = TokenStatus(token=token, token_type="user")
	unique_tokens.append(token)

	duplicate_count = original_count - len(unique_tokens)
	if duplicate_count > 0:
	logger.warning(f"⚠️ 检测到 {duplicate_count} 个重复token，已自动去重")

	if not self.token_statuses:
	logger.warning("⚠️ Token池为空，将依赖匿名模式")
	# else:
	# logger.info(f"🔧 初始化Token池，共 {len(self.token_statuses)} 个token")

	def get_next_token(self) -> Optional[str]:
	"""
	获取下一个可用的token（轮询算法）

	Returns:
	可用的token，如果没有可用token则返回None
	"""
	with self._lock:
	if not self.token_statuses:
	return None

	available_tokens = self._get_available_tokens()
	if not available_tokens:
	# 尝试恢复过期的失败token
	self._try_recover_failed_tokens()
	available_tokens = self._get_available_tokens()

	if not available_tokens:
	logger.warning("⚠️ 没有可用的token")
	return None

	# 轮询选择token
	token = available_tokens[self._current_index % len(available_tokens)]
	self._current_index = (self._current_index + 1) % len(available_tokens)

	return token

	def _get_available_tokens(self) -> List[str]:
	"""
	获取当前可用的认证用户token列表

	返回满足以下条件的token：
	1. is_available = True (可用状态)
	2. token_type == "user" (认证用户token)

	这确保轮询机制只会选择有效的认证用户token，跳过匿名用户token
	"""
	available_user_tokens = [
	status.token for status in self.token_statuses.values()
	if status.is_available and status.token_type == "user"
	]

	# 检查是否有匿名用户token并给出警告
	if not available_user_tokens and self.token_statuses:
	guest_tokens = [
	status.token for status in self.token_statuses.values()
	if status.token_type == "guest"
	]
	if guest_tokens:
	logger.warning(f"⚠️ 检测到 {len(guest_tokens)} 个匿名用户token，轮询机制将跳过这些token")

	return available_user_tokens

	def _try_recover_failed_tokens(self):
	"""尝试恢复失败的token"""
	current_time = time.time()
	recovered_count = 0

	for status in self.token_statuses.values():
	if (not status.is_available and
	current_time - status.last_failure_time > self.recovery_timeout):
	status.is_available = True
	status.failure_count = 0
	recovered_count += 1
	logger.info(f"🔄 恢复失败token: {status.token[:20]}...")

	if recovered_count > 0:
	logger.info(f"✅ 恢复了 {recovered_count} 个失败的token")

	def mark_token_success(self, token: str):
	"""标记token使用成功"""
	with self._lock:
	if token in self.token_statuses:
	status = self.token_statuses[token]
	status.total_requests += 1
	status.successful_requests += 1
	status.last_success_time = time.time()
	status.failure_count = 0 # 重置失败计数

	if not status.is_available:
	status.is_available = True
	logger.info(f"✅ Token恢复可用: {token[:20]}...")

	def mark_token_failure(self, token: str, error: Exception = None):
	"""标记token使用失败"""
	with self._lock:
	if token in self.token_statuses:
	status = self.token_statuses[token]
	status.total_requests += 1
	status.failure_count += 1
	status.last_failure_time = time.time()

	if status.failure_count >= self.failure_threshold:
	status.is_available = False
	logger.warning(f"🚫 Token已禁用: {token[:20]}... (失败 {status.failure_count} 次)")

	def get_pool_status(self) -> Dict:
	"""获取token池状态信息"""
	with self._lock:
	available_count = len(self._get_available_tokens())
	total_count = len(self.token_statuses)

	# 统计健康token数量
	healthy_count = sum(1 for status in self.token_statuses.values() if status.is_healthy)

	status_info = {
	"total_tokens": total_count,
	"available_tokens": available_count,
	"unavailable_tokens": total_count - available_count,
	"healthy_tokens": healthy_count,
	"unhealthy_tokens": total_count - healthy_count,
	"current_index": self._current_index,
	"tokens": []
	}

	for token, status in self.token_statuses.items():
	status_info["tokens"].append({
	"token": f"{token[:10]}...{token[-10:]}",
	"token_type": status.token_type,
	"is_available": status.is_available,
	"failure_count": status.failure_count,
	"success_count": status.successful_requests,
	"success_rate": f"{status.success_rate:.2%}",
	"total_requests": status.total_requests,
	"is_healthy": status.is_healthy,
	"last_failure_time": status.last_failure_time,
	"last_success_time": status.last_success_time
	})

	return status_info

	def update_tokens(self, new_tokens: List[str]):
	"""动态更新token列表"""
	with self._lock:
	# 保留现有token的状态信息
	old_statuses = self.token_statuses.copy()
	self.token_statuses.clear()

	original_count = len(new_tokens)
	unique_tokens = []

	# 去重并添加新token，保留已存在token的状态
	for token in new_tokens:
	if token and token not in self.token_statuses: # 过滤空token和重复token
	if token in old_statuses:
	self.token_statuses[token] = old_statuses[token]
	else:
	# 预设为认证用户token，因为这些是用户手动配置的token
	self.token_statuses[token] = TokenStatus(token=token, token_type="user")
	unique_tokens.append(token)

	# 记录去重信息
	duplicate_count = original_count - len(unique_tokens)
	if duplicate_count > 0:
	logger.warning(f"⚠️ 更新时检测到 {duplicate_count} 个重复token，已自动去重")

	# 重置索引
	self._current_index = 0

	logger.info(f"🔄 更新Token池，共 {len(self.token_statuses)} 个token")

	async def health_check_token(self, token: str, auth_url: str = "https://chat.z.ai/api/v1/auths/") -> bool:
	"""
	异步健康检查单个token

	使用Z.AI认证API验证token的有效性，通过检查响应内容判断token是否有效

	Args:
	token: 要检查的token
	auth_url: 认证URL

	Returns:
	token是否健康
	"""
	try:
	# 构建完整的请求头，模拟真实浏览器请求
	headers = {
	"Accept": "/",
	"Accept-Language": "zh-CN,zh;q=0.9",
	"Authorization": f"Bearer {token}",
	"Connection": "keep-alive",
	"Content-Type": "application/json",
	"DNT": "1",
	"Referer": "https://chat.z.ai/",
	"Sec-Fetch-Dest": "empty",
	"Sec-Fetch-Mode": "cors",
	"Sec-Fetch-Site": "same-origin",
	"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/140.0.0.0 Safari/537.36",
	"sec-ch-ua": '"Chromium";v="140", "Not=A?Brand";v="24", "Google Chrome";v="140"',
	"sec-ch-ua-mobile": "?0",
	"sec-ch-ua-platform": "Windows"
	}

	async with httpx.AsyncClient(timeout=15.0) as client:
	response = await client.get(auth_url, headers=headers)

	# 验证token有效性并获取类型
	token_type, is_healthy = self._validate_token_response(response)

	# 更新token类型
	if token in self.token_statuses:
	self.token_statuses[token].token_type = token_type

	if is_healthy:
	self.mark_token_success(token)
	else:
	# 简化错误信息，只记录关键错误类型
	if token_type == "guest":
	error_msg = "匿名用户token"
	elif response.status_code != 200:
	error_msg = f"HTTP {response.status_code}"
	else:
	error_msg = "认证失败"

	self.mark_token_failure(token, Exception(error_msg))

	return is_healthy

	except (httpx.TimeoutException, httpx.ConnectError, Exception) as e:
	self.mark_token_failure(token, e)
	return False

	def _validate_token_response(self, response: httpx.Response) -> bool:
	"""
	基于Z.AI API响应中的role字段验证token类型

	验证规则：
	- role: "user" = 认证用户token（有效，可用于AUTH_TOKENS）
	- role: "guest" = 匿名用户token（无效，不应在AUTH_TOKENS中）
	- 无role字段或其他值 = 无效token

	Args:
	response: HTTP响应对象

	Returns:
	token是否为有效的认证用户token
	"""
	# 首先检查HTTP状态码
	if response.status_code != 200:
	return ("unknown", False)

	try:
	# 尝试解析JSON响应
	response_data = response.json()

	if not isinstance(response_data, dict):
	return ("unknown", False)

	# 检查是否包含错误信息
	if "error" in response_data:
	return ("unknown", False)

	if "message" in response_data and "error" in response_data.get("message", "").lower():
	return ("unknown", False)

	# 核心验证：检查role字段
	role = response_data.get("role")

	if role == "user":
	return ("user", True)
	elif role == "guest":

	if not hasattr(self, '_guest_token_warned'):
	logger.warning("⚠️ 检测到匿名用户token，建议仅在AUTH_TOKENS中配置认证用户token")
	self._guest_token_warned = True
	return ("guest", False)
	else:
	return ("unknown", False)

	except (ValueError, Exception):
	return ("unknown", False)

	async def health_check_all(self, auth_url: str = "https://chat.z.ai/api/v1/auths/"):
	"""异步健康检查所有token"""
	if not self.token_statuses:
	logger.warning("⚠️ Token池为空，跳过健康检查")
	return

	total_tokens = len(self.token_statuses)
	logger.info(f"🔍 开始Token池健康检查... (共 {total_tokens} 个token)")

	# 并发执行所有token的健康检查
	tasks = []
	token_list = list(self.token_statuses.keys())

	for token in token_list:
	task = self.health_check_token(token, auth_url)
	tasks.append(task)

	# 执行并收集结果
	results = await asyncio.gather(*tasks, return_exceptions=True)

	# 统计结果
	healthy_count = 0
	failed_count = 0
	exception_count = 0

	for i, result in enumerate(results):
	if result is True:
	healthy_count += 1
	elif result is False:
	failed_count += 1
	else:
	# 异常情况
	exception_count += 1
	token = token_list[i]
	logger.error(f"💥 Token {token[:20]}... 健康检查异常: {result}")

	health_rate = (healthy_count / total_tokens) * 100 if total_tokens > 0 else 0

	if healthy_count == 0 and total_tokens > 0:
	logger.warning(f"⚠️ 健康检查完成: 0/{total_tokens} 个token健康 - 请检查token配置")
	elif failed_count > 0:
	logger.warning(f"⚠️ 健康检查完成: {healthy_count}/{total_tokens} 个token健康 ({health_rate:.1f}%)")
	else:
	logger.info(f"✅ 健康检查完成: {healthy_count}/{total_tokens} 个token健康")

	if exception_count > 0:
	logger.error(f"💥 {exception_count} 个token检查异常")


	# 全局token池实例
	_token_pool: Optional[TokenPool] = None
	_pool_lock = Lock()


	def get_token_pool() -> Optional[TokenPool]:
	"""获取全局token池实例"""
	return _token_pool


	def initialize_token_pool(tokens: List[str], failure_threshold: int = 3, recovery_timeout: int = 1800) -> TokenPool:
	"""初始化全局token池"""
	global _token_pool
	with _pool_lock:
	_token_pool = TokenPool(tokens, failure_threshold, recovery_timeout)
	return _token_pool


	def update_token_pool(tokens: List[str]):
	"""更新全局token池"""
	global _token_pool
	with _pool_lock:
	if _token_pool:
	_token_pool.update_tokens(tokens)
	else:
	_token_pool = TokenPool(tokens)