abacus_proxy

Paused

malt666 commited on Mar 29, 2025

Commit

f32de00

verified ·

1 Parent(s): b5b3be5

Upload 3 files

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1124,22 +1124,37 @@ def index():
 def num_tokens_from_string(string, model=""):
     try:
         response = requests.post(
             TOKENIZER_SERVICE_URL,
-            json={"model": model, "messages": [{"role": "user", "content": string}]},
             timeout=10
         )
         if response.status_code == 200:
             result = response.json()
             input_tokens = result.get("input_tokens", 0)
-            return input_tokens, "精确"  # 直接返回精确
         else:
             print(f"Tokenizer服务错误: {response.status_code} - {response.text}")
-            return len(string) // 4, "估算"  # 直接返回估算
     except Exception as e:
         print(f"计算token错误: {e}")
-        return len(string) // 4, "估算"  # 直接返回估算
 # 更新模型使用统计

 def num_tokens_from_string(string, model=""):
     try:
+        print(f"\n开始计算token: model={model}")
+        request_data = {
+            "model": model,
+            "messages": [{"role": "user", "content": string}]
+        }
+        print(f"请求数据: {json.dumps(request_data, ensure_ascii=False)}")
         response = requests.post(
             TOKENIZER_SERVICE_URL,
+            json=request_data,
             timeout=10
         )
+        print(f"Tokenizer响应状态码: {response.status_code}")
+        print(f"Tokenizer响应内容: {response.text}")
         if response.status_code == 200:
             result = response.json()
             input_tokens = result.get("input_tokens", 0)
+            print(f"成功获取token数: {input_tokens}，返回计算方法: 精确")
+            return input_tokens, "精确"
         else:
+            estimated_tokens = len(string) // 4
             print(f"Tokenizer服务错误: {response.status_code} - {response.text}")
+            print(f"使用估算token数: {estimated_tokens}，返回计算方法: 估算")
+            return estimated_tokens, "估算"
     except Exception as e:
+        estimated_tokens = len(string) // 4
         print(f"计算token错误: {e}")
+        print(f"使用估算token数: {estimated_tokens}，返回计算方法: 估算")
+        return estimated_tokens, "估算"
 # 更新模型使用统计