z2api

Sleeping

App Files Files Community

ZyphrZero commited on Sep 5, 2025

Commit

5d737f2

1 Parent(s): b3ffb9a

📝 更新 .env.example 和 README.md 文件

Browse files

Files changed (3) hide show

.env.example +39 -60
README.md +32 -35
app/utils/helpers.py +1 -1

.env.example CHANGED Viewed

@@ -1,93 +1,72 @@
 # Z.AI API 代理服务配置文件示例
 # 复制此文件为 .env 并根据需要修改配置值
-# =============================================================================
-# API 认证配置
-# =============================================================================
-# 客户端认证密钥
-# 客户端调用时需要使用此密钥进行认证
 AUTH_TOKEN=sk-your-api-key
-# 是否跳过api key验证
 SKIP_AUTH_TOKEN=false
-# 备用认证令牌（匿名模式失败时使用）
 BACKUP_TOKEN=eyJhbGciOiJFUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjMxNmJjYjQ4LWZmMmYtNGExNS04NTNkLWYyYTI5YjY3ZmYwZiIsImVtYWlsIjoiR3Vlc3QtMTc1NTg0ODU4ODc4OEBndWVzdC5jb20ifQ.PktllDySS3trlyuFpTeIZf-7hl8Qu1qYF3BxjgIul0BrNux2nX9hVzIjthLXKMWAf9V0qM8Vm_iyDqkjPGsaiQ
-# =============================================================================
-# 上游服务配置
-# =============================================================================
-# Z.AI 上游 API 地址
-API_ENDPOINT=https://chat.z.ai/api/chat/completions
-# =============================================================================
-# 模型配置
-# =============================================================================
-# 默认模型名称
 PRIMARY_MODEL=GLM-4.5
-# 思考模式模型名称
 THINKING_MODEL=GLM-4.5-Thinking
-# 搜索模式模型名称
 SEARCH_MODEL=GLM-4.5-Search
-# Air 模型名称
 AIR_MODEL=GLM-4.5-Air
-# =============================================================================
-# 服务器配置
-# =============================================================================
 # 服务监听端口
 LISTEN_PORT=8080
-# 调试日志开关 (true/false)
 DEBUG_LOGGING=true
-# =============================================================================
-# 功能配置
-# =============================================================================
 # 思考内容处理策略
-# think: 转换为 <span> 标签
 # strip: 移除思考内容
 # raw: 保留原始格式
 THINKING_PROCESSING=think
-# 匿名模式开关 (true/false)
-# 开启后将使用临时 token，避免对话历史共享
 ANONYMOUS_MODE=true
-# Function Call 功能开关 (true/false)
 TOOL_SUPPORT=true
 # 工具调用扫描限制（字符数）
 SCAN_LIMIT=200000
-# =============================================================================
-# 使用说明
-# =============================================================================
-#
-# 1. 复制此文件：
-#    cp .env.example .env
-#
-# 2. 根据需要修改配置值
-#
-# 3. 启动服务：
-#    python main.py
 #
-# 4. OpenAI 客户端示例：
-#    client = openai.OpenAI(
-#        base_url="http://localhost:8080/v1",
-#        api_key="your-auth-token"  # 使用 AUTH_TOKEN 的值
-#    )
 #
-# 5. Anthropic 客户端示例：
-#    client = anthropic.Anthropic(
-#        base_url="http://localhost:8080/v1",
-#        api_key="your-auth-token"  # 使用 AUTH_TOKEN 的值（或单独配置的 ANTHROPIC_API_KEY）
-#    )
-#

 # Z.AI API 代理服务配置文件示例
 # 复制此文件为 .env 并根据需要修改配置值
+# ========== API 基础配置 ==========
+# Z.ai API 端点地址
+API_ENDPOINT=https://chat.z.ai/api/chat/completions
+# 客户端认证密钥（您自定义的 API 密钥，用于客户端访问本服务）
 AUTH_TOKEN=sk-your-api-key
+# 跳过客户端认证（仅开发环境使用）
 SKIP_AUTH_TOKEN=false
+# Z.ai 备用访问令牌（当匿名模式失败时使用）
+# 注意：这是用于访问 Z.ai 服务的令牌，不是客户端认证密钥
 BACKUP_TOKEN=eyJhbGciOiJFUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjMxNmJjYjQ4LWZmMmYtNGExNS04NTNkLWYyYTI5YjY3ZmYwZiIsImVtYWlsIjoiR3Vlc3QtMTc1NTg0ODU4ODc4OEBndWVzdC5jb20ifQ.PktllDySS3trlyuFpTeIZf-7hl8Qu1qYF3BxjgIul0BrNux2nX9hVzIjthLXKMWAf9V0qM8Vm_iyDqkjPGsaiQ
+# ========== 模型配置 ==========
 PRIMARY_MODEL=GLM-4.5
 THINKING_MODEL=GLM-4.5-Thinking
 SEARCH_MODEL=GLM-4.5-Search
 AIR_MODEL=GLM-4.5-Air
+# ========== 服务器配置 ==========
 # 服务监听端口
 LISTEN_PORT=8080
+# 调试日志开关
 DEBUG_LOGGING=true
+# ========== 功能配置 ==========
 # 思考内容处理策略
+# think: 转换为 <span> 标签（OpenAI 兼容）
 # strip: 移除思考内容
 # raw: 保留原始格式
 THINKING_PROCESSING=think
+# 匿名模式开关（推荐启用）
+# true: 自动从 Z.ai 获取临时访问令牌，避免对话历史共享
+# false: 使用固定令牌 BACKUP_TOKEN
 ANONYMOUS_MODE=true
+# Function Call 功能开关
 TOOL_SUPPORT=true
 # 工具调用扫描限制（字符数）
 SCAN_LIMIT=200000
+# ========== Z.ai 访问令牌获取说明 ==========
+#
+# 方式一：匿名模式（推荐，默认启用）
+# - 设置 ANONYMOUS_MODE=true
+# - 系统会自动从 Z.ai 获取临时访问令牌
+# - 无需手动配置 Z.ai 账户
 #
+# 方式二：固定令牌模式
+# - 设置 ANONYMOUS_MODE=false
+# - 需要手动获取 Z.ai 访问令牌并设置 BACKUP_TOKEN
+#
+# 获取 Z.ai 访问令牌步骤：
+# 1. 访问 https://chat.z.ai
+# 2. 打开浏览器开发者工具 (F12)
+# 3. 切换到 Network 标签页
+# 4. 在 Z.ai 中发送一条消息
+# 5. 在网络请求中找到 chat/completions 请求
+# 6. 查看请求头中的 Authorization: Bearer <token>
+# 7. 复制 <token> 部分到 BACKUP_TOKEN
 #
+# 注意：
+# - BACKUP_TOKEN 是访问 Z.ai 服务的令牌
+# - AUTH_TOKEN 是客户端访问本代理服务的认证密钥（您自定义）
+# - 两者用途不同，请勿混淆

README.md CHANGED Viewed

@@ -69,7 +69,6 @@ response = client.chat.completions.create(
 print(response.choices[0].message.content)
 ```
 ### Docker 部署
 ```bash
@@ -81,12 +80,13 @@ docker-compose up -d
 ### 支持的模型
-| 模型 | 上游ID | 描述 | 特性 |
-|------|--------|------|------|
-| `GLM-4.5` | 0727-360B-API | 标准模型 | 通用对话，平衡性能 |
-| `GLM-4.5-Thinking` | 0727-360B-API | 思考模型 | 显示推理过程，透明度高 |
-| `GLM-4.5-Search` | 0727-360B-API | 搜索模型 | 实时网络搜索，信息更新 |
-| `GLM-4.5-Air` | 0727-106B-API | 轻量模型 | 快速响应，高效推理 |
 ### Function Call 功能
@@ -128,7 +128,7 @@ response = client.chat.completions.create(
 for chunk in response:
     content = chunk.choices[0].delta.content
     reasoning = chunk.choices[0].delta.reasoning_content
     if content:
         print(content, end="")
     if reasoning:
@@ -139,22 +139,22 @@ for chunk in response:
 ### 环境变量配置
-| 变量名 | 默认值 | 说明 |
-|--------|--------|------|
-| `AUTH_TOKEN` | `sk-your-api-key` | 客户端认证密钥 |
-| `API_ENDPOINT` | `https://chat.z.ai/api/chat/completions` | 上游 API 地址 |
-| `LISTEN_PORT` | `8080` | 服务监听端口 |
-| `PRIMARY_MODEL` | `GLM-4.5` | 主要模型名称 |
-| `THINKING_MODEL` | `GLM-4.5-Thinking` | 思考模型名称 |
-| `SEARCH_MODEL` | `GLM-4.5-Search` | 搜索模型名称 |
-| `AIR_MODEL` | `GLM-4.5-Air` | Air 模型名称 |
-| `DEBUG_LOGGING` | `true` | 调试日志开关 |
-| `THINKING_PROCESSING` | `think` | 思考内容处理策略 |
-| `ANONYMOUS_MODE` | `true` | 匿名模式开关 |
-| `TOOL_SUPPORT` | `true` | Function Call 功能开关 |
-| `SKIP_AUTH_TOKEN` | `false` | 跳过认证令牌验证 |
-| `SCAN_LIMIT` | `200000` | 扫描限制 |
-| `BACKUP_TOKEN` | `eyJhbGciOiJFUzI1NiIsInR5cCI6IkpXVCJ9...` | 备用认证令牌 |
 ### 思考内容处理策略
@@ -219,13 +219,14 @@ if response.choices[0].message.tool_calls:
 ## ❓ 常见问题
 **Q: 如何获取 AUTH_TOKEN？**
-A: `AUTH_TOKEN` 为自己自定义的api key，在环境变量中配置，需要保证客户端与服务端一致。
 **Q: 如何通过 Claude Code 使用本服务？**
-A: 创建 [zai.js](https://gist.githubusercontent.com/musistudio/b35402d6f9c95c64269c7666b8405348/raw/f108d66fa050f308387938f149a2b14a295d29e9/gistfile1.txt) 这个ccr插件放在`./.claude-code-router/plugins`目录下，配置 `./.claude-code-router/config.json` 指向本服务地址，使用 `AUTH_TOKEN` 进行认证。
 示例配置：
 ```json
 {
   "LOG": false,
@@ -248,14 +249,9 @@ A: 创建 [zai.js](https://gist.githubusercontent.com/musistudio/b35402d6f9c95c6
       "name": "GLM",
       "api_base_url": "http://127.0.0.1:8080/v1/chat/completions",
       "api_key": "sk-your-api-key",
-      "models": [
-        "GLM-4.5",
-        "GLM-4.5-Air"
-      ],
       "transformers": {
-        "use": [
-          "zai"
-        ]
       }
     }
   ],
@@ -295,7 +291,8 @@ A: 支持聊天完成、模型列表、流式响应、工具调用等核心功
 A: 改进了工具调用的请求响应结构，支持更复杂的工具链调用和并行执行。
 **Q: 如何选择合适的模型？**
-A:
 - **GLM-4.5**: 通用场景，性能和效果平衡
 - **GLM-4.5-Thinking**: 需要了解推理过程的场景
 - **GLM-4.5-Search**: 需要实时信息的场景
@@ -371,4 +368,4 @@ z.ai2api_python/
 <div align="center">
 Made with ❤️ by the community
-</div>

 print(response.choices[0].message.content)
 ```
 ### Docker 部署
 ```bash
 ### 支持的模型
+| 模型               | 上游 ID       | 描述        | 特性                   |
+| ------------------ | ------------- | ----------- | ---------------------- |
+| `GLM-4.5`          | 0727-360B-API | 标准模型    | 通用对话，平衡性能     |
+| `GLM-4.5-Thinking` | 0727-360B-API | 思考模型    | 显示推理过程，透明度高 |
+| `GLM-4.5-Search`   | 0727-360B-API | 搜索模型    | 实时网络搜索，信息更新 |
+| `GLM-4.5-Air`      | 0727-106B-API | 轻量模型    | 快速响应，高效推理     |
+| `GLM-4.5V`         | glm-4.5v      | ❌ 暂不支持 |                        |
 ### Function Call 功能
 for chunk in response:
     content = chunk.choices[0].delta.content
     reasoning = chunk.choices[0].delta.reasoning_content
     if content:
         print(content, end="")
     if reasoning:
 ### 环境变量配置
+| 变量名                | 默认值                                    | 说明                   |
+| --------------------- | ----------------------------------------- | ---------------------- |
+| `AUTH_TOKEN`          | `sk-your-api-key`                         | 客户端认证密钥         |
+| `API_ENDPOINT`        | `https://chat.z.ai/api/chat/completions`  | 上游 API 地址          |
+| `LISTEN_PORT`         | `8080`                                    | 服务监听端口           |
+| `PRIMARY_MODEL`       | `GLM-4.5`                                 | 主要模型名称           |
+| `THINKING_MODEL`      | `GLM-4.5-Thinking`                        | 思考模型名称           |
+| `SEARCH_MODEL`        | `GLM-4.5-Search`                          | 搜索模型名称           |
+| `AIR_MODEL`           | `GLM-4.5-Air`                             | Air 模型名称           |
+| `DEBUG_LOGGING`       | `true`                                    | 调试日志开关           |
+| `THINKING_PROCESSING` | `think`                                   | 思考内容处理策略       |
+| `ANONYMOUS_MODE`      | `true`                                    | 匿名模式开关           |
+| `TOOL_SUPPORT`        | `true`                                    | Function Call 功能开关 |
+| `SKIP_AUTH_TOKEN`     | `false`                                   | 跳过认证令牌验证       |
+| `SCAN_LIMIT`          | `200000`                                  | 扫描限制               |
+| `BACKUP_TOKEN`        | `eyJhbGciOiJFUzI1NiIsInR5cCI6IkpXVCJ9...` | 备用认证令牌           |
 ### 思考内容处理策略
 ## ❓ 常见问题
 **Q: 如何获取 AUTH_TOKEN？**
+A: `AUTH_TOKEN` 为自己自定义的 api key，在环境变量中配置，需要保证客户端与服务端一致。
 **Q: 如何通过 Claude Code 使用本服务？**
+A: 创建 [zai.js](https://gist.githubusercontent.com/musistudio/b35402d6f9c95c64269c7666b8405348/raw/f108d66fa050f308387938f149a2b14a295d29e9/gistfile1.txt) 这个 ccr 插件放在`./.claude-code-router/plugins`目录下，配置 `./.claude-code-router/config.json` 指向本服务地址，使用 `AUTH_TOKEN` 进行认证。
 示例配置：
 ```json
 {
   "LOG": false,
       "name": "GLM",
       "api_base_url": "http://127.0.0.1:8080/v1/chat/completions",
       "api_key": "sk-your-api-key",
+      "models": ["GLM-4.5", "GLM-4.5-Air"],
       "transformers": {
+        "use": ["zai"]
       }
     }
   ],
 A: 改进了工具调用的请求响应结构，支持更复杂的工具链调用和并行执行。
 **Q: 如何选择合适的模型？**
+A:
 - **GLM-4.5**: 通用场景，性能和效果平衡
 - **GLM-4.5-Thinking**: 需要了解推理过程的场景
 - **GLM-4.5-Search**: 需要实时信息的场景
 <div align="center">
 Made with ❤️ by the community
+</div>

app/utils/helpers.py CHANGED Viewed

@@ -208,4 +208,4 @@ def call_upstream_api(
     )
     debug_log(f"上游响应状态: {response.status_code}")
-    return response

     )
     debug_log(f"上游响应状态: {response.status_code}")
+    return response