Spaces:

Jack698
/

openai-api-proxy

Runtime error

+# 多阶段构建 Dockerfile，适用于 Hugging Face Spaces
+# 第一阶段：构建 Go 应用
+FROM golang:1.23-alpine AS builder
+# 安装必要的工具
+RUN apk add --no-cache git ca-certificates
+# 设置工作目录
+WORKDIR /app
+# 复制 go mod 文件
+COPY go.mod go.sum ./
+# 下载依赖
+RUN go mod download
+# 复制源代码
+COPY . .
+# 构建 Go 应用（禁用 CGO）
+RUN CGO_ENABLED=0 GOOS=linux go build -a -installsuffix cgo -o main .
+# 第二阶段：运行时镜像
+FROM alpine:latest
+# 安装 ca-certificates（用于 HTTPS）
+RUN apk --no-cache add ca-certificates tzdata
+# 设置时区
+ENV TZ=Asia/Shanghai
+# 创建非 root 用户
+RUN addgroup -g 1000 appgroup && adduser -u 1000 -G appgroup -s /bin/sh -D appuser
+# 设置工作目录
+WORKDIR /app
+# 从构建阶段复制二进制文件
+COPY --from=builder /app/main .
+# 切换到非 root 用户
+USER appuser
+# 暴露端口（Hugging Face Spaces 默认端口）
+EXPOSE 7860
+# 启动命令
+CMD ["./main"]

go.mod ADDED Viewed

	@@ -0,0 +1,5 @@

+module z2api
+go 1.23.0
+toolchain go1.23.4

go.sum ADDED Viewed

File without changes

main.go ADDED Viewed

	@@ -0,0 +1,707 @@

+package main
+import (
+	"bufio"
+	"bytes"
+	"encoding/json"
+	"fmt"
+	"io"
+	"log"
+	"net/http"
+	"os"
+	"regexp"
+	"strings"
+	"time"
+)
+// 配置变量（从环境变量读取）
+var (
+	UPSTREAM_URL     string
+	DEFAULT_KEY      string
+	UPSTREAM_TOKEN   string
+	MODEL_NAME       string
+	PORT             string
+	DEBUG_MODE       bool
+	DEFAULT_STREAM   bool
+)
+// 思考内容处理策略
+const (
+	THINK_TAGS_MODE = "strip" // strip: 去除<details>标签；think: 转为<think>标签；raw: 保留原样
+)
+// 伪装前端头部（来自抓包）
+const (
+	X_FE_VERSION   = "prod-fe-1.0.70"
+	BROWSER_UA     = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/139.0.0.0 Safari/537.36 Edg/139.0.0.0"
+	SEC_CH_UA      = "\"Not;A=Brand\";v=\"99\", \"Microsoft Edge\";v=\"139\", \"Chromium\";v=\"139\""
+	SEC_CH_UA_MOB  = "?0"
+	SEC_CH_UA_PLAT = "\"Windows\""
+	ORIGIN_BASE    = "https://chat.z.ai"
+)
+// 匿名token开关
+const ANON_TOKEN_ENABLED = true
+// 从环境变量初始化配置
+func initConfig() {
+	UPSTREAM_URL = getEnv("UPSTREAM_URL", "https://chat.z.ai/api/chat/completions")
+	DEFAULT_KEY = getEnv("DEFAULT_KEY", "sk-your-key")
+	UPSTREAM_TOKEN = getEnv("UPSTREAM_TOKEN", "eyJhbGciOiJFUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IjMxNmJjYjQ4LWZmMmYtNGExNS04NTNkLWYyYTI5YjY3ZmYwZiIsImVtYWlsIjoiR3Vlc3QtMTc1NTg0ODU4ODc4OEBndWVzdC5jb20ifQ.PktllDySS3trlyuFpTeIZf-7hl8Qu1qYF3BxjgIul0BrNux2nX9hVzIjthLXKMWAf9V0qM8Vm_iyDqkjPGsaiQ")
+	MODEL_NAME = getEnv("MODEL_NAME", "GLM-4.5")
+	PORT = getEnv("PORT", "8080")
+	// 处理PORT格式，确保有冒号前缀
+	if !strings.HasPrefix(PORT, ":") {
+		PORT = ":" + PORT
+	}
+	DEBUG_MODE = getEnv("DEBUG_MODE", "true") == "true"
+	DEFAULT_STREAM = getEnv("DEFAULT_STREAM", "true") == "true"
+}
+// 获取环境变量，如果不存在则返回默认值
+func getEnv(key, defaultValue string) string {
+	if value := os.Getenv(key); value != "" {
+		return value
+	}
+	return defaultValue
+}
+// OpenAI 请求结构
+type OpenAIRequest struct {
+	Model       string    `json:"model"`
+	Messages    []Message `json:"messages"`
+	Stream      bool      `json:"stream,omitempty"`
+	Temperature float64   `json:"temperature,omitempty"`
+	MaxTokens   int       `json:"max_tokens,omitempty"`
+}
+type Message struct {
+	Role    string `json:"role"`
+	Content string `json:"content"`
+}
+// 上游请求结构
+type UpstreamRequest struct {
+	Stream          bool                   `json:"stream"`
+	Model           string                 `json:"model"`
+	Messages        []Message              `json:"messages"`
+	Params          map[string]interface{} `json:"params"`
+	Features        map[string]interface{} `json:"features"`
+	BackgroundTasks map[string]bool        `json:"background_tasks,omitempty"`
+	ChatID          string                 `json:"chat_id,omitempty"`
+	ID              string                 `json:"id,omitempty"`
+	MCPServers      []string               `json:"mcp_servers,omitempty"`
+	ModelItem       struct {
+		ID      string `json:"id"`
+		Name    string `json:"name"`
+		OwnedBy string `json:"owned_by"`
+	} `json:"model_item,omitempty"`
+	ToolServers []string          `json:"tool_servers,omitempty"`
+	Variables   map[string]string `json:"variables,omitempty"`
+}
+// OpenAI 响应结构
+type OpenAIResponse struct {
+	ID      string   `json:"id"`
+	Object  string   `json:"object"`
+	Created int64    `json:"created"`
+	Model   string   `json:"model"`
+	Choices []Choice `json:"choices"`
+	Usage   Usage    `json:"usage,omitempty"`
+}
+type Choice struct {
+	Index        int     `json:"index"`
+	Message      Message `json:"message,omitempty"`
+	Delta        Delta   `json:"delta,omitempty"`
+	FinishReason string  `json:"finish_reason,omitempty"`
+}
+type Delta struct {
+	Role    string `json:"role,omitempty"`
+	Content string `json:"content,omitempty"`
+}
+type Usage struct {
+	PromptTokens     int `json:"prompt_tokens"`
+	CompletionTokens int `json:"completion_tokens"`
+	TotalTokens      int `json:"total_tokens"`
+}
+// 上游SSE响应结构
+type UpstreamData struct {
+	Type string `json:"type"`
+	Data struct {
+		DeltaContent string         `json:"delta_content"`
+		Phase        string         `json:"phase"`
+		Done         bool           `json:"done"`
+		Usage        Usage          `json:"usage,omitempty"`
+		Error        *UpstreamError `json:"error,omitempty"`
+		Inner        *struct {
+			Error *UpstreamError `json:"error,omitempty"`
+		} `json:"data,omitempty"`
+	} `json:"data"`
+	Error *UpstreamError `json:"error,omitempty"`
+}
+type UpstreamError struct {
+	Detail string `json:"detail"`
+	Code   int    `json:"code"`
+}
+// 模型列表响应
+type ModelsResponse struct {
+	Object string  `json:"object"`
+	Data   []Model `json:"data"`
+}
+type Model struct {
+	ID      string `json:"id"`
+	Object  string `json:"object"`
+	Created int64  `json:"created"`
+	OwnedBy string `json:"owned_by"`
+}
+// debug日志函数
+func debugLog(format string, args ...interface{}) {
+	if DEBUG_MODE {
+		log.Printf("[DEBUG] "+format, args...)
+	}
+}
+// 获取匿名token（每次对话使用不同token，避免共享记忆）
+func getAnonymousToken() (string, error) {
+	client := &http.Client{Timeout: 10 * time.Second}
+	req, err := http.NewRequest("GET", ORIGIN_BASE+"/api/v1/auths/", nil)
+	if err != nil {
+		return "", err
+	}
+	// 伪装浏览器头
+	req.Header.Set("User-Agent", BROWSER_UA)
+	req.Header.Set("Accept", "*/*")
+	req.Header.Set("Accept-Language", "zh-CN,zh;q=0.9")
+	req.Header.Set("X-FE-Version", X_FE_VERSION)
+	req.Header.Set("sec-ch-ua", SEC_CH_UA)
+	req.Header.Set("sec-ch-ua-mobile", SEC_CH_UA_MOB)
+	req.Header.Set("sec-ch-ua-platform", SEC_CH_UA_PLAT)
+	req.Header.Set("Origin", ORIGIN_BASE)
+	req.Header.Set("Referer", ORIGIN_BASE+"/")
+	resp, err := client.Do(req)
+	if err != nil {
+		return "", err
+	}
+	defer resp.Body.Close()
+	if resp.StatusCode != http.StatusOK {
+		return "", fmt.Errorf("anon token status=%d", resp.StatusCode)
+	}
+	var body struct {
+		Token string `json:"token"`
+	}
+	if err := json.NewDecoder(resp.Body).Decode(&body); err != nil {
+		return "", err
+	}
+	if body.Token == "" {
+		return "", fmt.Errorf("anon token empty")
+	}
+	return body.Token, nil
+}
+func main() {
+	// 初始化配置
+	initConfig()
+	http.HandleFunc("/v1/models", handleModels)
+	http.HandleFunc("/v1/chat/completions", handleChatCompletions)
+	http.HandleFunc("/", handleOptions)
+	log.Printf("OpenAI兼容API服务器启动在端口%s", PORT)
+	log.Printf("模型: %s", MODEL_NAME)
+	log.Printf("上游: %s", UPSTREAM_URL)
+	log.Printf("Debug模式: %v", DEBUG_MODE)
+	log.Printf("默认流式响应: %v", DEFAULT_STREAM)
+	log.Fatal(http.ListenAndServe(PORT, nil))
+}
+func handleOptions(w http.ResponseWriter, r *http.Request) {
+	setCORSHeaders(w)
+	if r.Method == "OPTIONS" {
+		w.WriteHeader(http.StatusOK)
+		return
+	}
+	w.WriteHeader(http.StatusNotFound)
+}
+func setCORSHeaders(w http.ResponseWriter) {
+	w.Header().Set("Access-Control-Allow-Origin", "*")
+	w.Header().Set("Access-Control-Allow-Methods", "GET, POST, PUT, DELETE, OPTIONS")
+	w.Header().Set("Access-Control-Allow-Headers", "Content-Type, Authorization")
+	w.Header().Set("Access-Control-Allow-Credentials", "true")
+}
+func handleModels(w http.ResponseWriter, r *http.Request) {
+	setCORSHeaders(w)
+	if r.Method == "OPTIONS" {
+		w.WriteHeader(http.StatusOK)
+		return
+	}
+	response := ModelsResponse{
+		Object: "list",
+		Data: []Model{
+			{
+				ID:      MODEL_NAME,
+				Object:  "model",
+				Created: time.Now().Unix(),
+				OwnedBy: "z.ai",
+			},
+		},
+	}
+	w.Header().Set("Content-Type", "application/json")
+	json.NewEncoder(w).Encode(response)
+}
+func handleChatCompletions(w http.ResponseWriter, r *http.Request) {
+	setCORSHeaders(w)
+	if r.Method == "OPTIONS" {
+		w.WriteHeader(http.StatusOK)
+		return
+	}
+	debugLog("收到chat completions请求")
+	// 验证API Key
+	authHeader := r.Header.Get("Authorization")
+	if !strings.HasPrefix(authHeader, "Bearer ") {
+		debugLog("缺少或无效的Authorization头")
+		http.Error(w, "Missing or invalid Authorization header", http.StatusUnauthorized)
+		return
+	}
+	apiKey := strings.TrimPrefix(authHeader, "Bearer ")
+	if apiKey != DEFAULT_KEY {
+		debugLog("无效的API key: %s", apiKey)
+		http.Error(w, "Invalid API key", http.StatusUnauthorized)
+		return
+	}
+	debugLog("API key验证通过")
+	// 读取请求体
+	body, err := io.ReadAll(r.Body)
+	if err != nil {
+		debugLog("读取请求体失败: %v", err)
+		http.Error(w, "Failed to read request body", http.StatusBadRequest)
+		return
+	}
+	// 解析请求
+	var req OpenAIRequest
+	if err := json.Unmarshal(body, &req); err != nil {
+		debugLog("JSON解析失败: %v", err)
+		http.Error(w, "Invalid JSON", http.StatusBadRequest)
+		return
+	}
+	// 如果客户端没有明确指定stream参数，使用默认值
+	if !bytes.Contains(body, []byte(`"stream"`)) {
+		req.Stream = DEFAULT_STREAM
+		debugLog("客户端未指定stream参数，使用默认值: %v", DEFAULT_STREAM)
+	}
+	debugLog("请求解析成功 - 模型: %s, 流式: %v, 消息数: %d", req.Model, req.Stream, len(req.Messages))
+	// 生成会话相关ID
+	chatID := fmt.Sprintf("%d-%d", time.Now().UnixNano(), time.Now().Unix())
+	msgID := fmt.Sprintf("%d", time.Now().UnixNano())
+	// 构造上游请求
+	upstreamReq := UpstreamRequest{
+		Stream:   true, // 总是使用流式从上游获取
+		ChatID:   chatID,
+		ID:       msgID,
+		Model:    "0727-360B-API", // 上游实际模型ID
+		Messages: req.Messages,
+		Params:   map[string]interface{}{},
+		Features: map[string]interface{}{
+			"enable_thinking": true,
+		},
+		BackgroundTasks: map[string]bool{
+			"title_generation": false,
+			"tags_generation":  false,
+		},
+		MCPServers: []string{},
+		ModelItem: struct {
+			ID      string `json:"id"`
+			Name    string `json:"name"`
+			OwnedBy string `json:"owned_by"`
+		}{ID: "0727-360B-API", Name: "GLM-4.5", OwnedBy: "openai"},
+		ToolServers: []string{},
+		Variables: map[string]string{
+			"{{USER_NAME}}":        "User",
+			"{{USER_LOCATION}}":    "Unknown",
+			"{{CURRENT_DATETIME}}": time.Now().Format("2006-01-02 15:04:05"),
+		},
+	}
+	// 选择本次对话使用的token
+	authToken := UPSTREAM_TOKEN
+	if ANON_TOKEN_ENABLED {
+		if t, err := getAnonymousToken(); err == nil {
+			authToken = t
+			debugLog("匿名token获取成功: %s...", func() string {
+				if len(t) > 10 {
+					return t[:10]
+				}
+				return t
+			}())
+		} else {
+			debugLog("匿名token获取失败，回退固定token: %v", err)
+		}
+	}
+	// 调用上游API
+	if req.Stream {
+		handleStreamResponseWithIDs(w, upstreamReq, chatID, authToken)
+	} else {
+		handleNonStreamResponseWithIDs(w, upstreamReq, chatID, authToken)
+	}
+}
+func callUpstreamWithHeaders(upstreamReq UpstreamRequest, refererChatID string, authToken string) (*http.Response, error) {
+	reqBody, err := json.Marshal(upstreamReq)
+	if err != nil {
+		debugLog("上游请求序列化失败: %v", err)
+		return nil, err
+	}
+	debugLog("调用上游API: %s", UPSTREAM_URL)
+	debugLog("上游请求体: %s", string(reqBody))
+	req, err := http.NewRequest("POST", UPSTREAM_URL, bytes.NewBuffer(reqBody))
+	if err != nil {
+		debugLog("创建HTTP请求失败: %v", err)
+		return nil, err
+	}
+	req.Header.Set("Content-Type", "application/json")
+	req.Header.Set("Accept", "application/json, text/event-stream")
+	req.Header.Set("User-Agent", BROWSER_UA)
+	req.Header.Set("Authorization", "Bearer "+authToken)
+	req.Header.Set("Accept-Language", "zh-CN")
+	req.Header.Set("sec-ch-ua", SEC_CH_UA)
+	req.Header.Set("sec-ch-ua-mobile", SEC_CH_UA_MOB)
+	req.Header.Set("sec-ch-ua-platform", SEC_CH_UA_PLAT)
+	req.Header.Set("X-FE-Version", X_FE_VERSION)
+	req.Header.Set("Origin", ORIGIN_BASE)
+	req.Header.Set("Referer", ORIGIN_BASE+"/c/"+refererChatID)
+	client := &http.Client{Timeout: 60 * time.Second}
+	resp, err := client.Do(req)
+	if err != nil {
+		debugLog("上游请求失败: %v", err)
+		return nil, err
+	}
+	debugLog("上游响应状态: %d %s", resp.StatusCode, resp.Status)
+	return resp, nil
+}
+func handleStreamResponseWithIDs(w http.ResponseWriter, upstreamReq UpstreamRequest, chatID string, authToken string) {
+	debugLog("开始处理流式响应 (chat_id=%s)", chatID)
+	resp, err := callUpstreamWithHeaders(upstreamReq, chatID, authToken)
+	if err != nil {
+		debugLog("调用上游失败: %v", err)
+		http.Error(w, "Failed to call upstream", http.StatusBadGateway)
+		return
+	}
+	defer resp.Body.Close()
+	if resp.StatusCode != http.StatusOK {
+		debugLog("上游返回错误状态: %d", resp.StatusCode)
+		// 读取错误响应体
+		if DEBUG_MODE {
+			body, _ := io.ReadAll(resp.Body)
+			debugLog("上游错误响应: %s", string(body))
+		}
+		http.Error(w, "Upstream error", http.StatusBadGateway)
+		return
+	}
+	// 用于策略2：总是展示thinking（配合标签处理）
+	transformThinking := func(s string) string {
+		// 去 <summary>…</summary>
+		s = regexp.MustCompile(`(?s)<summary>.*?</summary>`).ReplaceAllString(s, "")
+		// 清理残留自定义标签，如 </thinking>、<Full> 等
+		s = strings.ReplaceAll(s, "</thinking>", "")
+		s = strings.ReplaceAll(s, "<Full>", "")
+		s = strings.ReplaceAll(s, "</Full>", "")
+		s = strings.TrimSpace(s)
+		switch THINK_TAGS_MODE {
+		case "think":
+			s = regexp.MustCompile(`<details[^>]*>`).ReplaceAllString(s, "<think>")
+			s = strings.ReplaceAll(s, "</details>", "</think>")
+		case "strip":
+			s = regexp.MustCompile(`<details[^>]*>`).ReplaceAllString(s, "")
+			s = strings.ReplaceAll(s, "</details>", "")
+		}
+		// 处理每行前缀 "> "（包括起始位置）
+		s = strings.TrimPrefix(s, "> ")
+		s = strings.ReplaceAll(s, "\n> ", "\n")
+		return strings.TrimSpace(s)
+	}
+	// 设置SSE头部
+	w.Header().Set("Content-Type", "text/event-stream")
+	w.Header().Set("Cache-Control", "no-cache")
+	w.Header().Set("Connection", "keep-alive")
+	flusher, ok := w.(http.Flusher)
+	if !ok {
+		http.Error(w, "Streaming unsupported", http.StatusInternalServerError)
+		return
+	}
+	// 发送第一个chunk（role）
+	firstChunk := OpenAIResponse{
+		ID:      fmt.Sprintf("chatcmpl-%d", time.Now().Unix()),
+		Object:  "chat.completion.chunk",
+		Created: time.Now().Unix(),
+		Model:   MODEL_NAME,
+		Choices: []Choice{
+			{
+				Index: 0,
+				Delta: Delta{Role: "assistant"},
+			},
+		},
+	}
+	writeSSEChunk(w, firstChunk)
+	flusher.Flush()
+	// 读取上游SSE流
+	debugLog("开始读取上游SSE流")
+	scanner := bufio.NewScanner(resp.Body)
+	lineCount := 0
+	for scanner.Scan() {
+		line := scanner.Text()
+		lineCount++
+		if !strings.HasPrefix(line, "data: ") {
+			continue
+		}
+		dataStr := strings.TrimPrefix(line, "data: ")
+		if dataStr == "" {
+			continue
+		}
+		debugLog("收到SSE数据 (第%d行): %s", lineCount, dataStr)
+		var upstreamData UpstreamData
+		if err := json.Unmarshal([]byte(dataStr), &upstreamData); err != nil {
+			debugLog("SSE数据解析失败: %v", err)
+			continue
+		}
+		// 错误检测（data.error 或 data.data.error 或 顶层error）
+		if (upstreamData.Error != nil) || (upstreamData.Data.Error != nil) || (upstreamData.Data.Inner != nil && upstreamData.Data.Inner.Error != nil) {
+			errObj := upstreamData.Error
+			if errObj == nil {
+				errObj = upstreamData.Data.Error
+			}
+			if errObj == nil && upstreamData.Data.Inner != nil {
+				errObj = upstreamData.Data.Inner.Error
+			}
+			debugLog("上游错误: code=%d, detail=%s", errObj.Code, errObj.Detail)
+			// 结束下游流
+			endChunk := OpenAIResponse{
+				ID:      fmt.Sprintf("chatcmpl-%d", time.Now().Unix()),
+				Object:  "chat.completion.chunk",
+				Created: time.Now().Unix(),
+				Model:   MODEL_NAME,
+				Choices: []Choice{{Index: 0, Delta: Delta{}, FinishReason: "stop"}},
+			}
+			writeSSEChunk(w, endChunk)
+			fmt.Fprintf(w, "data: [DONE]\n\n")
+			flusher.Flush()
+			break
+		}
+		debugLog("解析成功 - 类型: %s, 阶段: %s, 内容长度: %d, 完成: %v",
+			upstreamData.Type, upstreamData.Data.Phase, len(upstreamData.Data.DeltaContent), upstreamData.Data.Done)
+		// 策略2：总是展示thinking + answer
+		if upstreamData.Data.DeltaContent != "" {
+			var out = upstreamData.Data.DeltaContent
+			if upstreamData.Data.Phase == "thinking" {
+				out = transformThinking(out)
+			}
+			if out != "" {
+				debugLog("发送内容(%s): %s", upstreamData.Data.Phase, out)
+				chunk := OpenAIResponse{
+					ID:      fmt.Sprintf("chatcmpl-%d", time.Now().Unix()),
+					Object:  "chat.completion.chunk",
+					Created: time.Now().Unix(),
+					Model:   MODEL_NAME,
+					Choices: []Choice{
+						{
+							Index: 0,
+							Delta: Delta{Content: out},
+						},
+					},
+				}
+				writeSSEChunk(w, chunk)
+				flusher.Flush()
+			}
+		}
+		// 检查是否结束
+		if upstreamData.Data.Done || upstreamData.Data.Phase == "done" {
+			debugLog("检测到流结束信号")
+			// 发送结束chunk
+			endChunk := OpenAIResponse{
+				ID:      fmt.Sprintf("chatcmpl-%d", time.Now().Unix()),
+				Object:  "chat.completion.chunk",
+				Created: time.Now().Unix(),
+				Model:   MODEL_NAME,
+				Choices: []Choice{
+					{
+						Index:        0,
+						Delta:        Delta{},
+						FinishReason: "stop",
+					},
+				},
+			}
+			writeSSEChunk(w, endChunk)
+			flusher.Flush()
+			// 发送[DONE]
+			fmt.Fprintf(w, "data: [DONE]\n\n")
+			flusher.Flush()
+			debugLog("流式响应完成，共处理%d行", lineCount)
+			break
+		}
+	}
+	if err := scanner.Err(); err != nil {
+		debugLog("扫描器错误: %v", err)
+	}
+}
+func writeSSEChunk(w http.ResponseWriter, chunk OpenAIResponse) {
+	data, _ := json.Marshal(chunk)
+	fmt.Fprintf(w, "data: %s\n\n", data)
+}
+func handleNonStreamResponseWithIDs(w http.ResponseWriter, upstreamReq UpstreamRequest, chatID string, authToken string) {
+	debugLog("开始处理非流式响应 (chat_id=%s)", chatID)
+	resp, err := callUpstreamWithHeaders(upstreamReq, chatID, authToken)
+	if err != nil {
+		debugLog("调用上游失败: %v", err)
+		http.Error(w, "Failed to call upstream", http.StatusBadGateway)
+		return
+	}
+	defer resp.Body.Close()
+	if resp.StatusCode != http.StatusOK {
+		debugLog("上游返回错误状态: %d", resp.StatusCode)
+		// 读取错误响应体
+		if DEBUG_MODE {
+			body, _ := io.ReadAll(resp.Body)
+			debugLog("上游错误响应: %s", string(body))
+		}
+		http.Error(w, "Upstream error", http.StatusBadGateway)
+		return
+	}
+	// 收集完整响应（策略2：thinking与answer都纳入，thinking转换）
+	var fullContent strings.Builder
+	scanner := bufio.NewScanner(resp.Body)
+	debugLog("开始收集完整响应内容")
+	for scanner.Scan() {
+		line := scanner.Text()
+		if !strings.HasPrefix(line, "data: ") {
+			continue
+		}
+		dataStr := strings.TrimPrefix(line, "data: ")
+		if dataStr == "" {
+			continue
+		}
+		var upstreamData UpstreamData
+		if err := json.Unmarshal([]byte(dataStr), &upstreamData); err != nil {
+			continue
+		}
+		if upstreamData.Data.DeltaContent != "" {
+			out := upstreamData.Data.DeltaContent
+			if upstreamData.Data.Phase == "thinking" {
+				out = func(s string) string {
+					// 同步一份转换逻辑（与流式一致）
+					s = regexp.MustCompile(`(?s)<summary>.*?</summary>`).ReplaceAllString(s, "")
+					s = strings.ReplaceAll(s, "</thinking>", "")
+					s = strings.ReplaceAll(s, "<Full>", "")
+					s = strings.ReplaceAll(s, "</Full>", "")
+					s = strings.TrimSpace(s)
+					switch THINK_TAGS_MODE {
+					case "think":
+						s = regexp.MustCompile(`<details[^>]*>`).ReplaceAllString(s, "<think>")
+						s = strings.ReplaceAll(s, "</details>", "</think>")
+					case "strip":
+						s = regexp.MustCompile(`<details[^>]*>`).ReplaceAllString(s, "")
+						s = strings.ReplaceAll(s, "</details>", "")
+					}
+					s = strings.TrimPrefix(s, "> ")
+					s = strings.ReplaceAll(s, "\n> ", "\n")
+					return strings.TrimSpace(s)
+				}(out)
+			}
+			if out != "" {
+				fullContent.WriteString(out)
+			}
+		}
+		if upstreamData.Data.Done || upstreamData.Data.Phase == "done" {
+			debugLog("检测到完成信号，停止收集")
+			break
+		}
+	}
+	finalContent := fullContent.String()
+	debugLog("内容收集完成，最终长度: %d", len(finalContent))
+	// 构造完整响应
+	response := OpenAIResponse{
+		ID:      fmt.Sprintf("chatcmpl-%d", time.Now().Unix()),
+		Object:  "chat.completion",
+		Created: time.Now().Unix(),
+		Model:   MODEL_NAME,
+		Choices: []Choice{
+			{
+				Index: 0,
+				Message: Message{
+					Role:    "assistant",
+					Content: finalContent,
+				},
+				FinishReason: "stop",
+			},
+		},
+		Usage: Usage{
+			PromptTokens:     0,
+			CompletionTokens: 0,
+			TotalTokens:      0,
+		},
+	}
+	w.Header().Set("Content-Type", "application/json")
+	json.NewEncoder(w).Encode(response)
+	debugLog("非流式响应发送完成")
+}