Spaces:

xidu
/

pro1

Paused

App Files Files Community

xidu commited on Jul 10, 2025

Commit

1c0114c

1 Parent(s): ddc83ee

Deploy Go API to pro1 Space

Browse files

Files changed (4) hide show

Dockerfile +7 -2
README.md +9 -9
go.mod +1 -1
main.go +149 -43

Dockerfile CHANGED Viewed

@@ -4,13 +4,18 @@ FROM golang:1.21-alpine AS builder
 WORKDIR /app
 # 复制go.mod和go.sum文件
-# 将模块名从 goapi 改为 pro1
 COPY go.mod ./
-RUN go mod edit -module pro1 && go mod tidy
 # 复制源代码
 COPY main.go ./
 # 构建应用
 RUN CGO_ENABLED=0 GOOS=linux go build -o /go-api

 WORKDIR /app
 # 复制go.mod和go.sum文件
 COPY go.mod ./
+# (此步骤在下一步的 go mod tidy 中已包含，为保持清晰而保留)
+# 先下载依赖，可以利用Docker的层缓存
+RUN go mod download
 # 复制源代码
 COPY main.go ./
+# tidy会确保go.sum文件是最新的，并移除不用的依赖
+RUN go mod tidy
 # 构建应用
 RUN CGO_ENABLED=0 GOOS=linux go build -o /go-api

README.md CHANGED Viewed

@@ -1,16 +1,16 @@
 ---
-title: Gemini 2.5 Pro API Service
-emoji: 💎
-colorFrom: indigo
-colorTo: purple
 sdk: docker
 app_port: 7860
 ---
-This Space runs a high-performance API proxy for Google's Gemini, built in Go.
-It is specifically configured to **only support the `gemini-2.5-pro` model**.
 ### Endpoints
-- **`POST /v1/chat/completions`**: Main endpoint for chat.
-- **`GET /v1/models`**: Lists available models (only gemini-2.5-pro).
-- **`GET /health`**: Health check.

 ---
+title: Pro1
+emoji: 🚀
+colorFrom: blue
+colorTo: green
 sdk: docker
 app_port: 7860
 ---
+This Space runs a high-performance API proxy for Google's Gemini, built entirely in Go.
 ### Endpoints
+- **`POST /v1/chat/completions`**: Main endpoint for chat, supports streaming & non-streaming.
+- **`GET /v1/models`**: Lists available models.
+- **`GET /health`**: Health check.
+- **`GET /`**: API Info.

go.mod CHANGED Viewed

@@ -1,4 +1,4 @@
-module pro1
 go 1.21


1	+ module goapi
2
3	go 1.21
4

main.go CHANGED Viewed

@@ -27,8 +27,22 @@ var apiKeys = []string{
     // 在此添加更多密钥
 }
-// 定义支持的模型信息 (已根据要求修改)
 var supportedModels = []ModelInfo{
     {
        ID:          "gemini-2.5-pro",
        Object:      "model",
@@ -38,17 +52,32 @@ var supportedModels = []ModelInfo{
     },
 }
-// 将OpenAI模型名称映射到Gemini模型名称 (已根据要求修改)
 var modelMapping = map[string]string{
-    "gemini-2.5-pro": "gemini-2.5-pro",
 }
 // 配置安全设置 (全部禁用)
 var safetySettings = []*genai.SafetySetting{
-    { Category: genai.HarmCategoryHarassment, Threshold: genai.HarmBlockNone },
-    { Category: genai.HarmCategoryHateSpeech, Threshold: genai.HarmBlockNone },
-    { Category: genai.HarmCategorySexuallyExplicit, Threshold: genai.HarmBlockNone },
-    { Category: genai.HarmCategoryDangerousContent, Threshold: genai.HarmBlockNone },
 }
 const maxRetries = 3
@@ -127,25 +156,30 @@ func getRandomAPIKey() string {
     return apiKeys[r.Intn(len(apiKeys))]
 }
 func convertMessages(messages []ChatMessage) (history []*genai.Content, lastPrompt []genai.Part, systemInstruction *genai.Content) {
     if len(messages) == 0 {
        return nil, nil, nil
     }
     for i, msg := range messages {
        var role string
        if msg.Role == "system" {
           systemInstruction = &genai.Content{Parts: []genai.Part{genai.Text(msg.Content)}}
           continue
        }
        if i == len(messages)-1 && msg.Role == "user" {
           lastPrompt = append(lastPrompt, genai.Text(msg.Content))
           continue
        }
        if msg.Role == "assistant" {
           role = "model"
        } else {
           role = "user"
        }
        history = append(history, &genai.Content{
           Role:  role,
           Parts: []genai.Part{genai.Text(msg.Content)},
@@ -159,32 +193,34 @@ func chatCompletionsHandler(w http.ResponseWriter, r *http.Request) {
        http.Error(w, "仅支持POST方法", http.StatusMethodNotAllowed)
        return
     }
     var req ChatCompletionRequest
     if err := json.NewDecoder(r.Body).Decode(&req); err != nil {
        http.Error(w, fmt.Sprintf("解析请求体失败: %v", err), http.StatusBadRequest)
        return
     }
-    geminiModel, ok := modelMapping[req.Model]
-    if !ok {
-       http.Error(w, fmt.Sprintf("不支持的模型: %s. 此接口仅支持 'gemini-2.5-pro'", req.Model), http.StatusBadRequest)
-       return
-    }
-    log.Printf("接收到模型请求: '%s', 将使用映射后的模型: '%s'", req.Model, geminiModel)
     history, lastPrompt, systemInstruction := convertMessages(req.Messages)
     var lastErr error
     usedKeys := make(map[string]bool)
     for i := 0; i < maxRetries; i++ {
        ctx := context.Background()
        apiKey := getRandomAPIKey()
        if len(usedKeys) < len(apiKeys) {
           for usedKeys[apiKey] {
              apiKey = getRandomAPIKey()
           }
        }
        usedKeys[apiKey] = true
        log.Printf("尝试第 %d 次, 使用密钥: ...%s", i+1, apiKey[len(apiKey)-4:])
        client, err := genai.NewClient(ctx, option.WithAPIKey(apiKey))
@@ -195,7 +231,7 @@ func chatCompletionsHandler(w http.ResponseWriter, r *http.Request) {
        }
        defer client.Close()
-       model := client.GenerativeModel(geminiModel)
        model.SystemInstruction = systemInstruction
        model.SafetySettings = safetySettings
        model.SetTemperature(req.Temperature)
@@ -216,10 +252,12 @@ func chatCompletionsHandler(w http.ResponseWriter, r *http.Request) {
        if err == nil {
           return
        }
        lastErr = err
        log.Printf("第 %d 次尝试失败: %v", i+1, err)
        time.Sleep(1 * time.Second)
     }
     http.Error(w, fmt.Sprintf("所有重试均失败: %v", lastErr), http.StatusInternalServerError)
 }
@@ -231,8 +269,12 @@ func handleStream(w http.ResponseWriter, ctx context.Context, chat *genai.ChatSe
     iter := chat.SendMessageStream(ctx, prompt...)
     for {
        resp, err := iter.Next()
-       if err == iterator.Done { break }
-       if err != nil { return fmt.Errorf("流式生成内容失败: %v", err) }
        var contentBuilder strings.Builder
        for _, part := range resp.Candidates[0].Content.Parts {
@@ -246,61 +288,111 @@ func handleStream(w http.ResponseWriter, ctx context.Context, chat *genai.ChatSe
           Object:  "chat.completion.chunk",
           Created: time.Now().Unix(),
           Model:   modelID,
-          Choices: []StreamChoice{{ Index: 0, Delta: ChatMessage{ Role: "assistant", Content: contentBuilder.String() }}},
        }
        var buf bytes.Buffer
-       if err := json.NewEncoder(&buf).Encode(chunk); err != nil { return fmt.Errorf("序列化流式块失败: %v", err) }
        fmt.Fprintf(w, "data: %s\n\n", buf.String())
-       if flusher, ok := w.(http.Flusher); ok { flusher.Flush() }
     }
     finishReason := "stop"
     doneChunk := ChatCompletionStreamResponse{
-       ID: fmt.Sprintf("chatcmpl-%d-done", time.Now().Unix()),
-       Object: "chat.completion.chunk",
        Created: time.Now().Unix(),
-       Model: modelID,
-       Choices: []StreamChoice{{ Index: 0, FinishReason: &finishReason }},
     }
     var buf bytes.Buffer
     json.NewEncoder(&buf).Encode(doneChunk)
     fmt.Fprintf(w, "data: %s\n\n", buf.String())
     fmt.Fprintf(w, "data: [DONE]\n\n")
-    if flusher, ok := w.(http.Flusher); ok { flusher.Flush() }
     return nil
 }
 func handleNonStream(w http.ResponseWriter, ctx context.Context, model *genai.GenerativeModel, chat *genai.ChatSession, prompt []genai.Part, modelID string) error {
     resp, err := chat.SendMessage(ctx, prompt...)
-    if err != nil { return fmt.Errorf("生成内容失败: %v", err) }
     var contentBuilder strings.Builder
     if len(resp.Candidates) > 0 && resp.Candidates[0].Content != nil {
        for _, part := range resp.Candidates[0].Content.Parts {
-          if txt, ok := part.(genai.Text); ok { contentBuilder.WriteString(string(txt)) }
        }
     }
     var promptParts []genai.Part
-    for _, c := range chat.History { promptParts = append(promptParts, c.Parts...) }
     promptParts = append(promptParts, prompt...)
     promptTokenCount, err := model.CountTokens(ctx, promptParts...)
-    if err != nil { return fmt.Errorf("计算prompt tokens失败: %v", err) }
     completionTokenCount, err := model.CountTokens(ctx, resp.Candidates[0].Content.Parts...)
-    if err != nil { return fmt.Errorf("计算completion tokens失败: %v", err) }
     response := ChatCompletionResponse{
        ID:      fmt.Sprintf("chatcmpl-%d", time.Now().Unix()),
        Object:  "chat.completion",
        Created: time.Now().Unix(),
        Model:   modelID,
-       Choices: []Choice{{ Index: 0, Message: ChatMessage{ Role: "assistant", Content: contentBuilder.String() }, FinishReason: "stop" }},
-       Usage:   Usage{ PromptTokens: int(promptTokenCount.TotalTokens), CompletionTokens: int(completionTokenCount.TotalTokens), TotalTokens: int(promptTokenCount.TotalTokens) + int(completionTokenCount.TotalTokens) },
     }
     w.Header().Set("Content-Type", "application/json")
     return json.NewEncoder(w).Encode(response)
 }
 func modelsHandler(w http.ResponseWriter, r *http.Request) {
     resp := ModelListResponse{
        Object: "list",
@@ -312,10 +404,14 @@ func modelsHandler(w http.ResponseWriter, r *http.Request) {
 func rootHandler(w http.ResponseWriter, r *http.Request) {
     info := map[string]interface{}{
-       "name":        "Gemini 2.5 Pro API Service (Go Version)",
-       "version":     "1.3.1",
-       "description": "Google Gemini 官方API接口服务，已配置为仅支持 gemini-2.5-pro",
-       "endpoints": map[string]string{ "models": "/v1/models", "chat": "/v1/chat/completions", "health": "/health" },
     }
     w.Header().Set("Content-Type", "application/json")
     json.NewEncoder(w).Encode(info)
@@ -323,13 +419,15 @@ func rootHandler(w http.ResponseWriter, r *http.Request) {
 func healthHandler(w http.ResponseWriter, r *http.Request) {
     var modelIDs []string
-    for _, m := range supportedModels { modelIDs = append(modelIDs, m.ID) }
     health := map[string]interface{}{
-       "status": "healthy",
-       "timestamp": time.Now().Unix(),
-       "api": "gemini-official-go",
        "available_models": modelIDs,
-       "version": "1.3.1",
     }
     w.Header().Set("Content-Type", "application/json")
     json.NewEncoder(w).Encode(health)
@@ -337,11 +435,13 @@ func healthHandler(w http.ResponseWriter, r *http.Request) {
 func main() {
     mux := http.NewServeMux()
     mux.HandleFunc("/", rootHandler)
     mux.HandleFunc("/health", healthHandler)
     mux.HandleFunc("/v1/models", modelsHandler)
     mux.HandleFunc("/v1/chat/completions", chatCompletionsHandler)
     c := cors.New(cors.Options{
        AllowedOrigins:   []string{"*"},
        AllowedMethods:   []string{"GET", "POST", "OPTIONS"},
@@ -351,8 +451,14 @@ func main() {
     handler := c.Handler(mux)
     port := "7860"
-    log.Println("🚀 启动 Gemini 2.5 Pro API 服务器 (Go 版本)")
-    log.Printf("📊 支持的唯一模型: %v", supportedModels[0].ID)
     log.Printf("🔑 已配置 %d 个API密钥", len(apiKeys))
     log.Println("🔄 支持自动重试和密钥轮换")
     log.Printf("🔗 服务器正在监听 http://0.0.0.0:%s", port)

     // 在此添加更多密钥
 }
+// 定义支持的模型信息
 var supportedModels = []ModelInfo{
+    {
+       ID:          "gemini-2.5-flash-preview-05-20",
+       Object:      "model",
+       Created:     time.Now().Unix(),
+       OwnedBy:     "google",
+       Description: "Gemini 2.5 Flash Preview - 最新实验性模型",
+    },
+    {
+       ID:          "gemini-2.5-flash",
+       Object:      "model",
+       Created:     time.Now().Unix(),
+       OwnedBy:     "google",
+       Description: "gemini-2.5-flash稳定经典专业模型",
+    },
     {
        ID:          "gemini-2.5-pro",
        Object:      "model",
     },
 }
+// 将OpenAI模型名称映射到Gemini模型名称
+// 根据您的要求，键和值现在是相同的，不做任何转换。
 var modelMapping = map[string]string{
+    "gemini-2.5-flash-preview-05-20": "gemini-2.5-flash-preview-05-20",
+    "gemini-2.5-flash":               "gemini-2.5-flash",
+    "gemini-2.5-pro":                 "gemini-2.5-pro",
 }
 // 配置安全设置 (全部禁用)
 var safetySettings = []*genai.SafetySetting{
+    {
+       Category:  genai.HarmCategoryHarassment,
+       Threshold: genai.HarmBlockNone,
+    },
+    {
+       Category:  genai.HarmCategoryHateSpeech,
+       Threshold: genai.HarmBlockNone,
+    },
+    {
+       Category:  genai.HarmCategorySexuallyExplicit,
+       Threshold: genai.HarmBlockNone,
+    },
+    {
+       Category:  genai.HarmCategoryDangerousContent,
+       Threshold: genai.HarmBlockNone,
+    },
 }
 const maxRetries = 3
     return apiKeys[r.Intn(len(apiKeys))]
 }
+// convertMessages 将OpenAI格式的消息转换为Gemini格式的历史记录和最后一个用户的提示
 func convertMessages(messages []ChatMessage) (history []*genai.Content, lastPrompt []genai.Part, systemInstruction *genai.Content) {
     if len(messages) == 0 {
        return nil, nil, nil
     }
     for i, msg := range messages {
        var role string
        if msg.Role == "system" {
           systemInstruction = &genai.Content{Parts: []genai.Part{genai.Text(msg.Content)}}
           continue
        }
        if i == len(messages)-1 && msg.Role == "user" {
           lastPrompt = append(lastPrompt, genai.Text(msg.Content))
           continue
        }
        if msg.Role == "assistant" {
           role = "model"
        } else {
           role = "user"
        }
        history = append(history, &genai.Content{
           Role:  role,
           Parts: []genai.Part{genai.Text(msg.Content)},
        http.Error(w, "仅支持POST方法", http.StatusMethodNotAllowed)
        return
     }
     var req ChatCompletionRequest
     if err := json.NewDecoder(r.Body).Decode(&req); err != nil {
        http.Error(w, fmt.Sprintf("解析请求体失败: %v", err), http.StatusBadRequest)
        return
     }
+    // 根据您的要求，直接使用请求中的模型名称
+    modelName := req.Model
+    log.Printf("接收到模型请求: '%s'，将直接使用该名称。", modelName)
     history, lastPrompt, systemInstruction := convertMessages(req.Messages)
     var lastErr error
     usedKeys := make(map[string]bool)
     for i := 0; i < maxRetries; i++ {
        ctx := context.Background()
        apiKey := getRandomAPIKey()
        if len(usedKeys) < len(apiKeys) {
           for usedKeys[apiKey] {
              apiKey = getRandomAPIKey()
           }
        }
        usedKeys[apiKey] = true
        log.Printf("尝试第 %d 次, 使用密钥: ...%s", i+1, apiKey[len(apiKey)-4:])
        client, err := genai.NewClient(ctx, option.WithAPIKey(apiKey))
        }
        defer client.Close()
+       model := client.GenerativeModel(modelName)
        model.SystemInstruction = systemInstruction
        model.SafetySettings = safetySettings
        model.SetTemperature(req.Temperature)
        if err == nil {
           return
        }
        lastErr = err
        log.Printf("第 %d 次尝试失败: %v", i+1, err)
        time.Sleep(1 * time.Second)
     }
     http.Error(w, fmt.Sprintf("所有重试均失败: %v", lastErr), http.StatusInternalServerError)
 }
     iter := chat.SendMessageStream(ctx, prompt...)
     for {
        resp, err := iter.Next()
+       if err == iterator.Done {
+          break
+       }
+       if err != nil {
+          return fmt.Errorf("流式生成内容失败: %v", err)
+       }
        var contentBuilder strings.Builder
        for _, part := range resp.Candidates[0].Content.Parts {
           Object:  "chat.completion.chunk",
           Created: time.Now().Unix(),
           Model:   modelID,
+          Choices: []StreamChoice{
+             {
+                Index: 0,
+                Delta: ChatMessage{
+                   Role:    "assistant",
+                   Content: contentBuilder.String(),
+                },
+             },
+          },
        }
        var buf bytes.Buffer
+       if err := json.NewEncoder(&buf).Encode(chunk); err != nil {
+          return fmt.Errorf("序列化流式块失败: %v", err)
+       }
        fmt.Fprintf(w, "data: %s\n\n", buf.String())
+       if flusher, ok := w.(http.Flusher); ok {
+          flusher.Flush()
+       }
     }
     finishReason := "stop"
     doneChunk := ChatCompletionStreamResponse{
+       ID:      fmt.Sprintf("chatcmpl-%d-done", time.Now().Unix()),
+       Object:  "chat.completion.chunk",
        Created: time.Now().Unix(),
+       Model:   modelID,
+       Choices: []StreamChoice{
+          {
+             Index:        0,
+             FinishReason: &finishReason,
+          },
+       },
     }
     var buf bytes.Buffer
     json.NewEncoder(&buf).Encode(doneChunk)
     fmt.Fprintf(w, "data: %s\n\n", buf.String())
     fmt.Fprintf(w, "data: [DONE]\n\n")
+    if flusher, ok := w.(http.Flusher); ok {
+       flusher.Flush()
+    }
     return nil
 }
 func handleNonStream(w http.ResponseWriter, ctx context.Context, model *genai.GenerativeModel, chat *genai.ChatSession, prompt []genai.Part, modelID string) error {
     resp, err := chat.SendMessage(ctx, prompt...)
+    if err != nil {
+       return fmt.Errorf("生成内容失败: %v", err)
+    }
     var contentBuilder strings.Builder
     if len(resp.Candidates) > 0 && resp.Candidates[0].Content != nil {
        for _, part := range resp.Candidates[0].Content.Parts {
+          if txt, ok := part.(genai.Text); ok {
+             contentBuilder.WriteString(string(txt))
+          }
        }
     }
+    // 计算Token
     var promptParts []genai.Part
+    for _, c := range chat.History {
+       promptParts = append(promptParts, c.Parts...)
+    }
     promptParts = append(promptParts, prompt...)
     promptTokenCount, err := model.CountTokens(ctx, promptParts...)
+    if err != nil {
+       return fmt.Errorf("计算prompt tokens失败: %v", err)
+    }
     completionTokenCount, err := model.CountTokens(ctx, resp.Candidates[0].Content.Parts...)
+    if err != nil {
+       return fmt.Errorf("计算completion tokens失败: %v", err)
+    }
     response := ChatCompletionResponse{
        ID:      fmt.Sprintf("chatcmpl-%d", time.Now().Unix()),
        Object:  "chat.completion",
        Created: time.Now().Unix(),
        Model:   modelID,
+       Choices: []Choice{
+          {
+             Index: 0,
+             Message: ChatMessage{
+                Role:    "assistant",
+                Content: contentBuilder.String(),
+             },
+             FinishReason: "stop",
+          },
+       },
+       Usage: Usage{
+          PromptTokens:     int(promptTokenCount.TotalTokens),
+          CompletionTokens: int(completionTokenCount.TotalTokens),
+          TotalTokens:      int(promptTokenCount.TotalTokens) + int(completionTokenCount.TotalTokens),
+       },
     }
     w.Header().Set("Content-Type", "application/json")
     return json.NewEncoder(w).Encode(response)
 }
 func modelsHandler(w http.ResponseWriter, r *http.Request) {
     resp := ModelListResponse{
        Object: "list",
 func rootHandler(w http.ResponseWriter, r *http.Request) {
     info := map[string]interface{}{
+       "name":        "Gemini Official API (Go Version)",
+       "version":     "1.3.0",
+       "description": "Google Gemini官方API接口服务",
+       "endpoints": map[string]string{
+          "models": "/v1/models",
+          "chat":   "/v1/chat/completions",
+          "health": "/health",
+       },
     }
     w.Header().Set("Content-Type", "application/json")
     json.NewEncoder(w).Encode(info)
 func healthHandler(w http.ResponseWriter, r *http.Request) {
     var modelIDs []string
+    for _, m := range supportedModels {
+       modelIDs = append(modelIDs, m.ID)
+    }
     health := map[string]interface{}{
+       "status":           "healthy",
+       "timestamp":        time.Now().Unix(),
+       "api":              "gemini-official-go",
        "available_models": modelIDs,
+       "version":          "1.3.0",
     }
     w.Header().Set("Content-Type", "application/json")
     json.NewEncoder(w).Encode(health)
 func main() {
     mux := http.NewServeMux()
     mux.HandleFunc("/", rootHandler)
     mux.HandleFunc("/health", healthHandler)
     mux.HandleFunc("/v1/models", modelsHandler)
     mux.HandleFunc("/v1/chat/completions", chatCompletionsHandler)
+    mux.HandleFunc("/v1/chat/completions/v1/models", modelsHandler)
     c := cors.New(cors.Options{
        AllowedOrigins:   []string{"*"},
        AllowedMethods:   []string{"GET", "POST", "OPTIONS"},
     handler := c.Handler(mux)
     port := "7860"
+    log.Println("🚀 启动Gemini官方API服务器 (Go版本)")
+    log.Printf("📊 支持的模型: %v", func() []string {
+       var ids []string
+       for _, m := range supportedModels {
+          ids = append(ids, m.ID)
+       }
+       return ids
+    }())
     log.Printf("🔑 已配置 %d 个API密钥", len(apiKeys))
     log.Println("🔄 支持自动重试和密钥轮换")
     log.Printf("🔗 服务器正在监听 http://0.0.0.0:%s", port)