Spaces:

caidaoli
/

de

Paused

caidaohz commited on Jun 29, 2025

Commit

ebcd387

1 Parent(s): b6bb5db

feat: Initialize OnDemand2API with Go, including API key management and chat completion functionality

- Removed requirements.txt as the project is now Go-based
- Added .gitignore to exclude .env files
- Created config.example.env for environment variable configuration
- Initialized go.mod and go.sum for dependency management
- Implemented main.go with chat completion API, session management, and error handling
- Added health check and model listing endpoints
- Integrated logging and middleware for API key validation

Files changed (11) hide show

.gitignore +1 -0
Dockerfile +40 -10
README.md +229 -2
config.example.env +32 -0
docker-compose.yml +17 -11
go.mod +36 -0
go.sum +90 -0
gunicorn.conf.py +0 -81
main.go +812 -0
openai_ondemand_adapter.py +0 -325
requirements.txt +0 -3

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ .env

Dockerfile CHANGED Viewed

@@ -1,11 +1,41 @@
-FROM python:3.10-slim
-# 安装pip依赖
-WORKDIR /workspace
-COPY requirements.txt .
-RUN pip install --no-cache-dir -r requirements.txt
-# 复制你的源码
-COPY . .
-# Space 必须监听 0.0.0.0:7860 或 3000，建议 7860！
-ENV PORT=7860
 EXPOSE 7860
-CMD ["gunicorn", "--config", "gunicorn.conf.py", "openai_ondemand_adapter:app"]

+# 多阶段构建
+FROM golang:1.21-alpine AS builder
+# 设置工作目录
+WORKDIR /app
+# 安装必要的工具
+RUN apk add --no-cache git
+# 复制go mod文件
+COPY go.mod go.sum ./
+# 下载依赖
+RUN go mod download
+# 复制源代码
+COPY main.go ./
+# 构建应用
+RUN CGO_ENABLED=0 GOOS=linux go build -a -installsuffix cgo -o main .
+# 运行阶段
+FROM alpine:latest
+# 安装ca-certificates用于HTTPS请求
+RUN apk --no-cache add ca-certificates curl
+WORKDIR /root/
+# 从构建阶段复制二进制文件
+COPY --from=builder /app/main .
+# 暴露端口
 EXPOSE 7860
+# 健康检查
+HEALTHCHECK --interval=30s --timeout=10s --start-period=5s --retries=3 \
+  CMD curl -f http://localhost:7860/v1/models || exit 1
+# 运行应用
+CMD ["./main"]

README.md CHANGED Viewed

@@ -1,5 +1,5 @@
 ---
-title: openai ondemand adapter
 emoji: 😻
 colorFrom: red
 colorTo: red
@@ -7,4 +7,231 @@ sdk: docker
 pinned: false
 ---
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
+title: OnDemand2Api
 emoji: 😻
 colorFrom: red
 colorTo: red
 pinned: false
 ---
+# OpenAI OnDemand Adapter - Go版本
+这是一个高性能的Go语言实现版本，将OpenAI API请求转换为OnDemand API调用，支持异步并发处理。
+## 主要特性
+### 🚀 性能优化
+- **异步并发处理**：使用Goroutines和Channels实现高并发请求处理
+- **连接池复用**：HTTP客户端连接复用，减少连接开销
+- **内存优化**：高效的内存管理，避免内存泄漏
+- **多阶段Docker构建**：最小化最终镜像大小
+### 🔧 核心功能
+- **API密钥管理**：支持多个API密钥的自动轮换和故障转移
+- **会话管理**：智能维护OnDemand API会话状态，支持会话超时自动重置
+- **流式响应**：支持Server-Sent Events (SSE)流式响应
+- **模型映射**：灵活的OpenAI模型到OnDemand端点的映射
+- **错误处理**：完善的错误处理和自动重试机制
+- **健康检查**：内置健康检查端点
+### 🛡️ 安全特性
+- **API鉴权**：支持Authorization Bearer Token和X-API-KEY头部鉴权
+- **只读文件系统**：Docker容器使用只读根文件系统提高安全性
+- **资源限制**：Docker容器资源限制和安全配置
+## 快速开始
+### 环境要求
+- Go 1.21+
+- Docker & Docker Compose (可选)
+### 本地运行
+1. **克隆项目并安装依赖**
+```bash
+git clone <repository>
+cd ondemand2api
+go mod download
+```
+2. **设置环境变量**
+```bash
+export PRIVATE_KEY="your_private_key_here"
+export ONDEMAND_APIKEYS="key1,key2,key3"
+export PORT=7860  # 可选，默认7860
+export GIN_MODE=release  # 可选：debug, release, test
+```
+3. **运行应用**
+```bash
+go run main.go
+```
+### Docker运行
+1. **构建并运行**
+```bash
+# 构建镜像
+docker build -t ondemand2api .
+# 运行容器
+docker run -p 7860:7860 \
+  -e PRIVATE_KEY="your_private_key_here" \
+  -e ONDEMAND_APIKEYS="key1,key2,key3" \
+  ondemand2api
+```
+2. **使用Docker Compose**
+```bash
+# 编辑docker-compose.yml中的环境变量
+# 然后运行：
+docker-compose up -d
+```
+## API接口
+### 聊天完成接口
+```http
+POST /v1/chat/completions
+Authorization: Bearer your_private_key_here
+Content-Type: application/json
+{
+  "model": "gpt-4o",
+  "messages": [
+    {"role": "user", "content": "Hello!"}
+  ],
+  "stream": false
+}
+```
+### 模型列表接口
+```http
+GET /v1/models
+Authorization: Bearer your_private_key_here
+```
+### 健康检查接口
+```http
+GET /
+```
+## 配置说明
+### 环境变量
+| 变量名 | 必需 | 默认值 | 说明 |
+|--------|------|--------|------|
+| `PRIVATE_KEY` | 是 | testofli | API访问密钥 |
+| `ONDEMAND_APIKEYS` | 是 | - | OnDemand API密钥列表，逗号分隔 |
+| `PORT` | 否 | 7860 | 服务端口 |
+| `GIN_MODE` | 否 | release | Gin运行模式 |
+### 支持的模型映射
+| OpenAI模型 | OnDemand端点 |
+|------------|--------------|
+| o3 | predefined-openai-gpto3 |
+| o3-mini | predefined-openai-gpto3-mini |
+| gpt-4o | predefined-openai-gpt4o |
+| gpt-4.1 | predefined-openai-gpt4.1 |
+| deepseek-v3 | predefined-deepseek-v3 |
+| deepseek-r1 | predefined-deepseek-r1 |
+| claude-4-sonnet | predefined-claude-4-sonnet |
+| gemini-2.5-pro | predefined-gemini-2.5-pro-preview |
+## 性能特性
+### 并发处理
+- **Goroutines**：每个请求在独立的goroutine中处理
+- **Channel通信**：使用带缓冲的channel处理流式响应
+- **连接复用**：HTTP客户端自动复用连接
+- **超时控制**：完善的上下文超时控制
+### 内存管理
+- **垃圾回收优化**：合理的对象生命周期管理
+- **缓冲区复用**：高效的内存缓冲区使用
+- **资源自动释放**：defer语句确保资源及时释放
+### 错误处理
+- **分级重试**：根据错误类型进行智能重试
+- **熔断机制**：自动检测和恢复故障的API密钥
+- **日志记录**：详细的操作日志和错误追踪
+## 监控和日志
+### 日志输出
+应用使用结构化日志输出，包含：
+- 请求处理信息
+- API密钥使用状态
+- 会话管理状态
+- 错误和异常信息
+### 健康检查
+- HTTP健康检查端点：`GET /`
+- Docker健康检查：自动检查服务可用性
+- 返回API密钥池状态
+## 与Python版本的对比
+| 特性 | Python版本 | Go版本 |
+|------|------------|--------|
+| **性能** | 中等 | 高 |
+| **并发处理** | 线程池 | Goroutines |
+| **内存使用** | 较高 | 较低 |
+| **启动时间** | 较慢 | 快 |
+| **资源占用** | 高 | 低 |
+| **并发能力** | 受GIL限制 | 原生并发 |
+| **部署大小** | 大 | 小 |
+## 开发说明
+### 项目结构
+```
+.
+├── main.go                 # 主应用文件
+├── go.mod                  # Go模块定义
+├── go.sum                  # 依赖锁定文件
+├── Dockerfile              # Docker构建文件
+├── docker-compose.yml      # Docker Compose配置
+└── README.md               # 项目文档
+```
+### 关键组件
+1. **KeyManager**: API密钥管理器
+   - 自动轮换密钥
+   - 故障检测和恢复
+   - 会话状态管理
+2. **HTTP处理器**:
+   - Gin框架路由
+   - 中间件鉴权
+   - 流式响应处理
+3. **并发控制**:
+   - Context超时控制
+   - Goroutine池管理
+   - Channel通信
+## 故障排查
+### 常见问题
+1. **端口占用**
+```bash
+# 检查端口占用
+lsof -i :7860
+# 或使用不同端口
+export PORT=8080
+```
+2. **API密钥问题**
+```bash
+# 检查环境变量
+echo $ONDEMAND_APIKEYS
+# 查看日志输出的密钥状态
+```
+3. **内存使用**
+```bash
+# 监控容器资源使用
+docker stats ondemand2api
+```
+## 许可证
+本项目基于原Python项目进行Go语言重构，保持相同的功能特性并增强了性能和并发能力。

config.example.env ADDED Viewed

	@@ -0,0 +1,32 @@

+# OnDemand2API Go版本 - 环境变量配置示例
+# ====== 必需配置 ======
+# API访问私钥（用于客户端鉴权）
+PRIVATE_KEY=your_private_key_here
+# OnDemand API密钥列表（逗号分隔，支持多个密钥轮换）
+ONDEMAND_APIKEYS=key1,key2,key3
+# ====== 可选配置 ======
+# 服务端口（默认7860）
+PORT=7860
+# Gin运行模式（debug, release, test）
+GIN_MODE=release
+# ====== 高级配置 ======
+# 如果需要自定义OnDemand API基础URL（通常不需要修改）
+# ONDEMAND_API_BASE=https://api.on-demand.io/chat/v1
+# ====== 使用说明 ======
+# 1. 复制此文件为 .env 或直接设置环境变量
+# 2. 修改上述配置值为实际值
+# 3. 运行应用：
+#    - 本地运行：make run
+#    - Docker运行：make docker-run
+#    - Docker Compose：make docker-compose-up
+# ====== 安全提示 ======
+# - 请妥善保管 PRIVATE_KEY 和 ONDEMAND_APIKEYS
+# - 不要将包含真实密钥的配置文件提交到代码仓库
+# - 生产环境建议使用环境变量或密钥管理服务

docker-compose.yml CHANGED Viewed

@@ -2,7 +2,9 @@ version: '3.8'
 services:
   ondemand2api:
-    build: .
     ports:
       - "7860:7860"
     environment:
@@ -10,24 +12,19 @@ services:
       - PRIVATE_KEY=your_private_key_here
       - ONDEMAND_APIKEYS=key1,key2,key3
-      # Gunicorn配置（可选，有默认值）
-      - GUNICORN_WORKERS=4          # Worker进程数，默认为CPU核心数*2+1
-      - GUNICORN_THREADS=4          # 每个Worker的线程数，默认为4
-      - GUNICORN_TIMEOUT=120        # 超时时间（秒），默认为120
       # 服务器配置（可选）
       - PORT=7860                   # 端口，默认为7860
-      - HOST=0.0.0.0               # 绑定地址，默认为0.0.0.0
     # 资源限制（可选）
     deploy:
       resources:
         limits:
           cpus: '2.0'
-          memory: 1G
-        reservations:
-          cpus: '0.5'
           memory: 512M
     # 健康检查
     healthcheck:
@@ -35,7 +32,7 @@ services:
       interval: 30s
       timeout: 10s
       retries: 3
-      start_period: 40s
     # 重启策略
     restart: unless-stopped
@@ -46,3 +43,12 @@ services:
       options:
         max-size: "10m"
         max-file: "3"

 services:
   ondemand2api:
+    build:
+      context: .
+      dockerfile: Dockerfile
     ports:
       - "7860:7860"
     environment:
       - PRIVATE_KEY=your_private_key_here
       - ONDEMAND_APIKEYS=key1,key2,key3
       # 服务器配置（可选）
       - PORT=7860                   # 端口，默认为7860
+      - GIN_MODE=release            # Gin运行模式：debug, release, test
     # 资源限制（可选）
     deploy:
       resources:
         limits:
           cpus: '2.0'
           memory: 512M
+        reservations:
+          cpus: '0.25'
+          memory: 128M
     # 健康检查
     healthcheck:
       interval: 30s
       timeout: 10s
       retries: 3
+      start_period: 10s
     # 重启策略
     restart: unless-stopped
       options:
         max-size: "10m"
         max-file: "3"
+    # 安全配置
+    security_opt:
+      - no-new-privileges:true
+    # 只读根文件系统（提高安全性）
+    read_only: true
+    tmpfs:
+      - /tmp:noexec,nosuid,size=100m

go.mod ADDED Viewed

	@@ -0,0 +1,36 @@

+module ondemand2api
+go 1.21
+require (
+	github.com/gin-gonic/gin v1.9.1
+	github.com/google/uuid v1.5.0
+	github.com/joho/godotenv v1.5.1
+)
+require (
+	github.com/bytedance/sonic v1.9.1 // indirect
+	github.com/chenzhuoyu/base64x v0.0.0-20221115062448-fe3a3abad311 // indirect
+	github.com/gabriel-vasile/mimetype v1.4.2 // indirect
+	github.com/gin-contrib/sse v0.1.0 // indirect
+	github.com/go-playground/locales v0.14.1 // indirect
+	github.com/go-playground/universal-translator v0.18.1 // indirect
+	github.com/go-playground/validator/v10 v10.14.0 // indirect
+	github.com/goccy/go-json v0.10.2 // indirect
+	github.com/json-iterator/go v1.1.12 // indirect
+	github.com/klauspost/cpuid/v2 v2.2.4 // indirect
+	github.com/leodido/go-urn v1.2.4 // indirect
+	github.com/mattn/go-isatty v0.0.19 // indirect
+	github.com/modern-go/concurrent v0.0.0-20180306012644-bacd9c7ef1dd // indirect
+	github.com/modern-go/reflect2 v1.0.2 // indirect
+	github.com/pelletier/go-toml/v2 v2.0.8 // indirect
+	github.com/twitchyliquid64/golang-asm v0.15.1 // indirect
+	github.com/ugorji/go/codec v1.2.11 // indirect
+	golang.org/x/arch v0.3.0 // indirect
+	golang.org/x/crypto v0.9.0 // indirect
+	golang.org/x/net v0.10.0 // indirect
+	golang.org/x/sys v0.8.0 // indirect
+	golang.org/x/text v0.9.0 // indirect
+	google.golang.org/protobuf v1.30.0 // indirect
+	gopkg.in/yaml.v3 v3.0.1 // indirect
+)

go.sum ADDED Viewed

	@@ -0,0 +1,90 @@

+github.com/bytedance/sonic v1.5.0/go.mod h1:ED5hyg4y6t3/9Ku1R6dU/4KyJ48DZ4jPhfY1O2AihPM=
+github.com/bytedance/sonic v1.9.1 h1:6iJ6NqdoxCDr6mbY8h18oSO+cShGSMRGCEo7F2h0x8s=
+github.com/bytedance/sonic v1.9.1/go.mod h1:i736AoUSYt75HyZLoJW9ERYxcy6eaN6h4BZXU064P/U=
+github.com/chenzhuoyu/base64x v0.0.0-20211019084208-fb5309c8db06/go.mod h1:DH46F32mSOjUmXrMHnKwZdA8wcEefY7UVqBKYGjpdQY=
+github.com/chenzhuoyu/base64x v0.0.0-20221115062448-fe3a3abad311 h1:qSGYFH7+jGhDF8vLC+iwCD4WpbV1EBDSzWkJODFLams=
+github.com/chenzhuoyu/base64x v0.0.0-20221115062448-fe3a3abad311/go.mod h1:b583jCggY9gE99b6G5LEC39OIiVsWj+R97kbl5odCEk=
+github.com/davecgh/go-spew v1.1.0/go.mod h1:J7Y8YcW2NihsgmVo/mv3lAwl/skON4iLHjSsI+c5H38=
+github.com/davecgh/go-spew v1.1.1 h1:vj9j/u1bqnvCEfJOwUhtlOARqs3+rkHYY13jYWTU97c=
+github.com/davecgh/go-spew v1.1.1/go.mod h1:J7Y8YcW2NihsgmVo/mv3lAwl/skON4iLHjSsI+c5H38=
+github.com/gabriel-vasile/mimetype v1.4.2 h1:w5qFW6JKBz9Y393Y4q372O9A7cUSequkh1Q7OhCmWKU=
+github.com/gabriel-vasile/mimetype v1.4.2/go.mod h1:zApsH/mKG4w07erKIaJPFiX0Tsq9BFQgN3qGY5GnNgA=
+github.com/gin-contrib/sse v0.1.0 h1:Y/yl/+YNO8GZSjAhjMsSuLt29uWRFHdHYUb5lYOV9qE=
+github.com/gin-contrib/sse v0.1.0/go.mod h1:RHrZQHXnP2xjPF+u1gW/2HnVO7nvIa9PG3Gm+fLHvGI=
+github.com/gin-gonic/gin v1.9.1 h1:4idEAncQnU5cB7BeOkPtxjfCSye0AAm1R0RVIqJ+Jmg=
+github.com/gin-gonic/gin v1.9.1/go.mod h1:hPrL7YrpYKXt5YId3A/Tnip5kqbEAP+KLuI3SUcPTeU=
+github.com/go-playground/assert/v2 v2.2.0 h1:JvknZsQTYeFEAhQwI4qEt9cyV5ONwRHC+lYKSsYSR8s=
+github.com/go-playground/assert/v2 v2.2.0/go.mod h1:VDjEfimB/XKnb+ZQfWdccd7VUvScMdVu0Titje2rxJ4=
+github.com/go-playground/locales v0.14.1 h1:EWaQ/wswjilfKLTECiXz7Rh+3BjFhfDFKv/oXslEjJA=
+github.com/go-playground/locales v0.14.1/go.mod h1:hxrqLVvrK65+Rwrd5Fc6F2O76J/NuW9t0sjnWqG1slY=
+github.com/go-playground/universal-translator v0.18.1 h1:Bcnm0ZwsGyWbCzImXv+pAJnYK9S473LQFuzCbDbfSFY=
+github.com/go-playground/universal-translator v0.18.1/go.mod h1:xekY+UJKNuX9WP91TpwSH2VMlDf28Uj24BCp08ZFTUY=
+github.com/go-playground/validator/v10 v10.14.0 h1:vgvQWe3XCz3gIeFDm/HnTIbj6UGmg/+t63MyGU2n5js=
+github.com/go-playground/validator/v10 v10.14.0/go.mod h1:9iXMNT7sEkjXb0I+enO7QXmzG6QCsPWY4zveKFVRSyU=
+github.com/goccy/go-json v0.10.2 h1:CrxCmQqYDkv1z7lO7Wbh2HN93uovUHgrECaO5ZrCXAU=
+github.com/goccy/go-json v0.10.2/go.mod h1:6MelG93GURQebXPDq3khkgXZkazVtN9CRI+MGFi0w8I=
+github.com/golang/protobuf v1.5.0/go.mod h1:FsONVRAS9T7sI+LIUmWTfcYkHO4aIWwzhcaSAoJOfIk=
+github.com/google/go-cmp v0.5.5 h1:Khx7svrCpmxxtHBq5j2mp/xVjsi8hQMfNLvJFAlrGgU=
+github.com/google/go-cmp v0.5.5/go.mod h1:v8dTdLbMG2kIc/vJvl+f65V22dbkXbowE6jgT/gNBxE=
+github.com/google/gofuzz v1.0.0/go.mod h1:dBl0BpW6vV/+mYPU4Po3pmUjxk6FQPldtuIdl/M65Eg=
+github.com/google/uuid v1.5.0 h1:1p67kYwdtXjb0gL0BPiP1Av9wiZPo5A8z2cWkTZ+eyU=
+github.com/google/uuid v1.5.0/go.mod h1:TIyPZe4MgqvfeYDBFedMoGGpEw/LqOeaOT+nhxU+yHo=
+github.com/joho/godotenv v1.5.1 h1:7eLL/+HRGLY0ldzfGMeQkb7vMd0as4CfYvUVzLqw0N0=
+github.com/joho/godotenv v1.5.1/go.mod h1:f4LDr5Voq0i2e/R5DDNOoa2zzDfwtkZa6DnEwAbqwq4=
+github.com/json-iterator/go v1.1.12 h1:PV8peI4a0ysnczrg+LtxykD8LfKY9ML6u2jnxaEnrnM=
+github.com/json-iterator/go v1.1.12/go.mod h1:e30LSqwooZae/UwlEbR2852Gd8hjQvJoHmT4TnhNGBo=
+github.com/klauspost/cpuid/v2 v2.0.9/go.mod h1:FInQzS24/EEf25PyTYn52gqo7WaD8xa0213Md/qVLRg=
+github.com/klauspost/cpuid/v2 v2.2.4 h1:acbojRNwl3o09bUq+yDCtZFc1aiwaAAxtcn8YkZXnvk=
+github.com/klauspost/cpuid/v2 v2.2.4/go.mod h1:RVVoqg1df56z8g3pUjL/3lE5UfnlrJX8tyFgg4nqhuY=
+github.com/leodido/go-urn v1.2.4 h1:XlAE/cm/ms7TE/VMVoduSpNBoyc2dOxHs5MZSwAN63Q=
+github.com/leodido/go-urn v1.2.4/go.mod h1:7ZrI8mTSeBSHl/UaRyKQW1qZeMgak41ANeCNaVckg+4=
+github.com/mattn/go-isatty v0.0.19 h1:JITubQf0MOLdlGRuRq+jtsDlekdYPia9ZFsB8h/APPA=
+github.com/mattn/go-isatty v0.0.19/go.mod h1:W+V8PltTTMOvKvAeJH7IuucS94S2C6jfK/D7dTCTo3Y=
+github.com/modern-go/concurrent v0.0.0-20180228061459-e0a39a4cb421/go.mod h1:6dJC0mAP4ikYIbvyc7fijjWJddQyLn8Ig3JB5CqoB9Q=
+github.com/modern-go/concurrent v0.0.0-20180306012644-bacd9c7ef1dd h1:TRLaZ9cD/w8PVh93nsPXa1VrQ6jlwL5oN8l14QlcNfg=
+github.com/modern-go/concurrent v0.0.0-20180306012644-bacd9c7ef1dd/go.mod h1:6dJC0mAP4ikYIbvyc7fijjWJddQyLn8Ig3JB5CqoB9Q=
+github.com/modern-go/reflect2 v1.0.2 h1:xBagoLtFs94CBntxluKeaWgTMpvLxC4ur3nMaC9Gz0M=
+github.com/modern-go/reflect2 v1.0.2/go.mod h1:yWuevngMOJpCy52FWWMvUC8ws7m/LJsjYzDa0/r8luk=
+github.com/pelletier/go-toml/v2 v2.0.8 h1:0ctb6s9mE31h0/lhu+J6OPmVeDxJn+kYnJc2jZR9tGQ=
+github.com/pelletier/go-toml/v2 v2.0.8/go.mod h1:vuYfssBdrU2XDZ9bYydBu6t+6a6PYNcZljzZR9VXg+4=
+github.com/pmezard/go-difflib v1.0.0 h1:4DBwDE0NGyQoBHbLQYPwSUPoCMWR5BEzIk/f1lZbAQM=
+github.com/pmezard/go-difflib v1.0.0/go.mod h1:iKH77koFhYxTK1pcRnkKkqfTogsbg7gZNVY4sRDYZ/4=
+github.com/stretchr/objx v0.1.0/go.mod h1:HFkY916IF+rwdDfMAkV7OtwuqBVzrE8GR6GFx+wExME=
+github.com/stretchr/objx v0.4.0/go.mod h1:YvHI0jy2hoMjB+UWwv71VJQ9isScKT/TqJzVSSt89Yw=
+github.com/stretchr/objx v0.5.0/go.mod h1:Yh+to48EsGEfYuaHDzXPcE3xhTkx73EhmCGUpEOglKo=
+github.com/stretchr/testify v1.3.0/go.mod h1:M5WIy9Dh21IEIfnGCwXGc5bZfKNJtfHm1UVUgZn+9EI=
+github.com/stretchr/testify v1.7.0/go.mod h1:6Fq8oRcR53rry900zMqJjRRixrwX3KX962/h/Wwjteg=
+github.com/stretchr/testify v1.7.1/go.mod h1:6Fq8oRcR53rry900zMqJjRRixrwX3KX962/h/Wwjteg=
+github.com/stretchr/testify v1.8.0/go.mod h1:yNjHg4UonilssWZ8iaSj1OCr/vHnekPRkoO+kdMU+MU=
+github.com/stretchr/testify v1.8.1/go.mod h1:w2LPCIKwWwSfY2zedu0+kehJoqGctiVI29o6fzry7u4=
+github.com/stretchr/testify v1.8.2/go.mod h1:w2LPCIKwWwSfY2zedu0+kehJoqGctiVI29o6fzry7u4=
+github.com/stretchr/testify v1.8.3 h1:RP3t2pwF7cMEbC1dqtB6poj3niw/9gnV4Cjg5oW5gtY=
+github.com/stretchr/testify v1.8.3/go.mod h1:sz/lmYIOXD/1dqDmKjjqLyZ2RngseejIcXlSw2iwfAo=
+github.com/twitchyliquid64/golang-asm v0.15.1 h1:SU5vSMR7hnwNxj24w34ZyCi/FmDZTkS4MhqMhdFk5YI=
+github.com/twitchyliquid64/golang-asm v0.15.1/go.mod h1:a1lVb/DtPvCB8fslRZhAngC2+aY1QWCk3Cedj/Gdt08=
+github.com/ugorji/go/codec v1.2.11 h1:BMaWp1Bb6fHwEtbplGBGJ498wD+LKlNSl25MjdZY4dU=
+github.com/ugorji/go/codec v1.2.11/go.mod h1:UNopzCgEMSXjBc6AOMqYvWC1ktqTAfzJZUZgYf6w6lg=
+golang.org/x/arch v0.0.0-20210923205945-b76863e36670/go.mod h1:5om86z9Hs0C8fWVUuoMHwpExlXzs5Tkyp9hOrfG7pp8=
+golang.org/x/arch v0.3.0 h1:02VY4/ZcO/gBOH6PUaoiptASxtXU10jazRCP865E97k=
+golang.org/x/arch v0.3.0/go.mod h1:5om86z9Hs0C8fWVUuoMHwpExlXzs5Tkyp9hOrfG7pp8=
+golang.org/x/crypto v0.9.0 h1:LF6fAI+IutBocDJ2OT0Q1g8plpYljMZ4+lty+dsqw3g=
+golang.org/x/crypto v0.9.0/go.mod h1:yrmDGqONDYtNj3tH8X9dzUun2m2lzPa9ngI6/RUPGR0=
+golang.org/x/net v0.10.0 h1:X2//UzNDwYmtCLn7To6G58Wr6f5ahEAQgKNzv9Y951M=
+golang.org/x/net v0.10.0/go.mod h1:0qNGK6F8kojg2nk9dLZ2mShWaEBan6FAoqfSigmmuDg=
+golang.org/x/sys v0.0.0-20220704084225-05e143d24a9e/go.mod h1:oPkhp1MJrh7nUepCBck5+mAzfO9JrbApNNgaTdGDITg=
+golang.org/x/sys v0.6.0/go.mod h1:oPkhp1MJrh7nUepCBck5+mAzfO9JrbApNNgaTdGDITg=
+golang.org/x/sys v0.8.0 h1:EBmGv8NaZBZTWvrbjNoL6HVt+IVy3QDQpJs7VRIw3tU=
+golang.org/x/sys v0.8.0/go.mod h1:oPkhp1MJrh7nUepCBck5+mAzfO9JrbApNNgaTdGDITg=
+golang.org/x/text v0.9.0 h1:2sjJmO8cDvYveuX97RDLsxlyUxLl+GHoLxBiRdHllBE=
+golang.org/x/text v0.9.0/go.mod h1:e1OnstbJyHTd6l/uOt8jFFHp6TRDWZR/bV3emEE/zU8=
+golang.org/x/xerrors v0.0.0-20191204190536-9bdfabe68543 h1:E7g+9GITq07hpfrRu66IVDexMakfv52eLZ2CXBWiKr4=
+golang.org/x/xerrors v0.0.0-20191204190536-9bdfabe68543/go.mod h1:I/5z698sn9Ka8TeJc9MKroUUfqBBauWjQqLJ2OPfmY0=
+google.golang.org/protobuf v1.26.0-rc.1/go.mod h1:jlhhOSvTdKEhbULTjvd4ARK9grFBp09yW+WbY/TyQbw=
+google.golang.org/protobuf v1.30.0 h1:kPPoIgf3TsEvrm0PFe15JQ+570QVxYzEvvHqChK+cng=
+google.golang.org/protobuf v1.30.0/go.mod h1:HV8QOd/L58Z+nl8r43ehVNZIU/HEI6OcFqwMG9pJV4I=
+gopkg.in/check.v1 v0.0.0-20161208181325-20d25e280405 h1:yhCVgyC4o1eVCa2tZl7eS0r+SDo693bJlVdllGtEeKM=
+gopkg.in/check.v1 v0.0.0-20161208181325-20d25e280405/go.mod h1:Co6ibVJAznAaIkqp8huTwlJQCZ016jof/cbN4VW5Yz0=
+gopkg.in/yaml.v3 v3.0.0-20200313102051-9f266ea9e77c/go.mod h1:K4uyk7z7BCEPqu6E+C64Yfv1cQ7kz7rIZviUmN+EgEM=
+gopkg.in/yaml.v3 v3.0.1 h1:fxVm/GzAzEWqLHuvctI91KS9hhNmmWOoWu0XTYJS7CA=
+gopkg.in/yaml.v3 v3.0.1/go.mod h1:K4uyk7z7BCEPqu6E+C64Yfv1cQ7kz7rIZviUmN+EgEM=
+rsc.io/pdf v0.1.1/go.mod h1:n8OzWcQ6Sp37PL01nO98y4iUCRdTGarVfzxY20ICaU4=

gunicorn.conf.py DELETED Viewed

@@ -1,81 +0,0 @@
-# Gunicorn配置文件
-import os
-# import multiprocessing
-# 服务器套接字
-bind = "0.0.0.0:7860"
-backlog = 2048
-# Worker进程
-workers = 2  # 推荐的worker数量
-worker_class = "gthread"  # 使用线程worker类
-threads = 4  # 每个worker的线程数
-worker_connections = 1000
-max_requests = 1000  # 每个worker处理的最大请求数，防止内存泄漏
-max_requests_jitter = 50  # 随机化max_requests，避免所有worker同时重启
-# 超时设置
-timeout = 120  # worker超时时间（秒）
-keepalive = 2  # keep-alive连接的超时时间
-# 日志
-loglevel = "info"
-accesslog = "-"  # 输出到stdout
-errorlog = "-"   # 输出到stderr
-access_log_format = '%(h)s %(l)s %(u)s %(t)s "%(r)s" %(s)s %(b)s "%(f)s" "%(a)s" %(D)s'
-# 进程命名
-proc_name = "ondemand2api"
-# 预加载应用
-preload_app = True
-# 临时目录
-tmp_upload_dir = None
-# 安全
-limit_request_line = 4094
-limit_request_fields = 100
-limit_request_field_size = 8190
-# 性能调优
-worker_tmp_dir = "/dev/shm"  # 使用内存文件系统作为临时目录（如果可用）
-# 环境变量配置覆盖
-if os.environ.get("GUNICORN_WORKERS"):
-    workers = int(os.environ.get("GUNICORN_WORKERS"))
-if os.environ.get("GUNICORN_THREADS"):
-    threads = int(os.environ.get("GUNICORN_THREADS"))
-if os.environ.get("GUNICORN_TIMEOUT"):
-    timeout = int(os.environ.get("GUNICORN_TIMEOUT"))
-# 钩子函数
-def on_starting(server):
-    server.log.info("服务器启动中...")
-def on_reload(server):
-    server.log.info("服务器重新加载中...")
-def when_ready(server):
-    server.log.info(f"服务器已就绪，监听 {bind}")
-    server.log.info(f"Workers: {workers}, Threads per worker: {threads}")
-def worker_int(worker):
-    worker.log.info("Worker收到INT或QUIT信号")
-def pre_fork(server, worker):
-    server.log.info(f"Worker {worker.pid} 即将启动")
-def post_fork(server, worker):
-    server.log.info(f"Worker {worker.pid} 已启动")
-def post_worker_init(worker):
-    worker.log.info(f"Worker {worker.pid} 初始化完成")
-def worker_abort(worker):
-    worker.log.info(f"Worker {worker.pid} 异常退出")
-def pre_exec(server):
-    server.log.info("服务器即将重新执行")

main.go ADDED Viewed

	@@ -0,0 +1,812 @@

+package main
+import (
+	"bufio"
+	"bytes"
+	"context"
+	"encoding/json"
+	"fmt"
+	"log"
+	"net/http"
+	"os"
+	"strconv"
+	"strings"
+	"sync"
+	"time"
+	"github.com/gin-gonic/gin"
+	"github.com/google/uuid"
+	"github.com/joho/godotenv"
+)
+// 配置常量
+const (
+	BadKeyRetryInterval = 600 * time.Second // 10分钟
+	SessionTimeout      = 600 * time.Second // 10分钟
+	DefaultPort         = 7860
+)
+// 全局变量
+var (
+	privateKey      string
+	ondemandAPIKeys []string
+	safeHeaders     = []string{"Authorization", "X-API-KEY"}
+	ondemandAPIBase = "https://api.on-demand.io/chat/v1"
+	defaultModel    = "predefined-openai-gpt4o"
+)
+// 模型映射
+var modelMap = map[string]string{
+	"o3-mini":         "predefined-openai-gpto3-mini",
+	"o4-mini":         "predefined-openai-gpto4-mini",
+	"gpt-4o":          "predefined-openai-gpt4o",
+	"gpt-4.1":         "predefined-openai-gpt4.1",
+	"gpt-4.1-mini":    "predefined-openai-gpt4.1-mini",
+	"gpt-4o-mini":     "predefined-openai-gpt4o-mini",
+	"deepseek-v3":     "predefined-deepseek-v3",
+	"deepseek-r1":     "predefined-deepseek-r1",
+	"claude-4-sonnet": "predefined-claude-4-sonnet",
+	"claude-4-opus":   "predefined-claude-4-opus",
+}
+// KeyStatus 表示API密钥的状态
+type KeyStatus struct {
+	Bad   bool      `json:"bad"`
+	BadTS time.Time `json:"bad_ts"`
+}
+// KeyManager 管理API密钥的轮换和状态
+type KeyManager struct {
+	keyList        []string
+	mu             sync.RWMutex
+	keyStatus      map[string]*KeyStatus
+	idx            int
+	currentKey     string
+	currentSession string
+	lastUsedTime   time.Time
+}
+// NewKeyManager 创建新的密钥管理器
+func NewKeyManager(keys []string) *KeyManager {
+	km := &KeyManager{
+		keyList:   make([]string, len(keys)),
+		keyStatus: make(map[string]*KeyStatus),
+	}
+	copy(km.keyList, keys)
+	for _, key := range keys {
+		km.keyStatus[key] = &KeyStatus{}
+	}
+	return km
+}
+// displayKey 显示密钥的简化版本
+func (km *KeyManager) displayKey(key string) string {
+	if len(key) <= 10 {
+		return key
+	}
+	return fmt.Sprintf("%s...%s", key[:6], key[len(key)-4:])
+}
+// Get 获取可用的API密钥
+func (km *KeyManager) Get() string {
+	km.mu.Lock()
+	defer km.mu.Unlock()
+	now := time.Now()
+	// 检查会话是否超时
+	if km.currentKey != "" && !km.lastUsedTime.IsZero() &&
+		now.Sub(km.lastUsedTime) > SessionTimeout {
+		log.Printf("【对话超时】上次使用时间: %s", km.lastUsedTime.Format("2006-01-02 15:04:05"))
+		log.Printf("【对话超时】当前时间: %s", now.Format("2006-01-02 15:04:05"))
+		log.Printf("【对话超时】超时%d分钟,切换新会话", int(SessionTimeout.Minutes()))
+		km.currentKey = ""
+		km.currentSession = ""
+	}
+	// 如果已有正在使用的key,继续使用
+	if km.currentKey != "" {
+		if !km.keyStatus[km.currentKey].Bad {
+			log.Printf("【对话请求】【继续使用API KEY: %s】【状态:正常】", km.displayKey(km.currentKey))
+			km.lastUsedTime = now
+			return km.currentKey
+		} else {
+			// 当前key已标记为异常,需要切换
+			km.currentKey = ""
+			km.currentSession = ""
+		}
+	}
+	// 选择新的key
+	total := len(km.keyList)
+	for i := 0; i < total; i++ {
+		key := km.keyList[km.idx]
+		km.idx = (km.idx + 1) % total
+		status := km.keyStatus[key]
+		if !status.Bad {
+			log.Printf("【对话请求】【使用新API KEY: %s】【状态:正常】", km.displayKey(key))
+			km.currentKey = key
+			km.currentSession = ""
+			km.lastUsedTime = now
+			return key
+		}
+		if status.Bad && !status.BadTS.IsZero() {
+			if now.Sub(status.BadTS) >= BadKeyRetryInterval {
+				log.Printf("【KEY自动尝试恢复】API KEY: %s 满足重试周期,标记为正常", km.displayKey(key))
+				status.Bad = false
+				status.BadTS = time.Time{}
+				km.currentKey = key
+				km.currentSession = ""
+				km.lastUsedTime = now
+				return key
+			}
+		}
+	}
+	// 所有密钥都不可用,强制重置
+	log.Printf("【警告】全部KEY已被禁用,强制选用第一个KEY继续尝试: %s", km.displayKey(km.keyList[0]))
+	for _, key := range km.keyList {
+		km.keyStatus[key].Bad = false
+		km.keyStatus[key].BadTS = time.Time{}
+	}
+	km.idx = 0
+	km.currentKey = km.keyList[0]
+	km.currentSession = ""
+	km.lastUsedTime = now
+	log.Printf("【对话请求】【使用API KEY: %s】【状态:强制尝试（全部异常）】", km.displayKey(km.currentKey))
+	return km.currentKey
+}
+// MarkBad 标记密钥为不可用
+func (km *KeyManager) MarkBad(key string) {
+	km.mu.Lock()
+	defer km.mu.Unlock()
+	if status, exists := km.keyStatus[key]; exists && !status.Bad {
+		log.Printf("【禁用KEY】API KEY: %s,接口返回无效（将在%d分钟后自动重试）",
+			km.displayKey(key), int(BadKeyRetryInterval.Minutes()))
+		status.Bad = true
+		status.BadTS = time.Now()
+		if km.currentKey == key {
+			km.currentKey = ""
+			km.currentSession = ""
+		}
+	}
+}
+// GetSession 获取或创建会话
+func (km *KeyManager) GetSession(ctx context.Context, apikey string) (string, error) {
+	km.mu.Lock()
+	defer km.mu.Unlock()
+	if km.currentSession == "" {
+		session, err := createSession(ctx, apikey, "", nil)
+		if err != nil {
+			log.Printf("【创建会话失败】错误: %v", err)
+			return "", err
+		}
+		km.currentSession = session
+		log.Printf("【创建新会话】SESSION ID: %s", km.currentSession)
+	}
+	km.lastUsedTime = time.Now()
+	return km.currentSession, nil
+}
+var keyManager *KeyManager
+// HTTP请求结构
+type ChatCompletionRequest struct {
+	Messages []Message `json:"messages"`
+	Model    string    `json:"model"`
+	Stream   bool      `json:"stream"`
+}
+type Message struct {
+	Role    string `json:"role"`
+	Content string `json:"content"`
+}
+type ChatCompletionResponse struct {
+	ID      string   `json:"id"`
+	Object  string   `json:"object"`
+	Created int64    `json:"created"`
+	Model   string   `json:"model"`
+	Choices []Choice `json:"choices"`
+	Usage   Usage    `json:"usage"`
+}
+type Choice struct {
+	Index        int      `json:"index"`
+	Message      *Message `json:"message,omitempty"`
+	Delta        *Message `json:"delta,omitempty"`
+	FinishReason *string  `json:"finish_reason"`
+}
+type Usage struct{}
+type ModelsResponse struct {
+	Object string  `json:"object"`
+	Data   []Model `json:"data"`
+}
+type Model struct {
+	ID      string `json:"id"`
+	Object  string `json:"object"`
+	OwnedBy string `json:"owned_by"`
+}
+// OnDemand API 结构
+type CreateSessionRequest struct {
+	ExternalUserID string   `json:"externalUserId"`
+	PluginIds      []string `json:"pluginIds,omitempty"`
+}
+type CreateSessionResponse struct {
+	Data struct {
+		ID string `json:"id"`
+	} `json:"data"`
+}
+type QueryRequest struct {
+	Query        string   `json:"query"`
+	EndpointID   string   `json:"endpointId"`
+	PluginIds    []string `json:"pluginIds"`
+	ResponseMode string   `json:"responseMode"`
+}
+type QueryResponse struct {
+	Data struct {
+		Answer string `json:"answer"`
+	} `json:"data"`
+}
+// 初始化配置
+func init() {
+	// 加载 .env 文件
+	err := godotenv.Load()
+	if err != nil {
+		log.Println("警告:没有找到 .env 文件,将仅使用系统环境变量")
+	}
+	initConfig()
+}
+func initConfig() {
+	privateKey = getEnv("PRIVATE_KEY", "testofli")
+	apiKeysStr := os.Getenv("ONDEMAND_APIKEYS")
+	if apiKeysStr != "" {
+		ondemandAPIKeys = strings.Split(apiKeysStr, ",")
+	}
+	if len(ondemandAPIKeys) == 0 && !isTestMode() {
+		log.Fatal("ONDEMAND_APIKEYS 环境变量为空,请设置API密钥")
+	}
+	if len(ondemandAPIKeys) > 0 {
+		keyManager = NewKeyManager(ondemandAPIKeys)
+	}
+}
+func isTestMode() bool {
+	for _, arg := range os.Args {
+		if strings.Contains(arg, "test") {
+			return true
+		}
+	}
+	return os.Getenv("GIN_MODE") == "test"
+}
+func getEnv(key, defaultValue string) string {
+	if value := os.Getenv(key); value != "" {
+		return value
+	}
+	return defaultValue
+}
+// 权限检查中间件
+func checkPrivateKey() gin.HandlerFunc {
+	return func(c *gin.Context) {
+		// 放宽部分接口
+		if c.Request.URL.Path == "/" || c.Request.URL.Path == "/favicon.ico" {
+			c.Next()
+			return
+		}
+		var key string
+		for _, header := range safeHeaders {
+			if value := c.GetHeader(header); value != "" {
+				key = value
+				if header == "Authorization" && strings.HasPrefix(value, "Bearer ") {
+					key = strings.TrimSpace(value[7:])
+				}
+				break
+			}
+		}
+		if key == "" || key != privateKey {
+			c.JSON(http.StatusUnauthorized, gin.H{
+				"error":   "Unauthorized, must provide correct Authorization or X-API-KEY",
+				"headers": c.Request.Header,
+			})
+			c.Abort()
+			return
+		}
+		c.Next()
+	}
+}
+// 获取端点ID
+func getEndpointID(openaiModel string) string {
+	model := strings.ToLower(strings.ReplaceAll(openaiModel, " ", ""))
+	if endpoint, exists := modelMap[model]; exists {
+		return endpoint
+	}
+	return defaultModel
+}
+// 创建会话
+func createSession(ctx context.Context, apikey, externalUserID string, pluginIds []string) (string, error) {
+	if externalUserID == "" {
+		externalUserID = uuid.New().String()
+	}
+	payload := CreateSessionRequest{
+		ExternalUserID: externalUserID,
+		PluginIds:      pluginIds,
+	}
+	jsonData, err := json.Marshal(payload)
+	if err != nil {
+		return "", err
+	}
+	req, err := http.NewRequestWithContext(ctx, "POST", ondemandAPIBase+"/sessions", bytes.NewBuffer(jsonData))
+	if err != nil {
+		return "", err
+	}
+	req.Header.Set("apikey", apikey)
+	req.Header.Set("Content-Type", "application/json")
+	client := &http.Client{Timeout: 20 * time.Second}
+	resp, err := client.Do(req)
+	if err != nil {
+		return "", err
+	}
+	defer resp.Body.Close()
+	if resp.StatusCode != http.StatusOK && resp.StatusCode != http.StatusCreated {
+		return "", fmt.Errorf("create session failed with status: %d", resp.StatusCode)
+	}
+	var sessionResp CreateSessionResponse
+	if err := json.NewDecoder(resp.Body).Decode(&sessionResp); err != nil {
+		return "", err
+	}
+	return sessionResp.Data.ID, nil
+}
+// 执行带重试的操作
+func withValidKey(ctx context.Context, fn func(ctx context.Context, key string) (interface{}, error)) (interface{}, error) {
+	badCount := 0
+	maxRetry := len(keyManager.keyList) * 2
+	for badCount < maxRetry {
+		key := keyManager.Get()
+		result, err := fn(ctx, key)
+		if err != nil {
+			// 检查是否是需要标记密钥为坏的错误
+			if isAuthError(err) {
+				keyManager.MarkBad(key)
+				badCount++
+				continue
+			}
+			return nil, err
+		}
+		return result, nil
+	}
+	return nil, fmt.Errorf("没有可用API KEY,请补充新KEY或联系技术支持")
+}
+// 检查是否是认证相关错误
+func isAuthError(err error) bool {
+	errStr := err.Error()
+	return strings.Contains(errStr, "401") ||
+		strings.Contains(errStr, "403") ||
+		strings.Contains(errStr, "429") ||
+		strings.Contains(errStr, "500")
+}
+// 聊天完成接口
+func chatCompletions(c *gin.Context) {
+	var req ChatCompletionRequest
+	if err := c.ShouldBindJSON(&req); err != nil {
+		c.JSON(http.StatusBadRequest, gin.H{"error": "请求缺少messages字段"})
+		return
+	}
+	if len(req.Messages) == 0 {
+		c.JSON(http.StatusBadRequest, gin.H{"error": "请求缺少messages字段"})
+		return
+	}
+	// 获取用户消息
+	var userMsg string
+	for i := len(req.Messages) - 1; i >= 0; i-- {
+		if req.Messages[i].Role == "user" {
+			userMsg = req.Messages[i].Content
+			break
+		}
+	}
+	if userMsg == "" {
+		c.JSON(http.StatusBadRequest, gin.H{"error": "未找到用户消息"})
+		return
+	}
+	endpointID := getEndpointID(req.Model)
+	// 添加模型和端点的日志记录
+	log.Printf("【模型请求】模型: %s, 端点: %s, 流式: %t", req.Model, endpointID, req.Stream)
+	if req.Stream {
+		handleStreamResponse(c, userMsg, endpointID, req.Model)
+	} else {
+		handleNonStreamResponse(c, userMsg, endpointID, req.Model)
+	}
+}
+// 处理流式响应
+func handleStreamResponse(c *gin.Context, userMsg, endpointID, model string) {
+	c.Header("Content-Type", "text/event-stream")
+	c.Header("Cache-Control", "no-cache")
+	c.Header("Connection", "keep-alive")
+	// 使用channel进行异步处理
+	resultChan := make(chan string, 100)
+	errorChan := make(chan error, 1)
+	go func() {
+		defer close(resultChan)
+		defer close(errorChan)
+		ctx := context.Background()
+		result, err := withValidKey(ctx, func(ctx context.Context, apikey string) (interface{}, error) {
+			return streamQuery(ctx, apikey, userMsg, endpointID, model, resultChan)
+		})
+		if err != nil {
+			errorChan <- err
+			return
+		}
+		_ = result // 流式响应的结果通过channel传递
+	}()
+	// 处理响应流
+	for {
+		select {
+		case chunk, ok := <-resultChan:
+			if !ok {
+				return
+			}
+			if chunk == "data: [DONE]" {
+				_, _ = fmt.Fprintf(c.Writer, "data: [DONE]\n\n")
+				c.Writer.Flush()
+				return
+			}
+			_, _ = fmt.Fprintf(c.Writer, "data: %s\n\n", chunk)
+			c.Writer.Flush()
+		case err := <-errorChan:
+			if err != nil {
+				errorData := map[string]any{"error": err.Error()}
+				errorJSON, _ := json.Marshal(errorData)
+				_, _ = fmt.Fprintf(c.Writer, "data: %s\n\n", string(errorJSON))
+				c.Writer.Flush()
+			}
+			return
+		case <-c.Request.Context().Done():
+			return
+		}
+	}
+}
+// 流式查询
+func streamQuery(ctx context.Context, apikey, userMsg, endpointID, model string, resultChan chan<- string) (interface{}, error) {
+	sessionID, err := keyManager.GetSession(ctx, apikey)
+	if err != nil {
+		return nil, err
+	}
+	payload := QueryRequest{
+		Query:        userMsg,
+		EndpointID:   endpointID,
+		PluginIds:    []string{},
+		ResponseMode: "stream",
+	}
+	jsonData, err := json.Marshal(payload)
+	if err != nil {
+		return nil, err
+	}
+	req, err := http.NewRequestWithContext(ctx, "POST",
+		fmt.Sprintf("%s/sessions/%s/query", ondemandAPIBase, sessionID),
+		bytes.NewBuffer(jsonData))
+	if err != nil {
+		return nil, err
+	}
+	req.Header.Set("apikey", apikey)
+	req.Header.Set("Content-Type", "application/json")
+	req.Header.Set("Accept", "text/event-stream")
+	client := &http.Client{Timeout: 300 * time.Second}
+	resp, err := client.Do(req)
+	if err != nil {
+		return nil, err
+	}
+	defer resp.Body.Close()
+	if resp.StatusCode != http.StatusOK {
+		return nil, fmt.Errorf("stream query failed with status: %d", resp.StatusCode)
+	}
+	scanner := bufio.NewScanner(resp.Body)
+	firstChunk := true
+	for scanner.Scan() {
+		line := scanner.Text()
+		if !strings.HasPrefix(line, "data:") {
+			continue
+		}
+		dataPart := strings.TrimSpace(line[5:])
+		if dataPart == "[DONE]" {
+			resultChan <- "data: [DONE]"
+			break
+		}
+		if strings.HasPrefix(dataPart, "[ERROR]:") {
+			errJSON := strings.TrimSpace(dataPart[8:])
+			resultChan <- fmt.Sprintf(`{"error": "%s"}`, errJSON)
+			break
+		}
+		var eventData map[string]any
+		if err := json.Unmarshal([]byte(dataPart), &eventData); err != nil {
+			continue
+		}
+		// 处理不同类型的事件
+		if eventType, ok := eventData["eventType"].(string); ok {
+			var content string
+			var hasContent bool
+			switch eventType {
+			case "fulfillment":
+				if answer, ok := eventData["answer"].(string); ok {
+					content = answer
+					hasContent = true
+				}
+			case "stream", "thinking", "reasoning", "thoughts": // 可能的思考过程事件类型
+				if answer, ok := eventData["answer"].(string); ok {
+					content = answer
+					hasContent = true
+				} else if text, ok := eventData["text"].(string); ok {
+					content = text
+					hasContent = true
+				} else if data, ok := eventData["data"].(string); ok {
+					content = data
+					hasContent = true
+				} else if thoughts, ok := eventData["thoughts"].(string); ok {
+					content = thoughts
+					hasContent = true
+				}
+			default:
+				// 对于未知事件类型,尝试提取任何文本内容
+				if answer, ok := eventData["answer"].(string); ok {
+					content = answer
+					hasContent = true
+				} else if text, ok := eventData["text"].(string); ok {
+					content = text
+					hasContent = true
+				} else if thoughts, ok := eventData["thoughts"].(string); ok {
+					content = thoughts
+					hasContent = true
+				}
+			}
+			if hasContent {
+				chunk := ChatCompletionResponse{
+					ID:      "chatcmpl-" + uuid.New().String()[:8],
+					Object:  "chat.completion.chunk",
+					Created: time.Now().Unix(),
+					Model:   model,
+					Choices: []Choice{{
+						Index: 0,
+						Delta: &Message{
+							Role: func() string {
+								if firstChunk {
+									return "assistant"
+								} else {
+									return ""
+								}
+							}(),
+							Content: content,
+						},
+						FinishReason: nil,
+					}},
+				}
+				chunkJSON, _ := json.Marshal(chunk)
+				resultChan <- string(chunkJSON)
+				firstChunk = false
+			}
+		}
+	}
+	if err := scanner.Err(); err != nil {
+		return nil, err
+	}
+	return nil, nil
+}
+// 处理非流式响应
+func handleNonStreamResponse(c *gin.Context, userMsg, endpointID, model string) {
+	ctx := c.Request.Context()
+	result, err := withValidKey(ctx, func(ctx context.Context, apikey string) (any, error) {
+		return nonStreamQuery(ctx, apikey, userMsg, endpointID, model)
+	})
+	if err != nil {
+		c.JSON(http.StatusInternalServerError, gin.H{"error": err.Error()})
+		return
+	}
+	c.JSON(http.StatusOK, result)
+}
+// 非流式查询
+func nonStreamQuery(ctx context.Context, apikey, userMsg, endpointID, model string) (any, error) {
+	sessionID, err := keyManager.GetSession(ctx, apikey)
+	if err != nil {
+		return nil, err
+	}
+	payload := QueryRequest{
+		Query:        userMsg,
+		EndpointID:   endpointID,
+		PluginIds:    []string{},
+		ResponseMode: "sync",
+	}
+	jsonData, err := json.Marshal(payload)
+	if err != nil {
+		return nil, err
+	}
+	req, err := http.NewRequestWithContext(ctx, "POST",
+		fmt.Sprintf("%s/sessions/%s/query", ondemandAPIBase, sessionID),
+		bytes.NewBuffer(jsonData))
+	if err != nil {
+		return nil, err
+	}
+	req.Header.Set("apikey", apikey)
+	req.Header.Set("Content-Type", "application/json")
+	client := &http.Client{Timeout: 300 * time.Second}
+	resp, err := client.Do(req)
+	if err != nil {
+		return nil, err
+	}
+	defer resp.Body.Close()
+	if resp.StatusCode != http.StatusOK {
+		return nil, fmt.Errorf("non-stream query failed with status: %d", resp.StatusCode)
+	}
+	var queryResp QueryResponse
+	if err := json.NewDecoder(resp.Body).Decode(&queryResp); err != nil {
+		return nil, err
+	}
+	content := queryResp.Data.Answer
+	response := ChatCompletionResponse{
+		ID:      "chatcmpl-" + uuid.New().String()[:8],
+		Object:  "chat.completion",
+		Created: time.Now().Unix(),
+		Model:   model,
+		Choices: []Choice{{
+			Index: 0,
+			Message: &Message{
+				Role:    "assistant",
+				Content: content,
+			},
+			FinishReason: func() *string { s := "stop"; return &s }(),
+		}},
+		Usage: Usage{},
+	}
+	return response, nil
+}
+// 模型列表接口
+func models(c *gin.Context) {
+	var modelList []Model
+	for modelID := range modelMap {
+		modelList = append(modelList, Model{
+			ID:      modelID,
+			Object:  "model",
+			OwnedBy: "ondemand-proxy",
+		})
+	}
+	response := ModelsResponse{
+		Object: "list",
+		Data:   modelList,
+	}
+	c.JSON(http.StatusOK, response)
+}
+// 健康检查接口
+func health(c *gin.Context) {
+	c.JSON(http.StatusOK, gin.H{
+		"status": "ok",
+		"keys":   len(ondemandAPIKeys),
+	})
+}
+func main() {
+	// 设置日志格式
+	log.SetFlags(log.LstdFlags | log.Lshortfile)
+	// 设置Gin模式
+	if os.Getenv("GIN_MODE") == "" {
+		gin.SetMode(gin.ReleaseMode)
+	}
+	router := gin.New()
+	// 中间件
+	router.Use(gin.Logger())
+	router.Use(gin.Recovery())
+	router.Use(checkPrivateKey())
+	// 路由
+	router.GET("/", health)
+	router.POST("/v1/chat/completions", chatCompletions)
+	router.GET("/v1/models", models)
+	// 获取端口
+	port := DefaultPort
+	if portStr := os.Getenv("PORT"); portStr != "" {
+		if p, err := strconv.Atoi(portStr); err == nil {
+			port = p
+		}
+	}
+	log.Printf("======== OnDemand KEY池数量:%d ========", len(ondemandAPIKeys))
+	log.Printf("服务器启动在端口:%d", port)
+	// 启动服务器
+	if err := router.Run(fmt.Sprintf(":%d", port)); err != nil {
+		log.Fatal("启动服务器失败:", err)
+	}
+}

openai_ondemand_adapter.py DELETED Viewed

@@ -1,325 +0,0 @@
-from flask import Flask, request, Response, jsonify
-import requests
-import uuid
-import time
-import json
-import threading
-import logging
-import os
-# ====== 读取 Huggingface Secret 配置的私有key =======
-PRIVATE_KEY = os.environ.get("PRIVATE_KEY", "") or "testofli"
-SAFE_HEADERS = ["Authorization", "X-API-KEY"]
-# 全局接口访问权限检查
-def check_private_key():
-    # 可以在这里放宽部分接口，比如首页等
-    if request.path in ["/", "/favicon.ico"]:
-        return
-    key = None
-    for header in SAFE_HEADERS:
-        key = request.headers.get(header)
-        if key:
-            if header == "Authorization" and key.startswith("Bearer "):
-                key = key[len("Bearer "):].strip()
-            break
-    if not key or key != PRIVATE_KEY:
-        return jsonify({
-            "error": "Unauthorized, must provide correct Authorization or X-API-KEY",
-            "headers": dict(request.headers)
-        }), 401
-# 应用所有API鉴权
-app = Flask(__name__)
-app.before_request(check_private_key)
-# ========== KEY池（每行一个）==========
-ONDEMAND_APIKEYS = os.environ.get("ONDEMAND_APIKEYS", "").split(",") if os.environ.get("ONDEMAND_APIKEYS") else []
-BAD_KEY_RETRY_INTERVAL = 600 # 秒
-SESSION_TIMEOUT = 600  # 对话超时时间（10分钟）
-# ========== OnDemand模型映射 ==========
-MODEL_MAP = {
-    "o3": "predefined-openai-gpto3",
-    "o3-mini":"predefined-openai-gpto3-mini",
-    "o4-mini":"predefined-openai-gpto4-mini",
-    "gpt-4o": "predefined-openai-gpt4o",
-    "gpt-4.1": "predefined-openai-gpt4.1",
-    "gpt-4.1-mini": "predefined-openai-gpt4.1-mini",
-    "gpt-4o-mini": "predefined-openai-gpt4o-mini",
-    "deepseek-v3": "predefined-deepseek-v3",
-    "deepseek-r1": "predefined-deepseek-r1",
-    "gemini-2.5-pro":"predefined-gemini-2.5-pro-preview",
-    "gemini-2.5-flash":"predefined-gemini-2.5-flash",
-    "claude-4-sonnet": "predefined-claude-4-sonnet",
-    "claude-4-opus": "predefined-claude-4-opus"
-}
-DEFAULT_ONDEMAND_MODEL = "predefined-openai-gpt4o"
-# ==========================================
-class KeyManager:
-    def __init__(self, key_list):
-        self.key_list = list(key_list)
-        self.lock = threading.Lock()
-        self.key_status = {k: {"bad": False, "bad_ts": None} for k in self.key_list}
-        self.idx = 0
-        # 新增：当前正在使用的key和session
-        self.current_key = None
-        self.current_session = None
-        self.last_used_time = None
-    def display_key(self, key):
-        return f"{key[:6]}...{key[-4:]}"
-    def get(self):
-        with self.lock:
-            now = time.time()
-            # 检查对话是否超时
-            if self.current_key and self.last_used_time and (now - self.last_used_time > SESSION_TIMEOUT):
-                print(f"【对话超时】上次使用时间: {time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(self.last_used_time))}")
-                print(f"【对话超时】当前时间: {time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(now))}")
-                print(f"【对话超时】超时{SESSION_TIMEOUT//60}分钟，切换新会话")
-                self.current_key = None
-                self.current_session = None
-            # 如果已有正在使用的key，继续使用
-            if self.current_key:
-                if not self.key_status[self.current_key]["bad"]:
-                    print(f"【对话请求】【继续使用API KEY: {self.display_key(self.current_key)}】【状态：正常】")
-                    self.last_used_time = now
-                    return self.current_key
-                else:
-                    # 当前key已标记为异常，需要切换
-                    self.current_key = None
-                    self.current_session = None
-            # 如果没有当前key或当前key无效，选择新的key
-            total = len(self.key_list)
-            for _ in range(total):
-                key = self.key_list[self.idx]
-                self.idx = (self.idx + 1) % total
-                s = self.key_status[key]
-                if not s["bad"]:
-                    print(f"【对话请求】【使用新API KEY: {self.display_key(key)}】【状态：正常】")
-                    self.current_key = key
-                    self.current_session = None  # 强制创建新会话
-                    self.last_used_time = now
-                    return key
-                if s["bad"] and s["bad_ts"]:
-                    ago = now - s["bad_ts"]
-                    if ago >= BAD_KEY_RETRY_INTERVAL:
-                        print(f"【KEY自动尝试恢复】API KEY: {self.display_key(key)} 满足重试周期，标记为正常")
-                        self.key_status[key]["bad"] = False
-                        self.key_status[key]["bad_ts"] = None
-                        self.current_key = key
-                        self.current_session = None  # 强制创建新会话
-                        self.last_used_time = now
-                        return key
-            print("【警告】全部KEY已被禁用，强制选用第一个KEY继续尝试:", self.display_key(self.key_list[0]))
-            for k in self.key_list:
-                self.key_status[k]["bad"] = False
-                self.key_status[k]["bad_ts"] = None
-            self.idx = 0
-            self.current_key = self.key_list[0]
-            self.current_session = None  # 强制创建新会话
-            self.last_used_time = now
-            print(f"【对话请求】【使用API KEY: {self.display_key(self.current_key)}】【状态：强制尝试（全部异常）】")
-            return self.current_key
-    def mark_bad(self, key):
-        with self.lock:
-            if key in self.key_status and not self.key_status[key]["bad"]:
-                print(f"【禁用KEY】API KEY: {self.display_key(key)}，接口返回无效（将在{BAD_KEY_RETRY_INTERVAL//60}分钟后自动重试）")
-                self.key_status[key]["bad"] = True
-                self.key_status[key]["bad_ts"] = time.time()
-                if self.current_key == key:
-                    self.current_key = None
-                    self.current_session = None
-    def get_session(self, apikey):
-        with self.lock:
-            if not self.current_session:
-                try:
-                    self.current_session = create_session(apikey)
-                    print(f"【创建新会话】SESSION ID: {self.current_session}")
-                except Exception as e:
-                    print(f"【创建会话失败】错误: {str(e)}")
-                    raise
-            self.last_used_time = time.time()
-            return self.current_session
-keymgr = KeyManager(ONDEMAND_APIKEYS)
-ONDEMAND_API_BASE = "https://api.on-demand.io/chat/v1"
-def get_endpoint_id(openai_model):
-    m = str(openai_model or "").lower().replace(" ", "")
-    return MODEL_MAP.get(m, DEFAULT_ONDEMAND_MODEL)
-def create_session(apikey, external_user_id=None, plugin_ids=None):
-    url = f"{ONDEMAND_API_BASE}/sessions"
-    payload = {"externalUserId": external_user_id or str(uuid.uuid4())}
-    if plugin_ids is not None:
-        payload["pluginIds"] = plugin_ids
-    headers = {"apikey": apikey, "Content-Type": "application/json"}
-    resp = requests.post(url, json=payload, headers=headers, timeout=20)
-    resp.raise_for_status()
-    return resp.json()["data"]["id"]
-def format_openai_sse_delta(chunk_str):
-    return f"data: {json.dumps(chunk_str, ensure_ascii=False)}\n\n"
-@app.route("/v1/chat/completions", methods=["POST"])
-def chat_completions():
-    data = request.json
-    if not data or "messages" not in data:
-        return jsonify({"error": "请求缺少messages字段"}), 400
-    messages = data["messages"]
-    openai_model = data.get("model", "gpt-4o")
-    endpoint_id = get_endpoint_id(openai_model)
-    is_stream = bool(data.get("stream", False))
-    user_msg = None
-    for msg in reversed(messages):
-        if msg.get("role") == "user":
-            user_msg = msg.get("content")
-            break
-    if user_msg is None:
-        return jsonify({"error": "未找到用户消息"}), 400
-    def with_valid_key(func):
-        bad_cnt = 0
-        max_retry = len(keymgr.key_list)*2
-        while bad_cnt < max_retry:
-            key = keymgr.get()
-            try:
-                return func(key)
-            except Exception as e:
-                if hasattr(e, 'response'):
-                    r = e.response
-                    if r.status_code in (401, 403, 429, 500):
-                        keymgr.mark_bad(key)
-                        bad_cnt += 1
-                        continue
-                raise
-        return jsonify({"error": "没有可用API KEY，请补充新KEY或联系技术支持"}), 500
-    if is_stream:
-        def generate():
-            def do_once(apikey):
-                # 使用KeyManager获取或创建session
-                sid = keymgr.get_session(apikey)
-                url = f"{ONDEMAND_API_BASE}/sessions/{sid}/query"
-                payload = {
-                    "query": user_msg,
-                    "endpointId": endpoint_id,
-                    "pluginIds": [],
-                    "responseMode": "stream"
-                }
-                headers = {"apikey": apikey, "Content-Type": "application/json", "Accept": "text/event-stream"}
-                with requests.post(url, json=payload, headers=headers, stream=True, timeout=120) as resp:
-                    if resp.status_code != 200:
-                        raise requests.HTTPError(response=resp)
-                    answer_acc = ""
-                    first_chunk = True
-                    for line in resp.iter_lines():
-                        if not line:
-                            continue
-                        line = line.decode("utf-8")
-                        if line.startswith("data:"):
-                            datapart = line[5:].strip()
-                            if datapart == "[DONE]":
-                                yield "data: [DONE]\n\n"
-                                break
-                            elif datapart.startswith("[ERROR]:"):
-                                err_json = datapart[len("[ERROR]:"):].strip()
-                                yield format_openai_sse_delta({"error": err_json})
-                                break
-                            else:
-                                try:
-                                    js = json.loads(datapart)
-                                except Exception:
-                                    continue
-                                if js.get("eventType") == "fulfillment":
-                                    delta = js.get("answer", "")
-                                    answer_acc += delta
-                                    chunk = {
-                                        "id": "chatcmpl-" + str(uuid.uuid4())[:8],
-                                        "object": "chat.completion.chunk",
-                                        "created": int(time.time()),
-                                        "model": openai_model,
-                                        "choices": [{
-                                            "delta": {
-                                                "role": "assistant",
-                                                "content": delta
-                                            } if first_chunk else {
-                                                "content": delta
-                                            },
-                                            "index": 0,
-                                            "finish_reason": None
-                                        }]
-                                    }
-                                    yield format_openai_sse_delta(chunk)
-                                    first_chunk = False
-                    yield "data: [DONE]\n\n"
-            yield from with_valid_key(do_once)
-        return Response(generate(), content_type='text/event-stream')
-    def nonstream(apikey):
-        # 使用KeyManager获取或创建session
-        sid = keymgr.get_session(apikey)
-        url = f"{ONDEMAND_API_BASE}/sessions/{sid}/query"
-        payload = {
-            "query": user_msg,
-            "endpointId": endpoint_id,
-            "pluginIds": [],
-            "responseMode": "sync"
-        }
-        headers = {"apikey": apikey, "Content-Type": "application/json"}
-        resp = requests.post(url, json=payload, headers=headers, timeout=120)
-        if resp.status_code != 200:
-            raise requests.HTTPError(response=resp)
-        ai_response = resp.json()["data"]["answer"]
-        resp_obj = {
-            "id": "chatcmpl-" + str(uuid.uuid4())[:8],
-            "object": "chat.completion",
-            "created": int(time.time()),
-            "model": openai_model,
-            "choices": [
-                {
-                    "index": 0,
-                    "message": {"role": "assistant", "content": ai_response},
-                    "finish_reason": "stop"
-                }
-            ],
-            "usage": {}
-        }
-        return jsonify(resp_obj)
-    return with_valid_key(nonstream)
-@app.route("/v1/models", methods=["GET"])
-def models():
-    model_objs = []
-    for mdl in MODEL_MAP.keys():
-        model_objs.append({
-            "id": mdl,
-            "object": "model",
-            "owned_by": "ondemand-proxy"
-        })
-    uniq = {m["id"]: m for m in model_objs}.values()
-    return jsonify({
-        "object": "list",
-        "data": list(uniq)
-    })
-if __name__ == "__main__":
-    log_fmt = '[%(asctime)s] %(levelname)s: %(message)s'
-    logging.basicConfig(level=logging.INFO, format=log_fmt)
-    print("======== OnDemand KEY池数量：", len(ONDEMAND_APIKEYS), "========")
-    app.run(host="0.0.0.0", port=7860, debug=False)

requirements.txt DELETED Viewed

@@ -1,3 +0,0 @@
-Flask
-requests
-gunicorn