oapi

Paused

App Files Files Community

sehsapneb commited on Aug 6, 2025

Commit

b7de6d6

verified ·

1 Parent(s): a920e80

Update app.py

Browse files

Files changed (1) hide show

app.py +19 -51

app.py CHANGED Viewed

@@ -4,10 +4,10 @@ import uuid
 import time
 from flask import Flask, request, jsonify, Response
-# --- 1. 初始化Flask应用 ---
 app = Flask(__name__)
-# --- 2. gpt-oss.com API的固定配置 (来自我们之前的分析) ---
 GPT_OSS_API_URL = "https://api.gpt-oss.com/chatkit"
 GPT_OSS_HEADERS = {
     'authority': 'api.gpt-oss.com',
@@ -16,48 +16,42 @@ GPT_OSS_HEADERS = {
     'origin': 'https://gpt-oss.com',
     'referer': 'https://gpt-oss.com/',
     'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36',
-    'x-selected-model': 'gpt-oss-120b', # 模型可以在此硬编码，或后续从请求中动态获取
 }
-# --- 3. 核心：创建OpenAI兼容的API端点 ---
 @app.route('/v1/chat/completions', methods=['POST'])
 def chat_completions_proxy():
-    """
-    这个端点模仿OpenAI的 `/v1/chat/completions` 接口。
-    它接收OpenAI格式的请求，然后代理到gpt-oss.com。
-    """
-    # 按照要求，我们不验证API Key。可以直接忽略 request.headers['Authorization']。
-    # (一) 解析客户端发来的OpenAI格式请求
     try:
         openai_request_data = request.json
-        # 从消息列表中找到用户最新的提问，作为我们的提示词
         messages = openai_request_data.get("messages", [])
         user_prompt = next((m['content'] for m in reversed(messages) if m.get('role') == 'user'), None)
         if not user_prompt:
             return jsonify({"error": "在请求中未找到用户消息。"}), 400
-        # 检查客户端是否请求了流式响应
         stream_requested = openai_request_data.get("stream", False)
     except Exception as e:
         return jsonify({"error": f"请求格式无效: {e}"}), 400
-    # (二) 准备发往 gpt-oss.com API 的请求
-    # 为每个独立的对话生成一个全新的随机user_id
     random_user_id = str(uuid.uuid4())
     gpt_oss_cookies = {'user_id': random_user_id}
-    # 构建gpt-oss服务需要的特殊Payload
     gpt_oss_payload = {
         "op": "threads.create",
         "params": {"input": {"text": user_prompt, "content": [{"type": "input_text", "text": user_prompt}]}}
     }
-    # (三) 定义一个“生成器”函数，用于处理和转换流式数据
     def generate_stream():
         try:
-            # 向真正的后端服务发起流式请求
             with requests.post(
                 GPT_OSS_API_URL,
                 headers=GPT_OSS_HEADERS,
@@ -66,9 +60,8 @@ def chat_completions_proxy():
                 stream=True,
                 timeout=120
             ) as response:
-                response.raise_for_status() # 如果状态码不是2xx，则抛出异常
-                # (四) 核心翻译逻辑：逐行读取gpt-oss的响应，并转换为OpenAI格式
                 for line in response.iter_lines():
                     if line:
                         line_str = line.decode('utf-8')
@@ -77,59 +70,34 @@ def chat_completions_proxy():
                             try:
                                 gpt_oss_data = json.loads(json_data_str)
-                                # 我们只关心包含文本片段的事件
                                 event_type = gpt_oss_data.get('type')
                                 if (event_type == 'thread.item_updated' and
                                     gpt_oss_data.get('update', {}).get('type') == 'assistant_message.content_part.text_delta'):
                                     delta_content = gpt_oss_data['update'].get('delta', '')
-                                    # 构建一个OpenAI流式响应的JSON块
                                     openai_chunk = {
                                         "id": f"chatcmpl-{str(uuid.uuid4())}",
                                         "object": "chat.completion.chunk",
                                         "created": int(time.time()),
                                         "model": "gpt-oss-120b",
-                                        "choices": [
-                                            {
-                                                "index": 0,
-                                                "delta": {
-                                                    "content": delta_content
-                                                },
-                                                "finish_reason": None
-                                            }
-                                        ]
                                     }
-                                    # 使用SSE（服务器发送事件）格式 yield 出去
                                     yield f"data: {json.dumps(openai_chunk)}\n\n"
                             except json.JSONDecodeError:
-                                continue # 忽略无法解析的行
-                # (五) 流式传输结束后，发送一个表示结束的特殊标记
                 yield "data: [DONE]\n\n"
         except requests.exceptions.RequestException as e:
             error_chunk = {"error": f"与后端服务通信失败: {e}"}
             yield f"data: {json.dumps(error_chunk)}\n\n"
-    # (六) 根据客户端请求，返回流式响应或一次性完整响应
     if stream_requested:
-        # 如果客户端要流式，就返回我们的生成器函数
         return Response(generate_stream(), mimetype='text/event-stream')
     else:
-        # 如果客户端要一次性响应，我们就在服务器端拼接完整结果再返回
-        # (注意：gpt-oss本身就是流式的，所以这个分支需要我们在服务器端缓存)
-        full_response_content = ""
-        for chunk in generate_stream():
-            # 这里需要更复杂的解析逻辑来拼接，为简化起见，我们优先推荐使用流式
-            pass # 简单实现：非流式模式暂不支持或需要更复杂的实现
-        # 为了简单起见，我们主要支持流式，因为这是最高效的方式
         return jsonify({"error": "非流式响应目前不受支持，请在请求中设置 'stream': true"}), 501
-# --- 4. 启动应用 ---
 if __name__ == '__main__':
-    # 在本地测试时，可以使用 app.run()
-    # 部署到Gunicorn时，它会直接使用'app'这个实例
-    app.run(debug=True, port=7860)

 import time
 from flask import Flask, request, jsonify, Response
+# 1. 初始化Flask应用
 app = Flask(__name__)
+# 2. gpt-oss.com API的固定配置
 GPT_OSS_API_URL = "https://api.gpt-oss.com/chatkit"
 GPT_OSS_HEADERS = {
     'authority': 'api.gpt-oss.com',
     'origin': 'https://gpt-oss.com',
     'referer': 'https://gpt-oss.com/',
     'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36',
+    'x-selected-model': 'gpt-oss-120b',
 }
+# 3. 新增：根路由，用于健康检查和显示欢迎信息
+@app.route('/', methods=['GET'])
+def root():
+    return jsonify({
+        "message": "欢迎使用 GPT-OSS to OpenAI 格式代理API",
+        "status": "ok",
+        "api_endpoint": "/v1/chat/completions"
+    })
+# 4. 核心：创建OpenAI兼容的API端点
 @app.route('/v1/chat/completions', methods=['POST'])
 def chat_completions_proxy():
     try:
         openai_request_data = request.json
         messages = openai_request_data.get("messages", [])
         user_prompt = next((m['content'] for m in reversed(messages) if m.get('role') == 'user'), None)
         if not user_prompt:
             return jsonify({"error": "在请求中未找到用户消息。"}), 400
         stream_requested = openai_request_data.get("stream", False)
     except Exception as e:
         return jsonify({"error": f"请求格式无效: {e}"}), 400
     random_user_id = str(uuid.uuid4())
     gpt_oss_cookies = {'user_id': random_user_id}
     gpt_oss_payload = {
         "op": "threads.create",
         "params": {"input": {"text": user_prompt, "content": [{"type": "input_text", "text": user_prompt}]}}
     }
     def generate_stream():
         try:
             with requests.post(
                 GPT_OSS_API_URL,
                 headers=GPT_OSS_HEADERS,
                 stream=True,
                 timeout=120
             ) as response:
+                response.raise_for_status()
                 for line in response.iter_lines():
                     if line:
                         line_str = line.decode('utf-8')
                             try:
                                 gpt_oss_data = json.loads(json_data_str)
                                 event_type = gpt_oss_data.get('type')
                                 if (event_type == 'thread.item_updated' and
                                     gpt_oss_data.get('update', {}).get('type') == 'assistant_message.content_part.text_delta'):
                                     delta_content = gpt_oss_data['update'].get('delta', '')
                                     openai_chunk = {
                                         "id": f"chatcmpl-{str(uuid.uuid4())}",
                                         "object": "chat.completion.chunk",
                                         "created": int(time.time()),
                                         "model": "gpt-oss-120b",
+                                        "choices": [{"index": 0, "delta": {"content": delta_content}, "finish_reason": None}]
                                     }
                                     yield f"data: {json.dumps(openai_chunk)}\n\n"
                             except json.JSONDecodeError:
+                                continue
                 yield "data: [DONE]\n\n"
         except requests.exceptions.RequestException as e:
             error_chunk = {"error": f"与后端服务通信失败: {e}"}
             yield f"data: {json.dumps(error_chunk)}\n\n"
     if stream_requested:
         return Response(generate_stream(), mimetype='text/event-stream')
     else:
         return jsonify({"error": "非流式响应目前不受支持，请在请求中设置 'stream': true"}), 501
+# 5. 启动应用
 if __name__ == '__main__':
+    # 使用 gunicorn 部署时不会执行这里，但在本地测试时会用到
+    app.run(host='0.0.0.0', port=7860)