Spaces:

Moonfanz
/

polling_reverse_proxy

Paused

App Files Files

Moonfanz commited on Oct 16, 2024

Commit

99c48bb

verified ·

1 Parent(s): 7b3bc0d

Update app.py

Browse files

Files changed (1) hide show

app.py +69 -32

app.py CHANGED Viewed

@@ -38,45 +38,82 @@ key_manager = APIKeyManager()
 @app.route('/v1/models', methods=['GET'])
 def list_models():
-    models = [
-        {
-            "id": "gpt-3.5-turbo",
-            "object": "model",
-            "created": 1677610602,
-            "owned_by": "openai",
-            "permission": [{
-                "id": "modelperm-M56FXnG1AsIr3SXq8BYPvXJA",
-                "object": "model_permission",
-                "created": 1679602088,
-                "allow_create_engine": False,
-                "allow_sampling": True,
-                "allow_logprobs": True,
-                "allow_search_indices": False,
-                "allow_view": True,
-                "allow_fine_tuning": False,
-                "organization": "*",
-                "group": None,
-                "is_blocking": False
-            }],
-            "root": "gpt-3.5-turbo",
-            "parent": None
-        }
-    ]
-    return Response(json.dumps({"data": models, "object": "list"}), mimetype='application/json')
 @app.route('/v1/chat/completions', methods=['POST'])
 def proxy_request():
-    api_key = key_manager.get_available_key()
-    if not api_key:
-        return Response(json.dumps({"error": "No available API key"}), status=429, mimetype='application/json')
     headers = {
-        'Authorization': f'Bearer {api_key}',
-        'Content-Type': 'application/json'
     }
-    response = requests.post(f'{CHATANYWHERE_ENDPOINT}/v1/chat/completions', headers=headers, data=request.data)
-    return Response(response.content, status=response.status_code, mimetype='application/json')
 @app.route('/key_info', methods=['GET'])
 def key_info():

 @app.route('/v1/models', methods=['GET'])
 def list_models():
+    key = key_manager.get_available_key()
+    if not key:
+        return Response(json.dumps({"error": "No available API keys"}), status=429, mimetype='application/json')
+    headers = {
+        "Authorization": f"Bearer {key}"
+    }
+    try:
+        response = requests.get(f"{CHATANYWHERE_ENDPOINT}/v1/models", headers=headers)
+        if response.status_code == 200:
+            return Response(response.text, mimetype='application/json')
+        else:
+            error_message = f"Error: {response.status_code}, {response.text}"
+            return Response(json.dumps({"error": error_message}), status=response.status_code, mimetype='application/json')
+    except requests.RequestException as e:
+        return Response(json.dumps({"error": str(e)}), status=500, mimetype='application/json')
 @app.route('/v1/chat/completions', methods=['POST'])
 def proxy_request():
+    data = request.get_json()
+    messages = data.get('messages', [])
+    model = data.get('model', 'gpt-4o-mini')
+    max_tokens = data.get('max_tokens', 4096)
+    temperature = data.get('temperature', 1)
+    stream = data.get('stream', False)
+    key = key_manager.get_available_key()
+    if not key:
+        return Response(json.dumps({"error": "No available API keys"}), status=429, mimetype='application/json')
     headers = {
+        "Content-Type": "application/json",
+        "Authorization": f"Bearer {key}"
+    }
+    payload = {
+        "model": model,
+        "messages": messages,
+        "max_tokens": max_tokens,
+        "temperature": temperature,
+        "stream": stream
     }
+    if stream:
+        def generate():
+            response = requests.post(f"{CHATANYWHERE_ENDPOINT}/v1/chat/completions", headers=headers, json=payload, stream=True)
+            for line in response.iter_lines():
+                if line:
+                    try:
+                        line = line.decode('utf-8')
+                        if line.startswith("data: "):
+                            json_str = line[6:]  # 去掉 "data: " 前缀
+                            if json_str.strip() == "[DONE]":
+                                yield f"data: [DONE]\n\n"
+                            else:
+                                data = json.loads(json_str)
+                                if 'choices' in data and len(data['choices']) > 0:
+                                    choice = data['choices'][0]
+                                    if 'delta' in choice:
+                                        delta = choice['delta']
+                                        if 'role' in delta:
+                                            yield f"data: {json.dumps({'choices': [{'delta': {'role': 'assistant'}}]})}\n\n"
+                                        elif 'content' in delta:
+                                            yield f"data: {json.dumps({'choices': [{'delta': {'content': delta['content']}}]})}\n\n"
+                    except json.JSONDecodeError:
+                        continue
+        return Response(generate(), content_type='text/event-stream')
+    else:
+        response = requests.post(f"{CHATANYWHERE_ENDPOINT}/v1/chat/completions", headers=headers, json=payload)
+        if response.status_code == 200:
+            return Response(response.content, mimetype='application/json')
+        else:
+            return Response(json.dumps({"error": f"Error: {response.status_code} - {response.text}"}),
+                            status=response.status_code, mimetype='application/json')
 @app.route('/key_info', methods=['GET'])
 def key_info():