Spaces:

Hivra
/

GLM4

Paused

App Files Files Community

Hivra commited on Apr 12, 2025

Commit

16a4437

verified ·

1 Parent(s): 45ea54e

Update main.py

Browse files

Files changed (1) hide show

main.py +71 -71

main.py CHANGED Viewed

@@ -5,22 +5,35 @@ import time
 import json
 import requests
 from functools import wraps
-from flask import Flask, request, Response, jsonify, abort
 import gevent.pywsgi
 from gevent import monkey; monkey.patch_all()
 app = Flask(__name__)
 app.json.sort_keys = False
-# ——— Load and enforce API key ———
-API_KEY = os.getenv("API_KEY")
-if not API_KEY:
-    raise RuntimeError("Missing API_KEY in env")
 def require_api_key(f):
     @wraps(f)
     def decorated(*args, **kwargs):
-        # look in X-API-Key header or Authorization: Bearer ...
         key = request.headers.get("X-API-Key") or request.headers.get("Authorization", "")
         if key.startswith("Bearer "):
             key = key.split(" ", 1)[1]
@@ -31,96 +44,77 @@ def require_api_key(f):
         return f(*args, **kwargs)
     return decorated
-# ——— Your existing arg parsing & base_url ———
-import argparse
-parser = argparse.ArgumentParser()
-parser.add_argument("--host", default="0.0.0.0")
-parser.add_argument("--port", type=int, default=7860)
-args = parser.parse_args()
-base_url = os.getenv("MODEL_BASE_URL")
-@app.route('/api/v1/models', methods=["GET", "POST"])
-@app.route('/v1/models',      methods=["GET", "POST"])
 @require_api_key
 def model_list():
-    time_now = int(time.time())
-    models = {
         "object": "list",
         "data": [
-            {"id": "glm-4",       "object": "model", "created": time_now, "owned_by": "tastypear"},
-            {"id": "gpt-3.5-turbo","object": "model", "created": time_now, "owned_by": "tastypear"}
         ]
-    }
-    return jsonify(models)
 @app.route("/", methods=["GET"])
 def index():
     return Response(
         f'ZhipuAI GLM-4 OpenAI Compatible API<br><br>'
-        f'Set "{os.getenv("SPACE_URL")}/api" as proxy in your Chatbot.<br><br>'
-        f'Full API: {os.getenv("SPACE_URL")}/api/v1/chat/completions'
     )
 @app.route("/api/v1/chat/completions", methods=["POST", "OPTIONS"])
 @app.route("/v1/chat/completions",      methods=["POST", "OPTIONS"])
 @require_api_key
 def chat_completions():
     if request.method == "OPTIONS":
         return Response(
-            headers={
-                "Access-Control-Allow-Origin": "*",
-                "Access-Control-Allow-Headers": "*",
-            }
         )
     data = request.get_json() or {}
-    if "messages" not in data:
         return jsonify({"error": "Missing 'messages' field"}), 400
-    # reorganize data
     system = "You are a helpful assistant."
     chat_history = []
-    messages = data["messages"]
-    prompt = messages[-1].get("content", "")
-    for i in range(len(messages) - 1):
-        r0 = messages[i].get("role")
-        r1 = messages[i+1].get("role")
-        if r0 == "system":
-            system = messages[i]["content"]
-        elif r0 == "user":
-            if r1 == "assistant":
-                chat_history.append([messages[i]["content"], messages[i+1]["content"]])
             else:
-                chat_history.append([messages[i]["content"], " "])
-    # random session id
-    session_hash = "".join(random.choices(string.ascii_lowercase + string.digits, k=11))
-    json_prompt = {
-        "data": [prompt, chat_history, system],
-        "fn_index": 0,
-        "session_hash": session_hash,
-    }
-    def generate():
-        # enqueue job
-        requests.post(f"{base_url}/queue/join", json=json_prompt)
-        url = f"{base_url}/queue/data?session_hash={session_hash}"
-        stream = requests.get(url, stream=True)
         start_time = int(time.time())
-        for line in stream.iter_lines():
             if not line:
                 continue
             msg = json.loads(line.decode("utf-8")[6:])
             if msg["msg"] == "process_starts":
-                chunk = gen_res_data({}, time_now=start_time, start=True)
             elif msg["msg"] == "process_generating":
-                chunk = gen_res_data(msg, time_now=start_time)
             elif msg["msg"] == "process_completed":
                 yield "data: [DONE]"
                 break
@@ -131,14 +125,12 @@ def chat_completions():
     return Response(
         generate(),
         mimetype="text/event-stream",
-        headers={
-            "Access-Control-Allow-Origin": "*",
-            "Access-Control-Allow-Headers": "*",
-        },
     )
-def gen_res_data(data, time_now=0, start=False):
     base = {
         "id": "chatcmpl",
         "object": "chat.completion.chunk",
@@ -149,13 +141,21 @@ def gen_res_data(data, time_now=0, start=False):
     if start:
         base["choices"][0]["delta"] = {"role": "assistant", "content": ""}
     else:
-        chat_pair = data["output"]["data"][1]
         if not chat_pair:
             base["choices"][0]["finish_reason"] = "stop"
         else:
             base["choices"][0]["delta"] = {"content": chat_pair[-1][-1]}
     return base
 if __name__ == "__main__":
-    gevent.pywsgi.WSGIServer((args.host, args.port), app).serve_forever()

 import json
 import requests
 from functools import wraps
+from flask import Flask, request, Response, jsonify
 import gevent.pywsgi
 from gevent import monkey; monkey.patch_all()
+# —— Load & check env vars ——
+API_KEY = os.getenv("API_KEY")
+if not API_KEY:
+    raise RuntimeError("Missing API_KEY env var")
+MODEL_BASE_URL = os.getenv("MODEL_BASE_URL")
+if not MODEL_BASE_URL:
+    raise RuntimeError("Missing MODEL_BASE_URL env var")
+SPACE_URL = os.getenv("SPACE_URL", "")
+# —— Flask setup ——
 app = Flask(__name__)
 app.json.sort_keys = False
+# —— Error handler to show real errors ——
+@app.errorhandler(Exception)
+def handle_all_errors(e):
+    app.logger.exception(e)
+    return jsonify({"error": str(e)}), 500
+# —— API‑key decorator ——
 def require_api_key(f):
     @wraps(f)
     def decorated(*args, **kwargs):
         key = request.headers.get("X-API-Key") or request.headers.get("Authorization", "")
         if key.startswith("Bearer "):
             key = key.split(" ", 1)[1]
         return f(*args, **kwargs)
     return decorated
+# —— Model list endpoint ——
+@app.route('/api/v1/models', methods=['GET', 'POST'])
+@app.route('/v1/models',      methods=['GET', 'POST'])
 @require_api_key
 def model_list():
+    now = int(time.time())
+    return jsonify({
         "object": "list",
         "data": [
+            {"id": "glm-4",        "object": "model", "created": now, "owned_by": "tastypear"},
+            {"id": "gpt-3.5-turbo", "object": "model", "created": now, "owned_by": "tastypear"}
         ]
+    })
+# —— Home page ——
 @app.route("/", methods=["GET"])
 def index():
     return Response(
         f'ZhipuAI GLM-4 OpenAI Compatible API<br><br>'
+        f'Set "{SPACE_URL}/api" as proxy in your Chatbot.<br><br>'
+        f'Full API: {SPACE_URL}/api/v1/chat/completions'
     )
+# —— Chat completions ——
 @app.route("/api/v1/chat/completions", methods=["POST", "OPTIONS"])
 @app.route("/v1/chat/completions",      methods=["POST", "OPTIONS"])
 @require_api_key
 def chat_completions():
     if request.method == "OPTIONS":
         return Response(
+            headers={"Access-Control-Allow-Origin":"*","Access-Control-Allow-Headers":"*"}
         )
     data = request.get_json() or {}
+    messages = data.get("messages")
+    if not messages:
         return jsonify({"error": "Missing 'messages' field"}), 400
+    # parse messages
     system = "You are a helpful assistant."
     chat_history = []
+    for i, msg in enumerate(messages[:-1]):
+        role = msg.get("role")
+        if role == "system":
+            system = msg.get("content", system)
+        elif role == "user":
+            next_role = messages[i+1].get("role")
+            if next_role == "assistant":
+                chat_history.append([msg.get("content",""), messages[i+1].get("content","")])
             else:
+                chat_history.append([msg.get("content",""), ""])
+    prompt = messages[-1].get("content","")
+    session_hash = "".join(random.choices(string.ascii_lowercase+string.digits, k=11))
+    json_prompt = {"data":[prompt, chat_history, system], "fn_index":0, "session_hash":session_hash}
+    def generate():
+        # enqueue
+        requests.post(f"{MODEL_BASE_URL}/queue/join", json=json_prompt)
+        url = f"{MODEL_BASE_URL}/queue/data?session_hash={session_hash}"
+        resp = requests.get(url, stream=True)
         start_time = int(time.time())
+        for line in resp.iter_lines():
             if not line:
                 continue
             msg = json.loads(line.decode("utf-8")[6:])
             if msg["msg"] == "process_starts":
+                chunk = gen_res_data({}, start=True, time_now=start_time)
             elif msg["msg"] == "process_generating":
+                chunk = gen_res_data(msg, start=False, time_now=start_time)
             elif msg["msg"] == "process_completed":
                 yield "data: [DONE]"
                 break
     return Response(
         generate(),
         mimetype="text/event-stream",
+        headers={"Access-Control-Allow-Origin":"*","Access-Control-Allow-Headers":"*"},
     )
+def gen_res_data(data, start=False, time_now=None):
+    if time_now is None:
+        time_now = int(time.time())
     base = {
         "id": "chatcmpl",
         "object": "chat.completion.chunk",
     if start:
         base["choices"][0]["delta"] = {"role": "assistant", "content": ""}
     else:
+        chat_pair = data.get("output",{}).get("data",[None,None])[1]
         if not chat_pair:
             base["choices"][0]["finish_reason"] = "stop"
         else:
             base["choices"][0]["delta"] = {"content": chat_pair[-1][-1]}
     return base
 if __name__ == "__main__":
+    import argparse
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--host", default="0.0.0.0")
+    parser.add_argument("--port", type=int, default=7860)
+    args = parser.parse_args()
+    # turn on debug so you see errors in browser
+    app.run(host=args.host, port=args.port, debug=True)
+    # once it works, you can switch back to:
+    # gevent.pywsgi.WSGIServer((args.host, args.port), app).serve_forever()