Spaces:

radison-tech
/

pr-1

Running

App Files Files Community

Hiren122 commited on 22 days ago

Commit

f184aa9

verified ·

1 Parent(s): 3d084de

Update app.py

Browse files

Files changed (1) hide show

app.py +79 -25

app.py CHANGED Viewed

@@ -1,39 +1,93 @@
-from flask import Flask, request, jsonify, Response
 import requests
-import os
 import time
-import uuid
-import json
 app = Flask(__name__)
 ONYX_URL = "https://cloud.onyx.app/api/chat/send-chat-message"
-API_KEY = os.environ.get("ONYX_SECRET")
-@app.route('/')
-def home():
-    if not API_KEY:
-        return "Server is running, but waiting for Hiren to set the ONYX_SECRET in Settings."
-    return "Server is Online and Connected to Onyx!"
-# ===================== MODELS LIST =====================
-@app.route('/v1/models', methods=['GET'])
-def list_models():
-    return jsonify({
-        "object": "list",
-        "data": [
-            {"id": "gpt-5.2", "object": "model", "owned_by": "openai"},
-            {"id": "claude-opus-4.5", "object": "model", "owned_by": "anthropic"},
-            {"id": "claude-sonnet-4.5", "object": "model", "owned_by": "anthropic"},
-            {"id": "gemini-3-pro-preview", "object": "model", "owned_by": "google"},
-            {"id": "gemini-3-flash-preview", "object": "model", "owned_by": "google"}
-        ]
-    })
-# ===================== CHAT =====================
 @app.route('/v1/chat/completions', methods=['POST'])
 def chat_proxy():
     data = request.json
     if not data or 'messages' not in data:
         return jsonify({"error": "No messages provided"}), 400

+import json
 import requests
 import time
+import os
+from flask import Flask, request, Response, stream_with_context
 app = Flask(__name__)
+# CONFIGURATION: Set this in your HF Space Secrets
+ONYX_API_KEY = os.getenv("ONYX_SECRET", "your_onyx_token_here")
 ONYX_URL = "https://cloud.onyx.app/api/chat/send-chat-message"
+def transform_to_openai_chunk(content, model_name, finish_reason=None):
+    """Encapsulates content into OpenAI's SSE format."""
+    chunk = {
+        "id": f"chatcmpl-{int(time.time())}",
+        "object": "chat.completion.chunk",
+        "created": int(time.time()),
+        "model": model_name,
+        "choices": [{
+            "index": 0,
+            "delta": {"content": content} if content else {},
+            "finish_reason": finish_reason
+        }]
+    }
+    return f"data: {json.dumps(chunk)}\n\n"
 @app.route('/v1/chat/completions', methods=['POST'])
 def chat_proxy():
     data = request.json
+    # DYNAMIC PARSING:
+    # Logic: "Provider Name / Model Name" -> provider="Provider Name", version="Model Name"
+    raw_model = data.get("model", "OpenAI / gpt-4o")
+    if "/" in raw_model:
+        provider, version = [part.strip() for part in raw_model.split("/", 1)]
+    else:
+        # Fallback if the user doesn't use a slash
+        provider, version = "OpenAI", raw_model.strip()
+    messages = data.get("messages", [])
+    user_content = messages[-1].get("content", "") if messages else ""
+    onyx_payload = {
+        "message": user_content,
+        "llm_override": {
+            "model_provider": provider,
+            "model_version": version,
+            "temperature": data.get("temperature", 0.7)
+        },
+        "stream": True, # Force stream mode logic
+        "include_citations": True,
+        "deep_research": False,
+        "parent_message_id": -1,
+        "chat_session_id": "3c90c3cc-0d44-4b50-8888-8dd25736052a"
+    }
+    headers = {
+        "Authorization": f"Bearer {ONYX_API_KEY}",
+        "Content-Type": "application/json"
+    }
+    def generate():
+        try:
+            with requests.post(ONYX_URL, json=onyx_payload, headers=headers, stream=True) as r:
+                for line in r.iter_lines():
+                    if not line:
+                        continue
+                    packet = json.loads(line.decode('utf-8'))
+                    # Onyx streams use 'message_delta' for actual text chunks
+                    if packet.get("type") == "message_delta":
+                        yield transform_to_openai_chunk(packet.get("delta", ""), raw_model)
+                # Finalize the stream for the OpenAI SDK
+                yield transform_to_openai_chunk(None, raw_model, finish_reason="stop")
+                yield "data: [DONE]\n\n"
+        except Exception as e:
+            yield f"data: {json.dumps({'error': str(e)})}\n\n"
+    return Response(stream_with_context(generate()), mimetype='text/event-stream')
+@app.route('/')
+def index():
+    return "Onyx OpenAI Proxy is Online. Point your SDK to /v1", 200
+if __name__ == '__main__':
+    # HF.co listens on 7860
+    app.run(host='0.0.0.0', port=7860)
     if not data or 'messages' not in data:
         return jsonify({"error": "No messages provided"}), 400