Spaces:

Hivra
/

Test1

Paused

App Files Files Community

Hivra commited on Apr 6, 2025

Commit

d33d331

verified ·

1 Parent(s): db7889b

Update app.py

Browse files

Files changed (1) hide show

app.py +121 -54

app.py CHANGED Viewed

@@ -4,6 +4,18 @@ from fastapi import FastAPI, HTTPException, Request
 import requests
 from pydantic import BaseModel, Field
 from typing import Optional, List, Dict, Any, Literal
 app = FastAPI(title="OpenAI-Compatible Chat API",
               description="A FastAPI application that provides an OpenAI-compatible interface")
@@ -40,32 +52,62 @@ class ChatCompletionResponse(BaseModel):
     choices: List[ChatCompletionChoice]
     usage: Usage
 # Custom endpoints for graniteAI
-@app.post("/v1/chat/completions", response_model=ChatCompletionResponse)
-async def chat_completion(request: ChatCompletionRequest):
-    # Forward to granite API
-    url = "https://d18n68ssusgr7r.cloudfront.net/v1/chat/completions"
-    headers = {
-        "Content-Type": "application/json",
-        "Authorization": "Bearer 89de4a8b-9dc6-4617-86a0-28690278b651"
-    }
-    # Convert to GraniteAI format if needed
-    granite_data = {
-        "messages": [{"role": msg.role, "content": msg.content} for msg in request.messages],
-        "model": request.model,
-        "max_tokens": request.max_tokens,
-        "temperature": request.temperature,
-        "top_p": request.top_p
-    }
     try:
         response = requests.post(url, headers=headers, json=granite_data)
-        response_json = response.json()
-        # Format into OpenAI-compatible response
-        # This assumes the granite API returns something we can parse
-        # You may need to adjust based on actual granite response
         # Extract the assistant message
         assistant_message = ""
@@ -76,58 +118,83 @@ async def chat_completion(request: ChatCompletionRequest):
             assistant_message = str(response_json)
         # Estimate token counts (very rough estimation)
-        prompt_tokens = sum(len(msg.content.split()) for msg in request.messages)
         completion_tokens = len(assistant_message.split())
-        return ChatCompletionResponse(
-            id=f"chatcmpl-{response_json.get('id', 'unknown')}",
-            created=response_json.get("created", 0),
-            model=request.model,
-            choices=[
-                ChatCompletionChoice(
-                    index=0,
-                    message=Message(
-                        role="assistant",
-                        content=assistant_message
-                    )
-                )
             ],
-            usage=Usage(
-                prompt_tokens=prompt_tokens,
-                completion_tokens=completion_tokens,
-                total_tokens=prompt_tokens + completion_tokens
-            )
-        )
     except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
 # Alternative version of the endpoint that directly passes through the raw granite API response
 @app.post("/raw/chat/completions")
 async def raw_chat_completion(request: Request):
-    data = await request.json()
-    # Forward to granite API
-    url = "https://d18n68ssusgr7r.cloudfront.net/v1/chat/completions"
-    headers = {
-        "Content-Type": "application/json",
-        "Authorization": "Bearer 89de4a8b-9dc6-4617-86a0-28690278b651"
-    }
     try:
         response = requests.post(url, headers=headers, json=data)
-        return response.json()
     except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
 @app.get("/")
 async def root():
     return {
         "message": "Welcome to the OpenAI-Compatible Chat API",
         "endpoints": {
             "/v1/chat/completions": "OpenAI-compatible chat completions endpoint",
-            "/raw/chat/completions": "Direct passthrough to the granite API"
         }
     }
 if __name__ == "__main__":
     uvicorn.run(app, host="0.0.0.0", port=7860)

 import requests
 from pydantic import BaseModel, Field
 from typing import Optional, List, Dict, Any, Literal
+import json
+import time
+import logging
+import sys
+# Configure logging
+logging.basicConfig(
+    level=logging.INFO,
+    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
+    handlers=[logging.StreamHandler(sys.stdout)]
+)
+logger = logging.getLogger(__name__)
 app = FastAPI(title="OpenAI-Compatible Chat API",
               description="A FastAPI application that provides an OpenAI-compatible interface")
     choices: List[ChatCompletionChoice]
     usage: Usage
+# Simple API endpoint for debugging
+@app.get("/health")
+async def health_check():
+    return {"status": "ok", "timestamp": time.time()}
 # Custom endpoints for graniteAI
+@app.post("/v1/chat/completions")
+async def chat_completion(request: Request):
     try:
+        # Get raw request data
+        data = await request.json()
+        logger.info(f"Received request: {data}")
+        # Extract messages
+        messages = data.get("messages", [])
+        model = data.get("model", "granite-3-2-8b-instruct")
+        temperature = data.get("temperature", 0.7)
+        top_p = data.get("top_p", 0.9)
+        max_tokens = data.get("max_tokens", 2048)
+        # Forward to granite API
+        url = "https://d18n68ssusgr7r.cloudfront.net/v1/chat/completions"
+        headers = {
+            "Content-Type": "application/json",
+            "Authorization": "Bearer 89de4a8b-9dc6-4617-86a0-28690278b651"
+        }
+        # Format request for granite API
+        granite_data = {
+            "messages": messages,
+            "model": model,
+            "max_tokens": max_tokens,
+            "temperature": temperature,
+            "top_p": top_p
+        }
+        logger.info(f"Sending request to granite API: {granite_data}")
         response = requests.post(url, headers=headers, json=granite_data)
+        logger.info(f"Granite API response status: {response.status_code}")
+        if response.status_code != 200:
+            logger.error(f"Error from granite API: {response.text}")
+            return {
+                "error": {
+                    "message": f"Error from upstream API: {response.text}",
+                    "type": "api_error",
+                    "status": response.status_code
+                }
+            }
+        try:
+            response_json = response.json()
+            logger.info(f"Granite API response: {response_json}")
+        except json.JSONDecodeError:
+            logger.error(f"Failed to parse JSON response: {response.text}")
+            response_json = {"error": "Failed to parse response"}
         # Extract the assistant message
         assistant_message = ""
             assistant_message = str(response_json)
         # Estimate token counts (very rough estimation)
+        prompt_tokens = sum(len(msg.get("content", "").split()) for msg in messages)
         completion_tokens = len(assistant_message.split())
+        # Format the response to match OpenAI's format
+        openai_response = {
+            "id": f"chatcmpl-{int(time.time())}",
+            "object": "chat.completion",
+            "created": int(time.time()),
+            "model": model,
+            "choices": [
+                {
+                    "index": 0,
+                    "message": {
+                        "role": "assistant",
+                        "content": assistant_message
+                    },
+                    "finish_reason": "stop"
+                }
             ],
+            "usage": {
+                "prompt_tokens": prompt_tokens,
+                "completion_tokens": completion_tokens,
+                "total_tokens": prompt_tokens + completion_tokens
+            }
+        }
+        logger.info(f"Returning OpenAI-compatible response")
+        return openai_response
     except Exception as e:
+        logger.exception(f"Exception in chat_completion: {str(e)}")
+        return {
+            "error": {
+                "message": f"Internal server error: {str(e)}",
+                "type": "server_error",
+                "status": 500
+            }
+        }
 # Alternative version of the endpoint that directly passes through the raw granite API response
 @app.post("/raw/chat/completions")
 async def raw_chat_completion(request: Request):
     try:
+        data = await request.json()
+        logger.info(f"Received raw request: {data}")
+        # Forward to granite API
+        url = "https://d18n68ssusgr7r.cloudfront.net/v1/chat/completions"
+        headers = {
+            "Content-Type": "application/json",
+            "Authorization": "Bearer 89de4a8b-9dc6-4617-86a0-28690278b651"
+        }
         response = requests.post(url, headers=headers, json=data)
+        logger.info(f"Raw API response status: {response.status_code}")
+        try:
+            result = response.json()
+            return result
+        except json.JSONDecodeError:
+            logger.error(f"Failed to parse raw JSON response: {response.text}")
+            return {"error": "Failed to parse response", "raw_response": response.text}
     except Exception as e:
+        logger.exception(f"Exception in raw_chat_completion: {str(e)}")
+        return {"error": str(e)}
 @app.get("/")
 async def root():
     return {
         "message": "Welcome to the OpenAI-Compatible Chat API",
+        "status": "running",
         "endpoints": {
             "/v1/chat/completions": "OpenAI-compatible chat completions endpoint",
+            "/raw/chat/completions": "Direct passthrough to the granite API",
+            "/health": "Health check endpoint"
         }
     }
 if __name__ == "__main__":
+    logger.info("Starting application on port 7860")
     uvicorn.run(app, host="0.0.0.0", port=7860)