Deepseek-R1-1.5b-API

Sleeping

Pamudu13 commited on Feb 6, 2025

Commit

9b54a18

verified ·

1 Parent(s): f9e8a03

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,6 +6,7 @@ from fastapi.responses import HTMLResponse
 from llama_cpp import Llama
 from pydantic import BaseModel
 import uvicorn
 # Configuration
 MODEL_URL = "https://huggingface.co/unsloth/DeepSeek-R1-Distill-Qwen-1.5B-GGUF/resolve/main/DeepSeek-R1-Distill-Qwen-1.5B-Q5_K_M.gguf"
@@ -132,17 +133,25 @@ class ChatCompletionResponse(BaseModel):
     choices: list[dict]
     usage: dict
-@app.post("/v1/chat/completions")
-async def chat_completion(request: ChatCompletionRequest):
     try:
-        prompt = "\n".join([f"{msg['role']}: {msg['content']}" for msg in request.messages])
         prompt += "\nassistant:"
         response = llm(
             prompt=prompt,
-            max_tokens=request.max_tokens,
-            temperature=request.temperature,
-            top_p=request.top_p,
             stop=["</s>"]
         )

 from llama_cpp import Llama
 from pydantic import BaseModel
 import uvicorn
+import json
 # Configuration
 MODEL_URL = "https://huggingface.co/unsloth/DeepSeek-R1-Distill-Qwen-1.5B-GGUF/resolve/main/DeepSeek-R1-Distill-Qwen-1.5B-Q5_K_M.gguf"
     choices: list[dict]
     usage: dict
+@app.get("/v1/chat/completions")
+async def chat_completion(
+    messages: str,
+    max_tokens: int = 128,
+    temperature: float = 0.7,
+    top_p: float = 0.9,
+    stream: bool = False
+):
     try:
+        messages_list = json.loads(messages)
+        prompt = "\n".join([f"{msg['role']}: {msg['content']}" for msg in messages_list])
         prompt += "\nassistant:"
         response = llm(
             prompt=prompt,
+            max_tokens=max_tokens,
+            temperature=temperature,
+            top_p=top_p,
             stop=["</s>"]
         )