Spaces:

edyxapi
/

convo-model

Running

Adi362 commited on about 1 month ago

Commit

2034a63

verified ·

1 Parent(s): ebcc4c1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,7 +9,7 @@ llm = Llama(
     n_ctx=2048,
     n_threads=2,
     n_batch=128,
-    verbose=False,
 )
 class Message(BaseModel):
@@ -21,21 +21,21 @@ class ChatRequest(BaseModel):
 @app.post("/v1/chat")
 def chat(req: ChatRequest):
-    prompt = ""
     for m in req.messages:
-        prompt += f"{m.role.upper()}: {m.content}\n"
-    prompt += "ASSISTANT:"
     output = llm(
         prompt,
         max_tokens=256,
         temperature=0.7,
         top_p=0.9,
-        stop=["USER:"]
     )
     return {
-        "model": "tinyllama-1.1b-chat-q4_k_m",
         "text": output["choices"][0]["text"].strip(),
         "tokens": output["usage"]["total_tokens"],
     }

     n_ctx=2048,
     n_threads=2,
     n_batch=128,
+    verbose=False
 )
 class Message(BaseModel):
 @app.post("/v1/chat")
 def chat(req: ChatRequest):
+    prompt = "<|system|>\nYou are a helpful, concise chatbot.\n"
     for m in req.messages:
+        prompt += f"<|{m.role}|>\n{m.content}\n"
+    prompt += "<|assistant|>\n"
     output = llm(
         prompt,
         max_tokens=256,
         temperature=0.7,
         top_p=0.9,
+        stop=["<|user|>", "<|system|>"]
     )
     return {
+        "model": "edyx-convo",
         "text": output["choices"][0]["text"].strip(),
         "tokens": output["usage"]["total_tokens"],
     }