Spaces:

aryo100
/

qwen_api

Sleeping

aryo100 commited on Sep 24

Commit

4b3ff1b

1 Parent(s): c2609dd

update app

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,6 +17,9 @@ model = AutoModelForCausalLM.from_pretrained(
     device_map="auto",
     trust_remote_code=True,
 )
 # Request schema
 class ChatRequest(BaseModel):
@@ -26,13 +29,19 @@ class ChatRequest(BaseModel):
 @app.post("/chat")
 def chat(req: ChatRequest):
     # Format input sesuai template Qwen
-    text = tokenizer.apply_chat_template(
-        req.messages,
-        tokenize=False,
-        add_generation_prompt=True
-    )
-    inputs = tokenizer(text, return_tensors="pt").to(model.device)
     # Generate
     outputs = model.generate(

     device_map="auto",
     trust_remote_code=True,
 )
+if not tokenizer.chat_template:
+    tokenizer.chat_template = """{% for message in messages %}{{ message['role'] }}: {{ message['content'] }}
+{% endfor %}Assistant:"""
 # Request schema
 class ChatRequest(BaseModel):
 @app.post("/chat")
 def chat(req: ChatRequest):
     # Format input sesuai template Qwen
+    # text = tokenizer.apply_chat_template(
+    #     req.messages,
+    #     tokenize=False,
+    #     add_generation_prompt=True
+    # )
+    # inputs = tokenizer(text, return_tensors="pt").to(model.device)
+    prompt = ""
+    for msg in req.messages:
+        prompt += f"{msg['role']}: {msg['content']}\n"
+    prompt += "assistant:"
+    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     # Generate
     outputs = model.generate(