Spaces:

Neon-tech
/

Test

Paused

Neon-tech commited on Apr 8

Commit

51e3fc3

verified ·

1 Parent(s): 7b3e43a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -12,7 +12,7 @@ model = Llama.from_pretrained(
 )
 def chat(message, history):
-    messages = []
     for user, assistant in history:
         messages.append({"role": "user", "content": user})
         messages.append({"role": "assistant", "content": assistant})
@@ -22,8 +22,7 @@ def chat(message, history):
     for chunk in model.create_chat_completion(
         messages=messages,
         max_tokens=2048,
-        stream=True,
-        chat_template_kwargs={"enable_thinking": False}
     ):
         delta = chunk["choices"][0]["delta"].get("content", "")
         output += delta

 )
 def chat(message, history):
+    messages = [{"role": "system", "content": "/nothink"}]
     for user, assistant in history:
         messages.append({"role": "user", "content": user})
         messages.append({"role": "assistant", "content": assistant})
     for chunk in model.create_chat_completion(
         messages=messages,
         max_tokens=2048,
+        stream=True
     ):
         delta = chunk["choices"][0]["delta"].get("content", "")
         output += delta