Spaces:

Goated121
/

ChatBot

Sleeping

Goated121 commited on 3 days ago

Commit

12df875

verified ·

1 Parent(s): 2a19c62

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,20 +1,27 @@
 from llama_cpp import Llama
 import gradio as gr
 model = Llama(
     model_path="qwen2.5-1.5B-q4.gguf",
     n_ctx=4096,
     n_gpu_layers=0,
-    chat_format="qwen2"  # needed for Qwen2 models
 )
-def chat(prompt):
-    out = model(
-        prompt,
         max_tokens=256,
         temperature=0.7,
     )
-    return out["choices"][0]["text"]
 gr.Interface(
     fn=chat,

 from llama_cpp import Llama
 import gradio as gr
+# IMPORTANT: Use chat_format="qwen" (qwen2 is NOT supported)
 model = Llama(
     model_path="qwen2.5-1.5B-q4.gguf",
     n_ctx=4096,
     n_gpu_layers=0,
+    chat_format="qwen",
 )
+def chat(user_input):
+    messages = [
+        {"role": "system", "content": "You are a helpful assistant. Answer ONLY the question. Do NOT continue, do NOT ask questions, do NOT add extra text."},
+        {"role": "user", "content": user_input}
+    ]
+    response = model.create_chat_completion(
+        messages=messages,
         max_tokens=256,
         temperature=0.7,
     )
+    return response["choices"][0]["message"]["content"]
 gr.Interface(
     fn=chat,