Spaces:

ST-THOMAS-OF-AQUINAS
/

model_text

Sleeping

Commit

4074487

verified ·

1 Parent(s): e4a69bb

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,25 +1,23 @@
 import torch
-from transformers import AutoTokenizer, AutoModelForCausalLM
 import gradio as gr
 MODEL_NAME = "Qwen/Qwen2.5-1.5B-Instruct"
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, trust_remote_code=True)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
-    torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
     device_map="auto",
     trust_remote_code=True
 )
 def chat(user_input, history):
-    messages = []
-    for h in history:
-        messages.append({"role": "user", "content": h[0]})
-        messages.append({"role": "assistant", "content": h[1]})
-    messages.append({"role": "user", "content": user_input})
     prompt = tokenizer.apply_chat_template(
         messages,
@@ -32,9 +30,9 @@ def chat(user_input, history):
     outputs = model.generate(
         **inputs,
         max_new_tokens=512,
-        do_sample=True,
         temperature=0.7,
-        top_p=0.9
     )
     response = tokenizer.decode(
@@ -42,14 +40,15 @@ def chat(user_input, history):
         skip_special_tokens=True
     )
-    history.append((user_input, response))
-    return history, ""
 with gr.Blocks() as demo:
     gr.Markdown("## 🤖 Qwen Chatbot")
-    chatbot = gr.Chatbot()
-    msg = gr.Textbox(label="Your message")
     clear = gr.Button("Clear")
     msg.submit(chat, [msg, chatbot], [chatbot, msg])

 import torch
 import gradio as gr
+from transformers import AutoTokenizer, AutoModelForCausalLM
 MODEL_NAME = "Qwen/Qwen2.5-1.5B-Instruct"
+tokenizer = AutoTokenizer.from_pretrained(
+    MODEL_NAME, trust_remote_code=True
+)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
     device_map="auto",
+    torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
     trust_remote_code=True
 )
 def chat(user_input, history):
+    # history is already in messages format
+    messages = history + [{"role": "user", "content": user_input}]
     prompt = tokenizer.apply_chat_template(
         messages,
     outputs = model.generate(
         **inputs,
         max_new_tokens=512,
         temperature=0.7,
+        top_p=0.9,
+        do_sample=True
     )
     response = tokenizer.decode(
         skip_special_tokens=True
     )
+    messages.append({"role": "assistant", "content": response})
+    return messages, ""
 with gr.Blocks() as demo:
     gr.Markdown("## 🤖 Qwen Chatbot")
+    chatbot = gr.Chatbot(type="messages")
+    msg = gr.Textbox(label="Your message", autofocus=True)
     clear = gr.Button("Clear")
     msg.submit(chat, [msg, chatbot], [chatbot, msg])