model_text2

Runtime error

App Files Files Community

ST-THOMAS-OF-AQUINAS commited on Jan 7

Commit

87f925a

verified ·

1 Parent(s): 7a19455

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -20

app.py CHANGED Viewed

@@ -2,11 +2,13 @@ import torch
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM
 MODEL_NAME = "Qwen/Qwen2.5-3B-Instruct"
 tokenizer = AutoTokenizer.from_pretrained(
-    MODEL_NAME,
-    trust_remote_code=True
 )
 model = AutoModelForCausalLM.from_pretrained(
@@ -16,6 +18,9 @@ model = AutoModelForCausalLM.from_pretrained(
     trust_remote_code=True
 )
 SYSTEM_MESSAGE = {
     "role": "system",
     "content": (
@@ -26,21 +31,23 @@ SYSTEM_MESSAGE = {
     )
 }
 def chat(user_input, messages):
     if not messages:
         messages = [SYSTEM_MESSAGE]
-    # Ensure clean message format
     messages = [
         {"role": m["role"], "content": str(m["content"])}
         for m in messages
     ]
-    messages.append({
-        "role": "user",
-        "content": str(user_input)
-    })
     prompt = tokenizer.apply_chat_template(
         messages,
         tokenize=False,
@@ -49,9 +56,10 @@ def chat(user_input, messages):
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(
         **inputs,
-        max_new_tokens=384,   # ↓ safer for 3B
         temperature=0.7,
         top_p=0.9,
         do_sample=True
@@ -62,22 +70,20 @@ def chat(user_input, messages):
         skip_special_tokens=True
     )
-    messages.append({
-        "role": "assistant",
-        "content": response
-    })
     return messages, ""
 with gr.Blocks() as demo:
     gr.Markdown("## 🤖 Qwen 2.5 – 3B Chatbot (English & Kiswahili)")
-    chatbot = gr.Chatbot()
-    msg = gr.Textbox(
-        label="Your message / Ujumbe wako",
-        autofocus=True
-    )
-    state = gr.State([])
     msg.submit(
         chat,
@@ -85,8 +91,9 @@ with gr.Blocks() as demo:
         outputs=[chatbot, state]
     )
-demo.queue(concurrency_count=1)
 if __name__ == "__main__":
     demo.launch(
         server_name="0.0.0.0",

 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM
+# ----------------------------
+# Model configuration
+# ----------------------------
 MODEL_NAME = "Qwen/Qwen2.5-3B-Instruct"
 tokenizer = AutoTokenizer.from_pretrained(
+    MODEL_NAME, trust_remote_code=True
 )
 model = AutoModelForCausalLM.from_pretrained(
     trust_remote_code=True
 )
+# ----------------------------
+# System prompt for CBE marking
+# ----------------------------
 SYSTEM_MESSAGE = {
     "role": "system",
     "content": (
     )
 }
+# ----------------------------
+# Chat function
+# ----------------------------
 def chat(user_input, messages):
     if not messages:
         messages = [SYSTEM_MESSAGE]
+    # Ensure all contents are strings
     messages = [
         {"role": m["role"], "content": str(m["content"])}
         for m in messages
     ]
+    # Add user input
+    messages.append({"role": "user", "content": str(user_input)})
+    # Create Qwen prompt
     prompt = tokenizer.apply_chat_template(
         messages,
         tokenize=False,
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
+    # Generate response
     outputs = model.generate(
         **inputs,
+        max_new_tokens=384,   # safe for 3B
         temperature=0.7,
         top_p=0.9,
         do_sample=True
         skip_special_tokens=True
     )
+    # Append assistant response
+    messages.append({"role": "assistant", "content": response})
     return messages, ""
+# ----------------------------
+# Gradio UI
+# ----------------------------
 with gr.Blocks() as demo:
     gr.Markdown("## 🤖 Qwen 2.5 – 3B Chatbot (English & Kiswahili)")
+    chatbot = gr.Chatbot()  # old Gradio safe
+    msg = gr.Textbox(label="Your message / Ujumbe wako", autofocus=True)
+    state = gr.State([])    # keeps messages
     msg.submit(
         chat,
         outputs=[chatbot, state]
     )
+# ----------------------------
+# Launch safely on HF Spaces
+# ----------------------------
 if __name__ == "__main__":
     demo.launch(
         server_name="0.0.0.0",