tinyInstruct

Sleeping

AItool commited on Sep 25, 2025

Commit

83fdf47

verified ·

1 Parent(s): 050e984

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -153,17 +153,18 @@ def chat(user_text, model_label, blocks_json):
     messages = build_messages(user_text, data["user_profile"], blocks)
-    inputs = tokenizer.apply_chat_template(
-        messages,
-        add_generation_prompt=True,
-        tokenize=True,
-        return_tensors="pt"
     ).to("cpu")
     start = time.time()
     with torch.no_grad():
         outputs = model.generate(
-            **inputs,
             max_new_tokens=200,
             do_sample=False,
             use_cache=False

     messages = build_messages(user_text, data["user_profile"], blocks)
+   inputs = tokenizer.apply_chat_template(
+    messages,
+    add_generation_prompt=True,
+    tokenize=True,
+    return_tensors="pt",
+    return_dict=True   # <-- this makes inputs a dict
     ).to("cpu")
     start = time.time()
     with torch.no_grad():
         outputs = model.generate(
+            **inputs,                # now safe, inputs is a dict
             max_new_tokens=200,
             do_sample=False,
             use_cache=False