glm-chat

Sleeping

vilarin commited on Aug 16, 2024

Commit

6f1ee3e

verified ·

1 Parent(s): 5312535

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -42,12 +42,12 @@ def stream_chat(message: str, history: list, temperature: float, max_new_tokens:
     conversation = []
     for prompt, answer in history:
         conversation.extend([{"role": "user", "content": prompt}, {"role": "assistant", "content": answer}])
-    conversation.append({"role": "user", "content": message})
     print(f"Conversation is -\n{conversation}")
-    input_ids = tokenizer.apply_chat_template(conversation, tokenize=True, add_generation_prompt=True, return_tensors="pt", return_dict=True).to(model.device)
     streamer = TextIteratorStreamer(tokenizer, timeout=60.0, skip_prompt=True, skip_special_tokens=True)
     generate_kwargs = dict(

     conversation = []
     for prompt, answer in history:
         conversation.extend([{"role": "user", "content": prompt}, {"role": "assistant", "content": answer}])
+    #conversation.append({"role": "user", "content": message})
     print(f"Conversation is -\n{conversation}")
+    input_ids = tokenizer.build_chat_input(message, history=conversation, role='user').input_ids.to(model.device)
+    #input_ids = tokenizer.apply_chat_template(conversation, tokenize=True, add_generation_prompt=True, return_tensors="pt", return_dict=True).to(model.device)
     streamer = TextIteratorStreamer(tokenizer, timeout=60.0, skip_prompt=True, skip_special_tokens=True)
     generate_kwargs = dict(