CalmConnect

Sleeping

allyyy commited on Oct 22, 2024

Commit

c595d62

verified ·

1 Parent(s): c216785

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -58,7 +58,19 @@ def generate_response(user_query, relevant_segment):
         # Encode the input and generate a response
         input_ids = tokenizer.encode(user_message, return_tensors='pt')
-        output = model.generate(input_ids, max_length=150, num_return_sequences=1)
         output_text = tokenizer.decode(output[0], skip_special_tokens=True)
         # Append assistant's message to messages list for context

         # Encode the input and generate a response
         input_ids = tokenizer.encode(user_message, return_tensors='pt')
+        # Create attention mask (1 for real tokens, 0 for padding tokens)
+        attention_mask = (input_ids != tokenizer.pad_token_id).long()
+        # Generate the response using the model
+        output = model.generate(
+            input_ids,
+            attention_mask=attention_mask,
+            max_length=150,
+            num_return_sequences=1,
+            pad_token_id=tokenizer.eos_token_id  # Set pad_token_id to eos_token_id
+        )
         output_text = tokenizer.decode(output[0], skip_special_tokens=True)
         # Append assistant's message to messages list for context