Spaces:

NurseCitizenDeveloper
/

PNA-Assistant

Running on Zero

Nursing Citizen Development commited on 3 days ago

Commit

dc8b89c

1 Parent(s): c02224c

Fix: Explicitly pass attention_mask to model.generate to resolve warning

Files changed (1) hide show

pna_client.py CHANGED Viewed

@@ -57,10 +57,12 @@ class PNAAssistantClient:
         ]
         inputs = self.tokenizer.apply_chat_template(messages, return_tensors="pt", add_generation_prompt=True).to(self.device)
         with torch.no_grad():
             outputs = self.model.generate(
                 inputs,
                 max_new_tokens=300,
                 temperature=0.7,
                 do_sample=True,

         ]
         inputs = self.tokenizer.apply_chat_template(messages, return_tensors="pt", add_generation_prompt=True).to(self.device)
+        attention_mask = torch.ones_like(inputs).to(self.device)
         with torch.no_grad():
             outputs = self.model.generate(
                 inputs,
+                attention_mask=attention_mask,
                 max_new_tokens=300,
                 temperature=0.7,
                 do_sample=True,