vikhyatk
/

moondream1

@@ -315,6 +315,7 @@ class CrossAttention(nn.Module):
                 dtype=scores.dtype,
                 device=scores.device,
             )
             padding_mask.masked_fill_(key_padding_mask, 0.0)
             scores = scores + rearrange(padding_mask, "b s -> b 1 1 s")

                 dtype=scores.dtype,
                 device=scores.device,
             )
+            key_padding_mask = key_padding_mask[:, :seqlen_k]
             padding_mask.masked_fill_(key_padding_mask, 0.0)
             scores = scores + rearrange(padding_mask, "b s -> b 1 1 s")