Deci
/

DeciLM-6b-instruct

Text Generation

Eval Results (legacy)

Model card Files Files and versions

itay-levy commited on Oct 1, 2023

Commit

46481bc

·

1 Parent(s): 9ac48ff

add padding_mask

Files changed (1) hide show

modeling_decilm.py +1 -0

modeling_decilm.py CHANGED Viewed

@@ -62,6 +62,7 @@ class DeciLMAttention(LlamaAttention):
             past_key_value: Optional[Tuple[torch.Tensor]] = None,
             output_attentions: bool = False,
             use_cache: bool = False,
     ) -> Tuple[torch.Tensor, Optional[torch.Tensor], Optional[Tuple[torch.Tensor]]]:
         bsz, q_len, _ = hidden_states.size()
         if past_key_value is None:

             past_key_value: Optional[Tuple[torch.Tensor]] = None,
             output_attentions: bool = False,
             use_cache: bool = False,
+            padding_mask: Optional[torch.LongTensor] = None,
     ) -> Tuple[torch.Tensor, Optional[torch.Tensor], Optional[Tuple[torch.Tensor]]]:
         bsz, q_len, _ = hidden_states.size()
         if past_key_value is None: