Maxtimer97
/

Llama2llama

Text Generation

Model card Files Files and versions

Maxtimer97 commited on Jun 30, 2025

Commit

6bc83aa

·

1 Parent(s): af54461

Corrected dtype setup

Files changed (1) hide show

modeling_hymba.py +2 -2

modeling_hymba.py CHANGED Viewed

@@ -1709,9 +1709,9 @@ class HymbaBlock(nn.Module):
         ## Attention Head
         if self.reuse_kv:
             assert kv_last_layer is not None
-            attn_outputs, attn_key_value = self.self_attn(attention_mask=attention_mask, position_ids=position_ids, query_states=query_states, kv_last_layer=kv_last_layer, use_swa=use_swa, use_cache=use_cache, past_key_value=cache_params, target_dtype=self.in_proj.weight.type)
         else:
-            attn_outputs, attn_key_value = self.self_attn(attention_mask=attention_mask, position_ids=position_ids, query_states=query_states, key_states=key_states, value_states=value_states, use_swa=use_swa, use_cache=use_cache, past_key_value=cache_params, target_dtype=self.in_proj.weight.type)
         if not self.pure_attn:

         ## Attention Head
         if self.reuse_kv:
             assert kv_last_layer is not None
+            attn_outputs, attn_key_value = self.self_attn(attention_mask=attention_mask, position_ids=position_ids, query_states=query_states, kv_last_layer=kv_last_layer, use_swa=use_swa, use_cache=use_cache, past_key_value=cache_params, target_dtype=self.in_proj.weight.dtype)
         else:
+            attn_outputs, attn_key_value = self.self_attn(attention_mask=attention_mask, position_ids=position_ids, query_states=query_states, key_states=key_states, value_states=value_states, use_swa=use_swa, use_cache=use_cache, past_key_value=cache_params, target_dtype=self.in_proj.weight.dtype)
         if not self.pure_attn: