NoesisLab
/

Asterisk

Text Generation

hybrid-architecture

graph-reasoning

Model card Files Files and versions

OzTianlu commited on 2 days ago

Commit

33a36ae

·

verified ·

1 Parent(s): bd6a668

Update AsteriskForCausalLM.py

Files changed (1) hide show

AsteriskForCausalLM.py +4 -2

AsteriskForCausalLM.py CHANGED Viewed

@@ -188,12 +188,14 @@ class HybridASPPAttentionLayer(LlamaDecoderLayer):
         # Attention branch - use parent's self_attn
         attn_outputs = self.self_attn(
-            hidden_states,
-            position_embeddings,
             attention_mask=attention_mask,
             past_key_values=past_key_values,
             cache_position=cache_position,
         )
         attn_output = attn_outputs[0]
         # Gated fusion

         # Attention branch - use parent's self_attn
         attn_outputs = self.self_attn(
+            hidden_states=hidden_states,
             attention_mask=attention_mask,
+            position_ids=position_ids,
             past_key_values=past_key_values,
             cache_position=cache_position,
+            position_embeddings=position_embeddings,
         )
         attn_output = attn_outputs[0]
         # Gated fusion