crumb
/

GLORT2

Text Generation

Model card Files Files and versions

crumb commited on Feb 12, 2024

Commit

1ee6f60

·

verified ·

1 Parent(s): e27b807

;)

Files changed (1) hide show

modeling_t2.py +2 -0

modeling_t2.py CHANGED Viewed

@@ -149,6 +149,8 @@ class TransformerAttention(nn.Module):
         super().__init__()
         self.config = config
         self.stage = stage
         self.head_dim = config.hidden_size // config.num_attention_heads
         assert (
             self.head_dim * config.num_attention_heads == config.hidden_size

         super().__init__()
         self.config = config
         self.stage = stage
+        self.max_position_embeddings = config.max_position_embeddings
+        self.rope_theta = config.rope_theta
         self.head_dim = config.hidden_size // config.num_attention_heads
         assert (
             self.head_dim * config.num_attention_heads == config.hidden_size