nm-testing
/

eagle3-llama3.1-8b-instruct-speculators

Model card Files Files and versions

RelaxingSnorlax commited on Jul 14, 2025

Commit

2bcfb08

·

verified ·

1 Parent(s): aa996f9

Upload folder using huggingface_hub

Files changed (2) hide show

config.json +1 -0
eagle3.py +14 -2

config.json CHANGED Viewed

@@ -28,6 +28,7 @@
   },
   "speculators_model_type": "eagle3",
   "speculators_version": "0.1.0.dev13",
   "torch_dtype": "float32",
   "transformer_layer_config": {
     "attention_bias": false,

   },
   "speculators_model_type": "eagle3",
   "speculators_version": "0.1.0.dev13",
+  "target_hidden_size": null,
   "torch_dtype": "float32",
   "transformer_layer_config": {
     "attention_bias": false,

eagle3.py CHANGED Viewed

@@ -73,6 +73,11 @@ class Eagle3SpeculatorConfig(SpeculatorModelConfig):
         description="Apply hidden_norm before storing residual",
     )
     @property
     def target_vocab_size(self) -> int:
         """Get target vocabulary size from transformer config."""
@@ -349,6 +354,13 @@ class Eagle3Speculator(SpeculatorModel):
         self.draft_vocab_size = config.draft_vocab_size
         self.target_vocab_size = config.target_vocab_size
         super().__init__(
             config=config,
             verifier=verifier,
@@ -364,7 +376,7 @@ class Eagle3Speculator(SpeculatorModel):
         )
         self.fc = nn.Linear(
-            3 * self.hidden_size,
             self.hidden_size,
             bias=False,
         )
@@ -422,7 +434,7 @@ class Eagle3Speculator(SpeculatorModel):
         :param input_ids: Input token IDs from draft vocabulary
         :param hidden_states: Concatenated hidden states from 3 verifier layers
-            [B, L, 3*H]
         :param attention_mask: Optional attention mask
         :param position_ids: Optional position IDs
         :param past_key_values: Optional cached key-values

         description="Apply hidden_norm before storing residual",
     )
+    target_hidden_size: Optional[int] = Field(
+        default=None,
+        description="Hidden size of the target model (if different from draft model)",
+    )
     @property
     def target_vocab_size(self) -> int:
         """Get target vocabulary size from transformer config."""
         self.draft_vocab_size = config.draft_vocab_size
         self.target_vocab_size = config.target_vocab_size
+        # Use target_hidden_size if specified, otherwise use draft model's hidden_size
+        self.target_hidden_size = (
+            config.target_hidden_size
+            if config.target_hidden_size is not None
+            else self.hidden_size
+        )
         super().__init__(
             config=config,
             verifier=verifier,
         )
         self.fc = nn.Linear(
+            3 * self.target_hidden_size,  # Use target model's hidden size
             self.hidden_size,
             bias=False,
         )
         :param input_ids: Input token IDs from draft vocabulary
         :param hidden_states: Concatenated hidden states from 3 verifier layers
+            [B, L, 3*target_H] where target_H is the target model's hidden size
         :param attention_mask: Optional attention mask
         :param position_ids: Optional position IDs
         :param past_key_values: Optional cached key-values