Charlie81
/

LoRE

Model card Files Files and versions

Metrics Training metrics Community

Charlie81 commited on Jul 11, 2025

Commit

45d6e50

·

1 Parent(s): 580eff8

train agaaa

Files changed (1) hide show

scripts/train.py +9 -5

scripts/train.py CHANGED Viewed

@@ -112,13 +112,17 @@ def main():
         batch["output_router_logits"] = True
         return batch
-    # Fixed CustomTrainer class
     class CustomTrainer(Trainer):
-        def compute_loss(self, model, inputs, return_outputs=False):
-            # Remove num_items_in_batch from inputs if present
-            inputs.pop('num_items_in_batch', None)
-            with torch.set_grad_enabled(True):  # Ensure gradients are enabled
                 outputs = model(**inputs)
                 loss = outputs.loss

         batch["output_router_logits"] = True
         return batch
+    # Fixed CustomTrainer class that handles all possible arguments
     class CustomTrainer(Trainer):
+        def compute_loss(self, model, inputs, return_outputs=False, **kwargs):
+            # Remove any unexpected arguments
+            inputs = {k: v for k, v in inputs.items() if k not in ['num_items_in_batch']}
+            # Ensure we're in training mode
+            model.train()
+            # Forward pass with gradients
+            with torch.set_grad_enabled(True):
                 outputs = model(**inputs)
                 loss = outputs.loss