appleeji
/

eagle-training-code

appleeji commited on Jan 30

Commit

1b8d732

verified ·

1 Parent(s): dee8162

Upload main.py with huggingface_hub

Files changed (1) hide show

main.py CHANGED Viewed

@@ -253,9 +253,11 @@ criterion = nn.SmoothL1Loss(reduction="none")
 num_epochs = train_config["num_epochs"]
 model_engine, optimizer, _, _ = deepspeed.initialize(args=args,
                                                      model=model,
-                                                     model_parameters=model.parameters(),
                                                      )
 global_rank = deepspeed.comm.get_rank()

 num_epochs = train_config["num_epochs"]
+# Only pass trainable parameters to DeepSpeed (frozen params cause grad tracking errors)
+trainable_params = [p for p in model.parameters() if p.requires_grad]
 model_engine, optimizer, _, _ = deepspeed.initialize(args=args,
                                                      model=model,
+                                                     model_parameters=trainable_params,
                                                      )
 global_rank = deepspeed.comm.get_rank()