Spaces:

miyuki2026
/

OpenMiniMind

Sleeping

miyuki2026 commited on Feb 19

Commit

75c5e57

1 Parent(s): 253ae18

update

Files changed (1) hide show

examples/tutorials/dpo/ultrafeedback-dpo/step_2_train_dpo_model_single_gpu.py CHANGED Viewed

@@ -198,7 +198,7 @@ def main():
         warmup_steps=100,
         lr_scheduler_type="cosine",
         fp16=True,
-        gradient_checkpointing=False,  # 如果内存紧张，可以设为 True
         optim="adamw_torch",
         report_to="none",
         max_length=1024 if debug_mode else 2048,  # prompt + chosen 的最大长度

         warmup_steps=100,
         lr_scheduler_type="cosine",
         fp16=True,
+        gradient_checkpointing=True,  # 如果内存紧张，可以设为 True
         optim="adamw_torch",
         report_to="none",
         max_length=1024 if debug_mode else 2048,  # prompt + chosen 的最大长度