Spaces:

miyuki2026
/

OpenMiniMind

Sleeping

miyuki2026 commited on 19 days ago

Commit

d251d39

1 Parent(s): 61148f6

update

Files changed (1) hide show

examples/tutorials/dpo/ultrafeedback-dpo/step_2_train_dpo_model_single_gpu.py CHANGED Viewed

@@ -169,7 +169,7 @@ def main():
         warmup_steps=100,
         lr_scheduler_type="cosine",
         fp16=False,
-        gradient_checkpointing=False,  # 如果内存紧张，可以设为 True
         optim="adamw_torch",
         report_to="none",
         max_length=1024 if debug_mode else 2048,  # prompt + chosen 的最大长度

         warmup_steps=100,
         lr_scheduler_type="cosine",
         fp16=False,
+        gradient_checkpointing=True,  # 如果内存紧张，可以设为 True
         optim="adamw_torch",
         report_to="none",
         max_length=1024 if debug_mode else 2048,  # prompt + chosen 的最大长度