miyuki2026 commited on
Commit
75c5e57
·
1 Parent(s): 253ae18
examples/tutorials/dpo/ultrafeedback-dpo/step_2_train_dpo_model_single_gpu.py CHANGED
@@ -198,7 +198,7 @@ def main():
198
  warmup_steps=100,
199
  lr_scheduler_type="cosine",
200
  fp16=True,
201
- gradient_checkpointing=False, # 如果内存紧张,可以设为 True
202
  optim="adamw_torch",
203
  report_to="none",
204
  max_length=1024 if debug_mode else 2048, # prompt + chosen 的最大长度
 
198
  warmup_steps=100,
199
  lr_scheduler_type="cosine",
200
  fp16=True,
201
+ gradient_checkpointing=True, # 如果内存紧张,可以设为 True
202
  optim="adamw_torch",
203
  report_to="none",
204
  max_length=1024 if debug_mode else 2048, # prompt + chosen 的最大长度