tobil
/

qmd-training-scripts

tobil commited on Jan 24

Commit

37174c2

verified ·

1 Parent(s): c27b1da

Upload train_grpo.py with huggingface_hub

Files changed (1) hide show

train_grpo.py CHANGED Viewed

@@ -270,7 +270,7 @@ def main():
     trainer = GRPOTrainer(
         model=model,
         processing_class=tokenizer,
-        config=config,
         train_dataset=dataset,
         reward_funcs=reward_fn,
     )

     trainer = GRPOTrainer(
         model=model,
         processing_class=tokenizer,
+        args=config,
         train_dataset=dataset,
         reward_funcs=reward_fn,
     )