hyan
/

grpo_reasoning_model

Generated from Trainer

Model card Files Files and versions

grpo_reasoning_model / training_args.bin

Commit History

Training in progress, step 100

a21b893
verified

hyan commited on Feb 15