hyan
/

grpo_reasoning_model

Generated from Trainer

Model card Files Files and versions

grpo_reasoning_model / tokenizer.json

Commit History

Training in progress, step 100

a21b893
verified

hyan commited on 29 days ago