Balab2021
/

Qwen2-0.5B-GRPO-test

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Qwen2-0.5B-GRPO-test / runs

25.2 kB

Ctrl+K

Ctrl+K

1 contributor

History: 12 commits

Balab2021's picture

Model save

68e6a8d verified 10 months ago

Jul11_20-10-36_86bc6f571546
Model save 10 months ago