Shekswess
/

tiny-think-dpo-math-stem-dpo-beta1-lr5e-6-e1-bs8

Text Generation

Generated from Trainer

Model card Files Files and versions

tiny-think-dpo-math-stem-dpo-beta1-lr5e-6-e1-bs8

Commit History

Update README.md

dbe5d9f
verified

Shekswess commited on Jan 28

Training in progress, step 358

e03bbd6
verified

Shekswess commited on Jan 18

initial commit

ac12c21
verified

Shekswess commited on Jan 18