bingyy
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO-DAPO-Math-17k

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-1.5B-GRPO-DAPO-Math-17k

Commit History

End of training

461bcfa
verified

bingyy commited on Jan 8

Model save

65ca7b3
verified

bingyy commited on Jan 8

Training in progress, step 4349

6c42617
verified

bingyy commited on Jan 8

Training in progress, step 4000

d118fe4
verified

bingyy commited on Jan 8

Training in progress, step 3500

ed94163
verified

bingyy commited on Jan 8

Training in progress, step 3000

dd7159b
verified

bingyy commited on Jan 8

Training in progress, step 2500

8dc3e78
verified

bingyy commited on Jan 8

Training in progress, step 2000

3258b48
verified

bingyy commited on Jan 8

Training in progress, step 1500

34404da
verified

bingyy commited on Jan 7

Training in progress, step 1000

c33c43c
verified

bingyy commited on Jan 7

Training in progress, step 500

babfbb3
verified

bingyy commited on Jan 7

Training in progress, step 2000

01d4328
verified

bingyy commited on Jan 7

Training in progress, step 1500

cc61a56
verified

bingyy commited on Jan 7

Training in progress, step 1000

8e5d608
verified

bingyy commited on Jan 7

Training in progress, step 500

6680ffe
verified

bingyy commited on Jan 7

initial commit

6e96a86
verified

bingyy commited on Jan 7