EricLabile
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO_generation_num_2

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-1.5B-GRPO_generation_num_2

Commit History

End of training

eaa5ccf
verified

EricLabile commited on Mar 25

Model save

63ff1cc
verified

EricLabile commited on Mar 25

Training in progress, step 52

2174921
verified

EricLabile commited on Mar 25

Training in progress, step 50

799e2af
verified

EricLabile commited on Mar 25

Training in progress, step 40

116ad90
verified

EricLabile commited on Mar 25

Training in progress, step 30

833834a
verified

EricLabile commited on Mar 25

Training in progress, step 20

c99b1f3
verified

EricLabile commited on Mar 25

Training in progress, step 10

08f7a16
verified

EricLabile commited on Mar 25

initial commit

88aad4d
verified

EricLabile commited on Mar 25