blacksunfm
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Commit History

End of training

2d6f45e
verified

blacksunfm commited on Mar 20, 2025

Model save

e1c8ae9
verified

blacksunfm commited on Mar 20, 2025

Training in progress, epoch 0

4fe500a
verified

blacksunfm commited on Mar 20, 2025

End of training

7efdb53
verified

blacksunfm commited on Mar 13, 2025

Model save

338b689
verified

blacksunfm commited on Mar 13, 2025

Training in progress, epoch 0

29758d6
verified

blacksunfm commited on Mar 13, 2025

initial commit

6976f4c
verified

blacksunfm commited on Mar 11, 2025