alex-chiu
/

DeepSeek-R1-Distill-Qwen-7B-GRPO

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-7B-GRPO

15.2 GB

1 contributor

History: 14 commits

alex-chiu's picture

Training in progress, step 260

c221ebb verified 11 months ago