DippyResearch
/

reward-model-DeepSeek-R1-Distill-Qwen-1.5B

Model card Files Files and versions

reward-model-DeepSeek-R1-Distill-Qwen-1.5B

24.7 GB

1 contributor

History: 3 commits

Manavshah's picture

Training in progress, step 100, checkpoint

1abbb27 verified 9 months ago