DippyResearch
/

reward-model-DeepSeek-R1-Distill-Qwen-1.5B

Model card Files Files and versions

reward-model-DeepSeek-R1-Distill-Qwen-1.5B

Commit History

Training in progress, step 100, checkpoint

1abbb27
verified

Manavshah commited on Apr 11, 2025

Training in progress, step 100

d22d9c1
verified

Manavshah commited on Apr 11, 2025

initial commit

455de28
verified

Manavshah commited on Apr 7, 2025