DippyResearch
/

reward-model-DeepSeek-R1-Distill-Qwen-1.5B

Model card Files Files and versions

reward-model-DeepSeek-R1-Distill-Qwen-1.5B / training_args.bin

Commit History

Training in progress, step 100

d22d9c1
verified

Manavshah commited on Apr 11, 2025