DippyResearch
/

reward-model-DeepSeek-R1-Distill-Qwen-1.5B

Model card Files Files and versions

reward-model-DeepSeek-R1-Distill-Qwen-1.5B / type_distribution.png

Manavshah's picture

Training in progress, step 100

d22d9c1 verified about 1 year ago

history contribute delete

21.7 kB