yolay
/

DeepSeek-R1-Distill-Qwen-7B-GRPO

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-7B-GRPO / tokenizer.json

Commit History

Training in progress, step 100

4c4cfec
verified

yolay commited on Feb 11, 2025