ItsMaxNorm
/

DeepSeek-R1-Distill-SmolLM3-3B-GRPO

Commit History

Training in progress, epoch 1

5caca02
verified

ItsMaxNorm commited on Aug 8, 2025