ItsMaxNorm
/

DeepSeek-R1-Fast-llada-5B-GRPO

Model card Files Files and versions

DeepSeek-R1-Fast-llada-5B-GRPO / tokenizer.json

Commit History

Training in progress, epoch 1

2cf2eda
verified

ItsMaxNorm commited on Aug 10, 2025