mlxha
/

DeepSeek-R1-Distill-Llama-8B-GRPO-code-2

Model card Files Files and versions

DeepSeek-R1-Distill-Llama-8B-GRPO-code-2 / tokenizer.json

Commit History

Training in progress, step 20

e5ec648
verified

mlxha commited on Apr 17