MartinKu
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-1.5B-GRPO / tokenizer.json

Commit History

Training in progress, epoch 1

694e7e8
verified

MartinKu commited on Apr 18, 2025

Model save

ab09f25
verified

MartinKu commited on Apr 17, 2025

Training in progress, epoch 1

de9a16c
verified

MartinKu commited on Apr 17, 2025

Model save

a38e93a
verified

MartinKu commited on Apr 16, 2025

Training in progress, step 1

776f4d1
verified

MartinKu commited on Apr 4, 2025