leonMW
/

DeepSeek-R1-Distill-Qwen-1.5B-GSPO-Basic

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-1.5B-GSPO-Basic / trainer_state.json

Commit History

Model save

0525bd6
verified

leonMW commited on Nov 17, 2025

Model save

0518f60
verified

leonMW commited on Nov 17, 2025