leonMW
/

DeepSeek-R1-Distill-Qwen-7B-GSPO-Basic

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-7B-GSPO-Basic / generation_config.json

Commit History

Model save

1d1dc8a
verified

leonMW commited on Nov 20, 2025

Training in progress, step 200

d98eeea
verified

leonMW commited on Oct 17, 2025

Merged basemodel Qwen2ForCausalLM(

39843d7
verified

leonMW commited on Sep 4, 2025

Merged basemodel Qwen2ForCausalLM(

8ab1f1a
verified

leonMW commited on Aug 29, 2025

Merged with LoRA adapter

de0cea2
verified

leonMW commited on Aug 12, 2025