leonMW
/

DeepSeek-R1-Distill-Qwen-7B-GSPO-Basic

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-7B-GSPO-Basic / trainer_state.json

Commit History

Model save

1d1dc8a
verified

leonMW commited on Nov 20, 2025

Merged basemodel Qwen2ForCausalLM(

8ab1f1a
verified

leonMW commited on Aug 29, 2025

Model save

5dab3fa
verified

leonMW commited on Aug 26, 2025

Model save

03bca11
verified

leonMW commited on Aug 26, 2025

Model save

e7f503f
verified

leonMW commited on Aug 26, 2025

Model save

0dcd46d
verified

leonMW commited on Aug 24, 2025

Merged with LoRA adapter

27e2d56
verified

leonMW commited on Aug 21, 2025

Model save

5b40aee
verified

leonMW commited on Aug 21, 2025

Model save

38be7aa
verified

leonMW commited on Aug 9, 2025

Model save

66fcf20
verified

leonMW commited on Aug 9, 2025