leonMW
/

DeepSeek-R1-Distill-Qwen-7B-GSPO-Basic

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-7B-GSPO-Basic / tokenizer.json

Commit History

Training in progress, step 200

d98eeea
verified

leonMW commited on Oct 17, 2025

Merged basemodel Qwen2ForCausalLM(

8ab1f1a
verified

leonMW commited on Aug 29, 2025

Training in progress, step 100

3fa7aa9
verified

leonMW commited on Aug 22, 2025

Merged with LoRA adapter

27e2d56
verified

leonMW commited on Aug 21, 2025

Training in progress, step 100

30b84c7
verified

leonMW commited on Aug 21, 2025

Merged with LoRA adapter

a73692e
verified

leonMW commited on Aug 12, 2025

Training in progress, step 50

dddf36c
verified

leonMW commited on Aug 9, 2025

Model save

66fcf20
verified

leonMW commited on Aug 9, 2025