cameronphchen
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Commit History

Model save

9c5e2ef
verified

cameronphchen commited on Feb 24, 2025

Training in progress, step 200

5125068
verified

cameronphchen commited on Feb 24, 2025

Training in progress, step 160

cb707e4
verified

cameronphchen commited on Feb 24, 2025

Training in progress, step 120

73ec0e5
verified

cameronphchen commited on Feb 24, 2025

Training in progress, step 80

f1ed5e5
verified

cameronphchen commited on Feb 24, 2025

Training in progress, step 40

ff033a6
verified

cameronphchen commited on Feb 24, 2025

initial commit

36fc34f
verified

cameronphchen commited on Feb 24, 2025