QYWH
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Commit History

Model save

24964ce
verified

QYWH commited on Feb 20, 2025

Model save

61284b2
verified

QYWH commited on Feb 18, 2025

initial commit

248184e
verified

QYWH commited on Feb 18, 2025