hzy
/

Qwen2.5-3B-Knowledge-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-3B-Knowledge-R1-GRPO

Commit History

Improve language tag

e7bf62c
verified

lbourdois commited on Apr 28, 2025

Model save

4b48b2b
verified

hzy commited on Feb 19, 2025

initial commit

a811b63
verified

hzy commited on Feb 19, 2025