SEGAgentRL
/

LLDS-R-GRPO-Qwen2.5-3B-Base

Reinforcement Learning

text-generation

QuestionAnswering

text-generation-inference

Model card Files Files and versions

LLDS-R-GRPO-Qwen2.5-3B-Base / README.md

Commit History

Update README.md

1b30983
verified

dwenlong commited on Jan 15

Update README.md

aef9fb2
verified

dwenlong commited on Jan 15

Upload README.md

29300e7
verified

yushu-li commited on Jan 14