SEGAgentRL
/

LLDS-R-GRPO-Qwen2.5-3B-Base

Reinforcement Learning

text-generation

QuestionAnswering

text-generation-inference

Model card Files Files and versions

LLDS-R-GRPO-Qwen2.5-3B-Base

13.6 GB

Ctrl+K

Ctrl+K

2 contributors

History: 5 commits

dwenlong's picture

Update README.md

1b30983 verified 4 months ago