SEGAgentRL
/

LLDS-R-GRPO-Qwen2.5-3B-Base

Reinforcement Learning

text-generation

QuestionAnswering

text-generation-inference

Model card Files Files and versions

LLDS-R-GRPO-Qwen2.5-3B-Base

Commit History

Update README.md

1b30983
verified

dwenlong commited on Jan 15

Update README.md

aef9fb2
verified

dwenlong commited on Jan 15

Upload README.md

29300e7
verified

yushu-li commited on Jan 14

Upload folder using huggingface_hub

41abfe8
verified

yushu-li commited on Jan 14

initial commit

0817087
verified

yushu-li commited on Jan 14