SEGAgentRL
/

LLDS-R-GRPO-Qwen2.5-3B-Base

Reinforcement Learning

text-generation

QuestionAnswering

text-generation-inference

Model card Files Files and versions

LLDS-R-GRPO-Qwen2.5-3B-Base / tokenizer.json

Commit History

Upload folder using huggingface_hub

41abfe8
verified

yushu-li commited on 20 days ago