SEGAgentRL
/

LLDS-R-GRPO-Qwen2.5-3B-Base

Reinforcement Learning

text-generation

QuestionAnswering

text-generation-inference

Model card Files Files and versions

LLDS-R-GRPO-Qwen2.5-3B-Base / generation_config.json

yushu-li's picture

Upload folder using huggingface_hub

41abfe8 verified 26 days ago

history blame contribute delete

117 Bytes

	{
	"bos_token_id": 151643,
	"eos_token_id": 151643,
	"max_new_tokens": 2048,
	"transformers_version": "4.47.1"
	}