mesbahuddin1989
/

SmolLM2-135M-Instruct-GRPO

Text Generation

Generated from Trainer

SmolLM2-135M-Instruct_GRPO

text-generation-inference

Model card Files Files and versions

SmolLM2-135M-Instruct-GRPO / generation_config.json

mesbahuddin1989's picture

mesbahuddin1989

End of training

8563d7f verified about 1 year ago

history blame contribute delete

132 Bytes

	{
	"_from_model_config": true,
	"bos_token_id": 1,
	"eos_token_id": 2,
	"pad_token_id": 2,
	"transformers_version": "4.48.2"
	}