Macromrit
/

SmolLM2-135M-GRPO-Trained-For-Reasoning

Model card Files Files and versions

SmolLM2-135M-GRPO-Trained-For-Reasoning / generation_config.json

Macromrit's picture

Upload folder using huggingface_hub

9afa2ee verified 12 months ago

history blame contribute delete

132 Bytes

	{
	"_from_model_config": true,
	"bos_token_id": 1,
	"eos_token_id": 2,
	"pad_token_id": 2,
	"transformers_version": "4.49.0"
	}