andrewlngdn
/

dsl-debug-7b-rl-only-step30

Text Generation

reinforcement-learning

Model card Files Files and versions

dsl-debug-7b-rl-only-step30 / generation_config.json

andrewlngdn's picture

Upload rl_only_step30 (publishable run)

a92caec verified about 1 month ago

history blame contribute delete

121 Bytes

	{
	"_from_model_config": true,
	"eos_token_id": 151645,
	"pad_token_id": 151643,
	"transformers_version": "4.57.3"
	}