Mike369williams
/

Sanchari

Text Generation

foundation-model

instruction-following

investor-preview

Model card Files Files and versions

Sanchari / training /config_s.json

Mike369williams's picture

Mike369williams

Create training/config_s.json

ba5c6a0 verified 5 months ago

history blame contribute delete

344 Bytes

	{
	"model": {
	"n_layer": 24,
	"n_head": 16,
	"n_embd": 1024
	},
	"block_size": 1024,
	"training": {
	"per_device_train_batch_size": 2,
	"gradient_accumulation_steps": 8,
	"num_train_epochs": 1,
	"learning_rate": 0.0002,
	"weight_decay": 0.01,
	"fp16": true,
	"logging_steps": 100,
	"save_steps": 1000
	}
	}